P1

library(data.table)
library(ggplot2)
library(janitor)
library(plotly)
library(RColorBrewer)
library(tidyverse)
library(lubridate)
rm(list=ls())
path <- "/Users/benjamintorreso/Desktop/Data Science/Tarea Grupal 2/"
superstore <- fread(paste0(path,"Superstore.csv"))
superstore<-superstore%>%
  mutate(`Order Date` = mdy(`Order Date`),
         `Ship Date` = mdy(`Ship Date`),
         ship = `Ship Date` - `Order Date`)
superstore$`Order Date` <- as.Date(superstore$`Order Date`)
superstore <- clean_names(superstore)

P2

ggplot(superstore,aes(x=ship_mode, y=ship)) +  geom_boxplot()

P3

superstore1 <- superstore[,.(ventas=sum(sales),ganancias=sum(profit)),by=state]
ggplot(superstore1, aes(x=reorder(state,-ganancias),y=ganancias)) + geom_col()

ggplot(superstore1, aes(x=reorder(state,-ventas),y=ventas)) + geom_bar(stat='identity')

Respuesta: El Estado en el que se recaudó mayores ganancias y ventas fue California.

P4

ggplot(superstore1,aes(reorder(state,-ganancias),y=ganancias)) + geom_col() + labs(x="Estados", y="Ganancias", title = "Ganancias en Estados Unidos", subtitle = "Por Estado", caption = "Fuente: Kaggle" ) + theme(axis.text.x = element_text(angle=90, vjust=0.5)) 

ggplot(superstore1,aes(x=reorder(state,-ventas),y=ventas)) + geom_bar(stat='identity') + labs(x="Estados", y="Ventas", title = "Ventas en Estados Unidos", subtitle = "Por Estado", caption = "Fuente: Kaggle" ) + theme(axis.text.x = element_text(angle=90, vjust=0.5)) 

P5

california <- superstore[state=="California",.N,by=sub_category]
ggplot(california, aes(x=reorder(sub_category,-N),y=N)) + geom_col() + labs(x="Subcategoria", y="Ventas", title = "Ventas en California", subtitle = "Por subcategoria", caption = "Fuente: Kaggle" ) + theme(axis.text.x = element_text(angle=45, vjust=0.5)) 

Respuesta: la subcategoría que más vende en California es “Paper” (papel).

P6

muebles_california <- superstore[category=="Furniture" & state=="California",.N,by=.(year(order_date))]
ggplot(muebles_california,aes(x=year, y=N)) +  geom_point() + geom_smooth() + labs(x="Año", y="Ventas de muebles", title = "Ventas de muebles en California", subtitle = "Por año", caption = "Fuente: Kaggle" ) + theme(axis.text.x = element_text(angle=0, vjust=0.5)) 

P7

ventas <- superstore[,sum(sales),by=state]
ventas[, porcentaje := (V1/sum(V1)*100)]

Respuesta: 19.92370974% es el porcentaje de ventas que contribuye California al pais.