P1 Cargue las librerías y la base de datos
library(data.table)
library(ggplot2)
library(janitor)
library(plotly)
library(RColorBrewer)
library(tidyverse)
library(lubridate)
path<-"C:/Users/Lenovo/Desktop/TAREA 2/"
Superstore<-fread(paste0(path,"Superstore.csv"))
Superstore<-Superstore%>%
mutate(`Order Date` = mdy(`Order Date`),
`Ship Date` = mdy(`Ship Date`),
ship = `Ship Date` - `Order Date`)
Superstore$`Order Date` <- as.Date(Superstore$`Order Date`)
Superstore <- clean_names(Superstore)
P2 Haga un grafico de boxplot que muestre el versus de los metodos de entrega y la rapidez de delivery.
ggplot(Superstore,aes(x=ship_mode, y=ship)) + geom_boxplot()
P3 ¿En que estado hubo mas ventas? ¿y ganancias? Realice dos graficos
distintos que muestren esta información.
Superstore1<-Superstore[,.(ventas=sum(sales),ganancias=sum(profit)),by=state]
ggplot(Superstore1, aes(x=reorder(state,-ganancias),y=ganancias))+geom_col()
ggplot(Superstore1,aes(x=reorder(state,-ventas), y=ventas)) + geom_bar(stat="identity")
P4 Estan ilegibles los nombres del eje x, arregle esto, además agregue título, subtítulo, fuente que sea Kaggle, y renombre los ejes, tanto x como y
ggplot(Superstore1,aes(reorder(state,-ganancias),y=ganancias)) + geom_col() + labs(x="Estados", y="Ganancias", title = "Ganancias en Estados Unidos", subtitle = "Por Estado", caption = "Fuente: Kaggle" ) + theme(axis.text.x = element_text(angle=90, vjust=0.5))
P5 Al parecer coincide el estado con más ganancias y ventas, realice un
gráfico que muestre la categoría que se vende más en ese estado según su
subcategoría, ¿Qué es lo que más se vende.
california<-Superstore[state=="California",.N,by=sub_category]
ggplot(california,aes(x=reorder(sub_category,-N),y=N)) + geom_col() + labs(x="Subcategoria",y="Ventas",title="Ventas en California", subtitle="Por subcategoria",caption="Fuente:Kaggle")+theme(axis.text = element_text(angle=45,vjust=0.5))
lo que vende más es paper P6 Realice un gráfico de lineas de las sumas
de las ventas por año en el estado de California en la categoría
muebles.
muebles_california <-Superstore[category=="Furniture" & state=="California",.N, by=.(year(order_date))]
ggplot(muebles_california,aes(x=year, y=N)) + geom_point() + geom_smooth()+ labs(x="Año", y="Ventas de Muebles", title = "Ventas de muebles en California", subtitle = "Por año", caption = "Fuente: Kaggle" ) + theme(axis.text.x = element_text(angle=90, vjust=0.5))
P7¿Cual es el porcentaje de ventas que contribuye el estado de California al país?
ventas<- Superstore[,sum(sales), by=state]
ventas[,porcentaje := (V1/sum(V1)*100)]
Respuesta:California tiene un 19.92370974% de las ventas de muebles de Estados Unidos