Realice todo el trabajo de datos de la Actividad 3 hasta la pregunta 4 (incluyendola). Además cargue el paquete ggplot2 que se utilizará en esta actividad. Utilice la base A4
rm(list=ls())
install.packages("ggplot2")
library(data.table)
library(ggplot2)
A4<-fread('A4.csv',fill=T)
A4<-A4[!duplicated(app)]
Obj1<-A4[,c(1:4,6:9)]
Obj1<-as.data.table(Obj1)
names(Obj1)
## [1] "app" "category" "rating" "reviews"
## [5] "installs" "type" "price" "contentrating"
Obj1<-Obj1[category!="1.9"]
Cree un gráfico de barra con ggplot que contenga el conteo de cada categoría de la base de datos que ha generado en la pregunta 1.
ggplot(data = Obj1, aes(x=category))+ geom_bar()
Agregar etiquetas a los ejes, títulos, subtítulos y fuente al gráfico anterior. Además, deje de manera legible las categorías del eje x.
ggplot(Obj1,aes(category)) + geom_bar() + theme(axis.text.x =element_text(angle=90, vjust=0.5),axis.text.x.top = element_text(size=15),plot.title = element_text(size=10)) + ggtitle("Conteo por Categoría", subtitle = 'Sumatoría de cada categoría de la base de datos') + xlab("Categoría") + ylab("Cantidad") + labs(caption = "Fuente:")
Cree un scatter-plot con ggplot que muestre la relación entre el número de comentarios (reviews) (eje x) y el rating (eje y).
ggplot(Obj1, aes(x=reviews, y=rating)) + geom_point() + ggtitle('Relación entre el número de Reviews y el Rating') + xlab("Reviews") + ylab("Rating")
Realice un histograma doble con ggplot que muestre la distribución del precio (price) de las aplicaciones para las categorías SOCIAL y PHOTOGRAPHY. Es decir, un histograma para cada categoría pero en un mismo gráfico como muestra el diagrama de ejemplo.
Ab<-Obj1[,c(2,7)]
Ab<-Ab[Ab$category == 'SOCIAL'|Ab$category == 'PHOTOGRAPHY',]
names(Ab) = c('Categoría','Precio')
ggplot(Ab, aes(x = Precio, fill = Categoría)) + geom_histogram() + ggtitle("Distribución del precio") + xlab("Precio") + ylab("Cantidad") + facet_wrap("Categoría")