P1

Realice todo el trabajo de datos de la Actividad 3 hasta la pregunta 4 (incluyendola). Además cargue el paquete ggplot2 que se utilizará en esta actividad. Utilice la base A4

rm(list=ls())

install.packages("ggplot2")
library(data.table)
library(ggplot2)
A4<-fread('A4.csv',fill=T)
A4<-A4[!duplicated(app)]
Obj1<-A4[,c(1:4,6:9)]
Obj1<-as.data.table(Obj1)
names(Obj1)
## [1] "app"           "category"      "rating"        "reviews"      
## [5] "installs"      "type"          "price"         "contentrating"
Obj1<-Obj1[category!="1.9"]

P2a

Cree un gráfico de barra con ggplot que contenga el conteo de cada categoría de la base de datos que ha generado en la pregunta 1.

ggplot(data = Obj1, aes(x=category))+ geom_bar()

P2b

Agregar etiquetas a los ejes, títulos, subtítulos y fuente al gráfico anterior. Además, deje de manera legible las categorías del eje x.

ggplot(Obj1,aes(category)) + geom_bar() + theme(axis.text.x =element_text(angle=90, vjust=0.5),axis.text.x.top = element_text(size=15),plot.title = element_text(size=10)) + ggtitle("Conteo por Categoría", subtitle = 'Sumatoría de  cada categoría de la base de datos') + xlab("Categoría") + ylab("Cantidad") + labs(caption = "Fuente:")

P3

Cree un scatter-plot con ggplot que muestre la relación entre el número de comentarios (reviews) (eje x) y el rating (eje y).

ggplot(Obj1, aes(x=reviews, y=rating)) + geom_point() + ggtitle('Relación entre el número de Reviews y el Rating') + xlab("Reviews") + ylab("Rating")

P4

Realice un histograma doble con ggplot que muestre la distribución del precio (price) de las aplicaciones para las categorías SOCIAL y PHOTOGRAPHY. Es decir, un histograma para cada categoría pero en un mismo gráfico como muestra el diagrama de ejemplo.

Ab<-Obj1[,c(2,7)]
Ab<-Ab[Ab$category == 'SOCIAL'|Ab$category == 'PHOTOGRAPHY',]
names(Ab) = c('Categoría','Precio')
ggplot(Ab, aes(x = Precio, fill = Categoría)) + geom_histogram() + ggtitle("Distribución del precio") + xlab("Precio") + ylab("Cantidad") + facet_wrap("Categoría")