rm(list = ls())
install.packages("data.table")
install.packages("dplyr")
install.packages("ggplot2")
library(ggplot2)
library(data.table)

P1

Realice todo el trabajo de datos de la Actividad 3 hasta la pregunta 4 (incluyendola). Además cargue el paquete ggplot2 que se utilizará en esta actividad. Utilice la base A4

library(dplyr)
library(ggplot2)
A4<-fread(file = "A4.csv")
A4<- A4[!duplicated(app), ]
A4i<-A4
A4i<-select(A4i, c(app,category,rating,reviews,installs,type,price,))

P2a

Cree un gráfico de barra con ggplot que contenga el conteo de cada categoría de la base de datos que ha generado en la pregunta 1.

ggplot(data = A4i, aes(x = category)) + geom_bar(outlier.shape = NA) 

P2b

Agregar etiquetas a los ejes, títulos, subtítulos y fuente al gráfico anterior. Además, deje de manera legible las categrías del eje x.

ggplot(data = A4i, aes(x = category)) + geom_bar(outlier.shape = NA) + ggtitle("Grafico Categorias") + xlab("Categorias") + ylab("Cantidad") + labs(subtitle = "Categorías de aplicaciones", caption = "Fuente: La base que subio la caro") + theme(axis.text.x = element_text(angle = 45, hjust = 1))

###P3 Cree un scatter-plot con ggplot que muestre la relación entre el número de comentarios (reviews) (eje x) y el rating (eje y).

ggplot(data = A4i, aes(x=reviews, y=rating)) + geom_point() + geom_smooth()

###P4 Realice un histograma doble con ggplot que muestre la distribución del precio (price) de las aplicaciones para las categorías SOCIAL y PHOTOGRAPHY. Es decir, un histograma para cada categoría pero en un mismo gráfico como muestra el diagrama de ejemplo.

ggplot( data = A4i[category%in% c("SOCIAL","PHOTOGRAPHY")],aes( x = price)) + geom_histogram(bins = 30)+facet_wrap(facets = "category")