P1

Realice todo el trabajo de datos de la Actividad 3 hasta la pregunta 4 (incluyendola). Además cargue el paquete ggplot2 que se utilizará en esta actividad. Utilice la base A4.

library(ggplot2)
library(data.table)
library(dplyr)
library(ggplot2)

A4 <-fread(file = "A4.csv")
A4 <- A4[!duplicated(app), ]
A4i <-A4
A4i <-select(A4i, c(app,category,rating,reviews,installs,type,price,))

P2a.

Cree un gráfico de barra con ggplot que contenga el conteo de cada categoría de la base de datos que ha generado en la pregunta 1

ggplot(data = A4i, aes(x = category)) + 
  geom_bar(outlier.shape = NA)

P2b.

Agregar etiquetas a los ejes, títulos, subtítulos y fuente al gráfico anterior. Además, deje de manera legible las categrías del eje x.

ggplot(data = A4i, aes(x = category)) + 
  geom_bar(outlier.shape = NA) +
  ggtitle("Grafico Categorias") +
  xlab("Categorias") +
  ylab("Cantidad") +
  labs(subtitle = "Categorías de aplicaciones", caption = "Fuente: La base que subio la caro") +
  theme(axis.text.x = element_text(angle = 45, hjust = 1))

P3

Cree un scatter-plot con ggplot que muestre la relación entre el número de comentarios (reviews) (eje x) y el rating (eje y).

ggplot(data = A4i, aes(x=reviews, y=rating)) + 
  geom_point() +
  geom_smooth()

P4

Realice un histograma doble con ggplot que muestre la distribución del precio (price) de las aplicaciones para las categorías SOCIAL y PHOTOGRAPHY. Es decir, un histograma para cada categoría pero en un mismo gráfico como muestra el diagrama de ejemplo.

ggplot( data = A4i[category%in% c("SOCIAL","PHOTOGRAPHY")],aes( x = price)) + geom_histogram(bins = 30)+facet_wrap(facets = "category")