P1

Cargue la base de datos Act3.csv y los paquetes que sean necesario para trabajar un data.table.

rm(list = ls())
Act3 <-fread(file = "Act3.csv", fill = TRUE)

P2

Revise la base de datos y elimine las aplicaciones que se encuentran duplicadas.

library(dplyr)

Act3 <- Act3[!duplicated(Act3), ]

P3

Cree un nuevo objeto que contenga las siguientes variables de interés: App,Category,Rating,Reviews,Installs,Type,Price y Content Rating.

ActInt <-Act3
ActInt <-select(ActInt, c(App,Category,Rating,Reviews,Installs,Type,Price,"Content Rating"))

P4

Para el objeto anterior, elimine la categoría 1.9 de la variable Category

ActInt <-ActInt[!Category==1.9]

P5

Cree un objeto que este compuesto por el número de observaciones de cada categoría.

TotalCategory <- ActInt %>% 
  group_by(Category) %>%
  summarise(TotalxCategory = length(Category))

P6

Reemplace el objeto anterior para que ahora contenga el número de observaciones, el promedio de comentarios (Reviews) y el promedio del Rating por categoría.

promRating <- ActInt[,mean(Rating,na.rm = T), by = Category]
promReviews <- ActInt[,mean(as.numeric(Reviews),na.rm = T), by = Category]

M<- merge(promRating,promReviews, by = c("Category"))

TotalCategory <- merge(TotalCategory,M,by = c("Category"))

P7

Renombre las columnas del objeto de la pregunta 6. La primera columna debe ser Categoria, la segunda columna Numero_Observaciones, la tercera columa Promedio_Comentarios y la cuarta columna Promedio_Rating.

names(TotalCategory) = c("Categoria","Numero_Observaciones","Promedio_Comentarios","Promedio_Rating")

P8

Ahora queremos analizar el nivel de competencia que existe por categoría para identificar cómo se encuentra valorada cada categoría de aplicaciones. Para realizar esto, debe crear un objeto con el identificador de competencia para cada categoría. El indicador esta definido como Icompetencia=(reviews∗rating)1000¯ Este identificador debe calcularse con el objeto de la Pregunta 4.

ActInt <- as.data.table(ActInt)[,Ic:= Rating*as.numeric(Reviews)/1000]
Icompetencia <- ActInt[,mean(Ic,na.rm = T), by = Category]

P9

Renombrar las columnas del objeto de la Pregunta 8. La primera columna debe ser Categoria y la segunda columna Identificador.

names(Icompetencia) = c("Categoria","Identificador")

P10

Reemplace el objeto de la Pregunta 7 realizando un merge entre el objeto de la Pregunta 7 y el objeto de la Pregunta 9.

TotalCategory <- merge(TotalCategory,Icompetencia, by = c("Categoria"))

P11

Cree un objeto, a partir del objeto de la pregunta anterior, que contenga información solo de las categrías que más se relacionan con el rubro de la empresa (SOCIAL y PHOTOGRAPHY).

S <- TotalCategory[(28),]
P <- TotalCategory[(25),]

 SP <- rbind(S,P)

BONUS

Realizar un gráfico que relacione dos variables que para usted sean relevantes relacionar. Para esto utilice el objeto de la Pregunta 3. Explique su gráfico.

library(ggplot2)

ggplot(ActInt, aes(x=Type, y=Rating)) + geom_bar(stat="identity")

#El grafico trata de mostrar el tipo de Raiting y la cantidad de Raiting que corresponde.