Cargue la base de datos Act3.csv y los paquetes que sean necesario para trabajar un data.table.
library(data.table)
Act3<-fread("Act3.csv", fill = TRUE)
Revise la base de datos y elimine las aplicaciones que se encuentran duplicadas.
Act3<- Act3[!duplicated(Act3),]
Cree un nuevo objeto que contenga las siguientes variables de interés: App,Category,Rating,Reviews,Installs,Type,Price y Content Rating.
new_var<- Act3[, . (App, Category, Rating, Reviews, Installs, Type,Price, `Content Rating`)]
Para el objeto anterior, elimine la categoría 1.9 de la variable Category.
new_var2<- new_var[-9991,]
rm(new_var)
Cree un objeto que este compuesto por el número de observaciones de cada categoría.
obs_category<-new_var2[,.N,by=Category]
Reemplace el objeto anterior para que ahora contenga el número de observaciones, el promedio de comentarios (Reviews) y el promedio del Rating por categoría.
obs_category<- new_var2[, prom_rating:=mean(Rating,na.rm = T), by=Category]
obs_category[,Reviews:=as.numeric(Reviews)]
obs_category[, prom_comentarios:=mean(Reviews,na.rm = T), by=Category]
obs_category<- obs_category[,c(2,9,10)]
obs_category[,Comentarios:=.N, by=Category]
obs_category<- obs_category[!duplicated(Category),]
Renombre las columnas del objeto de la pregunta 6. La primera columna debe ser Categoria, la segunda columna Numero_Observaciones, la tercera columa Promedio_Comentarios y la cuarta columna Promedio_Rating.
colnames(obs_category)=c("Categoria", "Promedio_Rating", "Promedio_Comentarios", "Numero_Observaciones")
Ahora queremos analizar el nivel de competencia que existe por categoría para identificar cómo se encuentra valorada cada categoría de aplicaciones.
new_var2[,Reviews:=as.numeric(Reviews)]
Idemcomp<- new_var2[, identificador:= (Reviews*Rating)/1000]
Idemcomp[, identificador:=mean(identificador,na.rm = T), by=Category]
Idemcomp<- Idemcomp[,c(2,11)]
Idemcomp<- Idemcomp[!duplicated(Category)]
Renombrar las columnas del objeto de la Pregunta 8. La primera columna debe ser Categoria y la segunda columna Identificador.
colnames(Idemcomp)=c("Categoria", "Identificador")
Reemplace el objeto de la Pregunta 7 realizando un merge entre el objeto de la Pregunta 7 y el objeto de la Pregunta 9.
obs_category<-merge(x=obs_category,y=Idemcomp,by=c("Categoria"))
Cree un objeto, a partir del objeto de la pregunta anterior, que contenga información solo de las categrías que más se relacionan con el rubro de la empresa (SOCIAL y PHOTOGRAPHY).
syp<- obs_category[Categoria== "SOCIAL" | Categoria== "PHOTOGRAPHY"]