Cargue la base de datos Act3.csv y los paquetes que sean necesario para trabajar un data.table.
library(data.table)
Datos<-fread("Act3.csv",fill=TRUE)
Revise la base de datos y elimine las aplicaciones que se encuentran duplicadas.
Datos<-Datos[!duplicated(App)]
Cree un nuevo objeto que contenga las siguientes variables de interés: App,Category,Rating,Reviews,Installs,Type,Price y Content Rating.
Datos2<-Datos[,list(App,Category,Rating,Reviews,Installs,Type,Price,`Content Rating`)]
Para el objeto anterior, elimine la categoría 1.9 de la variable Category
Datos3<-Datos2[!Category==1.9]
Cree un objeto que este compuesto por el número de observaciones de cada categoría.
Datos4<-Datos3[,.N,by=Category]
Reemplace el objeto anterior para que ahora contenga el número de observaciones, el promedio de comentarios (Reviews) y el promedio del Rating por categoría.
Datos3[, Reviews:= as.numeric(Reviews)]
Datos3[, Rating:= as.numeric(Rating)]
Datos3[,PromReviews:=mean(Reviews)]
Datos3[,PromRating:=mean(Rating,na.rm=T)]
Datos3[,Obs:=.N,by=Category]
Datos4<-Datos3[,list(Category,Obs,PromReviews,PromRating)]
Renombre las columnas del objeto de la pregunta 6. La primera columna debe ser Categoria, la segunda columna Numero_Observaciones, la tercera columa Promedio_Comentarios y la cuarta columna Promedio_Rating.
setnames(Datos4, c("Categoria","Numero_Observaciones","Promedio_Comentarios","Promedio_Rating") )
Ahora queremos analizar el nivel de competencia que existe por categoría para identificar cómo se encuentra valorada cada categoría de aplicaciones. Para realizar esto, debe crear un objeto con el identificador de competencia para cada categoría. El indicador esta definido como Icompetencia=(reviews∗rating)1000¯ Este identificador debe calcularse con el objeto de la Pregunta 4.
promcategorias<-Datos3[,(mean(Reviews*Rating,na.rm=T))/1000,by="Category"]
Renombrar las columnas del objeto de la Pregunta 8. La primera columna debe ser Categoria y la segunda columna Identificador.
setnames(promcategorias, c("Categoria","Identificador") )
Reemplace el objeto de la Pregunta 7 realizando un merge entre el objeto de la Pregunta 7 y el objeto de la Pregunta 9.
Datos4<-merge(x=Datos4,y=promcategorias,by=c("Categoria"))
Cree un objeto, a partir del objeto de la pregunta anterior, que contenga información solo de las categrías que más se relacionan con el rubro de la empresa (SOCIAL y PHOTOGRAPHY).
Datos5<-Datos4[Categoria %in% c("SOCIAL","PHOTOGRAPHY")]
Grafico<-Datos2[plot(Reviews,Rating,"p")]
## Warning in xy.coords(x, y, xlabel, ylabel, log): NAs introduced by coercion