###Nombres: Anibal Bravo Maria Jose Flores Katherine Mac-Ginty Benjamin Santibáñez
###1
rm(list=ls())
###2
library(data.table)
library(ggplot2)
hogares <- fread("Base_Hogares.csv")
View(hogares)
###3
#Forma 1
ggplot(data=hogares[IngresoHogar<2000000], aes(x=IngresoHogar,fill=Macrozonahg))+
geom_histogram()+
facet_wrap(facets = "Macrozonahg")
## `stat_bin()` using `bins = 30`. Pick better value with `binwidth`.
#Forma 2
ggplot(data=hogares[IngresoHogar<2000000], aes(x=IngresoHogar,fill=Macrozonahg))+
geom_histogram()
## `stat_bin()` using `bins = 30`. Pick better value with `binwidth`.
#Forma 3
ggplot(data=hogares[IngresoHogar<2000000], aes(x=IngresoHogar,fill=Macrozonahg))+
geom_histogram(bins=3, position = "dodge")
#La razón de porque utilizamos 3 graficos debido a que un grafico no representa la dispersion de la distribucion de los ingresos, por lo que al hacer 3 se puede visualizar de mejor manera y lograr un mejor analisis.
###4
ingprom= hogares [,.(ingprom=mean(IngresoHogar)),by=.(Macrozonahg,Macrozona)]
###5
ggplot(data=ingprom,aes(x=Macrozonahg,weights=ingprom))+
geom_bar()
###6
ggplot(data=ingprom,aes(x=Macrozonahg,weights=ingprom))+
geom_bar()+
labs(x="Macrozona", y="Ingreso Promedio", title="Ingreso promedio", subtitle = "por Macrozona", caption = "Encuesta Origen y Destino, Gran Valparaíso")+
theme(axis.text.x = element_text(angle=90,vjust=1))
#Forma 2
ggplot(ingprom, aes(x= Macrozona, weights = ingprom, color = Macrozonahg)) +
geom_bar()+
labs(x="Macrozonahg", y="Ingreso Promedio", title = "Ingreso Promedio del Hogar", subtitle = "Según Macrozona", caption = "Fuente: Encuesta Hogares Origen y Destino")
###7
restaurantes <- fread("restaurantes.csv")
###8
ggplot(data=restaurantes)+
geom_point(aes(x=reviews,y=rating, color=COMUNA))
###9
competitividad<-restaurantes[,mean(reviews*rating,na.rm=T)/1000, by=MacrozonaOrigen1]
View(competitividad)
###10
Restaurant_Promedios = restaurantes[, .(Review_Promedio = mean(reviews), Rating_Promedio = mean(rating)), by=MacrozonaOrigen1]
Restaurant_Promedios[, Indicador2 := Review_Promedio*Rating_Promedio/1000]
tabbla2 = Restaurant_Promedios[,Indicador2, by=MacrozonaOrigen1]
ggplot(Restaurant_Promedios, aes(x=Review_Promedio , y=Rating_Promedio, color = MacrozonaOrigen1))+
geom_point()
###a) Segun el indicador que se creo el mejor lugar para abrir un local de hamburguesas es la Macrozona Plan Vina
###b)
###Para poder evaluar cual seria el mejor lugar para colocar un local de hamburguesa, va a depender de la cantidad de reviews que tenga y de la cantidad de rating, por lo que, lo mejor seria modificar este identificador y lograr hacer un grafico que represente la correlacion entre la variable independiente y dependiente. En este grafico, se puede visualizar, que se debe tener en considerar los lugares que tienen pocos review, es decir, poca gente demanda su producto y el ideal seria tener un buen rating, pero si analizamos, aquellos lugares que tienen buen rating, puede ser un nicho muy competitivo.
###Por lo tanto, el más recomendable, el cual calza con la eleccion de la pregunta A, seria Plan Viña, en donde hay un alto nivel de reviews y el poder de mercado no es tan fuerte.
###Ingresos promedio de las personas que viven en la macrozona es importante para evaluar como puede ser tu negocio, si puede ser de un nicho mas premium o mas de barrio, siendo importante al momento de analizar tu clientela.