###Nombres: Anibal Bravo Maria Jose Flores Katherine Mac-Ginty Benjamin Santibáñez

###1

rm(list=ls())

###2

library(data.table)
library(ggplot2)
hogares <- fread("Base_Hogares.csv")

View(hogares)

###3

#Forma 1
ggplot(data=hogares[IngresoHogar<2000000], aes(x=IngresoHogar,fill=Macrozonahg))+
  geom_histogram()+
  facet_wrap(facets = "Macrozonahg")
## `stat_bin()` using `bins = 30`. Pick better value with `binwidth`.

#Forma 2
ggplot(data=hogares[IngresoHogar<2000000], aes(x=IngresoHogar,fill=Macrozonahg))+
  geom_histogram()
## `stat_bin()` using `bins = 30`. Pick better value with `binwidth`.

#Forma 3
ggplot(data=hogares[IngresoHogar<2000000], aes(x=IngresoHogar,fill=Macrozonahg))+
  geom_histogram(bins=3, position = "dodge")  

#La razón de porque utilizamos 3 graficos debido a que un grafico no representa la dispersion de la distribucion de los ingresos, por lo que al hacer 3 se puede visualizar de mejor manera y lograr un mejor analisis.

###4

ingprom= hogares [,.(ingprom=mean(IngresoHogar)),by=.(Macrozonahg,Macrozona)]

###5

ggplot(data=ingprom,aes(x=Macrozonahg,weights=ingprom))+
  geom_bar()

###6

ggplot(data=ingprom,aes(x=Macrozonahg,weights=ingprom))+
  geom_bar()+
  labs(x="Macrozona", y="Ingreso Promedio", title="Ingreso promedio", subtitle = "por Macrozona", caption = "Encuesta Origen y Destino, Gran Valparaíso")+
  theme(axis.text.x = element_text(angle=90,vjust=1))

#Forma 2
ggplot(ingprom, aes(x= Macrozona, weights = ingprom, color = Macrozonahg)) +
  geom_bar()+ 
  labs(x="Macrozonahg", y="Ingreso Promedio", title = "Ingreso Promedio del Hogar", subtitle = "Según Macrozona", caption = "Fuente: Encuesta Hogares Origen y Destino")

###7

restaurantes <- fread("restaurantes.csv")

###8

ggplot(data=restaurantes)+
  geom_point(aes(x=reviews,y=rating, color=COMUNA))

###9

competitividad<-restaurantes[,mean(reviews*rating,na.rm=T)/1000, by=MacrozonaOrigen1]
View(competitividad)

###10

Restaurant_Promedios = restaurantes[, .(Review_Promedio = mean(reviews), Rating_Promedio = mean(rating)), by=MacrozonaOrigen1]
Restaurant_Promedios[, Indicador2 := Review_Promedio*Rating_Promedio/1000]
tabbla2 = Restaurant_Promedios[,Indicador2, by=MacrozonaOrigen1]

ggplot(Restaurant_Promedios, aes(x=Review_Promedio , y=Rating_Promedio, color = MacrozonaOrigen1))+
  geom_point()

###a) Segun el indicador que se creo el mejor lugar para abrir un local de hamburguesas es la Macrozona Plan Vina
###b)
###Para poder evaluar cual seria el mejor lugar para colocar un local de hamburguesa, va a depender de la cantidad de reviews que tenga y de la cantidad de rating, por lo que, lo mejor seria modificar este identificador y lograr hacer un grafico que represente la correlacion entre la variable independiente y dependiente. En este grafico, se puede visualizar, que se debe tener en considerar los lugares que tienen pocos review, es decir, poca gente demanda su producto y el ideal seria tener un buen rating, pero si analizamos, aquellos lugares que tienen buen rating, puede ser un nicho muy competitivo.

###Por lo tanto, el más recomendable, el cual calza con la eleccion de la pregunta A, seria Plan Viña, en donde hay un alto nivel de reviews y el poder de mercado no es tan fuerte.
###Ingresos promedio de las personas que viven en la macrozona es importante para evaluar como puede ser tu negocio, si puede ser de un nicho mas premium o mas de barrio, siendo importante al momento de analizar tu clientela.