Local de Hamburguesas V Región

Considere un restaurante de hamburguesas que desea abrir un nuevo local en la V región. Para esto, deciden contratarlo/a para hacer un análisis de mercado en la zona y ver cuál es el mejor lugar para inaugurar el local. Por lo tanto, su análisis se basará en visualizaciones de las distintas comunas y macrozonas para poder identificar la localización más conveniente de la nueva sucursal.

P1

Cargue los paquetes necesarios para realizar visualizaciones y trabajar con DT. Además cargue la base hogares de la Encuesta Origen y Destino en formato data.table.

library(data.table)
library(ggplot2)
hogares <- fread("Base_Hogares.csv", encoding="Latin-1") 
## Warning in require_bit64_if_needed(ans): Some columns are type 'integer64'
## but package bit64 is not installed. Those columns will print as strange
## looking floating point data. There is no need to reload the data. Simply
## install.packages('bit64') to obtain the integer64 print method and print the
## data again.

P2

Realice un histograma con ggplot que muestre la distribución del ingreso de los hogares para las macrozonas del Gran Valparaíso. Es decir, un histograma para cada comuna, pero en un mismo gráfico. Además, limite el ingreso a menos de 2000000.

ggplot(data=hogares[hogares$IngresoHogar<=2000000], aes(x=IngresoHogar, weights=Factorhg)) + geom_histogram() + facet_wrap(facets="Macrozonahg") + theme(axis.text.x = element_text(angle=75, vjust=0.6))
## `stat_bin()` using `bins = 30`. Pick better value with `binwidth`.

P3

  1. Usando la base de hogares, cree el objeto ingprom, que contenga el ingreso promedio de los hogares en cada macro-zona.
ingprom<- hogares[,weighted.mean(IngresoHogar, weights=Factorhg, na.rm=T), by=Macrozonahg]
  1. Realice un gráfico que permita ver el ingreso promedio de los hogares por macro-zona.
ggplot(data=ingprom,aes(x=Macrozonahg, y = V1))+ geom_col()

  1. Agregar etiquetas
ggplot(data=ingprom,aes(x=Macrozonahg, y = V1))+ geom_col() + labs(title="Ingresos Promedio", subtitle="Por zona", caption="Fuente xx", x= "Macrozona", y="Ingresos") + theme(axis.text.x=element_text(angle= 85, vjust= 0.6))

P4

Cargue la base de datos de locales hamburguesas para analizar donde se encuentra la competencia.

local <- fread("restaurantes.csv")

P5

Cree un scatter-plot con ggplot que muestre la relación entre el número de comentarios (reviews) (eje x) y el rating (eje y).

ggplot(data=local, aes(x=reviews, y=rating)) + geom_point()

P6

Ahora queremos analizar el nivel de competencia que existe por macrozona. Para realizar esto, debe crear un identificador de competencia para cada macrozona.

local[,mean(reviews*rating,na.rm=T)/1000, by=MacrozonaOrigen1]
##     MacrozonaOrigen1        V1
##  1:        Plan Vina 2.4707909
##  2:  Plan Valparaiso 1.9452714
##  3:  Valparaiso Alto 2.1717750
##  4:      Marga-Marga 1.6290000
##  5:  Concon Poniente 2.1308500
##  6:           Renaca 1.3645000
##  7: Quilpue Poniente 0.3294000
##  8:      Playa Ancha 0.0300000
##  9:           Recreo 0.2409333
## 10:      Santa Julia 1.8814000
## 11: Placilla-Curauma 0.0090000
## 12:       El Belloto 0.0070000

P7

  1. Dado este primer análisis exploratorio, ¿dónde es más conveniente abrir el nuevo local de hamburguesas? Justifique su respuesta.

R: En las zonas donde haya menos competencia de restaurantes, como por ejemplo, Playa Ancha, Quilpue Poniente, Recreo, etc.