El formato tiene puntaje.
library(data.table)
library(ggplot2)
library(tidyverse)
library(leaflet)
Latin-1 para que se lean los tílde. **Pista: una de las opciones de la función fread es encoding. Debe ir después de una coma, después del nombre del archivo y dentro de paréntesis. Recuerde que también puede revisar las opciones con ?fread.hogares <- fread("Base_Hogares.csv", encoding="Latin-1")
ggplot(data=hogares[IngresoHogar<2000000], aes(x=IngresoHogar)) +
geom_histogram() +
facet_wrap(facets = "Macrozonahg") +
theme(axis.text.x = element_text(angle=75, vjust=0.6))
ingprom, que contenga el ingreso promedio de los hogares en cada macro-zona.ingprom<-hogares[,mean(IngresoHogar,na.rm=T),by=Macrozonahg]
ggplot(data=ingprom,aes(x=Macrozonahg, y = V1))+
geom_col()
ggplot(data=ingprom,aes(x=Macrozonahg, y = V1))+
geom_col()+
labs(x="Zonas", y="Ingresos", title = "Ingresos promedio", subtitle = "Por zona", caption = "Fuente: Encuesta Origen y Destino - Gran Valparaíso 2014" )+
theme(axis.text.x = element_text(angle=85, vjust=0.6))
locales<-fread("restaurantes.csv")
ggplot(data=locales, aes(x=reviews, y=rating, color=COMUNA)) +
geom_point()
NA en caso de que existan.locales[,indicador:=mean(reviews*rating,na.rm = T)/1000, by=MacrozonaOrigen1]
¿Dónde es más conveniente abrir el nuevo local de hamburguesas? Justifique su respuesta.
¿Qué agregaría/modificaría a este análisis para poder dar una respuesta más robusta?
popup <- paste0("<br>Nombre: ", locales$nombre, "<br>Rating: ", locales$rating,"<br>Indicador: ",locales$indicador)
leaflet(locales) %>% addTiles() %>%
addMarkers(~lng, ~lat, popup = popup)