Datos y Visualizaciónes

Primero Eliminamos todo lo que pueda estar en el enviroment

rm(list=ls())

Pregunta 1

Cargue las librerias data.table, readxl, ggplot2, chilemapas,sf,sp,leaflet y las bases de datos ENE.csv con el nombre ENE y comunas.csv con el nombre comunas. Luego, una ambas bases de datos con el código de la comuna (en la base de datos de la ENE se llama r_p_c.)

Instaladas las librerias, y ocultado el chunk con ((include=F)). Ahora instalamos la base de datos y aseguramos que esten en data.table.

ENE <- fread("ENE.csv")
ENE <- as.data.table(ENE)
comunas <- fread("comunas.csv")
comunas <- as.data.table(comunas)

Por ultimo, antes de seguir a la pregunta 2, unimos las dos bases de datos.

names(ENE)[6] <- "codigo_comuna"
ENE_comunas <- merge(ENE, comunas, by.x ="codigo_comuna", by.y="codigo_comuna")

Pregunta 2

¿Cuántas personas fueron encuestadas y a cuántas personas representa esta encuesta?

personas_encuestas <- ENE_comunas[,.N]
representación_encuesta <- ENE_comunas[,sum(fact_cal, na.rm = T)]
personas_encuestas # Numero personas encuestadas
## [1] 73797
representación_encuesta # A cuantas representa la encuesta
## [1] 15853046

Pregunta 3

Grafíque el número de personas por región, utilice la función ggplot

ENE_comunas %>% 
  ggplot(aes(region1)) +
  geom_bar()

Pregunta 4

Aguegue título, subtítlo y fuente al gráfico anterior, además arregle el eje x para que sea legible

ENE_comunas %>% 
  ggplot(aes(region1)) +
  geom_bar(color = "Black", fill = "Yellow") +
  labs(title= "Numero de personas por region", subtitle = "Encuestados", caption = "Grafico anterior") +
  labs(x = "Region", y = "Cantidad de personas (Fact_Cal)") +
  theme(axis.text.x = element_text(angle=90, vjust=0.5)) 

Pregunta 5

Escoja una región al azar. Cree un objeto que se llame Desempleo que contenga el número de personas por situación ocupacional y comuna de la región que eligió. Cree una nueva variable que se llame Tdesempleo utilizando la siguiente fórmula:

Tdesempleo = (Cesantes/Ocupados) + Cesantes

Elegimos valparaiso Primero creamos un nuevo objeto que se llame desempleo que contiene el numero de personas por situacion ocupacional (VALPO)

desempleo <- ENE_comunas[region1 == "Valparaiso"]
desempleo <- desempleo[,.N, by = situacion_ocupacional]
desempleo
##    situacion_ocupacional    N
## 1:              INACTIVO 4342
## 2:               OCUPADO 4235
## 3:               CESANTE  479
ENE_comunas_valpo <- ENE_comunas[region1 == "Valparaiso"]
ENE_comunas_valpo <- ENE_comunas_valpo[!situacion_ocupacional == 'INACTIVO']
ENE_comunas_valpo <- ENE_comunas_valpo[,cesante:= ifelse (situacion_ocupacional == "CESANTE", 1, 0)]
ENE_comunas_valpo <- ENE_comunas_valpo[,ocupado:= ifelse (situacion_ocupacional == "OCUPADO", 1, 0)]
cesantes_suma <- ENE_comunas_valpo[,sum(cesante)]
ocupados_suma <- ENE_comunas_valpo[,sum(ocupado)]
ENE_comunas_valpo <- ENE_comunas_valpo[,Tdesempleo:=((cesantes_suma/ocupados_suma) + cesantes_suma)]

Pregunta 6

No hay pregunta 6

Pregunta 7

Haga un gráfico de barras con las comunas en el eje y, y la tasa de desempleo en el eje x.

#Primero, al igual que la pregunta anterior debemos calcular las tasas de desemplo para poder hacer el grafico. Para esto vamos hacer lo mismo que se hizo anteriormente.

ENE_TD <- ENE_comunas[!situacion_ocupacional == 'INACTIVO']
ENE_TD <- ENE_TD[,cesante:= ifelse (situacion_ocupacional == "CESANTE", 1, 0)]
ENE_TD <- ENE_TD[,ocupado:= ifelse (situacion_ocupacional == "OCUPADO", 1, 0)]
ENE_TD <- ENE_TD[, .(region1, cesante, ocupado)]
ENE_TD_C <- ENE_TD[, sum((cesante),na.rm=F), by = "region1"]
ENE_TD_O <- ENE_TD[, sum((ocupado),na.rm=T), by = "region1"]
ENE_TD_CO <- merge(x = ENE_TD_C, y= ENE_TD_O, by = "region1")
names(ENE_TD_CO)[2] <- "cesantes"
names(ENE_TD_CO)[3] <- "ocupados"
ENE_TD_CO <- ENE_TD_CO[,TasaDesempleo:= ((ENE_TD_CO$cesantes / (ENE_TD_CO$ocupados) + ENE_TD_CO$cesantes))]
ENE_TD_CO
ENE_TD_CO %>% 
  ggplot(aes(TasaDesempleo, region1)) +
  geom_col(color = "Black", fill = "Orange") +
  labs(title = "Tasa de desempleo : Region") +
  labs(x = "Tasa de Desempleo", y = "Region") +
  theme_bw()

Pregunta 8

Cree un mapa con la tasa de desempleo comunal, utilizando el paquete chilemapas. Para esto, cree un objeto llamado mapa con el merge entre la geografía y la información de las comunas.

Para esto primero debemos filtar nuevamente, y obtener la misma tabla visto en la pregunta 5, pero agregando el codigo columna

ENE_codigo <- ENE_comunas[,. (region1, codigo_comuna)]
ENE_codigo <- unique(ENE_codigo)
ENE_codigo_desempleo <- merge(x = ENE_codigo, y= ENE_TD_CO, by = "region1")
ENE_codigo_desempleo <- ENE_codigo_desempleo[, .(region1, codigo_comuna, TasaDesempleo)]

mapa <- merge(comunas, ENE_codigo_desempleo, by.x = "codigo_comuna", by.y="codigo_comuna")
mapa <- as.data.table(mapa)
pal <- colorBin("YlOrRd", domain = c(mapa$total))
mapa <- st_sf(mapa)


leaflet(mapa)%>% 
  addTiles() %>% 
  addPolygons(color = ~pal(ENE_codigo_desempleo),
              weight = 1, 
              fillOpacity = 0.8,
              label = labels)%>%
  addLegend(pal = pal, values = ~bins, opacity = 1,position = "bottomright",title ="Desempleados")