Pregunta 1

Cargue las librerias data.table, readxl, ggplot2, chilemapas,sf,sp,leaflet y las bases de datos ENE.csv con el nombre ENE y comunas.csv con el nombre comunas. Luego, una ambas bases de datos con el código de la comuna (en la base de datos de la ENE se llama r_p_c.) (5 puntos)

rm(list = ls())
#install.packages("leaflet")
#install.packages("chilemapas")
library(data.table)
library(readxl)
library(ggplot2)
library(chilemapas)
library(sf)
library(sp)
library(leaflet)
library(dplyr)
ENE <- fread( "C:/Users/Esteban/Desktop/UAI/1 Sem 2021/Data Science/Controles/Control 2/ENE.csv" ,encoding= "UTF-8" )
library(readr)
comunas <- read_csv("C:/Users/Esteban/Desktop/UAI/1 Sem 2021/Data Science/Controles/Control 2/comunas.csv")
comunas <- as.data.table(comunas)

ENE[, `r_p_c` := ifelse(`r_p_c` < 10000 , paste0("0",ENE$r_p_c), ENE$r_p_c)]

merge1 <- merge(ENE, comunas, by.x= "r_p_c" , by.y= "codigo_comuna")

Pregunta 2

¿Cuántas personas fueron encuestadas y a cuántas personas representa esta encuesta?

merge1[,.N]
## [1] 73797
merge1[, sum(fact_cal, na.rm=T)]
## [1] 15853046

Fueron encuestadas 73.797 personas que representan 15.853.046 .

De aqui en adelante usarmeos la cantidad de personas representas.

Pregunta 3

Grafíque el número de personas por región, utilice la función ggplot.

ggplot(merge1, aes(x=region1, y= fact_cal))+  geom_bar(stat = "identity") 

Pregunta 4

Aguegue título, subtítlo y fuente al gráfico anterior, además arregle el eje x para que sea legible.

ggplot(merge1, aes(x=region1, y= fact_cal))+  geom_bar(stat = "identity") +  theme (axis.text.x = element_text(angle=20, vjust=0.5))+ labs(x=" N° personas  ", y=" Región ", title = " Numero de Personas por Región ", subtitle = "Chile  ", caption = " fuente: ENE" )

Pregunta 5

Escoja una región al azar. Cree un objeto que se llame Desempleo que contenga el número de personas por situación ocupacional y comuna de la región que eligió. Cree una nueva variable que se llame Tdesempleo utilizando la siguiente fórmula:

Tdesempleo=(Cesantes/Ocupados)+Cesantes

Hint: Después de crear el objeto, cree una columna que sea la suma de ocupados por comuna, otra que sea la suma de cesantes por comuna, para después crear la tasa de desempleo que sea la suma de cesantes por comuna dividido por la suma de ocupados por comuna más la suma de cesantes por comuna.

desempleo <- merge1[region1== 'La Araucania']
ocup_per_com <- desempleo[situacion_ocupacional== "OCUPADO", sum(fact_cal, na.rm = TRUE), by= nombre_comuna]
names (ocup_per_com) [2] <- "ocup_com"
ces_per_com <- desempleo[situacion_ocupacional== "CESANTE", sum(fact_cal, na.rm = TRUE), by= nombre_comuna]
names (ces_per_com) [2] <- "ces_com"
desempleo <-merge(desempleo,ocup_per_com, by= "nombre_comuna", all=TRUE )
desempleo <-merge(desempleo,ces_per_com, by= "nombre_comuna", all=TRUE ) 
desempleo[,Tdesempleo:=ces_com/(ocup_com+ces_com)]

Pregunta 6

No Existe!

Pregunta 7

Haga un gráfico de barras con las comunas en el eje y, y la tasa de desempleo en el eje x.

#selecciono las variables de interés
desempleo_graph <- desempleo [,c("nombre_comuna","Tdesempleo","r_p_c")]

#me deshago de los duplicados 

desempleo_graph<- unique(desempleo_graph)

#hay comunas en las que no hay censantes, por lo tanto las eliminaremos de "desempleo_graph". Nos enfocarmos en las demás 

desempleo_graph<-na.omit(desempleo_graph)

#grafico 

ggplot(desempleo_graph, aes(x= Tdesempleo,  y= nombre_comuna ))+  geom_bar(stat = "identity") + labs(y="Comuna  ", x="Tasa de Desempleo ", title = " Tasa de Desempleo por Comuna", caption = " Fuente: ENE" )

Pregunta 8

Cree un mapa con la tasa de desempleo comunal, utilizando el paquete chilemapas. Para esto, cree un objeto llamado mapa con el merge entre la geografía y la información de las comunas.

Hint: Después de realizar el merge, elimine los duplicados de las comunas del objeto mapa y seleccione solo las variables nombre_comuna, geometry, T_desempleo

Primero filtro mapa de la Región de la Araucania

comunas <- mapa_comunas %>% filter(codigo_region == "09")

Juantamos las comunas desempleo_graph con las del mapa

merge2<- merge(comunas,desempleo_graph, by.x= "codigo_comuna", by.y= "r_p_c"  )
merge2 <- st_sf(merge2)

Construimos el mapa

pal <- colorNumeric(palette = "YlOrBr", domain = desempleo_graph$Tdesempleo)


mapa <- leaflet(merge2) %>% 
  addProviderTiles(providers$CartoDB.Positron) %>% 
  addPolygons( fillColor = ~pal(Tdesempleo),
              color = "#b2aeae",
              fillOpacity = 0.7, 
              smoothFactor = 0.2,
              weight = 1,  label =~paste("Tasa de Desempleo:",Tdesempleo)) %>%   
  addLegend(pal = pal,  
            values = merge2$Tdesempleo,
            position = "bottomright",
            title = "Tasa de Desempleo") %>% 
            addScaleBar(position = "topright")
## Warning: sf layer has inconsistent datum (+proj=longlat +ellps=GRS80 +no_defs).
## Need '+proj=longlat +datum=WGS84'
mapa