Cargar paquetes

library(data.table)
library(tidyverse)
## -- Attaching packages --------------------------------------- tidyverse 1.3.1 --
## v ggplot2 3.3.3     v purrr   0.3.4
## v tibble  3.1.0     v dplyr   1.0.5
## v tidyr   1.1.3     v stringr 1.4.0
## v readr   1.4.0     v forcats 0.5.1
## Warning: package 'tidyr' was built under R version 4.0.5
## Warning: package 'readr' was built under R version 4.0.5
## Warning: package 'dplyr' was built under R version 4.0.5
## Warning: package 'forcats' was built under R version 4.0.5
## -- Conflicts ------------------------------------------ tidyverse_conflicts() --
## x dplyr::between()   masks data.table::between()
## x dplyr::filter()    masks stats::filter()
## x dplyr::first()     masks data.table::first()
## x dplyr::lag()       masks stats::lag()
## x dplyr::last()      masks data.table::last()
## x purrr::transpose() masks data.table::transpose()
library(leaflet) 
## Warning: package 'leaflet' was built under R version 4.0.5
library(sp)
## Warning: package 'sp' was built under R version 4.0.5
library(broom)
## Warning: package 'broom' was built under R version 4.0.5
library(janitor) 
## Warning: package 'janitor' was built under R version 4.0.5
## 
## Attaching package: 'janitor'
## The following objects are masked from 'package:stats':
## 
##     chisq.test, fisher.test
library(rgbif) 
## Warning: package 'rgbif' was built under R version 4.0.5
library(sf) 
## Warning: package 'sf' was built under R version 4.0.5
## Linking to GEOS 3.9.0, GDAL 3.2.1, PROJ 7.2.1
library(chilemapas) 
## Warning: package 'chilemapas' was built under R version 4.0.5
## Registered S3 method overwritten by 'geojsonlint':
##   method         from 
##   print.location dplyr
library(ggplot2)

Limpiar

rm(list=ls())

Cargar bae de datos

La siguiente Base de datos se saco del INE, de su encuesta de desempleo de Enero del 2021.

ine <- fread("ene-2021-01-def.csv")

Escoger variables y filtrar

paso1<-ine[,c(4,16,18,24)]
paso1<-filter(paso1,curso<14)

Filtrar mapa a reguion metropolitana

comunas <- mapa_comunas %>% 
  filter(codigo_region==13)

Juntar datos y crear variable con nombres de las provincias

paso2 <- merge(comunas,paso1 , by.x="codigo_comuna", by.y="r_p_c")
paso2 <- as.data.table(paso2)
paso2[codigo_provincia=="131", provincia:="Santiago"]
paso2[codigo_provincia=="132", provincia:="Cordillera"]
paso2[codigo_provincia=="133", provincia:="Chacabuco"]
paso2[codigo_provincia=="134", provincia:="Maipo"]
paso2[codigo_provincia=="135", provincia:="Melipilla"]
paso2[codigo_provincia=="136", provincia:="Talagante"]

Crear graficos para analizar

ggplot(paso2, aes(x=curso, fill=sexo))+
  geom_histogram()+
  facet_wrap(facets="sexo")
## `stat_bin()` using `bins = 30`. Pick better value with `binwidth`.

### En este grafico queremos demostrar si existe una diferencia entre los niveles de cursos aprobados entre mujer y hombre de la region metropolitana, se puede analizar que tanto los hombres como las mujeres tienen una tendencia parecida, es decir, ambas tienen una distribucion aproximadamente simetrica, con varias personas que aprobaron la media (4 nivel) y se comportan los datos de forma parecida. Sin embargo, se puede visualizar que las mujeres sobresalen en la mayoria de los niveles del curso, por lo tanto, se puede decir que hay mayor cantidad de mujeres encuestadas.

ggplot(paso2, aes(x=curso, fill=provincia))+
  geom_histogram()+
  facet_wrap(facets="provincia")
## `stat_bin()` using `bins = 30`. Pick better value with `binwidth`.

### En este grafico podemos visualizar como se comportan las distintas provincias de la region metropolitana con respecto al nivel educacional aprobado por los distintos encuestados. Se puede concluir, que Santiago es la provincia con mas personas encuestadas que tienen un nivel educacional aprobado mayor a educacion media y a la vez, hay una mayor cantidad de encuestados. Melipilla tiene la menor cantidad de encuestados y asimismo, la menor cantidad de personas con nivel educacional superior a la media.

Crear variable a analizar

paso2[,con_mas_media:=1]
paso2[curso<5,con_mas_media:=0]

Con el obejto ya creado, se creo una variable para identifciar a aquellas personas que fueron encuestadas que poseen estudio superior, es decir, que estan sobre la media, asignando con un 1 si esta sobre y 0 si esta bajo. Despues, se creo un nuevo objeto “paso3” con el porcentaje que tiene el promedio de las personas por comuna que poseen estudios superiores.

paso3<-paso2[,porcentaje:=mean(con_mas_media),by="codigo_comuna"]

Filtrar variables innecsarias y pasar a formato correcto

paso3 <- distinct(paso3) %>% 
  select(codigo_comuna, geometry, porcentaje) 
paso3 <- st_sf(paso3)

Crear paleta de colores

pal <- colorNumeric(   
  palette = "YlOrBr",
  domain = paso3$porcentaje
)

Crear el mapa

mapa <- leaflet() %>% 
  addProviderTiles(providers$CartoDB.Positron) %>% 
  addPolygons(data = paso3,
              fillColor = ~pal(porcentaje),
              color = "#b2aeae",  
              fillOpacity = 0.7, 
              smoothFactor = 0.2,
              weight = 1) %>%   
  addLegend(pal = pal, 
            values = paso3$porcentaje,
            position = "bottomright",
            title = "Promedio General") %>% 
  addScaleBar(position = "topright") 
## Warning: sf layer has inconsistent datum (+proj=longlat +ellps=GRS80 +no_defs).
## Need '+proj=longlat +datum=WGS84'
mapa

Para realizar el mapa, quisimos ir de lo mas general a lo particular, por lo que se queria ver como se comportaba a nivel de comuna los niveles de educacion aprobados comparando a quienes tienen educacion superior a la media y quienes no. Para lograr esto, se modifico el objeto “paso3”, calculando el porcentaje de personas que tenian una eduacion mayor a la enseñanza media por comuna. El mapa arroja que la mayor parte del sector oriente de la capital de Chile posee un alto porcentaje de personas encuestadas que tienen un nivel educacional aprobado mayor a la enseñanza media. Por otro lado, el sector poniente de la capital se puede ver que las comunas tienen un color más claro, eso se puede interpretar que esas comunas tienen menor porcentaje de personas encuestadas que tienne la enseñanza media aprobada.Tambien, se puede apreciar que el sector Sur de la capital tiene un alto porcentaje de personas que tienen estudios superiores a la enseñanza media aprobada. Cabe destacar, que no se esta haciendo