library(data.table)
library(tidyverse)
## -- Attaching packages --------------------------------------- tidyverse 1.3.1 --
## v ggplot2 3.3.3 v purrr 0.3.4
## v tibble 3.1.0 v dplyr 1.0.5
## v tidyr 1.1.3 v stringr 1.4.0
## v readr 1.4.0 v forcats 0.5.1
## Warning: package 'tidyr' was built under R version 4.0.5
## Warning: package 'readr' was built under R version 4.0.5
## Warning: package 'dplyr' was built under R version 4.0.5
## Warning: package 'forcats' was built under R version 4.0.5
## -- Conflicts ------------------------------------------ tidyverse_conflicts() --
## x dplyr::between() masks data.table::between()
## x dplyr::filter() masks stats::filter()
## x dplyr::first() masks data.table::first()
## x dplyr::lag() masks stats::lag()
## x dplyr::last() masks data.table::last()
## x purrr::transpose() masks data.table::transpose()
library(leaflet)
## Warning: package 'leaflet' was built under R version 4.0.5
library(sp)
## Warning: package 'sp' was built under R version 4.0.5
library(broom)
## Warning: package 'broom' was built under R version 4.0.5
library(janitor)
## Warning: package 'janitor' was built under R version 4.0.5
##
## Attaching package: 'janitor'
## The following objects are masked from 'package:stats':
##
## chisq.test, fisher.test
library(rgbif)
## Warning: package 'rgbif' was built under R version 4.0.5
library(sf)
## Warning: package 'sf' was built under R version 4.0.5
## Linking to GEOS 3.9.0, GDAL 3.2.1, PROJ 7.2.1
library(chilemapas)
## Warning: package 'chilemapas' was built under R version 4.0.5
## Registered S3 method overwritten by 'geojsonlint':
## method from
## print.location dplyr
library(ggplot2)
rm(list=ls())
ine <- fread("ene-2021-01-def.csv")
paso1<-ine[,c(4,16,18,24)]
paso1<-filter(paso1,curso<14)
comunas <- mapa_comunas %>%
filter(codigo_region==13)
paso2 <- merge(comunas,paso1 , by.x="codigo_comuna", by.y="r_p_c")
paso2 <- as.data.table(paso2)
paso2[codigo_provincia=="131", provincia:="Santiago"]
paso2[codigo_provincia=="132", provincia:="Cordillera"]
paso2[codigo_provincia=="133", provincia:="Chacabuco"]
paso2[codigo_provincia=="134", provincia:="Maipo"]
paso2[codigo_provincia=="135", provincia:="Melipilla"]
paso2[codigo_provincia=="136", provincia:="Talagante"]
ggplot(paso2, aes(x=curso, fill=sexo))+
geom_histogram()+
facet_wrap(facets="sexo")
## `stat_bin()` using `bins = 30`. Pick better value with `binwidth`.
### En este grafico queremos demostrar si existe una diferencia entre los niveles de cursos aprobados entre mujer y hombre de la region metropolitana, se puede analizar que tanto los hombres como las mujeres tienen una tendencia parecida, es decir, ambas tienen una distribucion aproximadamente simetrica, con varias personas que aprobaron la media (4 nivel) y se comportan los datos de forma parecida. Sin embargo, se puede visualizar que las mujeres sobresalen en la mayoria de los niveles del curso, por lo tanto, se puede decir que hay mayor cantidad de mujeres encuestadas.
ggplot(paso2, aes(x=curso, fill=provincia))+
geom_histogram()+
facet_wrap(facets="provincia")
## `stat_bin()` using `bins = 30`. Pick better value with `binwidth`.
### En este grafico podemos visualizar como se comportan las distintas provincias de la region metropolitana con respecto al nivel educacional aprobado por los distintos encuestados. Se puede concluir, que Santiago es la provincia con mas personas encuestadas que tienen un nivel educacional aprobado mayor a educacion media y a la vez, hay una mayor cantidad de encuestados. Melipilla tiene la menor cantidad de encuestados y asimismo, la menor cantidad de personas con nivel educacional superior a la media.
paso2[,con_mas_media:=1]
paso2[curso<5,con_mas_media:=0]
paso3<-paso2[,porcentaje:=mean(con_mas_media),by="codigo_comuna"]
paso3 <- distinct(paso3) %>%
select(codigo_comuna, geometry, porcentaje)
paso3 <- st_sf(paso3)
pal <- colorNumeric(
palette = "YlOrBr",
domain = paso3$porcentaje
)
mapa <- leaflet() %>%
addProviderTiles(providers$CartoDB.Positron) %>%
addPolygons(data = paso3,
fillColor = ~pal(porcentaje),
color = "#b2aeae",
fillOpacity = 0.7,
smoothFactor = 0.2,
weight = 1) %>%
addLegend(pal = pal,
values = paso3$porcentaje,
position = "bottomright",
title = "Promedio General") %>%
addScaleBar(position = "topright")
## Warning: sf layer has inconsistent datum (+proj=longlat +ellps=GRS80 +no_defs).
## Need '+proj=longlat +datum=WGS84'
mapa