Limpiamos el environment

rm(list=ls())

Cargamos los paquetes necesarios

library(data.table)
library(tidyverse)
library(leaflet) 
library(sp)
library(broom)
library(janitor) 
library(rgbif) 
library(RColorBrewer)
library(ggplot2)
library(plotly)

Cargamos base de datos Rendimiento_2018 de la clase 7

rend_2018 <- fread("~/Desktop/Rendimiento_2018.csv")
rend_2018 <- as.data.table(rend_2018)

Pregunta central:

¿Se podría decir que los alumnos de colegios de la capital tienen mejor rendimiento que los alumnos de colegios de región?

Creamos objeto que contenga el promedio del “promedio general” por región

prompromgral <- rend_2018[, mean(prom_gral), by= nom_reg_rbd_a]

Graficamos mediante un histograma

ggplot(prompromgral,aes(x=nom_reg_rbd_a,
y= V1)) + geom_histogram(fill = "dark green", stat = "identity") + 
  labs(x="Región", y="Promedio General", title="Rendimiento alumnos" , subtitle = "Por regiones", caption = "Fuente: MINEDUC") +  theme(axis.text.x = element_text(angle=90, vjust=0.5))

Interpretación: Podemos notar ciertas diferencias respecto a la region metropolitana con algunas regiones donde le promedio general es más alto. Sin embargo, estos datos no logran ser de gran relevancia, al no ser una muestra significativa ni representativa en algunas regiones, reflejado en las pocas observaciones (como por ejemplo la región de Magallanes, siendo este el promedio general más alto)

Creamos objeto que contenga el promedio general del “promedio general” por comunas

rm <- rend_2018[nom_reg_rbd_a == "RM"]

regionrm1<- rm[, mean(prom_gral), by= nom_com_rbd]

Graficamos mediante un histograma

ggplot(regionrm1,aes(x=nom_com_rbd,
y= V1)) + geom_histogram(fill = "dark green", stat = "identity") + 
  labs(x="Comuna", y="Promedio General", title="Rendimiento alumnos" , subtitle = "Por comunas", caption = "Fuente: MINEDUC") +  theme(axis.text.x = element_text(angle=90, vjust=0.5))

Interpretación: Se puede observar que, las comunas con mayor rendimiento en los colegios de la región metropolitana se encuentran en las comunas de Lo Barnechea, Vitacura y Las Condes.

Pregunta secundaria:

¿Dónde se encuentran ubicadas las comunas con mayor rendimiento en los colegios de la región metropolitana?

leaflet() %>% 
  addProviderTiles(providers$CartoDB.Positron) %>% 
  addMarkers(lat=-33.366475823123444
, lng=-70.58122878873604
)
leaflet() %>% 
  addProviderTiles(providers$CartoDB.Positron) %>% 
  addMarkers(lat=-33.32165211781281
, lng=-70.58122878873604
)
leaflet() %>% 
  addProviderTiles(providers$CartoDB.Positron) %>% 
  addMarkers(lat=-33.34780262135686
, lng=-70.51131500192902
)

Para cerrar, los mejores rendimientos de la región metropolitana se encuentran en los sectores orientes del mismo. Esto, sumado al conocimiento que estas zonas particulares de la region cuentan con los mayores ingresos promedio, se podría llegar a la conclución (de tener estos datos a mano para confirmar) que existe una relación positiva entre ingresos y rendimiento.

Ingresos por comuna https://www.24horas.cl/data/hasta-siete-veces-mas-dinero-por-habitante-la-enorme-diferencia-en-los-presupuestos-de-las-municipalidades-en-chile-3556524