El formato de respuesta es el siguiente:
Antes de la respuesta debes agregar un encabezado de tercer nivel (###) con P y el nĆŗmero de pregunta.
Abajo del encabezado, debe estar escrita la pregunta.
Agregar la linea de código.
Agregar el output de ser necesario.
Si requieres agregar alguna respuesta analĆtica, agregar al final de la pregunta (despuĆ©s del output).
El tĆtulo del informe debe tener un encabezado de primer nivel (#) y debe ser: Control 2.
El nombre del archivo .rmd debe tener la siguiente forma: Control 2 - Apellido.
TambiƩn debe enviar su archivo en formato R Markdown como respaldo.
Recuerde que puede usar todo el material visto para apoyarse.
El formato tiene puntaje.(3 ptos)
Suprimir warning y mensajes(3 ptos)
Rendimiento escolar en Chile.
Esta base de datos contiene información del rendimiento por alumno por comuna en el paĆs en el aƱo 2021 Podemos encontrar información detallada del alumno como el gĆ©nero, edad, asistencia, promedio, etc.
Cargue los siguientes paquetes: data.table,ggplot2,leaflet,sp,tidyverse,chilemapas, classInterval y RColorBrewer. (1 punto)
library(data.table)
library(ggplot2)
library(leaflet)
library(sp)
library(chilemapas)
library(tidyverse)
library(classInt)
Cargue la base de datos de rendimiento escolar. (2 puntos)
col <- fread('colegio_2021.csv')
Cuantos establecimientos hay en cada una de las regiones del paĆs. (2 puntos)
pais <- col[!duplicated(NOM_RBD),.(NOM_RBD,NOM_REG_RBD_A )]
pais1 <- pais[,.N,by='NOM_REG_RBD_A']
Muestre los resultados de la pregunta anterior graficamente. Agregue tĆtulo, subtĆtulo, fuente:Ministerio Educación, color (4 puntos)
ggplot(pais1,aes(x=NOM_REG_RBD_A,y=N)) + geom_col() +coord_flip()
¿Qué institución tiene el mÔs alto promedio general?. (3 puntos)
prom <- col[,mean(PROM_GRAL,na.rm=T), by='NOM_RBD']
Escoja una región, exceptuando la RM. Revise si existe alguna relación entre el promedio general y la asistencia. Grafique (4 puntos)
tercera <- col[COD_REG_RBD==03,]
ggplot(tercera,aes(x=PROM_GRAL,y=ASISTENCIA)) + geom_point() +coord_flip() + geom_smooth()
Respecto a la pregunta anterior, existe alguna diferencia entre genero?. Agregue tĆtulo, subtĆtulo, fuente:Ministerio Educación, color y nombre en el facet wrap. (6 puntos).
ggplot(tercera,aes(x=PROM_GRAL,y=ASISTENCIA)) + geom_point() +coord_flip() + geom_smooth()+facet_wrap(facets = 'GEN_ALU')
Muestre en un mapa el promedio general por comuna de la región elegida anteriormente. Este mapa debe tener colores mÔs intensos para aquellas comunas con mayor promedio. Para esto:
a.Cargue el mapa de las comunas.(3 puntos)
tercera_comunas <- mapa_comunas
tercera_comunas <- data.table(tercera_comunas)
tercera_comunas <- tercera_comunas[codigo_region=='03']
tercera_colegios <- tercera[,.(prom=mean(PROM_GRAL,na.rm=T)), by=.(COD_COM_RBD,NOM_COM_RBD)]
tercera_comunas$codigo_comuna <- as.integer(tercera_comunas$codigo_comuna)
tercera_colegios <- merge(tercera_colegios,tercera_comunas, by.x='COD_COM_RBD', by.y='codigo_comuna')
bins<-seq(4.5,6,0.5)
paleta<-colorBin(palette = 'Greens',domain = tercera_colegios$prom,bins = bins)
labels <- sprintf(
"<strong>Comuna: %s</strong><br/>Promedio general %g ",
tercera_colegios$NOM_COM_RBD, tercera_colegios$prom
) %>% lapply(htmltools::HTML)
tercera_colegios <- st_sf(tercera_colegios)
leaflet(tercera_colegios)%>%
addProviderTiles(provider = providers$OpenStreetMap)%>%
addPolygons(
fillColor = ~paleta(prom),
weight = 2,
opacity = 1,
color = "black",
dashArray = "2",
fillOpacity = 0.3,
label = labels)%>%
addLegend(pal = paleta, values = ~bins, opacity = 1,position = "bottomright",title ="Promedio Final")%>%
setView(lng = -70.35, lat = -27.37, zoom = 7) #-27.395581,-72.1740378
Utilice la función de classIntervals para crear 6 intervalos de los promedios. Utilice el style visto en clases . Por último, haga un mapa de ggplot2 con el fill de la variable categórica creada (la de los intervalos). (6 puntos)
breaks_pretty <- classIntervals(tercera_colegios$prom, style = "pretty",n=6)
tercera_colegios$pretty <- cut(tercera_colegios$prom,breaks = breaks_pretty$brks, include.lowest = T)
ggplot() +
geom_sf(tercera_colegios,mapping=aes(geometry=geometry, fill=pretty))+
scale_fill_viridis_d(name="Intervalos") +
coord_sf(xlim = c(-72.35,-66), ylim = c(-30.37,-25.37)) +
theme_void() + labs(title="Rendimiento 2021" , subtitle = "En la región de Atacama", caption = "Fuente: Ministerio de Educación")
Realice un mapa de circulos con los puntos de cada uno de los establecimientos en la región que eligeron. (6 puntos)