Introducción

ICFES son las siglas de Instituto Colombiano para el Fomento de la Educación Superior. Este organismo es el encargado de promover la educación superior en Colombia. En sus inicios, fue creada para evaluar a los alumnos cursando su último año de bachillerato y por lo tanto, muchas universidades desde entonces lo han tenido en cuenta para sus procesos de admisión.

Con el decreto 1324 de 2009, se cambio el nombre de ICFES a Pruebas Saber pro. Está estipulado que los alumnos que obtengan los diez primeros puntajes del departamento o capital, reciben una distinción, además, de recibir descuentos para estudiar en varias universidades de hasta el 75% o incluso becas completas.

El examen consta de preguntas realizadas sobre distintas áreas de formación tales como matemáticas, ciencias sociales, lenguaje, biología, filosofía, química, física e inglés.

Sabiendo ya la importancia de las pruebas saber, se planea realizar un estudio comparativo, del resultado(variable que sera creada) entre los colegios publicos y privados del Valle de Aburrá, para eso compararemos instituciones con el mismo nivel de riqueza(variable que sera creada) y de la misma jornada.

En el estudio comparativo se espera encontrar si los colegios privados tienen mejores resultados sobre los colegios publicos y cuales variables afectan primordialmente este resultado.

Retos

  • Contextualizar la base de datos

  • Crear la variable resultado, nivel de riqueza del estudiante y nivel de riqueza del colegio

  • Realizar un análisis comparativo entre los colegios del Valle de Aburra

  • Obtener conclusiones con respecto al análisis

Contextualización del conjunto de datos

El resultado de las pruebas saber indican de alguna manera no solo el nivel académico del estudiante, sino también el nivel académico del colegio o establecimiento, pero el ICFES, además, de realizar las pruebas saber, también recolecta a la par información del estudiante que la presenta, como del establecimiento educativo al que pertenece.

Con la aplicación del examen Saber 11, los estudiantes deben diligenciar encuestas que indagan sobre información personal, información socioeconómica, entre otros. En el cojunto de datos de las pruebas saber podemos econtrar la siguiente información

    1. Información personal: Este módulo indaga por aspectos como el género del estudiante, pertenencia a una etnia, discapacidades, lugar de residencia, entre otros.
    1. Información Académica y de citación: Este módulo indaga por aspectos cómo el colegio al que pertenece el estudiante, valor de la pensión que paga en su colegio (en caso de que lo haga), entre otros.
    1. Información socioeconómica: Este módulo indaga por aspectos familiares como el nivel educativo de los padres, su ocupación, servicios con los que cuenta el hogar, entre otros.

El conjunto de datos con el que se trabajara corresponde a las pruebas saber 11 del segundo semestre del año 2013, este cojunto de datos contiene información de los tres modulos(Información personal, Información académica, Información socioeconómica)

En el siguiente link pueden encontrar un diccionario con algo de información y descripción de algunas de las variables.

Creación de la variable resultado

Como se realizara un estudio comparativo con el resultado de los estudiantes, se debe crear esta variable(resultado), ya que no esta presente y así poderse utilizar.

Como primer paso se lee la base de datos

load(file = "baseICFEStrabajo.RData") # se carga la base de datos
levels(datos$COLE_INST_JORNADA) <- c('COMPLETA U ORDINARIA', 'MAÑANA', 'NOCHE', 'SABATINA - DOMINICAL', 'TARDE') # redifinicion de los niveles, de la variable COLE_INST_JORNADA

En la base de datos se puede encontrar la variable ESTU_PUESTO, su rango esta entre 1 y 1000 e indica el puesto del estudiante en la prueba, esto es una ordenación de los evaluados en 1000 posiciones, en base a las 8 asignaturas base del examen, se puede decir que quienes ocuparon un puesto entre 1 y 200 obtuvieron los mejores desempeños.

Con la variable ESTU_PUESTO se crea la variable resultado

resultado <- cut(datos$ESTU_PUESTO, breaks=(0:10)*100) # con cut creamos intervalos

Resultado es una variable categórica, con 10 niveles, de la siguiente manera (0,100], (100, 200], …, (900, 1000], es decir, que según el puesto que ocupo el estudiante se le sera asignada una de las 10 categorías.

Creación de la variable pobreza(nivel de riqueza del estudiante)

Utilizando las variables socioeconómicas de los estudiantes, se creará una variable con 10 categorías, donde la categoría 1 representa a los estudiantes más pobres y la categoría 10 represente los más ricos.

Se debe seleccionar una base de datos solo con las variables que nos proporciona información socioeconómica.

Datos_sel <- datos[ , c('ESTU_ESTRATO',
                        'ECON_CUARTOS',
                        'FAMI_NIVEL_SISBEN',
                        'ECON_MATERIAL_PISOS',
                        'ECON_PERSONAS_HOGAR',
                        'ECON_SN_TELEFONIA',
                        'ECON_SN_CELULAR',
                        'ECON_SN_INTERNET',
                        'ECON_SN_SERVICIO_TV',
                        'ECON_SN_COMPUTADOR',
                        'ECON_SN_LAVADORA',
                        'ECON_SN_NEVERA',
                        'ECON_SN_HORNO',
                        'ECON_SN_DVD',
                        'ECON_SN_MICROHONDAS',
                        'ECON_SN_AUTOMOVIL',
                        'FAMI_ING_FMILIAR_MENSUAL',
                        'ESTU_TRABAJA')] # selección de variables

str(Datos_sel) # Estructura de las variables
## 'data.frame':    547285 obs. of  18 variables:
##  $ ESTU_ESTRATO            : int  2 3 3 3 3 3 3 3 2 4 ...
##  $ ECON_CUARTOS            : int  2 5 2 4 4 2 2 2 2 2 ...
##  $ FAMI_NIVEL_SISBEN       : int  1 1 5 4 5 5 3 5 5 5 ...
##  $ ECON_MATERIAL_PISOS     : int  2 4 4 4 4 4 4 4 4 4 ...
##  $ ECON_PERSONAS_HOGAR     : int  3 7 4 6 4 3 4 3 4 4 ...
##  $ ECON_SN_TELEFONIA       : int  1 1 1 1 1 1 1 1 1 1 ...
##  $ ECON_SN_CELULAR         : int  1 1 1 1 1 1 1 1 1 1 ...
##  $ ECON_SN_INTERNET        : int  0 1 1 1 1 1 1 1 1 1 ...
##  $ ECON_SN_SERVICIO_TV     : int  0 1 1 1 1 1 1 1 1 1 ...
##  $ ECON_SN_COMPUTADOR      : int  1 1 1 1 1 1 1 1 1 1 ...
##  $ ECON_SN_LAVADORA        : int  0 1 1 1 1 1 1 1 1 1 ...
##  $ ECON_SN_NEVERA          : int  1 1 1 1 1 1 1 1 1 1 ...
##  $ ECON_SN_HORNO           : int  1 1 1 0 1 1 1 1 1 1 ...
##  $ ECON_SN_DVD             : int  1 1 1 1 1 0 1 1 0 1 ...
##  $ ECON_SN_MICROHONDAS     : int  1 1 1 0 1 1 1 1 0 1 ...
##  $ ECON_SN_AUTOMOVIL       : int  0 1 1 0 1 0 0 0 0 1 ...
##  $ FAMI_ING_FMILIAR_MENSUAL: int  2 2 5 3 3 2 3 3 3 6 ...
##  $ ESTU_TRABAJA            : int  2 1 1 1 1 1 2 1 1 1 ...

De la salida anterior se observa que las variables tienen una estructura numérica, estás deben ser transformadas a variable de tipo factor.

Se transforman las variables numéricas a categóricas, haciendo uso de un ciclo.

for (i in 1:length(names(Datos_sel))) {
  Datos_sel[ ,i] <- as.factor(Datos_sel[ ,i]) # transformando la variable
                                               # a categórica
}

Datos_sel <- na.omit(Datos_sel) # quitamos los NA's de nuestra base de datos

Para crear la variable pobreza se hará uso del análisis de correspondencia múltiple.

El análisis de correspondencia múltiple (MCA) es una extensión del análisis de correspondencia simple para resumir y visualizar una tabla de datos que contiene más de dos variables categóricas. También puede verse como una generalización del análisis de componentes principales cuando las variables a analizar son categóricas en lugar de cuantitativas (Abdi y Williams 2010).

Cargamos las librerias

library("FactoMineR")
library("factoextra")

Primero se utilizará MCA para Seleccionar las variables más importantes en la creación de nuestra variable.

Aplicando MCA

res.mca <- MCA(Datos_sel, graph = FALSE) # se aplica MCA

Se Visualizan los porcentajes de varianza explicados por cada dimensión de MCA

fviz_screeplot(res.mca, addlabels = TRUE, ylim = c(0, 45)) #grafico de varianza

Se puede observar que con la primera componente se logra explicar un 10.8% de la variabilidad total del conjunto de datos, lo cual es mas bien bajo. Sin embargo, se utilizara la primera dimensión de MCA, con el fin de obtener las variables mas relevantes en dicha componente.

Se gráfica la contribución de las variables a la componente 1

# contribucción de las variables a la primera dimensión
fviz_contrib(res.mca, choice = "var", axes = 1, top = 20, title = "Contribucción de las variable a Dim-1")

Se observa que las variables más contribuyentes a la formación de la primera componente para la creación de un indice de pobreza, son:

  • ECON_SN_COMPUTADOR(En el hogar del estudiante tienen o no computador)
  • ECON_SN_INTERNET(En el hogar del estudiante tienen o no conexion a internet)
  • ECON_SN_MICROHONDAS(En el hogar del estudiante tienen o no horno microondas)
  • ECON_SN_LAVADORA(En el hogar del estudiante tienen o no horno lavadora)
  • ESTU_ESTRATO(Estrato socioeconomico del hogar del estudiante)
  • FAMI_NIVEL_SISBEN(Nivel de sisben del estudiante)
  • FAMI_ING_FMILIAR_MENSUAL(Ingresos economicos en el hogar del estudiante)
  • ECON_SN_TELEFONIA(En el hogar del estudiante tienen o no telefonia)
  • ECON_SN_SERVICIO_TV(En el hogar del estudiante tienen o no servicio de TV)
  • ECON_MATERIAL_PISOS(Material del piso en el hogar del estudiante)
  • ECON_SN_AUTOMOVIL(En el hogar del estudiante tienen o no automovil)

Se seleccionan solo las variables a utilizar

Datos_indice <- Datos_sel[ ,c('ECON_SN_COMPUTADOR',
                              'ECON_SN_INTERNET',
                              'ECON_SN_MICROHONDAS',
                              'ECON_SN_LAVADORA',
                              'ESTU_ESTRATO',
                              'FAMI_NIVEL_SISBEN',
                              'FAMI_ING_FMILIAR_MENSUAL',
                              'ECON_SN_TELEFONIA',
                              'ECON_SN_SERVICIO_TV',
                              'ECON_MATERIAL_PISOS',
                              'ECON_SN_AUTOMOVIL')] #seleccion de variables

Datos_indice <- na.omit(Datos_indice) # se eliminan las filas con NA's

Para la creación del indice, se realiza un nuevo MCA, esta vez solo con las variables seleccionadas anteriormente.

Se aplica MCA Para obtener el indice

res.mcaI <- MCA(Datos_indice, graph = FALSE) #Aplicacion de MCA

Se Visualizan los porcentajes de varianza, explicados por cada dimensión de MCA

fviz_screeplot(res.mcaI, addlabels = TRUE, ylim = c(0, 22)) #grafico de varianza explicada

Con la primera dimensión se logra explicar un 19.9% de la variabilidad del conjunto de datos; la primera dimensión se utilizara como indice de pobreza, ya que mediante esta técnica, MCA asigna unos pesos de manera automática a las variables seleccionadas anteriormente.

Se sacara los valores que asigna la dimensión 1 a cada uno de los datos, estos valores ya están ponderados por un peso que se es asignado a cada variable mediante MCA.

Pobreza <- res.mcaI$ind$coord[,1] #Se obtiene la dimensión 1

La forma en que se distribuye la variable Pobreza es de tal forma que los valores más pequeños indican un nivel bajo en el indice y los valores más grandes, un nivel más alto.

Se creara una variable categórica que se llamará Pobreza, con 10 niveles, comenzando con el 1 como el más bajo, hasta llegar al nivel 10 que significa un nivel de riqueza mas grande.

Pobreza <- cut(Pobreza, breaks = 10, labels = 1:10) # Creacion de la variable, cut transforma una variable continua en categorica

Gráfico de barras para la variable Pobreza.

plot(Pobreza, xlab = 'Indicador de pobreza',
     main = 'Grafico de barras para la variable pobreza',
     ylab = '', col = 'cyan4')
grid()

Se observa que los niveles 1 y 2 son los que tienen la mayor frecuencia, es decir, que hay una gran cantidad de estudiantes en situaciones de pobreza, mientras que los niveles del 3 al 8 la frecuencia son mas o menos parecidas, para los niveles 9 y 10, los mas ricos, se observa pocos registros, es decir, que hay una mayor cantidad de estudiantes pobres que ricos.

Base de datos final, con la variable Pobreza y resultado, creadas anteriormente.

indices <- row.names(Datos_indice) #Indices de la base de datos 
DatosFinal <- datos
DatosFinal$resultado <- resultado #agregamos la variable resultado
DatosFinal <- DatosFinal[indices, ] # selecionamos los datos con los que creamos la variable
DatosFinal$pobreza <- Pobreza #agregamos la variable pobreza

Creación de la variable RiquezaColegio(nivel de riqueza del colegio)

A cada colegio se le calcula una medida de posición socioeconómica de acuerdo al indicador de pobreza creado anteriormente. Sera el promedio de los niveles del indicador de pobreza de los estudiantes que tomaron la prueba Saber en esa institución. Luego se crean 10 grupos usando los deciles, para clasificar los colegios desde los más pobres hasta los más ricos. Se crea una variable para que todos los estudiantes tengan el indicador de riqueza del colegio donde están estudiando.

Se calcula una medida de posición socioeconómica a cada colegio de acuerdo al indicador de pobreza, esto será posible utilizando la variable CODIGO_DANE, la cual es un identificador único de colegio, luego se agrupa por esa misma variable y se saca el promedio de pobreza a cada institución, a partir del indicador de pobreza del estudiante.

require(tidyverse)

PobrezaColegio <- DatosFinal %>%
  select(CODIGO_DANE, pobreza) %>% # Seleccion de variables
  group_by(CODIGO_DANE)  %>% # agrupamos por colegio
  summarize(mediaPobreza = mean(as.numeric(pobreza))) # sacamos la media
                                                      #de pobreza a cada colegio

Se clasifican los colegios, en 10 grupos, correspondientes a los deciles, según su nivel de riqueza.

PobrezaColegio$RiquezaColegio <- with(PobrezaColegio,
                                      cut(mediaPobreza,
                                          breaks=quantile(mediaPobreza,
                                                          probs=seq(0,1, by=0.1),
                                                          na.rm=TRUE),
                                          include.lowest=TRUE)) # con cut se crea una variable de tipo factor y con probs las categorias son asignadas por los deciles.

levels(PobrezaColegio$RiquezaColegio) <- 1:10 # cambiando los nombres de los factores

Ahora, se tiene por cada colegio a que grupo pertenece en el nivel de pobreza, el siguiente paso será añadir esa nueva información a la base de datos, creando así una nueva variable que para cada estudiante indica el nivel de pobreza del colegio, donde 1 es el más bajo y 10 el más alto.

# Union de la base datos con merge

DatosFinal <- merge(DatosFinal,
                    PobrezaColegio[,c("CODIGO_DANE", "RiquezaColegio")],
                    by = "CODIGO_DANE",
                    all.x = T) # all.x queremos conservar todos los registros de                                     DatosFinal

Análisis comparativo entre los colegios del Valle de Aburra

Se realizará un análisis comparativo del Resultado, entre los colegios privados y los colegios públicos de los municipios del Valle de Aburrá, los colegios tendran el mismo nivel de riqueza y seran de la misma jornada.

Separando los colegios que son del Valle de Aburrá

require(tidyverse)
DatosAburra <- DatosFinal %>%
        filter(ESTU_RESIDE_MCPIO %in% c('CALDAS','ESTRELLA','SABANETA','ITAGUI','ENVIGADO','MEDELLIN','BELLO','COPACABANA','GIRARDOTA','BARBOSA'), ESTU_RESIDE_DEPT == 'ANTIOQUIA') # filtro para seleccionar los estudiantes del valle de aburra

Gráfico para la variable que mide la riqueza del colegio.

plot(DatosAburra$RiquezaColegio, main = 'Distrubución del nivel de riqueza del colegio', col = 'cyan4', ylab = 'Frecuencia', xlab = 'Riqueza del colegio') # grafico de barras
grid() # grilla

Del gráfico anterior se observa que hay muy pocos colegios que tiene un nivel de riqueza 1, 2, 3 o 4; mientras que la mayoría de los colegios se acumulan en los niveles 8 y 9, por lo tanto da idea de que los colegios tienen niveles de riqueza mas bien altos.

Gráfico de barras para la variable que representa el resultado del colegio.

par(mar = c(7,3,3,3))
plot(DatosAburra$resultado, las = 2, main = 'Distribuccion del resultado del estudiante', col = 'cyan4', ylab = 'Frecuencia') # grafico de barras
grid() # grilla

Del gráfico anterior se observa como este decrece a medida que aumenta el resultado, indicando que entre mas alto sea el resultado, menor cantidad de estudiantes se pueden encontrar.

Tabla de medias agrupando por el nivel de riqueza del colegio, la jornada y naturaleza del colegio; las medias de la tabla se sacaron de la variable ESTU_PUESTO, que es una variable continua que indica el puesto del colegio y es similar a la variable resultado que fue creada anteriormente, por lo tanto los resultados son acordes a la variable resultado

require(kableExtra)
require(tidyverse)
DatosAburra %>%
  group_by(RiquezaColegio, COLE_INST_JORNADA, COLE_NATURALEZA) %>% # agrupamiento de                                                                          variables
  
  summarize(Media_de_resultado = mean(ESTU_PUESTO)) %>% # sacando la media
  kable(align = 'c') %>% # creando una tabla bonita con kable
  kable_paper('striped', full_width = F) %>%
  scroll_box(width = "100%", height = "300px") #barra para mover la tabla
RiquezaColegio COLE_INST_JORNADA COLE_NATURALEZA Media_de_resultado
1 COMPLETA U ORDINARIA N 882.0000
1 COMPLETA U ORDINARIA O 794.0000
2 COMPLETA U ORDINARIA N 792.1000
2 COMPLETA U ORDINARIA O 690.0000
2 MAÑANA O 737.0000
3 COMPLETA U ORDINARIA N 734.2333
3 COMPLETA U ORDINARIA O 680.6667
3 NOCHE O 737.6667
3 SABATINA - DOMINICAL O 655.0000
3 TARDE O 527.4490
4 COMPLETA U ORDINARIA O 653.4783
4 MAÑANA N 565.7412
4 MAÑANA O 484.8182
4 NOCHE N 669.1364
4 NOCHE O 701.7179
4 SABATINA - DOMINICAL O 707.3684
4 TARDE O 552.9200
5 COMPLETA U ORDINARIA O 491.4000
5 MAÑANA N 616.9816
5 MAÑANA O 563.0892
5 NOCHE N 741.9351
5 NOCHE O 661.2353
5 SABATINA - DOMINICAL N 711.1752
5 SABATINA - DOMINICAL O 603.5714
5 TARDE N 652.8750
5 TARDE O 518.9788
6 COMPLETA U ORDINARIA N 729.0400
6 COMPLETA U ORDINARIA O 460.6190
6 MAÑANA N 578.1702
6 MAÑANA O 548.8641
6 NOCHE N 777.0984
6 NOCHE O 702.4755
6 SABATINA - DOMINICAL N 712.6018
6 SABATINA - DOMINICAL O 708.9612
6 TARDE N 635.1840
6 TARDE O 560.6448
7 COMPLETA U ORDINARIA N 399.6099
7 COMPLETA U ORDINARIA O 484.2000
7 MAÑANA N 590.3804
7 MAÑANA O 494.4052
7 NOCHE N 713.0833
7 NOCHE O 697.7345
7 SABATINA - DOMINICAL N 717.6069
7 SABATINA - DOMINICAL O 697.5995
7 TARDE N 598.2825
7 TARDE O 522.7272
8 COMPLETA U ORDINARIA N 345.4146
8 MAÑANA N 566.9502
8 MAÑANA O 473.2810
8 NOCHE N 675.2000
8 NOCHE O 687.0873
8 SABATINA - DOMINICAL N 663.9880
8 SABATINA - DOMINICAL O 658.2414
8 TARDE N 592.1319
8 TARDE O 476.0427
9 COMPLETA U ORDINARIA N 334.1702
9 COMPLETA U ORDINARIA O 260.6174
9 MAÑANA N 490.2283
9 MAÑANA O 377.4775
9 NOCHE N 587.7163
9 NOCHE O 674.8717
9 SABATINA - DOMINICAL N 624.9689
9 TARDE N 586.4528
9 TARDE O 418.4079
10 COMPLETA U ORDINARIA N 205.5991
10 MAÑANA N 233.5362
10 MAÑANA O 313.5440
10 NOCHE N 641.3235
10 NOCHE O 350.6923
10 SABATINA - DOMINICAL N 660.6064
10 TARDE N 231.8442
10 TARDE O 363.2128

De la anterior tabla se observa que cuando tenemos un mismo nivel de riqueza y jornada del colegio y variamos en la naturaleza del colegio, la media del puesto del estudiante cambia, generalmente se obtiene un mayor promedio en los colegios no oficiales, por lo que se puede pensar, que colegios no oficiales, tienen mejores resultados, aunque tengan la misma jornada y nivel de riqueza que colegios oficiales.

Boxplot para la variable ESTU_PUESTO en función de la riqueza del colegio

Recordemos que la variable ESTU_PUESTO es similar a la variable resultado, ya que esta fue creada a partir de la otra, por lo tanto lo que afecta a una afecta a la otra.

boxplot(ESTU_PUESTO ~ RiquezaColegio, data = DatosAburra, ylab = 'Puesto del estudiante', xlab = 'Riqueza del colegio', main = 'Puesto del estudiante en funcion de la riqueza del colegio', col = 'cyan4') # grafico boxplot
grid() #grilla

Del gráfico anterior se podría pensar que los colegios con un nivel de riqueza 1 tienen los mejores resultados, sin embargo, en este nivel las observaciones son muy pocas para sacar conclusiones. Pero si se puede pensar que el resultado del estudiante se ve afectado por la riqueza del colegio; el nivel 10 tiene la media mas baja que los otros, sin embargo, también cuenta con muchas observaciones atípicas.

Boxplot para la variable ESTU_PUESTO en función de la jornada del colegio

par(mar = c(11,3,1,3)) # margenes del grafico
boxplot(ESTU_PUESTO ~ COLE_INST_JORNADA, data = DatosAburra, las = 2, xlab = '', sub = 'Jornada del colegio', ylab = 'Puesto del estudiante', main = 'Puesto del estudiante en función de la jornada del colegio', col = 'cyan4') # grafico boxplot
grid() #grilla

Del gráfico anterior de observa como la media del resultado cambia en los diferentes niveles de la jornada del colegio, teniendo medias mas altas el nivel noche y sabatina-dominical, aunque se observan valores atípicos en el nivel completa u ordinaria, por lo que se puede pensar que la jornada del colegio afecta el resultado del estudiante.

Boxplot para la variable ESTU_PUESTO en función de la naturaleza del colegio

boxplot(ESTU_PUESTO ~ COLE_NATURALEZA, data = DatosAburra, xlab = 'Naturaleza del colegio', ylab = 'Puesto del estudiante', main = 'Puesto del estudiante en función de la naturaleza del colegio', col = 'cyan4')
grid()

Del gráfico anterior se observa una leve diferencia en la media entre los dos tipos de colegio, aunque parece haber mayor cantidad de colegios no oficiales; se puede pensar a simple vista que los estudiantes de colegios oficiales tienen mejores resultados.

Se crearan tablas de contingencia para comparar el resultado de colegios oficiales v.s no oficiales; teniendo en cuenta que solo se compararan colegios con el mismo nivel de riqueza y jornada.

tablas2 <- list() #lista vacia
tablas <- list() #lista vacia
nombres <- list() # lista vacia
aux <- 1 # contador
for (i in levels(DatosAburra$RiquezaColegio)) { #ciclo en los niveles de riqueza
  for (j in levels(DatosAburra$COLE_INST_JORNADA)) { # ciclo en los niveles de jornada
     datosTabla <- DatosAburra[DatosAburra$RiquezaColegio == i & DatosAburra$COLE_INST_JORNADA == j, ] # data.frame para tener colegios en el mismo nivel                                          de riqueza y jornada 
     
     if(dim(datosTabla)[1] >= 30){ # condicion para sacar tablas con mas de 30                                               observaciones
       tablas[[aux]] <- prop.table(table(datosTabla$resultado, datosTabla$COLE_NATURALEZA), 2)# tabla                                                                           de contigencia con proporciones por columna.
       tablas2[[aux]] <-table(datosTabla$resultado, datosTabla$COLE_NATURALEZA) #tablas sin proporciones
       nombres[[aux]] <- c(i,j) # lista con el nombre de cada tabla
       aux = aux + 1 # contador
     }
  }
}

A continuación se presenta diferentes tablas de contingencia de colegios con el mismo nivel de riqueza y jornada, no se presentan todas ya que hay varias sin casi observaciones, donde la mayoría de sus valores son ceros.

Tabla para nivel de riqueza 3 y jornada completa u ordinaria

require(kableExtra)
kable(tablas[[1]], align = 'c', col.names = c('NO OFICIAL', 'OFICIAL')) %>%
  kable_paper('striped', full_width = F) %>%
  footnote(general = "Resultado de los estudiantes comparado con colegios no oficiales y oficiales 
           con nivel de riqueza 3 y jornada completa u ordinaria")
NO OFICIAL OFICIAL
(0,100] 0.0000000 0.0000000
(100,200] 0.0333333 0.0000000
(200,300] 0.0333333 0.0000000
(300,400] 0.0000000 0.0000000
(400,500] 0.1000000 0.0000000
(500,600] 0.1666667 0.6666667
(600,700] 0.0333333 0.0000000
(700,800] 0.0666667 0.0000000
(800,900] 0.2333333 0.0000000
(900,1e+03] 0.3333333 0.3333333
Note:
Resultado de los estudiantes comparado con colegios no oficiales y oficiales
con nivel de riqueza 3 y jornada completa u ordinaria

La anterior tabla presenta muy pocos datos para sacar conclusiones, asi que no podemos decir mucho de esta tabla, solo que en el Valle de Aburrá hay pocos colegios que tienen un nivel de riqueza 3 y jornada completa u ordinaria

Tabla para nivel de riqueza 3 y jornada tarde

kable(tablas[[2]], align = 'c', col.names = c('NO OFICIAL', 'OFICIAL')) %>%
  kable_paper('striped', full_width = F) %>%
  footnote(general = "Resultado de los estudiantes comparado con colegios no oficiales y oficiales 
           con nivel de riqueza 3 y jornada tarde")
NO OFICIAL OFICIAL
(0,100] NaN 0.0000000
(100,200] NaN 0.1428571
(200,300] NaN 0.0612245
(300,400] NaN 0.1020408
(400,500] NaN 0.2244898
(500,600] NaN 0.0816327
(600,700] NaN 0.1632653
(700,800] NaN 0.0612245
(800,900] NaN 0.0408163
(900,1e+03] NaN 0.1224490
Note:
Resultado de los estudiantes comparado con colegios no oficiales y oficiales
con nivel de riqueza 3 y jornada tarde

En la anterior tabla sucede algo muy particular y es que no hay observaciones para los colegios no oficiales, en este caso para las instituciones con un nivel de riqueza 3 y jornada tarde solo tenemos datos para los colegios oficiales y un 22% de los estudiantes de estos colegios tuvieron un resultado entre (400, 500], que es como algo medio, ni bueno ni malo, aunque si se observa que son mas bien pocos los estudiantes con buenos resultados.

Tabla para nivel de riqueza 4 y jornada mañana

kable(tablas[[3]], align = 'c', col.names = c('NO OFICIAL', 'OFICIAL')) %>%
  kable_paper('striped', full_width = F) %>%
  footnote(general = "Resultado de los estudiantes comparado con colegios no oficiales y oficiales 
           con nivel de riqueza 4 y jornada mañana")
NO OFICIAL OFICIAL
(0,100] 0.0000000 0.0909091
(100,200] 0.0705882 0.0454545
(200,300] 0.0823529 0.1363636
(300,400] 0.0823529 0.1363636
(400,500] 0.2235294 0.0909091
(500,600] 0.1176471 0.1363636
(600,700] 0.1294118 0.1363636
(700,800] 0.0705882 0.1363636
(800,900] 0.0941176 0.0681818
(900,1e+03] 0.1294118 0.0227273
Note:
Resultado de los estudiantes comparado con colegios no oficiales y oficiales
con nivel de riqueza 4 y jornada mañana

En la anterior tabla se observa que hay una observación vacía para los colegios no oficiales, teniendo en cuenta que el calculo se hizo dividiendo cada observación por el total de la columna, se debe comparar de forma horizontal el resultado; vemos algunas grandes diferencias, como en (300, 400], (400, 500], (700, 800], indicando que puede existir alguna relación entre las variables que esta afectando las proporciones.

Tabla para nivel de riqueza 4 y jornada noche

kable(tablas[[4]], align = 'c', col.names = c('NO OFICIAL', 'OFICIAL')) %>%
  kable_paper('striped', full_width = F) %>%
  footnote(general = "Resultado de los estudiantes comparado con colegios no oficiales y oficiales 
           con nivel de riqueza 4 y jornada noche")
NO OFICIAL OFICIAL
(0,100] 0.0000000 0.0256410
(100,200] 0.0454545 0.0512821
(200,300] 0.0454545 0.0000000
(300,400] 0.0909091 0.0512821
(400,500] 0.1363636 0.0769231
(500,600] 0.1363636 0.0769231
(600,700] 0.0000000 0.1282051
(700,800] 0.1818182 0.1282051
(800,900] 0.0909091 0.2307692
(900,1e+03] 0.2727273 0.2307692
Note:
Resultado de los estudiantes comparado con colegios no oficiales y oficiales
con nivel de riqueza 4 y jornada noche

Teniendo en cuenta que el calculo se hizo dividiendo cada observación por el total de la columna, se debe comparar de forma horizontal el resultado; vemos algunas grandes diferencias, como en (400, 500], (500, 600], (800, 900], indicando que puede existir alguna relación entre las variables que esta afectando las proporciones; aunque no podemos decir si los colegios oficiales tienen mejores resultados que los colegios no oficiales, ya que en algunos casos es mayor el porcentaje en colegios oficiales y viceversa, esto puede deberse a falta de datos en la tabla.

Tabla para nivel de riqueza 5 y jornada mañana

kable(tablas[[5]], align = 'c', col.names = c('NO OFICIAL', 'OFICIAL')) %>%
  kable_paper('striped', full_width = F) %>%
  footnote(general = "Resultado de los estudiantes comparado con colegios no oficiales y oficiales 
           con nivel de riqueza 5 y jornada mañana")
NO OFICIAL OFICIAL
(0,100] 0.0245399 0.0191083
(100,200] 0.0429448 0.0859873
(200,300] 0.0674847 0.0828025
(300,400] 0.0797546 0.1210191
(400,500] 0.0490798 0.1178344
(500,600] 0.1411043 0.0955414
(600,700] 0.1963190 0.1273885
(700,800] 0.1533742 0.1242038
(800,900] 0.1288344 0.1337580
(900,1e+03] 0.1165644 0.0923567
Note:
Resultado de los estudiantes comparado con colegios no oficiales y oficiales
con nivel de riqueza 5 y jornada mañana

En este caso comparamos instituciones de nivel de riqueza 5 y jornada mañana, que son un poco mas comunes que los anteriores colegios, aunque en el gráfico de barras el nivel 5 no era el de mayor proporción.

Teniendo en cuenta que el calculo se hizo dividiendo cada observación por el total de la columna, se debe comparar de forma horizontal el resultado; vemos algunas grandes diferencias, como en (300, 400], (400, 500], (500, 600], indicando que puede existir alguna relación entre las variables que está afectando las proporciones; generalmente se observa que entre mas bajito es el resultado, mas grande es la proporción en los colegios oficiales, mientras que mas alto es el resultado, mayor proporción en colegios no oficiales.

Tabla para nivel de riqueza 5 y jornada noche

kable(tablas[[6]], align = 'c', col.names = c('NO OFICIAL', 'OFICIAL')) %>%
  kable_paper('striped', full_width = F) %>%
  footnote(general = "Resultado de los estudiantes comparado con colegios no oficiales y oficiales 
           con nivel de riqueza 5 y jornada noche")
NO OFICIAL OFICIAL
(0,100] 0.0032468 0.0000000
(100,200] 0.0097403 0.0196078
(200,300] 0.0259740 0.0392157
(300,400] 0.0487013 0.1372549
(400,500] 0.0551948 0.0784314
(500,600] 0.1071429 0.0980392
(600,700] 0.1363636 0.1176471
(700,800] 0.1233766 0.1568627
(800,900] 0.1850649 0.1960784
(900,1e+03] 0.3051948 0.1568627
Note:
Resultado de los estudiantes comparado con colegios no oficiales y oficiales
con nivel de riqueza 5 y jornada noche

En este caso comparamos instituciones de nivel de riqueza 5 y jornada noche, que son colegios donde los estudiantes generalmente quieren acabar su bachiller de manera rápida, aunque en el gráfico de barras el nivel 5 no era el de mayor proporción, tal vez la tabla no tenga muchos datos.

Teniendo en cuenta que el calculo se hizo dividiendo cada observación por el total de la columna, se debe comparar de forma horizontal el resultado; vemos algunas grandes diferencias, como en (300, 400], (900, 1000], indicando que puede existir alguna relación entre las variables que está afectando las proporciones; generalmente se observa que entre mas bajito es el resultado, mas grande es la proporción en los colegios oficiales, mientras que mas alto es el resultado, mayor proporción en colegios no oficiales; por lo que se podría pensar que en los colegios no oficiales los estudiantes tienen mejores resultados.

Tabla para nivel de riqueza 5 y jornada sabatina-dominical

kable(tablas[[7]], align = 'c', col.names = c('NO OFICIAL', 'OFICIAL')) %>%
  kable_paper('striped', full_width = F) %>%
  footnote(general = "Resultado de los estudiantes comparado con colegios no oficiales y oficiales 
           con nivel de riqueza 5 y jornada sabatina-dominical")
NO OFICIAL OFICIAL
(0,100] 0.0000000 0.0000000
(100,200] 0.0000000 0.1428571
(200,300] 0.0145985 0.1428571
(300,400] 0.0875912 0.0000000
(400,500] 0.0656934 0.0000000
(500,600] 0.1021898 0.0000000
(600,700] 0.1459854 0.1428571
(700,800] 0.1897810 0.4285714
(800,900] 0.1970803 0.1428571
(900,1e+03] 0.1970803 0.0000000
Note:
Resultado de los estudiantes comparado con colegios no oficiales y oficiales
con nivel de riqueza 5 y jornada sabatina-dominical

En este caso comparamos instituciones de nivel de riqueza 5 y jornada sabatina-dominical, pero en el gráfico de barras el nivel 5 no era el de mayor proporción.

Teniendo en cuenta que el calculo se hizo dividiendo cada observación por el total de la columna, se debe comparar de forma horizontal el resultado; vemos que hay bastantes ceros en la columna de colegios oficiales, esto se debe a que no es común que este tipo de colegios ofrezca la jornada sabatina-dominical, por lo tanto no es posible comparar de manera adecuada el resultado por la naturaleza de colegio

Tabla para nivel de riqueza 5 y jornada tarde

kable(tablas[[8]], align = 'c', col.names = c('NO OFICIAL', 'OFICIAL')) %>%
  kable_paper('striped', full_width = F) %>%
  footnote(general = "Resultado de los estudiantes comparado con colegios no oficiales y oficiales 
           con nivel de riqueza 5 y jornada tarde")
NO OFICIAL OFICIAL
(0,100] 0.0000000 0.0454545
(100,200] 0.0000000 0.0848485
(200,300] 0.0625000 0.1181818
(300,400] 0.0833333 0.0939394
(400,500] 0.1458333 0.1424242
(500,600] 0.1458333 0.1151515
(600,700] 0.1458333 0.1333333
(700,800] 0.1250000 0.0818182
(800,900] 0.0625000 0.0878788
(900,1e+03] 0.2291667 0.0969697
Note:
Resultado de los estudiantes comparado con colegios no oficiales y oficiales
con nivel de riqueza 5 y jornada tarde

En este caso comparamos instituciones de nivel de riqueza 5 y jornada tarde, que son un poco mas comunes que los anteriores colegios, aunque en el gráfico de barras el nivel 5 no era el de mayor proporción.

Teniendo en cuenta que el calculo se hizo dividiendo cada observación por el total de la columna, se debe comparar de forma horizontal el resultado; vemos algunas grandes diferencias, como en (700, 800], (900, 1000], indicando que puede existir alguna relación entre las variables que está afectando las proporciones; aunque se observan observaciones con ceros, indicando que tenemos pocos datos para la tabla; generalmente se observa que entre mas bajito es el resultado, mas grande es la proporción en los colegios oficiales, mientras que mas alto es el resultado, mayor proporción en colegios no oficiales; dando la idea de que a los estudiantes de colegios no oficiales pueden obtener un mejor resultado.

Tabla para nivel de riqueza 6 y jornada completa u ordinaria

kable(tablas[[9]], align = 'c', col.names = c('NO OFICIAL', 'OFICIAL')) %>%
  kable_paper('striped', full_width = F) %>%
  footnote(general = "Resultado de los estudiantes comparado con colegios no oficiales y oficiales 
           con nivel de riqueza 6 y jornada completa u ordinaria")
NO OFICIAL OFICIAL
(0,100] 0.02 0.0476190
(100,200] 0.04 0.0476190
(200,300] 0.00 0.2380952
(300,400] 0.02 0.0952381
(400,500] 0.08 0.1428571
(500,600] 0.06 0.1904762
(600,700] 0.06 0.0952381
(700,800] 0.20 0.0952381
(800,900] 0.42 0.0000000
(900,1e+03] 0.10 0.0476190
Note:
Resultado de los estudiantes comparado con colegios no oficiales y oficiales
con nivel de riqueza 6 y jornada completa u ordinaria

En este caso comparamos instituciones de nivel de riqueza 6 y jornada completa u ordinaria, que son un poco mas comunes que los anteriores colegios, aunque en el gráfico de barras el nivel 6 no era el de mayor proporción.

Teniendo en cuenta que el calculo se hizo dividiendo cada observación por el total de la columna, se debe comparar de forma horizontal el resultado; vemos algunas grandes diferencias, como en (400, 500], (500, 600], (700, 800], indicando que puede existir alguna relación entre las variables que está afectando las proporciones; aunque se observan observaciones con ceros, indicando que tenemos pocos datos para la tabla; generalmente se observa que entre mas bajito es el resultado, mas grande es la proporción en los colegios oficiales, mientras que mas alto es el resultado, mayor proporción en colegios no oficiales; dando la idea de que a los estudiantes de colegios no oficiales pueden obtener un mejor resultado.

Tabla para nivel de riqueza 6 y jornada mañana

kable(tablas[[10]], align = 'c', col.names = c('NO OFICIAL', 'OFICIAL')) %>%
  kable_paper('striped', full_width = F) %>%
  footnote(general = "Resultado de los estudiantes comparado con colegios no oficiales y oficiales 
           con nivel de riqueza 6 y jornada mañana")
NO OFICIAL OFICIAL
(0,100] 0.0531915 0.0429009
(100,200] 0.0744681 0.0725230
(200,300] 0.0585106 0.0990807
(300,400] 0.0904255 0.1041879
(400,500] 0.1063830 0.1082737
(500,600] 0.1170213 0.1246170
(600,700] 0.1276596 0.1164454
(700,800] 0.1063830 0.1256384
(800,900] 0.1382979 0.1052094
(900,1e+03] 0.1276596 0.1011236
Note:
Resultado de los estudiantes comparado con colegios no oficiales y oficiales
con nivel de riqueza 6 y jornada mañana

En este caso comparamos instituciones de nivel de riqueza 6 y jornada mañana, que son un poco mas comunes que los anteriores colegios, aunque en el gráfico de barras el nivel 6 no era el de mayor proporción.

Teniendo en cuenta que el calculo se hizo dividiendo cada observación por el total de la columna, se debe comparar de forma horizontal el resultado; no vemos grandes diferencias, indicando que tal vez no hay relación entre las variables, por lo tanto el resultado en colegios con nivel de riqueza 6 y jornada mañana, no se ve afectado por la naturaleza del colegio, se puede pensar en realizar una prueba chi-cuadrado de independencia.

Prueba chi-cuadrado para la tabla anterior

se quiere probar: \[H_0: \text{los dos factores son independientes}\] \[H_1: \text{los dos factores son dependentes}\]

chisq.test(tablas2[[10]])
## 
##  Pearson's Chi-squared test
## 
## data:  tablas2[[10]]
## X-squared = 6.8206, df = 9, p-value = 0.6558

Como el p-valor es mayor a 0.05, hay suficiente evidencia estadística para no rechazar \(H_0\), es decir que el resultado es independiente de la naturaleza del colegio; para los colegios con un nivel de riqueza 6 y jornada mañana.

Tabla para nivel de riqueza 6 y jornada noche

kable(tablas[[11]], align = 'c', col.names = c('NO OFICIAL', 'OFICIAL')) %>%
  kable_paper('striped', full_width = F) %>%
  footnote(general = "Resultado de los estudiantes comparado con colegios no oficiales y oficiales 
           con nivel de riqueza 6 y jornada noche")
NO OFICIAL OFICIAL
(0,100] 0.0000000 0.0049020
(100,200] 0.0000000 0.0294118
(200,300] 0.0000000 0.0294118
(300,400] 0.0327869 0.0588235
(400,500] 0.0655738 0.0784314
(500,600] 0.0491803 0.0833333
(600,700] 0.1639344 0.1372549
(700,800] 0.1803279 0.1715686
(800,900] 0.1803279 0.1764706
(900,1e+03] 0.3278689 0.2303922
Note:
Resultado de los estudiantes comparado con colegios no oficiales y oficiales
con nivel de riqueza 6 y jornada noche

En este caso comparamos instituciones de nivel de riqueza 6 y jornada noche, que son colegios donde los estudiantes generalmente quieren acabar su bachiller de manera rápida, aunque en el gráfico de barras el nivel 6 no era el de mayor proporción, tal vez la tabla no tenga muchos datos.

Teniendo en cuenta que el calculo se hizo dividiendo cada observación por el total de la columna, se debe comparar de forma horizontal el resultado; vemos algunas diferencias, indicando que posiblemente pueda existir alguna relación entre las variables que está afectando las proporciones, sin embargo hay observaciones en 0, indicando que la tabla tiene pocos datos y podemos llegar a conclusiones no adecuadas; por otro lado, generalmente se observa que entre mas bajito es el resultado, mas grande es la proporción en los colegios oficiales, mientras que mas alto es el resultado, mayor proporción en colegios no oficiales; por lo que se podría pensar que en los colegios no oficiales los estudiantes tienen mejores resultados.

Tabla para nivel de riqueza 6 y jornada sabatina-dominical

kable(tablas[[12]], align = 'c', col.names = c('NO OFICIAL', 'OFICIAL')) %>%
  kable_paper('striped', full_width = F) %>%
  footnote(general = "Resultado de los estudiantes comparado con colegios no oficiales y oficiales 
           con nivel de riqueza 6 y jornada sabatina-dominical")
NO OFICIAL OFICIAL
(0,100] 0.0089820 0.0000000
(100,200] 0.0059880 0.0194175
(200,300] 0.0329341 0.0582524
(300,400] 0.0628743 0.0485437
(400,500] 0.0808383 0.0388350
(500,600] 0.1077844 0.1262136
(600,700] 0.1257485 0.1359223
(700,800] 0.1407186 0.1262136
(800,900] 0.2035928 0.2135922
(900,1e+03] 0.2305389 0.2330097
Note:
Resultado de los estudiantes comparado con colegios no oficiales y oficiales
con nivel de riqueza 6 y jornada sabatina-dominical

En este caso comparamos instituciones de nivel de riqueza 6 y jornada sabatina-dominical, generalmente este servicio es ofrecido por colegios no oficiales, también recordemos que en el gráfico de barras el nivel 6 no era el de mayor proporción, por lo que la tabla puede tener pocos datos y por eso hay una observación en cero.

Teniendo en cuenta que el calculo se hizo dividiendo cada observación por el total de la columna, se debe comparar de forma horizontal el resultado; no vemos grandes diferencias, indicando que tal vez no hay relación entre las variables, por lo tanto el resultado en colegios con nivel de riqueza 6 y jornada sabatina-dominical, no se ve afectado por la naturaleza del colegio.

Tabla para nivel de riqueza 6 y jornada tarde

kable(tablas[[13]], align = 'c', col.names = c('NO OFICIAL', 'OFICIAL')) %>%
  kable_paper('striped', full_width = F) %>%
  footnote(general = "Resultado de los estudiantes comparado con colegios no oficiales y oficiales 
           con nivel de riqueza 6 y jornada tarde")
NO OFICIAL OFICIAL
(0,100] 0.0184049 0.0260417
(100,200] 0.0429448 0.0864583
(200,300] 0.0429448 0.0833333
(300,400] 0.0858896 0.1020833
(400,500] 0.0981595 0.1135417
(500,600] 0.1042945 0.1229167
(600,700] 0.1349693 0.1270833
(700,800] 0.1779141 0.1208333
(800,900] 0.2085890 0.1135417
(900,1e+03] 0.0858896 0.1041667
Note:
Resultado de los estudiantes comparado con colegios no oficiales y oficiales
con nivel de riqueza 6 y jornada tarde

En este caso comparamos instituciones de nivel de riqueza 6 y jornada tarde, que son un poco mas comunes que los anteriores colegios, pero en el gráfico de barras el nivel 6 no era el de mayor proporción, por lo que la tabla puede presentar pocos datos.

Teniendo en cuenta que el calculo se hizo dividiendo cada observación por el total de la columna, se debe comparar de forma horizontal el resultado; vemos algunas grandes diferencias, como en (300, 400], (400, 500], (700, 800], (800, 900], indicando que puede existir alguna relación entre las variables que está afectando las proporciones; generalmente se observa que entre mas bajito es el resultado, mas grande es la proporción en los colegios oficiales, mientras que mas alto es el resultado, mayor proporción en colegios no oficiales; dando la idea de que a los estudiantes de colegios no oficiales pueden obtener un mejor resultado.

Tabla para nivel de riqueza 7 y jornada completa u ordinaria

kable(tablas[[14]], align = 'c', col.names = c('NO OFICIAL', 'OFICIAL')) %>%
  kable_paper('striped', full_width = F) %>%
  footnote(general = "Resultado de los estudiantes comparado con colegios no oficiales y oficiales 
           con nivel de riqueza 7 y jornada completa u ordinaria")
NO OFICIAL OFICIAL
(0,100] 0.1373626 0.0666667
(100,200] 0.1813187 0.1333333
(200,300] 0.1373626 0.1666667
(300,400] 0.1263736 0.0333333
(400,500] 0.0604396 0.1000000
(500,600] 0.0879121 0.1333333
(600,700] 0.0824176 0.1333333
(700,800] 0.0824176 0.0333333
(800,900] 0.0604396 0.1666667
(900,1e+03] 0.0439560 0.0333333
Note:
Resultado de los estudiantes comparado con colegios no oficiales y oficiales
con nivel de riqueza 7 y jornada completa u ordinaria

En este caso comparamos instituciones de nivel de riqueza 7 y jornada completa u ordinaria, que son un poco mas comunes que los anteriores colegios, en el gráfico de barras el nivel 7 tenia buena proporción de estudiantes.

Teniendo en cuenta que el calculo se hizo dividiendo cada observación por el total de la columna, se debe comparar de forma horizontal el resultado; vemos algunas grandes diferencias, como en (000, 100], (300, 400], (800, 900], indicando que puede existir alguna relación entre las variables que está afectando las proporciones; generalmente se observa que entre mas bajito es el resultado, mas grande es la proporción en los colegios no oficiales, mientras que mas alto es el resultado, mayor proporción en colegios oficiales; dando la idea de que a los estudiantes de colegios oficiales pueden obtener un mejor resultado, una idea un poco contraria a la que nos ha venido presentando las tablas anteriores.

Tabla para nivel de riqueza 7 y jornada mañana

kable(tablas[[15]], align = 'c', col.names = c('NO OFICIAL', 'OFICIAL')) %>%
  kable_paper('striped', full_width = F) %>%
  footnote(general = "Resultado de los estudiantes comparado con colegios no oficiales y oficiales 
           con nivel de riqueza 7 y jornada mañana")
NO OFICIAL OFICIAL
(0,100] 0.0264609 0.0606926
(100,200] 0.0529217 0.1024634
(200,300] 0.0782800 0.1131739
(300,400] 0.0859978 0.1288825
(400,500] 0.1069460 0.1099607
(500,600] 0.1389195 0.1160300
(600,700] 0.1334068 0.1056765
(700,800] 0.1289967 0.0949661
(800,900] 0.1389195 0.0946091
(900,1e+03] 0.1091510 0.0735452
Note:
Resultado de los estudiantes comparado con colegios no oficiales y oficiales
con nivel de riqueza 7 y jornada mañana

En este caso comparamos instituciones de nivel de riqueza 7 y jornada mañana, que es una jornada mas bien comun en los colegios, recordemos que en el gráfico de barras el nivel 7 presenta una buena proporción de estudiantes.

Teniendo en cuenta que el calculo se hizo dividiendo cada observación por el total de la columna, se debe comparar de forma horizontal el resultado; vemos diferencias, algunas un poco mas grandes que las otras, indicando que tal vez hay una relación entre las variables, por lo tanto el resultado en colegios con nivel de riqueza 7 y jornada mañana, se ve afectado por la naturaleza del colegio, se puede pensar en realizar una prueba.

En este caso en general los colegios no oficiales presentan mejores resultados que los colegios oficiales.

chi-cuadrado de independencia.

Prueba chi-cuadrado para la tabla anterior

se quiere probar: \[H_0: \text{los dos factores son independientes}\] \[H_1: \text{los dos factores son dependentes}\]

chisq.test(tablas2[[15]])
## 
##  Pearson's Chi-squared test
## 
## data:  tablas2[[15]]
## X-squared = 91.266, df = 9, p-value = 9.069e-16

Con un p-valor menor a 0.05, se concluye que hay suficiente evidencia estadistica para rechazar \(H_0\), es decir que el resultado es dependiente de la naturaleza del colegio.

Tabla para nivel de riqueza 7 y jornada noche

kable(tablas[[16]], align = 'c', col.names = c('NO OFICIAL', 'OFICIAL')) %>%
  kable_paper('striped', full_width = F) %>%
  footnote(general = "Resultado de los estudiantes comparado con colegios no oficiales y oficiales 
           con nivel de riqueza 7 y jornada noche")
NO OFICIAL OFICIAL
(0,100] 0.0036232 0.0054545
(100,200] 0.0181159 0.0290909
(200,300] 0.0362319 0.0309091
(300,400] 0.0434783 0.0636364
(400,500] 0.0760870 0.0709091
(500,600] 0.0724638 0.0981818
(600,700] 0.1576087 0.1472727
(700,800] 0.1684783 0.1490909
(800,900] 0.2010870 0.1818182
(900,1e+03] 0.2228261 0.2236364
Note:
Resultado de los estudiantes comparado con colegios no oficiales y oficiales
con nivel de riqueza 7 y jornada noche

En este caso comparamos instituciones de nivel de riqueza 7 y jornada noche, que son colegios donde los estudiantes generalmente quieren acabar su bachiller de manera rápida, en el gráfico de barras el nivel 7 era uno de los de mayor proporción, pero por ser jornada nocturna tal vez la tabla no tenga muchos datos.

Teniendo en cuenta que el calculo se hizo dividiendo cada observación por el total de la columna, se debe comparar de forma horizontal el resultado; vemos algunas diferencias, aunque estas no son muy grandes, por lo tanto no es muy seguro que pueda existir alguna relación entre las variables que está afectando las proporciones; se podría pensar que las variables no están relacionadas y que para los colegios con nivel de riqueza 7 y jornada noche es resultado no se ve muy afectado por la naturaleza del colegio.

Tabla para nivel de riqueza 7 y jornada sabatina-dominical

kable(tablas[[17]], align = 'c', col.names = c('NO OFICIAL', 'OFICIAL')) %>%
  kable_paper('striped', full_width = F) %>%
  footnote(general = "Resultado de los estudiantes comparado con colegios no oficiales y oficiales 
           con nivel de riqueza 7 y jornada sabatina-dominical")
NO OFICIAL OFICIAL
(0,100] 0.0045290 0.0052356
(100,200] 0.0163043 0.0392670
(200,300] 0.0326087 0.0445026
(300,400] 0.0597826 0.0471204
(400,500] 0.0570652 0.0628272
(500,600] 0.0969203 0.1020942
(600,700] 0.1503623 0.1125654
(700,800] 0.1530797 0.1675393
(800,900] 0.1675725 0.2068063
(900,1e+03] 0.2617754 0.2120419
Note:
Resultado de los estudiantes comparado con colegios no oficiales y oficiales
con nivel de riqueza 7 y jornada sabatina-dominical

En este caso comparamos instituciones de nivel de riqueza 7 y jornada sabatina-dominical, generalmente este servicio es ofrecido por colegios no oficiales, también recordemos que en el gráfico de barras el nivel 7 era uno de los de mayor proporción.

Teniendo en cuenta que el calculo se hizo dividiendo cada observación por el total de la columna, se debe comparar de forma horizontal el resultado; vemos grandes diferencias en (600, 700], (800, 900], (900, 1000], indicando que tal vez hay relación entre las variables, por lo tanto el resultado en colegios con nivel de riqueza 7 y jornada sabatina-dominical, se ve afectado por la naturaleza del colegio.

Tabla para nivel de riqueza 7 y jornada tarde

kable(tablas[[18]], align = 'c', col.names = c('NO OFICIAL', 'OFICIAL')) %>%
  kable_paper('striped', full_width = F) %>%
  footnote(general = "Resultado de los estudiantes comparado con colegios no oficiales y oficiales 
           con nivel de riqueza 7 y jornada tarde")
NO OFICIAL OFICIAL
(0,100] 0.0259740 0.0385688
(100,200] 0.0551948 0.0947955
(200,300] 0.0714286 0.1036245
(300,400] 0.0746753 0.1166357
(400,500] 0.1298701 0.1180297
(500,600] 0.1201299 0.1222119
(600,700] 0.1071429 0.1147770
(700,800] 0.1623377 0.1152416
(800,900] 0.1136364 0.0938662
(900,1e+03] 0.1396104 0.0822491
Note:
Resultado de los estudiantes comparado con colegios no oficiales y oficiales
con nivel de riqueza 7 y jornada tarde

En este caso comparamos instituciones de nivel de riqueza 7 y jornada tarde, que es una jornada mas común, en el gráfico de barras el nivel 7 era uno de los de mayor proporción.

Teniendo en cuenta que el calculo se hizo dividiendo cada observación por el total de la columna, se debe comparar de forma horizontal el resultado; vemos algunas grandes diferencias, como en (700, 800], (900, 1000], indicando que puede existir alguna relación entre las variables que está afectando las proporciones; generalmente se observa que entre mas bajito es el resultado, mas grande es la proporción en los colegios oficiales, mientras que mas alto es el resultado, mayor proporción en colegios no oficiales; dando la idea de que a los estudiantes de colegios no oficiales pueden obtener un mejor resultado.

Se puede realizar una prueba chi-cuadrado

chi-cuadrado de independencia.

Prueba chi-cuadrado para la tabla anterior

se quiere probar: \[H_0: \text{los dos factores son independientes}\] \[H_1: \text{los dos factores son dependentes}\]

chisq.test(tablas2[[18]])
## 
##  Pearson's Chi-squared test
## 
## data:  tablas2[[18]]
## X-squared = 29.325, df = 9, p-value = 0.000571

Con un p-valor menor a 0.05, se concluye que hay suficiente evidencia estadística para rechazar \(H_0\), es decir que el resultado es dependiente de la naturaleza del colegio.

Tabla para nivel de riqueza 8 y jornada completa u ordinaria

kable(tablas[[19]], align = 'c', col.names = c('NO OFICIAL', 'OFICIAL')) %>%
  kable_paper('striped', full_width = F) %>%
  footnote(general = "Resultado de los estudiantes comparado con colegios no oficiales y oficiales 
           con nivel de riqueza 8 y jornada completa u ordinaria")
NO OFICIAL OFICIAL
(0,100] 0.3170732 NaN
(100,200] 0.0975610 NaN
(200,300] 0.1219512 NaN
(300,400] 0.0243902 NaN
(400,500] 0.1707317 NaN
(500,600] 0.0731707 NaN
(600,700] 0.0243902 NaN
(700,800] 0.0487805 NaN
(800,900] 0.0975610 NaN
(900,1e+03] 0.0243902 NaN
Note:
Resultado de los estudiantes comparado con colegios no oficiales y oficiales
con nivel de riqueza 8 y jornada completa u ordinaria

En este caso comparamos instituciones de nivel de riqueza 8 y jornada completa u ordinaria, que son un poco mas comunes que los anteriores colegios, en el gráfico de barras el nivel 8 tenia buena proporción de estudiantes.

Teniendo en cuenta que el calculo se hizo dividiendo cada observación por el total de la columna, se debe comparar de forma horizontal el resultado; vemos algo muy particular y es que no hay colegios oficiales con las características mencionadas anteriormente, esto puede deberse a que no es muy común encontrar colegios oficiales con jornada completa, mientras que para los colegios no oficiales vemos que un 30% de los estudiantes tuvieron un mal resultado, que no es acorde a la idea que se ha venido dando con otras tablas; este tipo de jornada, con un nivel de riqueza 8, parece ser algo especial.

Tabla para nivel de riqueza 8 y jornada mañana

kable(tablas[[20]], align = 'c', col.names = c('NO OFICIAL', 'OFICIAL')) %>%
  kable_paper('striped', full_width = F) %>%
  footnote(general = "Resultado de los estudiantes comparado con colegios no oficiales y oficiales 
           con nivel de riqueza 8 y jornada mañana")
NO OFICIAL OFICIAL
(0,100] 0.0431894 0.0791928
(100,200] 0.0730897 0.1107938
(200,300] 0.0664452 0.1206929
(300,400] 0.1096346 0.1201218
(400,500] 0.1129568 0.1142204
(500,600] 0.0897010 0.1151723
(600,700] 0.1328904 0.0993718
(700,800] 0.1561462 0.1014658
(800,900] 0.1129568 0.0738626
(900,1e+03] 0.1029900 0.0651057
Note:
Resultado de los estudiantes comparado con colegios no oficiales y oficiales
con nivel de riqueza 8 y jornada mañana

En este caso comparamos instituciones de nivel de riqueza 8 y jornada mañana, que es una jornada mas bien común en los colegios, recordemos que en el gráfico de barras el nivel 8 presenta una buena proporción de estudiantes.

Teniendo en cuenta que el calculo se hizo dividiendo cada observación por el total de la columna, se debe comparar de forma horizontal el resultado; vemos diferencias, algunas un poco mas grandes que las otras, indicando que tal vez hay una relación entre las variables, por lo tanto el resultado en colegios con nivel de riqueza 8 y jornada mañana, se ve afectado por la naturaleza del colegio, se puede pensar en realizar una prueba chi-cuadrado.

En este caso en general los colegios no oficiales presentan mejores resultados que los colegios oficiales.

chi-cuadrado de independencia.

Prueba chi-cuadrado para la tabla anterior

se quiere probar: \[H_0: \text{los dos factores son independientes}\] \[H_1: \text{los dos factores son dependentes}\]

chisq.test(tablas2[[20]])
## 
##  Pearson's Chi-squared test
## 
## data:  tablas2[[20]]
## X-squared = 40.625, df = 9, p-value = 5.852e-06

Con un p-valor menor a 0.05, se concluye que hay suficiente evidencia estadística para rechazar \(H_0\), es decir que el resultado es dependiente de la naturaleza del colegio.

Tabla para nivel de riqueza 8 y jornada noche

kable(tablas[[21]], align = 'c', col.names = c('NO OFICIAL', 'OFICIAL')) %>%
  kable_paper('striped', full_width = F) %>%
  footnote(general = "Resultado de los estudiantes comparado con colegios no oficiales y oficiales 
           con nivel de riqueza 8 y jornada noche")
NO OFICIAL OFICIAL
(0,100] 0.0000000 0.0042599
(100,200] 0.0222222 0.0212993
(200,300] 0.0444444 0.0500532
(300,400] 0.0888889 0.0575080
(400,500] 0.0000000 0.0905218
(500,600] 0.1777778 0.1033014
(600,700] 0.1333333 0.1182109
(700,800] 0.2222222 0.1789137
(800,900] 0.1555556 0.1789137
(900,1e+03] 0.1555556 0.1970181
Note:
Resultado de los estudiantes comparado con colegios no oficiales y oficiales
con nivel de riqueza 8 y jornada noche

En este caso comparamos instituciones de nivel de riqueza 8 y jornada noche, que son colegios donde los estudiantes generalmente quieren acabar su bachiller de manera rápida, en el gráfico de barras el nivel 8 era uno de los de mayor proporción, pero por ser jornada nocturna tal vez la tabla no tenga muchos datos o presente ceros.

Teniendo en cuenta que el calculo se hizo dividiendo cada observación por el total de la columna, se debe comparar de forma horizontal el resultado; vemos algunas diferencias, algunas grandes como: (500, 600], (900, 1000], indicando que puede haber una relación entre el resultado y la naturaleza del colegio; se observa que los colegios oficiales presentan mejores resultados en los dos últimos niveles.

Tabla para nivel de riqueza 8 y jornada sabatina-dominical

kable(tablas[[22]], align = 'c', col.names = c('NO OFICIAL', 'OFICIAL')) %>%
  kable_paper('striped', full_width = F) %>%
  footnote(general = "Resultado de los estudiantes comparado con colegios no oficiales y oficiales 
           con nivel de riqueza 8 y jornada sabatina-dominical")
NO OFICIAL OFICIAL
(0,100] 0.0023981 0.0068966
(100,200] 0.0263789 0.0206897
(200,300] 0.0671463 0.0206897
(300,400] 0.0479616 0.1172414
(400,500] 0.1031175 0.1103448
(500,600] 0.1223022 0.1103448
(600,700] 0.1510791 0.0965517
(700,800] 0.1318945 0.1793103
(800,900] 0.1702638 0.1931034
(900,1e+03] 0.1774580 0.1448276
Note:
Resultado de los estudiantes comparado con colegios no oficiales y oficiales
con nivel de riqueza 8 y jornada sabatina-dominical

En este caso comparamos instituciones de nivel de riqueza 8 y jornada sabatina-dominical, generalmente este servicio es ofrecido por colegios no oficiales, también recordemos que en el gráfico de barras el nivel 8 era uno de los de mayor proporción.

Teniendo en cuenta que el calculo se hizo dividiendo cada observación por el total de la columna, se debe comparar de forma horizontal el resultado; vemos grandes diferencias en (300, 400], (600, 700], (700, 800], (900, 1000], indicando que tal vez hay relación entre las variables, por lo tanto el resultado en colegios con nivel de riqueza 8 y jornada sabatina-dominical, se ve afectado por la naturaleza del colegio; generalmente se observa mejores resultados para colegios no oficiales.

Tabla para nivel de riqueza 8 y jornada tarde

kable(tablas[[23]], align = 'c', col.names = c('NO OFICIAL', 'OFICIAL')) %>%
  kable_paper('striped', full_width = F) %>%
  footnote(general = "Resultado de los estudiantes comparado con colegios no oficiales y oficiales 
           con nivel de riqueza 8 y jornada tarde")
NO OFICIAL OFICIAL
(0,100] 0.0208333 0.0773680
(100,200] 0.0347222 0.1123162
(200,300] 0.0902778 0.1176187
(300,400] 0.1041667 0.1231622
(400,500] 0.1180556 0.1135213
(500,600] 0.1388889 0.1161726
(600,700] 0.1250000 0.0966498
(700,800] 0.1111111 0.0961678
(800,900] 0.0902778 0.0785732
(900,1e+03] 0.1666667 0.0684502
Note:
Resultado de los estudiantes comparado con colegios no oficiales y oficiales
con nivel de riqueza 8 y jornada tarde

En este caso comparamos instituciones de nivel de riqueza 8 y jornada tarde, que es una jornada mas común, en el gráfico de barras el nivel 8 era uno de los de mayor proporción.

Teniendo en cuenta que el calculo se hizo dividiendo cada observación por el total de la columna, se debe comparar de forma horizontal el resultado; vemos algunas grandes diferencias, como en (100, 200], (900, 1000], indicando que puede existir alguna relación entre las variables que está afectando las proporciones; generalmente se observa que entre mas bajito es el resultado, mas grande es la proporción en los colegios oficiales, mientras que mas alto es el resultado, mayor proporción en colegios no oficiales; dando la idea de que a los estudiantes de colegios no oficiales pueden obtener un mejor resultado.

Se puede realizar una prueba chi-cuadrado

chi-cuadrado de independencia.

Prueba chi-cuadrado para la tabla anterior

se quiere probar: \[H_0: \text{los dos factores son independientes}\] \[H_1: \text{los dos factores son dependentes}\]

chisq.test(tablas2[[23]])
## 
##  Pearson's Chi-squared test
## 
## data:  tablas2[[23]]
## X-squared = 35.893, df = 9, p-value = 4.142e-05

Con un p-valor menor a 0.05, se concluye que hay suficiente evidencia estadística para rechazar \(H_0\), es decir que el resultado es dependiente de la naturaleza del colegio.

Tabla para nivel de riqueza 9 y jornada completa u ordinaria

kable(tablas[[24]], align = 'c', col.names = c('NO OFICIAL', 'OFICIAL')) %>%
  kable_paper('striped', full_width = F) %>%
  footnote(general = "Resultado de los estudiantes comparado con colegios no oficiales y oficiales 
           con nivel de riqueza 9 y jornada completa u ordinaria")
NO OFICIAL OFICIAL
(0,100] 0.2335404 0.2761341
(100,200] 0.1726708 0.2386588
(200,300] 0.1453416 0.1360947
(300,400] 0.1093168 0.1104536
(400,500] 0.0770186 0.0966469
(500,600] 0.0683230 0.0473373
(600,700] 0.0583851 0.0414201
(700,800] 0.0521739 0.0355030
(800,900] 0.0509317 0.0098619
(900,1e+03] 0.0322981 0.0078895
Note:
Resultado de los estudiantes comparado con colegios no oficiales y oficiales
con nivel de riqueza 9 y jornada completa u ordinaria

Tabla para nivel de riqueza 9 y jornada mañana

kable(tablas[[25]], align = 'c', col.names = c('NO OFICIAL', 'OFICIAL')) %>%
  kable_paper('striped', full_width = F) %>%
  footnote(general = "Resultado de los estudiantes comparado con colegios no oficiales y oficiales 
           con nivel de riqueza 9 y jornada mañana")
NO OFICIAL OFICIAL
(0,100] 0.0997375 0.1535515
(100,200] 0.1062992 0.1659123
(200,300] 0.1115486 0.1424095
(300,400] 0.0931759 0.1206476
(400,500] 0.1062992 0.1032382
(500,600] 0.0984252 0.0955780
(600,700] 0.1010499 0.0757312
(700,800] 0.0879265 0.0591922
(800,900] 0.1023622 0.0510097
(900,1e+03] 0.0931759 0.0327298
Note:
Resultado de los estudiantes comparado con colegios no oficiales y oficiales
con nivel de riqueza 9 y jornada mañana

En este caso comparamos instituciones de nivel de riqueza 9 y jornada mañana, que es una jornada mas bien común en los colegios, recordemos que en el gráfico de barras el nivel 9 presenta una buena proporción de estudiantes.

Teniendo en cuenta que el calculo se hizo dividiendo cada observación por el total de la columna, se debe comparar de forma horizontal el resultado; vemos diferencias, algunas un poco mas grandes que las otras, indicando que tal vez hay una relación entre las variables, por lo tanto el resultado en colegios con nivel de riqueza 9 y jornada mañana, se ve afectado por la naturaleza del colegio, se puede pensar en realizar una prueba chi-cuadrado.

En este caso en general los colegios no oficiales presentan mejores resultados que los colegios oficiales.

chi-cuadrado de independencia.

Prueba chi-cuadrado para la tabla anterior

se quiere probar: \[H_0: \text{los dos factores son independientes}\] \[H_1: \text{los dos factores son dependentes}\]

chisq.test(tablas2[[25]])
## 
##  Pearson's Chi-squared test
## 
## data:  tablas2[[25]]
## X-squared = 144.55, df = 9, p-value < 2.2e-16

Con un p-valor menor a 0.05, se concluye que hay suficiente evidencia estadística para rechazar \(H_0\), es decir que el resultado es dependiente de la naturaleza del colegio.

Tabla para nivel de riqueza 9 y jornada noche

kable(tablas[[26]], align = 'c', col.names = c('NO OFICIAL', 'OFICIAL')) %>%
  kable_paper('striped', full_width = F) %>%
  footnote(general = "Resultado de los estudiantes comparado con colegios no oficiales y oficiales 
           con nivel de riqueza 9 y jornada noche")
NO OFICIAL OFICIAL
(0,100] 0.0354610 0.0048426
(100,200] 0.0283688 0.0460048
(200,300] 0.0780142 0.0508475
(300,400] 0.1489362 0.0411622
(400,500] 0.0851064 0.0968523
(500,600] 0.1205674 0.1089588
(600,700] 0.1276596 0.1476998
(700,800] 0.1134752 0.1234867
(800,900] 0.0992908 0.1598063
(900,1e+03] 0.1631206 0.2203390
Note:
Resultado de los estudiantes comparado con colegios no oficiales y oficiales
con nivel de riqueza 9 y jornada noche

En este caso comparamos instituciones de nivel de riqueza 9 y jornada noche, que son colegios donde los estudiantes generalmente quieren acabar su bachiller de manera rápida, en el gráfico de barras el nivel 9 era uno de los de mayor proporción, pero por ser jornada nocturna tal vez la tabla no tenga muchos datos.

Teniendo en cuenta que el calculo se hizo dividiendo cada observación por el total de la columna, se debe comparar de forma horizontal el resultado; vemos algunas diferencias, algunas grandes como: (300, 400], (800, 900], (900, 1000], indicando que puede haber una relación entre el resultado y la naturaleza del colegio; se observa que los colegios oficiales presentan mejores resultados en los dos últimos niveles.

Tabla para nivel de riqueza 9 y jornada sabatina-dominical

kable(tablas[[27]], align = 'c', col.names = c('NO OFICIAL', 'OFICIAL')) %>%
  kable_paper('striped', full_width = F) %>%
  footnote(general = "Resultado de los estudiantes comparado con colegios no oficiales y oficiales 
           con nivel de riqueza 9 y jornada sabatina-dominical")
NO OFICIAL OFICIAL
(0,100] 0.0177778 NaN
(100,200] 0.0533333 NaN
(200,300] 0.0400000 NaN
(300,400] 0.1200000 NaN
(400,500] 0.1022222 NaN
(500,600] 0.1022222 NaN
(600,700] 0.1022222 NaN
(700,800] 0.1511111 NaN
(800,900] 0.1822222 NaN
(900,1e+03] 0.1288889 NaN
Note:
Resultado de los estudiantes comparado con colegios no oficiales y oficiales
con nivel de riqueza 9 y jornada sabatina-dominical

En este caso comparamos instituciones de nivel de riqueza 9 y jornada sabatina-dominical, en el gráfico de barras el nivel 9 era uno de los de mayor proporción, pero la jornada sabatina es mas bien escasa.

Teniendo en cuenta que el calculo se hizo dividiendo cada observación por el total de la columna, se debe comparar de forma horizontal el resultado; vemos que no hay ninguna observación en la columna de colegios oficiales, esto se debe a que no es común que este tipo de colegios ofrezca la jornada sabatina-dominical, por lo tanto no es posible comparar de manera adecuada el resultado por la naturaleza de colegio

Tabla para nivel de riqueza 9 y jornada tarde

kable(tablas[[28]], align = 'c', col.names = c('NO OFICIAL', 'OFICIAL')) %>%
  kable_paper('striped', full_width = F) %>%
  footnote(general = "Resultado de los estudiantes comparado con colegios no oficiales y oficiales 
           con nivel de riqueza 9 y jornada tarde")
NO OFICIAL OFICIAL
(0,100] 0.0188679 0.1085995
(100,200] 0.0512129 0.1434889
(200,300] 0.1105121 0.1528256
(300,400] 0.1132075 0.1174447
(400,500] 0.0808625 0.1046683
(500,600] 0.1051213 0.1031941
(600,700] 0.1320755 0.0899263
(700,800] 0.1293801 0.0805897
(800,900] 0.1320755 0.0530713
(900,1e+03] 0.1266846 0.0461916
Note:
Resultado de los estudiantes comparado con colegios no oficiales y oficiales
con nivel de riqueza 9 y jornada tarde

En este caso comparamos instituciones de nivel de riqueza 9 y jornada tarde, que es una jornada mas común, en el gráfico de barras el nivel 9 era uno de los de mayor proporción.

Teniendo en cuenta que el calculo se hizo dividiendo cada observación por el total de la columna, se debe comparar de forma horizontal el resultado; vemos grandes diferencias en: (000, 100], (100, 200], (600, 700], (800, 900], (900, 1000], indicando que puede existir alguna relación entre las variables que está afectando las proporciones; generalmente se observa que entre mas bajito es el resultado, mas grande es la proporción en los colegios oficiales, mientras que mas alto es el resultado, mayor proporción en colegios no oficiales; dando la idea de que a los estudiantes de colegios no oficiales pueden obtener un mejor resultado.

Se puede realizar una prueba chi-cuadrado

chi-cuadrado de independencia.

Prueba chi-cuadrado para la tabla anterior

se quiere probar: \[H_0: \text{los dos factores son independientes}\] \[H_1: \text{los dos factores son dependentes}\]

chisq.test(tablas2[[28]])
## 
##  Pearson's Chi-squared test
## 
## data:  tablas2[[28]]
## X-squared = 131.96, df = 9, p-value < 2.2e-16

Con un p-valor menor a 0.05, se concluye que hay suficiente evidencia estadística para rechazar \(H_0\), es decir que el resultado es dependiente de la naturaleza del colegio.

Tabla para nivel de riqueza 10 y jornada completa u ordinaria

kable(tablas[[29]], align = 'c', col.names = c('NO OFICIAL', 'OFICIAL')) %>%
  kable_paper('striped', full_width = F) %>%
  footnote(general = "Resultado de los estudiantes comparado con colegios no oficiales y oficiales 
           con nivel de riqueza 10 y jornada completa u ordinaria")
NO OFICIAL OFICIAL
(0,100] 0.4565064 NaN
(100,200] 0.1887456 NaN
(200,300] 0.1043376 NaN
(300,400] 0.0811254 NaN
(400,500] 0.0501758 NaN
(500,600] 0.0379836 NaN
(600,700] 0.0269637 NaN
(700,800] 0.0241501 NaN
(800,900] 0.0166471 NaN
(900,1e+03] 0.0133646 NaN
Note:
Resultado de los estudiantes comparado con colegios no oficiales y oficiales
con nivel de riqueza 10 y jornada completa u ordinaria

En este caso comparamos instituciones de nivel de riqueza 10 y jornada completa u ordinaria, que es una jornada no muy comun en colegios oficiales, en el gráfico de barras el nivel 10 tenia buena proporción de estudiantes.

Teniendo en cuenta que el calculo se hizo dividiendo cada observación por el total de la columna, se debe comparar de forma horizontal el resultado; vemos algo muy particular y es que no hay colegios oficiales con las características mencionadas anteriormente, esto puede deberse a que no es muy común encontrar colegios oficiales con jornada completa, mientras que para los colegios no oficiales vemos que un 45% de los estudiantes tuvieron un mal resultado, que no es acorde a la idea que se ha venido dando con otras tablas; este tipo de jornada, con un nivel de riqueza 10, parece ser algo especial al igual que con el nivel 8 de riqueza y la misma jornada.

Tabla para nivel de riqueza 10 y jornada mañana

kable(tablas[[30]], align = 'c', col.names = c('NO OFICIAL', 'OFICIAL')) %>%
  kable_paper('striped', full_width = F) %>%
  footnote(general = "Resultado de los estudiantes comparado con colegios no oficiales y oficiales 
           con nivel de riqueza 10 y jornada mañana")
NO OFICIAL OFICIAL
(0,100] 0.3908465 0.1726384
(100,200] 0.1956258 0.2214984
(200,300] 0.1198866 0.1889251
(300,400] 0.0870798 0.1237785
(400,500] 0.0615634 0.0944625
(500,600] 0.0498177 0.0586319
(600,700] 0.0380721 0.0553746
(700,800] 0.0198461 0.0423453
(800,900] 0.0178210 0.0228013
(900,1e+03] 0.0194411 0.0195440
Note:
Resultado de los estudiantes comparado con colegios no oficiales y oficiales
con nivel de riqueza 10 y jornada mañana

En este caso comparamos instituciones de nivel de riqueza 10 y jornada mañana, que es una jornada mas bien común en los colegios, recordemos que en el gráfico de barras el nivel 10 presenta una buena proporción de estudiantes.

Teniendo en cuenta que el calculo se hizo dividiendo cada observación por el total de la columna, se debe comparar de forma horizontal el resultado; vemos diferencias, algunas un poco mas grandes que las otras, indicando que tal vez hay una relación entre las variables, por lo tanto el resultado en colegios con nivel de riqueza 10 y jornada mañana, se ve afectado por la naturaleza del colegio, se puede pensar en realizar una prueba chi-cuadrado.

En este caso en general parece que los colegios oficiales presentan un poco mejores resultados que los colegios no oficiales, contrario a lo que venia sucediendo en las otras tablas.

chi-cuadrado de independencia.

Prueba chi-cuadrado para la tabla anterior

se quiere probar: \[H_0: \text{los dos factores son independientes}\] \[H_1: \text{los dos factores son dependentes}\]

chisq.test(tablas2[[30]])
## 
##  Pearson's Chi-squared test
## 
## data:  tablas2[[30]]
## X-squared = 64.167, df = 9, p-value = 2.095e-10

Con un p-valor menor a 0.05, se concluye que hay suficiente evidencia estadística para rechazar \(H_0\), es decir que el resultado es dependiente de la naturaleza del colegio.

Tabla para nivel de riqueza 10 y jornada noche

kable(tablas[[31]], align = 'c', col.names = c('NO OFICIAL', 'OFICIAL')) %>%
  kable_paper('striped', full_width = F) %>%
  footnote(general = "Resultado de los estudiantes comparado con colegios no oficiales y oficiales 
           con nivel de riqueza 10 y jornada noche")
NO OFICIAL OFICIAL
(0,100] 0.0000000 0.1538462
(100,200] 0.0294118 0.1538462
(200,300] 0.0294118 0.2307692
(300,400] 0.0882353 0.0769231
(400,500] 0.1176471 0.2307692
(500,600] 0.1470588 0.0000000
(600,700] 0.2058824 0.0000000
(700,800] 0.1176471 0.0769231
(800,900] 0.1176471 0.0000000
(900,1e+03] 0.1470588 0.0769231
Note:
Resultado de los estudiantes comparado con colegios no oficiales y oficiales
con nivel de riqueza 10 y jornada noche

En este caso comparamos instituciones de nivel de riqueza 10 y jornada noche, que son colegios donde los estudiantes generalmente quieren acabar su bachiller de manera rápida, en el gráfico de barras el nivel 10 era uno de los de mayor proporción, pero por ser jornada nocturna tal vez la tabla no tenga muchos datos o observaciones con ceros.

Teniendo en cuenta que el calculo se hizo dividiendo cada observación por el total de la columna, se debe comparar de forma horizontal el resultado; vemos algunas diferencias, algunas grandes como: (100, 200], (200, 300], (400, 500], (900, 1000], indicando que puede haber una relación entre el resultado y la naturaleza del colegio, sin embargo, se observan ceros en las observaciones, por lo tanto puede no ser adecuado dar conclusiones; se observa que los colegios no oficiales presentan mejores resultados en los dos últimos niveles.

Tabla para nivel de riqueza 10 y jornada sabatina-dominical

kable(tablas[[32]], align = 'c', col.names = c('NO OFICIAL', 'OFICIAL')) %>%
  kable_paper('striped', full_width = F) %>%
  footnote(general = "Resultado de los estudiantes comparado con colegios no oficiales y oficiales 
           con nivel de riqueza 10 y jornada sabatina-dominical")
NO OFICIAL OFICIAL
(0,100] 0.0531915 NaN
(100,200] 0.0212766 NaN
(200,300] 0.0106383 NaN
(300,400] 0.0851064 NaN
(400,500] 0.0957447 NaN
(500,600] 0.1170213 NaN
(600,700] 0.0851064 NaN
(700,800] 0.0957447 NaN
(800,900] 0.2765957 NaN
(900,1e+03] 0.1595745 NaN
Note:
Resultado de los estudiantes comparado con colegios no oficiales y oficiales
con nivel de riqueza 10 y jornada sabatina-dominical

En este caso comparamos instituciones de nivel de riqueza 10 y jornada sabatina-dominical, en el gráfico de barras el nivel 10 presenta una buena proporción, pero la jornada sabatina es mas bien escasa.

Teniendo en cuenta que el calculo se hizo dividiendo cada observación por el total de la columna, se debe comparar de forma horizontal el resultado; vemos que no hay ninguna observación en la columna de colegios oficiales, esto se debe a que no es común que este tipo de colegios ofrezca la jornada sabatina-dominical, por lo tanto no es posible comparar de manera adecuada el resultado por la naturaleza de colegio

Tabla para nivel de riqueza 10 y jornada tarde

kable(tablas[[33]], align = 'c', col.names = c('NO OFICIAL', 'OFICIAL')) %>%
  kable_paper('striped', full_width = F) %>%
  footnote(general = "Resultado de los estudiantes comparado con colegios no oficiales y oficiales 
           con nivel de riqueza 10 y jornada tarde")
NO OFICIAL OFICIAL
(0,100] 0.3652597 0.1276596
(100,200] 0.2029221 0.1489362
(200,300] 0.1461039 0.1702128
(300,400] 0.0941558 0.1489362
(400,500] 0.0649351 0.1063830
(500,600] 0.0422078 0.1489362
(600,700] 0.0357143 0.0212766
(700,800] 0.0243506 0.0851064
(800,900] 0.0146104 0.0212766
(900,1e+03] 0.0097403 0.0212766
Note:
Resultado de los estudiantes comparado con colegios no oficiales y oficiales
con nivel de riqueza 10 y jornada tarde

En este caso comparamos instituciones de nivel de riqueza 10 y jornada tarde, que es una jornada mas común, en el gráfico de barras el nivel 10 era uno de los de mayor proporción.

Teniendo en cuenta que el calculo se hizo dividiendo cada observación por el total de la columna, se debe comparar de forma horizontal el resultado; vemos grandes diferencias en: (000, 100], (100, 200], (200, 300], (300, 400], (500, 600], indicando que puede existir alguna relación entre las variables que está afectando las proporciones; generalmente se observa que entre mas bajito es el resultado, mas grande es la proporción en los colegios no oficiales, mientras que mas alto es el resultado, mayor proporción en colegios oficiales; dando la idea de que a los estudiantes de colegios oficiales pueden obtener un mejor resultado, contrario a tablas anteriores del mismo estilo.

Conclusiones

  • En las tablas que tienen un nivel 7, 8 y 9, con jornada mañana o tarde, fue posible realizar una prueba de independencia chi-cuadrado, que arrojaron como resultado el rechazo de \(H_0\), es decir que en las 6 tablas hay dependencia entre el resultado y la naturaleza de los colegios, en todas las tablas mencionadas anteriormente, se observo que los estudiantes de colegios no oficiales presentaron mejores resultados que los colegios oficiales; si consideramos como colegios comunes los que tienen nivel de riqueza 7,8,9 en la jornada mañana o tarde, podemos decir que en general a los colegios no oficiales les va mejor en las pruebas saber que a los colegios oficiales.

  • Para las tablas con la jornada noche se observo que en algunas tablas los colegios no oficiales tenían mejores resultados que los colegios oficiales, sin embargo, no fue posible realizar pruebas chi-cuadrado de independencia y las diferencias en ocasiones no eran muy grandes, en general la jornada nocturna no es muy común en colegios oficiales.

  • Para la jornada sabatina-dominical se observo que en algunos niveles de riqueza, los colegios no oficiales ofrecían mejores resultados que los colegios oficiales, sin embargo, hay que tener en cuenta que los colegios oficiales generalmente no ofrecen la jornada sabatina-dominical, incluso en algunas tablas la columna de los colegios oficiales no tenían datos, por lo tanto no es posible mirar si los colegios oficiales ofrecen mejores resultados que los colegios no oficiales.

  • En general los colegios no oficiales presentaron mejores resultados.

Referencias

de Respuesta, C. D. D. E. L. C. O. (n.d.). DICCIONARIO DE VARIABLES SABER 11° PERIODO 2013-20141. Gov.Co. Retrieved August 7, 2021, from https://www.icfes.gov.co/documents/20143/517898/Diccionario%20saber%2011%202013%201%20a%202014%201.pdf

PreICFES. (2012, May 6). ICFES, que es y para que sirve el examen de estado. Icfesinteractivo.info. https://icfesinteractivo.info/que-es/

Pruebas Saber - ..::Ministerio de Educaci�n Nacional de Colombia:: (n.d.). Gov.Co. Retrieved August 7, 2021, from https://www.mineducacion.gov.co/1621/w3-article-244735.html