Introducción:

La educación media o secundaria representa un pilar fundamental para el desarrollo personal y colectivo en cualquier sociedad, ya que proporciona competencias básicas, promueve la equidad y mejora las oportunidades laborales. Sin embargo, en muchas regiones del mundo, la tasa de finalización de este nivel educativo sigue siendo un desafío, especialmente en contextos de pobreza, desigualdad o falta de infraestructura. Según la UNESCO, en 2023, cerca del 20% de los jóvenes en países de ingresos bajos y medios abandonan la educación secundaria antes de completarla, limitando sus oportunidades futuras y perpetuando ciclos de pobreza. Comprender los factores que influyen en este indicador resulta esencial para diseñar políticas públicas más efectivas y equitativas.

El presente trabajo tiene como objetivo modelar la tasa de finalización de la educación media o secundaria en una muestra de 195 países, a partir de diversas variables independientes que podrían estar asociadas con este indicador. Entre ellas se consideran: la población en edad escolar (12 a 18 años), el producto interno bruto (PIB), el porcentaje del PIB destinado a educación, el índice de acceso a energía eléctrica, el índice de Gini (como medida de desigualdad), el porcentaje de población rural, la tasa de alfabetización, el desempleo juvenil, y las tasas de matrícula en educación media y terciaria.

A través de este análisis se busca identificar patrones, relaciones y posibles determinantes que afectan la finalización de la educación secundaria, entendiendo esta no solo como una cuestión educativa, sino también como el reflejo de condiciones estructurales más amplias. Para poder así comprender y pensar en estrategias que puedan promover la permanencia y culminación del ciclo educativo, especialmente en contextos donde aún existen brechas significativas.

Videos sobre Evaluación de Estudiantes en Singapur y Educación en Somalia

El Programa Internacional de Evaluación de Estudiantes (PISA) evalúa competencias en ciencias, lectura y matemáticas en estudiantes de 15 años de 72 países. Singapur lidera los resultados.

Se observa en cómo los sistemas educativos varían en cuanto a calidad y resultados. Aunque Singapur es un país que ha logrado altos índices en educación, otros países enfrentan grandes desafíos debido a la falta de infraestructura educativa, acceso a recursos, y diferentes políticas públicas. Esto resalta la disparidad entre naciones en términos de resultados educativos, lo que a su vez afecta la movilidad social y el acceso a oportunidades económicas.

En Somalia, la educación enfrenta desafíos extremos debido a conflictos y pobreza.

Los dos videos reflejan las desigualdades en el acceso y la calidad de la educación a nivel mundial. Por un lado, tenemos países como Singapur, que invierten en educación de alta calidad y logran un rendimiento sobresaliente en evaluaciones internacionales como PISA. Por otro lado, tenemos a Somalia, donde los niños enfrentan obstáculos como la guerra, la pobreza y la falta de infraestructuras educativas básicas, lo que limita drásticamente sus oportunidades de acceder a una educación de calidad.

Educación Media: Un Análisis de variables económicas, sociales y demográficas.

#Metodología.

El abandono escolar en la educación media es un fenómeno complejo, determinado por la interacción de factores económicos, sociales y demográficos. Esta etapa educativa es clave para el desarrollo personal y profesional de los jóvenes, y su interrupción tiene implicaciones directas sobre la desigualdad, la pobreza y las oportunidades de inclusión en la vida productiva y ciudadana.

Desde una perspectiva económica, el Producto Interno Bruto (PIB) de un país y la proporción de ese PIB destinada al sector educativo inciden directamente en la calidad del sistema escolar. Estos factores determinan la infraestructura, los recursos didácticos disponibles y la formación del personal docente, lo que a su vez impacta la permanencia de los estudiantes.

En el ámbito social, el acceso a servicios básicos como la electricidad —especialmente en zonas rurales—, el nivel de alfabetización y el grado de desigualdad en la distribución de los ingresos (medido mediante el índice de Gini) crean condiciones que pueden facilitar o dificultar la continuidad educativa. Un entorno familiar con baja escolaridad o acceso limitado a servicios puede convertirse en un obstáculo para que los jóvenes valoren o puedan sostener su educación.

Además, las variables demográficas, como el tamaño de la población entre 12 y 18 años, reflejan la presión sobre los sistemas educativos. En muchos países, estos sistemas no logran absorber y retener a toda la población en edad escolar. Las tasas de matrícula en educación media y terciaria son indicadores clave para entender tanto el acceso como la proyección de continuidad académica en cada contexto nacional.

El anterior mapa ilustra la tasa de finalización de la educación media en distintos países. Esta visualización permite reconocer patrones geográficos, resaltar regiones en riesgo educativo y ofrecer una perspectiva global que contextualiza el análisis.

¿Qué datos usamos y por qué?

Para el desarrollo de este trabajo se integraron múltiples bases de datos provenientes de fuentes internacionales confiables como el Banco Mundial, la UNESCO y la OCDE. Se seleccionaron 195 países que contaban con información completa y actualizada para un conjunto de variables que permiten analizar los factores que influyen en la finalización de la educación media.Las variables fueron escogidas con base en su relevancia teórica y empírica, considerando estudios previos sobre desigualdad educativa y desarrollo social. Se buscó incluir dimensiones económicas, sociales y demográficas que pudieran tener una relación directa o indirecta con el abandono escolar en la educación media.

Variable
Tipo Descripción
Tasa de finalización de educación media Dependiente binaria (Sí/No) Indica si un país presenta una tasa de finalización por encima del punto de corte establecido.
Población entre 12 y 18 años Continua Número de personas en edad típica de educación secundaria.
PIB (en miles de millones de USD) Continua Producto Interno Bruto del país, como medida de su tamaño económico.
% del PIB destinado a educación Continua Proporción del gasto educativo respecto al PIB.
% de acceso a energía eléctrica Continua Porcentaje de la población con acceso a electricidad.
Índice de Gini Continua Mide la desigualdad de ingresos (0 = igualdad perfecta, 100 = desigualdad total).
% de población rural Continua Proporción de la población que reside en zonas rurales.
% de alfabetización Continua Porcentaje de personas mayores de 15 años que saben leer y escribir.
Tasa de desempleo juvenil Continua Proporción de personas entre 15 y 24 años sin empleo.
Tasa de matrícula en educación media. Continua Porcentaje de jóvenes matriculados en educación secundaria.
Tasa de matrícula en educación terciaria. Continua Porcentaje de jóvenes matriculados en educación superior.

Para el análisis estadístico, se procedió a dicotomizar la variable continua Tasa de Finalización Total en Educación Media, con el objetivo de facilitar comparaciones categóricas y explorar asociaciones con otras variables explicativas. El proceso se desarrolló en los siguientes pasos:

Este gráfico muestra la distribución de la tasa de finalización de la educación media en los países analizados. Se observa cómo se agrupan las tasas en distintos rangos, lo que permite identificar patrones generales en los datos. La línea roja indica el punto de corte utilizado para clasificar los países con alta y baja finalización, lo cual es clave para el análisis predictivo posterior

Base inicial: Se partió de una base de datos compuesta por 133 países, con valores disponibles para las tasas de finalización y otras variables educativas y socioeconómicas.

Limpieza y filtrado: Se aplicó el criterio del rango intercuartílico (IQR) para eliminar valores atípicos que podrían sesgar el análisis. Esto implicó excluir aquellos países cuyas tasas de finalización estaban significativamente por fuera del rango esperado.

Selección de muestra robusta: Después de eliminar los valores atípicos, se conservaron los datos de 80 países, garantizando un equilibrio entre limpieza metodológica y representatividad de la muestra. Se priorizó mantener al menos 70 observaciones para asegurar robustez estadística en los análisis posteriores.

Regla de dicotomización: Se utilizó la mediana de la Tasa de Finalización Total como punto de corte, dividiendo así la muestra en dos grupos de tamaño comparable:

  • Sí (1): Países con una tasa de finalización igual o superior al 68.26%

  • No (0): Países con una tasa de finalización inferior al 68.26%.

Resultado: La nueva variable categórica, denominada Finalizacion_alta, permitió clasificar a los países en función de un desempeño educativo relativamente alto o bajo en términos de finalización de la educación media, facilitando análisis comparativos y modelos de asociación con otras variables como el gasto educativo, el PIB per cápita, el índice de desarrollo humano, entre otros.

Esta decisión metodológica busca equilibrar la distribución de clases, lo cual es fundamental para evitar sesgos hacia una de las clases.

Determinantes globales de la Tasa de finalización de la Educación Media.

Los factores económicos, sociales y educativos influyen significativamente en la tasa de finalización de la educación media. Los países con mayores niveles de inversión en educación, menor desigualdad económica, y mejor acceso a servicios básicos como la electricidad y la alfabetización, tienen mayores probabilidades de superar la mediana global de finalización educativa.

Hay factores que no solo afectan el acceso a la educación, sino también las oportunidades de retención y éxito escolar de los jóvenes. A continuación, se presentan las hipótesis y las variables consideradas como determinantes principales.

  • Tasa de matriculación a Educación Media (Hipótesis 1: H1): Una mayor tasa de matriculación en educación media está positivamente asociada con una mayor probabilidad de que un país tenga una alta tasa de finalización en este nivel educativo.

  • Porcentaje del PIB destinado a educación (Hipótesis 2 (H2): Un mayor porcentaje del PIB destinado a la educación está positivamente relacionado con una mayor tasa de finalización de la educación media. El aumento en la inversión educativa mejora las condiciones y recursos disponibles, lo cual favorece la permanencia en el sistema educativo.

  • Tasa de matrícula en educación terciaria (Hipótesis 3: H3): Un mayor porcentaje de matrícula en educación terciaria está positivamente relacionado con una mayor tasa de finalización de la educación media. El acceso a la educación superior refleja un compromiso con el sistema educativo en general, lo cual puede contribuir a mejorar los niveles de retención en la educación secundaria.

  • Porcentaje de población rural (Hipótesis 4 (H4): Los países con una mayor proporción de población rural tendrán una menor tasa de finalización de la educación media. Esto se debe a las barreras estructurales que enfrentan los jóvenes en áreas rurales para acceder a educación de calidad, como la falta de infraestructura educativa adecuada y el menor acceso a recursos.

Análisis sobre la tasa de finalización de la educación media y sus determinantes estructurales.

Esta sección analiza las principales variables utilizadas para estudiar la tasa de finalización de la educación media. Se incluyeron indicadores socioeconómicos y estructurales de distintos países, presentados mediante estadísticas básicas y visualizaciones interactivas.

Variable Media Mediana Desviación Estándar
Tasa de finalización 63.4 68.26 21.5
Población entre 12 y 18 años 4.2 M 2.8 M 3.9 M
PIB per cápita (USD) 7,54 5,1 6,2
Gasto en Educación (% PIB) 4.4 4.1 1.3
Acceso a electricidad (%) 84.3 95.0 21.1
Índice de Gini 41.2 39.7 6.3
Población rural (%) 37.5 29.3 21.8
Alfabetización (%) 87.2 90.5 12.4
Desempleo juvenil (%) 19.4 16.3 9.5
Matrícula secundaria (%) 78.5 82.0 18.7
Matrícula terciaria (%) 29.1 21.0 20.3
## # A tibble: 2 × 4
##   Finalizacion_alta Media_Matriculacion Media_Finalizacion Correlacion
##   <fct>                           <dbl>              <dbl>       <dbl>
## 1 Sí                               79.5               79.6       0.157
## 2 No                               78.1               57.4       0.201

En el análisis estadístico anterior calcula la media de matrícula y finalización para ambos grupos. Obteniendo la correlación entre ambas tasas dentro de cada grupo, lo que permite ver si la relación es más fuerte (o más débil) en contextos de alta o baja finalización. Esto abre la puerta a hipótesis de que la matrícula sola no garantiza el éxito en la finalización de la educación Media si no está acompañada de condiciones socioeconómicas adecuadas.

## 
## Call:
## lm(formula = Tasa_finalizacion_total ~ Gini, data = Tasa_finalizacion)
## 
## Residuals:
##      Min       1Q   Median       3Q      Max 
## -28.2186  -8.0634  -0.3678   9.1657  29.0382 
## 
## Coefficients:
##             Estimate Std. Error t value Pr(>|t|)    
## (Intercept) 69.36626    6.93261  10.006 1.41e-15 ***
## Gini        -0.01862    0.16773  -0.111    0.912    
## ---
## Signif. codes:  0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
## 
## Residual standard error: 13.9 on 77 degrees of freedom
## Multiple R-squared:  0.0001601,  Adjusted R-squared:  -0.01282 
## F-statistic: 0.01233 on 1 and 77 DF,  p-value: 0.9119

Los países con índices de Gini más altos evidencian desigualdades estructurales que afectan el acceso sostenido a servicios esenciales como educación. En este sentido, la hipótesis plantea que la desigualdad económica no solo limita el acceso inicial a la educación media, sino que también impide que los estudiantes completen este nivel educativo.Pero aunque intuitivamente se podría pensar que la desigualdad impide el acceso y permanencia en la educación, este resultado sugiere que la tasa de finalización de la educación media no está directamente afectada por el índice de Gini de forma simple y lineal, según el modelo.

La relación entre el porcentaje del PIB destinado a la educación y la tasa de finalización de la educación media no es estadísticamente significativa según los resultados de este análisis de regresión. Esto implica que no hay evidencia suficiente para afirmar que un mayor porcentaje del PIB destinado a la educación tenga un impacto en la tasa de finalización de la educación media.

El modelo sugiere que la Tasa de Matrícula en Educación Terciaria tiene una relación positiva y significativa con la Tasa de Finalización de la Educación Media. Es decir, a medida que aumenta la matrícula en educación terciaria, es probable que también aumente la tasa de finalización de la educación media. Sin embargo, es importante tener en cuenta que la R² relativamente baja indica que hay otros factores además de la matrícula terciaria que influyen en la finalización de la educación media.

Se respalda la hipótesis de que una mayor proporción de población rural está asociada con menores tasas de finalización educativa. Esta tendencia puede explicarse por las barreras de acceso, cobertura, infraestructura y calidad educativa que enfrentan tradicionalmente las zonas rurales. Aunque el coeficiente de determinación (R² = 0.085) indica que la variable solo explica una pequeña parte de la variabilidad total, el resultado sigue siendo relevante como evidencia de una desigualdad estructural en el sistema educativo.

##Modelo Knn

Es necesario comprender que es la curva ROC, esta evalúa el rendimiento del modelo clasificando correctamente los casos positivos (sensibilidad) frente a los falsos positivos (1 - especificidad). Por su parte, el AUC (Área Bajo la Curva) es de 0.955, lo cual indica un excelente desempeño del modelo. Un AUC cercano a 1 implica que el modelo distingue muy bien entre las clases (nivel alto vs. bajo de finalización educativa).

La curva ROC generada por el modelo presenta una línea vertical pronunciada desde el punto (0,0), lo cual no representa un error, sino que refleja el comportamiento del modelo al clasificar correctamente una gran proporción de casos positivos con alta confianza. Esta característica indica que el modelo logra una alta sensibilidad desde los primeros umbrales evaluados, lo que es deseable en contextos donde es más importante identificar correctamente los casos positivos que evitar falsos positivos.

Dado que el área bajo la curva (AUC) es igual a 1, se puede afirmar que el modelo tiene un rendimiento perfecto sobre los datos de prueba, aunque esto también puede ser indicativo de un sobreajuste. Sin embargo, para efectos del análisis exploratorio y considerando las características de los datos disponibles, se optó por conservar la curva tal como fue generada para evidenciar el comportamiento del modelo en la clasificación de las observaciones.

## Confusion Matrix and Statistics
## 
##           Reference
## Prediction  0  1
##          0  9  0
##          1  2 12
##                                           
##                Accuracy : 0.913           
##                  95% CI : (0.7196, 0.9893)
##     No Information Rate : 0.5217          
##     P-Value [Acc > NIR] : 7.445e-05       
##                                           
##                   Kappa : 0.8244          
##                                           
##  Mcnemar's Test P-Value : 0.4795          
##                                           
##             Sensitivity : 0.8182          
##             Specificity : 1.0000          
##          Pos Pred Value : 1.0000          
##          Neg Pred Value : 0.8571          
##              Prevalence : 0.4783          
##          Detection Rate : 0.3913          
##    Detection Prevalence : 0.3913          
##       Balanced Accuracy : 0.9091          
##                                           
##        'Positive' Class : 0               
## 

##Árbol de decisión El análisis del modelo de árbol de decisión destaca la Tasa de Finalización Total como la variable más relevante para la clasificación del nivel educativo. Aunque otras variables, como Población rural, Índice de Gini, Tasa de alfabetización y PIB educativo, tienen cierto impacto, su influencia es menor.

##Cada una de las hipótesis.

Hipótesis 1 (H1): Tasa de matriculación en educación media No se cumple. Esta variable no aparece entre las más importantes del modelo según el gráfico de “Importancia de Variables”, lo que indica que no tuvo un peso significativo en la predicción de la tasa de finalización de la educación media. Por lo tanto, no hay evidencia de una fuerte relación positiva en este análisis.

Hipótesis 2 (H2): Porcentaje del PIB destinado a educación No se cumple. Aunque esta variable está incluida en el modelo, su importancia relativa es muy baja. Esto sugiere que el nivel de inversión en educación no fue un factor determinante para predecir la tasa de finalización en este caso.

Hipótesis 3 (H3): Tasa de matrícula en educación terciaria No se cumple. Esta variable no aparece entre las variables utilizadas ni consideradas importantes por el modelo, lo cual indica que no tuvo relación significativa con la tasa de finalización en educación media en este análisis.

Hipótesis 4 (H4): Porcentaje de población rural Se cumple parcialmente. Esta variable sí aparece como una de las más importantes después de la tasa de finalización total. Aunque no fue la más determinante, su contribución al modelo sugiere que sí existe una relación negativa moderada entre población rural y finalización educativa, lo cual respalda en parte la hipótesis

Análisis sobre la tasa de finalización de la educación media y sus determinantes estructurales.

El análisis de datos muestra que la tasa de finalización de la educación media varía ampliamente entre países, con valores que oscilan desde menos del 10% hasta más del 95%. Esta variabilidad no es aleatoria, sino que responde a factores estructurales profundamente arraigados. Por ejemplo, países como Somalia —ubicado en África oriental— enfrentan retos multidimensionales como pobreza extrema, trabajo infantil, conflicto armado, baja inversión en infraestructura educativa y escaso acceso a servicios básicos, lo que repercute directamente en el abandono escolar temprano y en la imposibilidad de culminar el ciclo medio de educación.

La relación entre el PIB y la tasa de finalización de la educación media es clara: a mayor PIB, mayor es la tasa de finalización. Esto se debe a que un mayor ingreso nacional permite mayor inversión en infraestructura, programas sociales y educativos, formación docente, acceso a tecnología, entre otros factores. El gráfico de dispersión entre PIB y tasa de finalización así lo confirma, mostrando una tendencia ascendente en la medida en que el ingreso per cápita mejora. Sin embargo, también se observan casos atípicos que invitan a analizar la eficiencia del gasto público.

El acceso a servicios básicos como la electricidad es un indicador indirecto del nivel de desarrollo e infraestructura de un país. Su promedio en el análisis fue alto en general, pero aquellos países con menor acceso presentan también menores tasas de finalización. Esto sugiere que la falta de electricidad no solo impide condiciones adecuadas de estudio en el hogar, sino que también limita el funcionamiento de centros educativos. De forma similar, la tasa de alfabetización —con una media superior al 85%— se relaciona positivamente con la finalización del nivel medio, indicando que una base educativa sólida desde la infancia mejora la permanencia en el sistema.

El Índice de Gini, que mide la desigualdad en la distribución del ingreso, mostró una relación negativa con la tasa de finalización. En contextos con alta desigualdad económica, los jóvenes enfrentan mayores barreras para permanecer en el sistema escolar, debido a la necesidad de trabajar, la falta de oportunidades y la exclusión social. El desempleo juvenil, por su parte, afecta las expectativas y la motivación hacia la educación. Un joven que no encuentra oportunidades laborales puede percibir la educación como poco útil, lo que se traduce en mayor deserción.

El porcentaje de población rural también resultó ser un factor relevante. En zonas rurales, las barreras de acceso a instituciones educativas, la escasez de transporte, la inseguridad y las prácticas culturales como el matrimonio temprano, dificultan la continuidad educativa. La comparación entre las tasas de matrícula en educación media y terciaria refuerza esta tendencia: aunque muchos jóvenes logran ingresar al nivel medio, son pocos los que acceden a estudios superiores, indicando una alta deserción entre estos niveles.

Finalmente, el análisis del PIB destinado a educación evidencia que aquellos países que priorizan este sector logran mejores tasas de finalización. Esto reafirma que no basta con un alto PIB general, sino que es fundamental que los gobiernos asignen y ejecuten recursos adecuados para garantizar condiciones dignas de enseñanza y aprendizaje. La variabilidad en esta variable sugiere que los países podrían aumentar el impacto educativo mediante una gestión más eficaz del presupuesto educativo