16/12/2020

INTRODUCCIÓN

Dentro de los objetivos de las pruebas Saber 11, según el Ministerio de Educación Nacional (MEN, 2010), están: comprobar el grado de desarrollo de las competencias de los estudiantes próximos a finalizar el grado undécimo de la educación media, proporcionar a las instituciones educativas información pertinente sobre las competencias de los aspirantes a ingresar a programas de educación superior, así como sobre las de quienes son admitidos que sirva como base para el diseño de programas de nivelación académica y prevención de la deserción durante la vida universitaria[1].

Un factor que ha mostrado ser predictor del desempeño futuro del estudiante es su puntaje en las pruebas de estado del Instituto Colombiano para el Fomento de la Educación Superior (ICFES) [2].

OBJETIVO GENERAL

 

Realizar una caracterización académica y sociodemográfica de los estudiantes de grado undécimo, apartir de los resultados en las Pruebas Saber Pro 11 Colombia, periodo 2019-2.

OBJETIVOS ESPECIFICOS

Contextualización de la base de datos

La base de datos saber 11 2019-2, contiene información de 546212 observaciones sobre estudiantes que presentaron la prueba saber 11 en el país durante la segunda mitad del 2019, según los informes del ICFES otorgados por el Ministerio de Educación.

Las variables se codificaron como:

estu_genero: El género del estudiante.

periodo: Período del año académico que presentó la prueba (2019-2).

estu_pais_reside: País en el que reside el estudiante.

estu_tieneetnia: Si el estudiante pertenece o no a una etnia en específico.

estu_etnia: La etnia a la cual pertenece el estudiante.

Contextualización de la base de datos

estu_depto_reside: Departamento de colombia donde reside el estudiante.

fami_estratovivienda: Estrato socioeconómico de vivienda familiar.

cole_nombre_establecimiento: Nombre del colegio en el cual estudia.

cole_genero: Género del estblecimiento educativo (mixto, femenino y masculino).

cole_naturaleza: Naturaleza del establecimiento educativo (público o privado).

cole_calendario: Tipo de calendario del establecimiento educativo con el cual presta sus servicios académicos (calendario A o calendario B).

cole_caracter: Modalidad académica del establecimiento educativo (técnico, normalista, académico,etc.).

cole_jornada: Jornada en la que el establecimiento educativo dicta las clases (Única, completa, mañana, tarde,etc.).

Contextualización de la base de datos

cole_depto_ubicacion: Departameto del país donde esta ubicado el establecimiento educativo.

estu_privado_libertad: Situación del estudiante que presentó la prueba saber 11.

punt_lectura_critica: Puntaje en la prueba de lectura crítica.

desemp_lectura_critica: Nivel de desempeño del estudiante en la prueba de lectura crítica (insuficiente, mínimo, satisfactorio y avanzado).

punt_matematicas: Puntaje en la prueba de matemáticas.

desemp_matematicas: Nivel de desempeño del estudiante en la prueba de matemáticas (insuficiente, mínimo, satisfactorio y avanzado).

punt_c_naturales: Puntaje en la prueba de ciencias naturales.

desemp_c_naturales: Nivel de desempeño del estudiante en la prueba de ciencias naturales (insuficiente, mínimo, satisfactorio y avanzado).

Contextualización de la base de datos

punt_sociales_ciudadanas: Puntaje en la prueba de sociales y ciencias ciudadadnas.

desemp_sociales_ciudadanas: Nivel de desempeño del estudiante en la prueba de sociales y ciencias (insuficiente, mínimo, satisfactorio y avanzado).

punt_ingles: Puntaje en la prueba de inglés.

desemp_ingles: Nivel de desempeño del estudiante en la prueba de inglés (insuficiente, mínimo, satisfactorio y avanzado).

punt_global: Promedio global de la prueba saber 11.

estu_generacion_e: becas estudiantiles otorgadas por el Ministerio de Eduación a estudiantes con puntaje superior en la prueba saber 11.

PRESENTACIÓN DE LOS DATOS

Primeras seis filas de la base de atos.

PRESENTACIÓN DE LOS DATOS

Últimas seis filas de la base de Datos

Dimensión de los datos

#dim(DATOSF)

VARIABLES EMPLEADAS EN EL ESTUDIO

Cambiar naturaleza y nombres de variables

Estructura de la base de datos

Identificando valores NA por columna

Cantidad de valores ausentes para las variables descritas anteriormente

Identificando valores NA por columna

Identificando las filas con al menos un NA

Proporción de valores ausentes

Decisión sobre el tratamiento a los valores ausentes

En este caso lo correcto es eliminar los valores faltantes y no realizar imputación de datos, porque el interes principal es caracterizar la situación educativa en Colombia. El análisis estadístico de esta investigación se realizó con base en los datos suministrados de Diversas bases de datos de Colombia: https://www.datos.gov.co/browse?limitTo=charts de 546212 estudiantes que aplicaron a esta prueba, de los cuales 511233 fueron objeto de análisis por tener resultados de Saber 11 completos. Para efectos del trabajo computacional, se utilizó el software estadístico R studio versión 4.0.3 y Jupyther Notebook. La metodología estadística usada fue un estudio ecológico.

Datos atípicos

Graficos de caja y bigotes para los puntajes obtenidos en las áreas básicas.

Datos atípicos

Graficos de caja y bigotes para el puntaje global por estudiantes.

Datos atípicos

Observamos que el 50% de los puntajes globales de las pruebas Saber 11 en Colombia durante 2019-2, presentaron promedios por debajo de 245. Un 25% de los promedios superaron puntajes de 284, la distancia que separa el 50% de los puntajes centrales en este conjunto de datos es de 75, se manifiestan en esta variable valores atípicos muy por debajo y por encima de la media, sin embargo pertenecen al rango de calificación determinado por el ICFES, este mismo panorama se presentó en los puntajes individuales por área, se sugiere mantener estas observaciones ya que son coherentes con los distintos perfiles académicos de los estudiantes, ya que permiten incorporar factores individuales, académicos, socioeconómicos e institucionales como principales determinantes en el rendimiento de las pruebas.

Análisis descriptivos

Puntaje medio de los resultados de las pruebas Saber Pro 11 en colegios no oficiales en Colombia. `

Análisis descriptivos

Análisis descriptivos

Puntaje medio de los resultados de las pruebas Saber Pro 11 en colegios oficiales en Colombia.

Análisis descriptivos

Puntaje medio de los resultados de las pruebas Saber Pro 11 de acuerdo al estrato socieconomico de los estudiantes en Colombia.

Estratos con puntajes mayores que 260

Análisis descriptivos