Antecedentes

A continuación, se elabora una propuesta de estudio que busca sentar los objetivos, metodologías e insumos necesarios que permitan analizar y evaluar el impacto de modificar la ponderación de selección asignada a las calificaciones de enseñanza secundaria. Para tal fin se busca caracterizar y sistematizar la relación entre el rendimiento académico temprano, a partir de las calificaciones de la instrucción secundaria, y factores de progresión académica tales como tasa de retención y/o permanencia. La USACH, busca establecer el mejor criterio de ponderación del factor de admisión, asociado a las calificaciones de enseñanza media que permitan una selección responsable de los estudiantes.

El Puntaje NEM corresponde al promedio de calificaciones de enseñanza media que se obtienen en cada nivel cursado, transformado a un puntaje estándar. El Puntaje Ranking se otorga a la posición relativa de las calificaciones de enseñanza media en comparación con las tres generaciones del o de las estudiantes en su contexto educativo.

Actualmente, la ponderación del puntaje de selección en USACH se desglosa en 10% para el rendimiento académico de las notas de enseñanza media (NEM) que se considera un registro absoluto y 40% con el Puntaje Ranking (PR), que busca establecer una posición relativa en su contexto educativo particular, asignando importancia a la posición obtenida de los estudiantes como factor de admisión. La adición de ambos factores constituye el 50% de la ponderación para la selección de ingreso a las 73 carreras de pregrado que conforman la oferta regular 2023 vigente con alumnos nuevos.

El otro 50 % corresponde a las pruebas de selección universitaria, actuales o pasadas. La institución busca conocer el impacto de alterar la actual ponderación Esto con el fin de determinar si es oportuno o requiere modificación, para una admisión con responsabilidad.

Objetivo General

  • Describir, relacionar y modelar los registros DEMRE-E de calificaciones de enseñanza media, puntaje ranking y los resultados de lenguaje y matemática, respecto de los registros de matrícula por carrera en torno a las tasas de retención, desde primer a tercer año.

Objetivos Específicos

  • Identificar las variables que resulten estadísticamente significativas en torno a la retención al primer, segundo y tercer año.

  • Determinar los efectos de NEM, RNK y LMAT como variables independientes, para los registros de retención por facultad.

  • Establecer comparaciones de los tres factores de selección indicados, de modo de identificar el tamaño de cada efecto y su nivel de significación y de esta manera determinar factores protectores en torno a la retención.

Metodología

  • Se trabajó con Información de postulaciones efectivas DEMRE-E desde el año 2014 hasta 2022. Se excluye el año de proceso 2023, dado que en este año se efectúa un cambio de escala (0 - 1000) y se producen cambios en las pruebas de selección.

  • Se consolidó la información y se procedió a relacionar con los registros de cohortes y retención para los años de cohorte 2014 - 2022. Esto resulta en 4169 registros con información DEMRE de matrículas efectivas en programas regulares.

Estos programas incluyen:

  • CUPO P.S.U.
  • CUPO P.D.T.
  • CUPO BEA
  • CUPO OFICIO DEMRE

I Descripción de las Variables Explicativas

1.1 NEM, Ranking, Lenguaje y Matemática

A continuación se describen los registros asociados a los Puntaje de Notas de Enseñanza Media (NEM) y Puntaje Ranking presentes en la información de DEMRE-E consolidada, además de los registros del promedio obtenidos de lenguaje y matemática (LMAT). Importante señalar que las medidas de tendencia central, media y mediana indican que las calificaciones del nivel secundario de los postulantes a la Universidad de Santiago de Chile (USACH) serían cada vez más altas, lo que denota que la institución habría aumentado su demanda, en cuanto a estudiantes con mejor rendimiento secundario. El caso de LMAT es menos claro a este respecto.

Tabla Descriptiva Inicial

Variables Continuas

Variable n media mediana sd min max
PTJE_NEM 4169 670.77 669.0 56.23 488.0 840.0
PTJE_RANKING 4169 728.00 727.0 74.68 491.0 850.0
PROMEDIO_LMAT_REC 4169 598.48 599.5 55.78 373.5 785.5
EDAD_2 4169 19.17 18.0 2.86 16.0 55.0

Variables Categóricas

Categoría Frecuencia Proporción
Sexo
H 1315 0.32
M 2854 0.68
Sum 4169 1.00
Grupo Dependencia
Municipal 1158 0.28
Particular Pagado 445 0.11
Particular Subvencionado 2537 0.61
SLE 15 0.00
Sum 4155 1.00
Categoría Frecuencia Proporción
Region
Region 844 0.20
RM 3324 0.80
Sum 4168 1.00
Rama
Cientifico Humanista 3618 0.87
Sin Informacion 1 0.00
Tecnico Profesional 550 0.13
Sum 4169 1.00


\[ \] \[ \]

A continuación se muestra, por medio de tres histogramas, información de los registros de los tres factores de selección: NEM, Ranking y LMAT (media de los resultados obtenidos de lenguaje y matemática).

Importante señalar la frecuencia anómala de aquellos puntajes iguales a 850 puntos para el Puntaje Ranking, que resultan escapar de la probabilidad esperada para esa región de la curva. En efecto, se espera una baja probabilidad de puntajes tan altos. Una posible explicación resulta en la naturaleza de la asignación del puntaje a los mejores estudiantes de cada generación. Esto implicaría la posibilidad de puntajes asociados a calificaciones medias o bajas con una alta asignación de Puntaje Ranking.

1.2 Distribución Variables Puntaje NEM, Ranking y LMAT

  • Respecto a la distribución de los datos, la mediana del puntaje NEM en 2014 corresponde a 652 la cual aumenta hasta 709 puntos ponderados en 2022.

  • En efecto, este aumento también se verifica en el puntaje Ranking.716 la cual aumenta hasta 757 puntos ponderados en 2022.

  • La serie, para Lenguaje y matemática inicia con una mediana de 594.5, en tanto que en 2022 esta corresponde a 594

Puntaje NEM, Ranking y LMAT 2014 - 2022 por Año de Proceso
PROCESO
NEM
RNK
LMAT
Año n media med min max sd asim media med min max sd asim n media med min max sd asim
2014 458 654.0 652.0 488 801 51.8 0.2 721.0 716 491 850 75.6 0.0 458 597.4 594.5 477.5 741.0 51.1 0.3
2015 473 657.3 657.0 536 799 50.3 0.1 731.3 731 546 850 73.8 -0.1 473 599.1 598.0 483.0 755.5 53.1 0.3
2016 402 662.6 661.0 544 811 49.5 0.2 724.7 723 559 850 71.6 0.0 402 601.5 601.5 479.0 785.5 55.1 0.2
2017 377 660.7 657.0 502 814 56.8 0.0 721.4 715 502 850 79.7 0.0 377 605.9 606.0 477.5 749.0 50.7 0.1
2018 456 663.5 661.0 525 814 48.5 0.0 726.3 719 548 850 70.6 0.0 456 607.2 609.0 476.0 756.0 55.7 -0.1
2019 486 667.2 669.0 517 818 51.0 0.0 720.9 718 517 850 72.1 0.0 486 603.2 603.5 476.5 775.5 53.9 -0.1
2020 530 668.4 665.5 513 820 54.2 0.0 716.7 714 513 850 72.1 -0.1 530 593.3 592.8 475.5 764.5 57.1 0.1
2021 502 691.9 699.0 517 840 58.6 -0.3 740.9 747 517 850 76.8 -0.4 502 590.3 591.5 389.0 760.0 60.8 -0.2
2022 485 705.4 709.0 494 833 61.7 -0.4 746.9 757 496 850 75.1 -0.5 485 591.9 594.0 373.5 757.5 59.7 -0.2

Es posible indicar, que de acuerdo a la información expuesta y según a lo registrado por DEMRE, los estudiantes que ingresan a la USACH en el periodo descrito, pueden considerarse aptos para el nivel universitario.

En efecto, solo el 25% de los puntajes se encuentra por debajo de 631 para el Puntaje NEM y 673 para Ranking, cual indicaría una población que evidencia aptitudes adecuadas para el nivel universitario, considerando que el 75% de las postulaciones presenta un puntaje medio o medio alto.

La distribución para los puntajes asociados a Lenguaje y Matemática indican que el primer cuartil se encuentra en torno a 558, es decir el 25% de los resultados de LEnaguaje y matemática se encuentra por debajo de este indicador. En tanto que el tercer cuartil se verifica en 637

1.2.1 Distribución Variables Puntaje NEM, Ranking y LMAT según SEXO

  • En efecto, la mediana del periodo 2014-2022 para el grupo masculino del puntaje NEM corresponde a 657 en tanto que para el grupo femenino 677.

  • La mediana del periodo 2014-2022 para el grupo masculino del puntaje Ranking corresponde a 710 en tanto que para el grupo femenino 734.

  • La mediana del periodo 2014-2022 para el grupo masculino del puntaje del promedio de Lenguaje y matemática corresponde a 606.5 en tanto que para el grupo femenino 596.

1.2.2 Distribución Variables Puntaje NEM, Ranking y LMAT - Establecimiento de Origen

A continuación se muestra los resultados de los tres factores de selección por establecimientos de origen.

II Descripción de las Variable Dependiente - Retención

En este apartado se describe la variable dependiente, la cual corresponde a una variable de tipo dicotómica, es decir, de respuesta binaria, donde si la variable toma el valor 0 corresponde a aquellos/aquellas estudiantes “No Retenidos” y 1 los/las estudiantes “Retenidos”.

2.1 Gráficos: Box plot

En los siguientes gráficos se muestra la relación entre las variables Puntaje NEM, Ranking y LMAT según el grupo de No Retenidos (0) y Retenidos (1). Donde si la pendiente es positiva implica que los retenidos tienen un mejor rendimiento, si la pendiente es negativa implica que los no retenidos tienen un mejor rendimiento y si la pendiente es nula implica que los rendimientos son similares entre retenidos y no retenidos.

Facultad

Cluster 1

Carreras
Cluster 1
PEDAGOGÍA EN CASTELLANO
PEDAGOGÍA EN EDUCACIÓN GENERAL BÁSICA
PEDAGOGÍA EN HISTORIA Y CIENCIAS SOCIALES
  • En primer año la diferencia porcentual de la media de los puntajes normalizados para NEM entre retenidos y no retenidos corresponde a 0.03 y la diferencia de la mediana es 0.028 . En la retención al tercer año esta diferencia corresponde a 0.037 y 0.034 , respectivamente.
  • En primer año la diferencia porcentual de la media de los puntajes normalizados para Ranking entre retenidos y no retenidos corresponde a 0.024 y la diferencia de la mediana es 0.036 . En la retención al tercer año esta diferencia corresponde a 0.037 y 0.038 , respectivamente.
  • En primer año la diferencia porcentual de la media de los puntajes normalizados para LMAT entre retenidos y no retenidos corresponde a 0.019 y la diferencia de la mediana es 0.029 . En la retención al tercer año esta diferencia corresponde a 0.011 y 0.03 , respectivamente.

Cluster 2

Carreras
Cluster 2
LICENCIATURA EN ESTUDIOS INTERNACIONALES
LICENCIATURA EN HISTORIA
PEDAGOGÍA EN FILOSOFÍA
PEDAGOGÍA EN INGLÉS
  • En primer año la diferencia porcentual de la media de los puntajes normalizados para NEM entre retenidos y no retenidos corresponde a 0.0361 y la diferencia de la mediana es 0.0284 . En la retención al tercer año esta diferencia corresponde a 0.0343 y 0.0255 , respectivamente.
  • En primer año la diferencia porcentual de la media de los puntajes normalizados para Ranking entre retenidos y no retenidos corresponde a 0.0201 y la diferencia de la mediana es 0.0084 . En la retención al tercer año esta diferencia corresponde a 0.0233 y 0.0069 , respectivamente.
  • En primer año la diferencia porcentual de la media de los puntajes normalizados para LMAT entre retenidos y no retenidos corresponde a 0.042 y la diferencia de la mediana es 0.0449 . En la retención al tercer año esta diferencia corresponde a 0.0557 y 0.0582 , respectivamente.

Cluster 3

Carreras
Cluster 3
LICENCIATURA EN LING. APLIC. A LA TRAD. INGLÉS - JAPONÉS E INGLÉS PORTUG.
PERIODISMO
PSICOLOGÍA
  • En primer año la diferencia porcentual de la media de los puntajes normalizados para NEM entre retenidos y no retenidos corresponde a 0.0148 y la diferencia de la mediana es 0.0199 . En la retención al tercer año esta diferencia corresponde a -0.0013 y 0.0085 , respectivamente.
  • En primer año la diferencia porcentual de la media de los puntajes normalizados para Ranking entre retenidos y no retenidos corresponde a 0.0014 y la diferencia de la mediana es 0.0084 . En la retención al tercer año esta diferencia corresponde a -0.0025 y 0.0084 , respectivamente.
  • En primer año la diferencia porcentual de la media de los puntajes normalizados para LMAT entre retenidos y no retenidos corresponde a 0.0135 y la diferencia de la mediana es 0.0267 . En la retención al tercer año esta diferencia corresponde a 0.0168 y 0.0243 , respectivamente.

2.1 Modelos

2.1.1 Modelos de regresión logística

En primera instancia se realiza un modelo de regresión logística, el cual opera a través de una variable respuesta que se define como:

\[ y= \left\{ \begin{array}{l} 0 \hspace{3mm} Estudiante \hspace{1mm} No \hspace{1mm} Retenido\\ 1 \hspace{3mm} Estudiante \hspace{1mm} Retenido \end{array} \right. \] Esta regresión utiliza la función Logit, la cual se define como:

\[ F(x^t\beta) = \frac{e^{(x^t\beta)}}{1+e^{(x^t\beta)}} \]

En esta primera iteración se utilizan las siguientes variables explicativas: Año de ingreso, carrera, Puntaje NEM, puntaje Ranking, puntaje Promedio(Comprensión Lectora y Matemática), edad, sexo, nivel socio económico, dependencia establecimiento educacional (Público, Subvencionado o Particular) y tipo de establecimiento (Científico Humanista o Técnico Profesional). Y se define un nivel de significancia de \(\alpha=0.05\).

De esta forma, en la siguiente tabla se observan los coeficientes, los odds ratio, que expresan la fuerza de la relación, y que variables son significativas para la explicación de la retención de primer año (Modelo 1), retención al segundo año (Modelo 2) y retención al tercer año (Modelo 3).

Modelo Logístico

Interpretaciones

Las siguientes interpretaciones son para el Modelo 1, el cual corresponde a la Retención al primer año.

  • El Odd Ratio para la variable Puntaje NEM corresponde a 1.0021, esta variable resulta ser no significativa y es un factor protector.

  • El Odd Ratio para la variable Puntaje Ranking corresponde a 0.9998, esta variable resulta ser no significativa y es un factor de riesgo.

  • El Odd Ratio para la variable Puntaje Lenguaje y Matemática corresponde a 1.0052, esta variable resulta ser significativa y es un factor protector.

  • El Odd Ratio para la variable de estudiantes de la región metropolitana corresponde a 1.0624, esta variable resulta ser no significativa y es un factor protector.

  • El Odd Ratio para la variable Origen Educacional de establecimientos pagados corresponde a 0.8281, esta variable resulta ser no significativa y es un factor de riesgo.

  • El Odd Ratio para la variable Origen Educacional de establecimientos Subvencionados corresponde a 1.1747, esta variable resulta ser no significativa y es un factor protector.

  • El Odd Ratio para la variable rama Educacional de estudiantes técnico profesionales corresponde a 1.1321, esta variable resulta ser no significativa y es un factor protector.

Notas

  • Para retención al primer año 4169, están todas las cohortes.

  • Para retención al segundo año 3684, están todas las cohortes menos 2022.

  • Para retención al tercer año 3182, están todas las cohortes excepto 2021 y 2022.

Modelo Logístico cluster

2.1.2 Modelo Cox

En esta instancia se utiliza la regresión de Cox, el cual expresa una función de riesgo \(h(t)\) en función del tiempo \(t\) y un conjunto de variables explicativas \((X)\). La variable tiempo se define como:

\[ t: \text{años hasta que el estudiante aparece como No Retenido.}\hspace{2mm} t=1,2,3\]

Esta regresión utiliza la función Logit, la cual se define como: \[ h(t,X)=h_0(t) \cdot exp{\sum_{j=1}^{p}\beta_jX_j}\]

Modelo de Cox

En las siguientes tablas se observan los resultados de dos tablas sumarias del análisis de cox. En la primera de ellas se indica la cantidad casos en “riesgo” en este caso 4169 de los cuales se observan 674 no retenciones que equivalen a una tasa de “sobreviviencia” de 0.84. La sobrevivencia al tercer año corresponde a 0.72

time n.risk n.event survival
1 4169 674 0.838
2 3067 247 0.771
3 2394 166 0.717

La interpretación del modelo se presenta a través de la \(exp(\beta_i)\). Importante señalar que en esta tabla se omiten los coeficientes, ya que se trabaja directamente con los HR (Hazard Ratio). Cuando el HR es mayor que 1 indica que la relación es directa respecto de la variable dependiente. Asimismo, cuando el HR es menor que 1 indica una relación inversa.

Como el evento que se busca evaluar es relativo a la “No Retención”, los factores están invertidos respecto del Modelo Logístico ya presentado, es decir, aquí el evento es justamente opuesto: “No Retenido - No Retenida”.

  • De acuerdo a lo anterior podemos señalar que la variable asociada a las mujeres demuestra ser una variable significativa. El HR asociado corresponde a 0.811 por tanto la relación respecto del evento de no retención correspondería a un factor protector.

  • Es posible indicar que NEM es una variable significativa. El HR asociado corresponde a 0.996, por tanto la relación respecto del evento de no retención correspondería a un factor protector.

  • Es posible indicar que Ranking es una variable no significativa. El HR corresponde a 1 , por tanto la relación respecto del evento de no retención correspondería a un factor de riesgo..

  • La variable LMAT, resulta ser significativa. El HR asociado corresponde a 0.995, y por tanto sería protector..

  • Es posible indicar que Región es una variable no significativa. El HR asociado a 0.896, por tanto la relación respecto del evento de no retención correspondería a un factor protector., respecto de ser de Región Metropolitana que de Región.

  • Es posible indicar que los estudiantes de establecimientos Pagados resulta ser significativa. El HR asociado corresponde a 1.324, por tanto la relación respecto del evento de no retención correspondería a un factor de riesgo.

  • Es posible indicar que los estudiantes de establecimientos Subvencionados resulta ser no significativa. El HR asociado corresponde a 0.872, por tanto la relación respecto del evento de no retención correspondería a un factor protector..

  • Es posible indicar que los estudiantes técnico profesionales de la variable rama educacional resulta ser no significativa. El HR asociado corresponde a 0.839, por tanto la relación respecto del evento de no retención correspondería a un factor protector..

Modelo Cox Cluster

  • La suma tiempo persona para C1 es 2677

  • La suma tiempo persona para C2 es 2882

  • La suma tiempo persona para C3 es 4071

Anexos

Anexo 1

Tablas Continuas

Resultado Variables Continuas
Estado
ret 1
ret 2
ret 3
Año Ret
no ret
ret
no ret
ret
no ret
ret
Var Media Sd Media Sd Media Sd Media Sd Media Sd Media Sd
EDAD_2 19.40 3.26 19.13 2.77 19.49 3.38 19.14 2.74 19.52 3.27 19.17 2.78
PTJE_NEM 659.51 55.28 672.94 56.17 656.72 54.12 669.09 53.45 653.75 51.74 665.67 51.62
PTJE_RANKING 719.08 74.22 729.72 74.66 716.61 75.13 728.20 73.81 714.36 73.46 726.72 73.34
PROMEDIO_LMAT_REC 588.06 57.77 600.49 55.17 588.99 57.38 602.49 54.14 591.08 55.85 604.84 52.89

Gráfico Facultad

Gráfico Cluster 1

Gráfico Cluster 2

Gráfico Cluster 3

Anexo 2

Tabla Columnas

Resultado Variables categoricas columnas
var
ret 1
ret 2
ret 3
var
no ret
ret
no ret
ret
no ret
ret
freq prop freq prop freq prop freq prop freq prop freq prop
Sexo
H 251 0.37 1064 0.30 313 0.37 842 0.30 336 0.36 657 0.29
M 423 0.63 2431 0.70 543 0.63 1986 0.70 602 0.64 1587 0.71
Sum 674 1.00 3495 1.00 856 1.00 2828 1.00 938 1.00 2244 1.00
Region
Region 142 0.21 702 0.20 182 0.21 561 0.20 196 0.21 461 0.21
RM 531 0.79 2793 0.80 673 0.79 2267 0.80 741 0.79 1783 0.79
Sum 673 1.00 3495 1.00 855 1.00 2828 1.00 937 1.00 2244 1.00
Grupo Dependencia
Municipal 205 0.31 953 0.27 251 0.30 771 0.27 277 0.30 601 0.27
Particular Pagado 80 0.12 365 0.10 104 0.12 292 0.10 116 0.12 224 0.10
Particular Subvencionado 381 0.57 2156 0.62 491 0.58 1751 0.62 539 0.58 1409 0.63
SLE 3 0.00 12 0.00 2 0.00 8 0.00 0 0.00 4 0.00
Sum 669 1.00 3486 1.00 848 1.00 2822 1.00 932 1.00 2238 1.00
Rama
Cientifico Humanista 581 0.86 3037 0.87 739 0.86 2432 0.86 806 0.86 1913 0.85
Sin Informacion 1 0.00 0 0.00 1 0.00 0 0.00 1 0.00 0 0.00
Tecnico Profesional 92 0.14 458 0.13 116 0.14 396 0.14 131 0.14 331 0.15
Sum 674 1.00 3495 1.00 856 1.00 2828 1.00 938 1.00 2244 1.00

Tabla Filas

Resultado Variables categoricas Filas
id
ret 1
ret 2
ret 3
id
no ret
ret
no ret
ret
no ret
ret
id freq prop freq prop freq prop freq prop freq prop freq prop
Sexo
1 H 251 0.19 1064 0.81 313 0.27 842 0.73 336 0.34 657 0.66
2 M 423 0.15 2431 0.85 543 0.21 1986 0.79 602 0.28 1587 0.72
Region
4 Region 142 0.17 702 0.83 182 0.24 561 0.76 196 0.30 461 0.70
5 RM 531 0.16 2793 0.84 673 0.23 2267 0.77 741 0.29 1783 0.71
grupo dep
7 Municipal 205 0.18 953 0.82 251 0.25 771 0.75 277 0.32 601 0.68
8 Particular.Pagado 80 0.18 365 0.82 104 0.26 292 0.74 116 0.34 224 0.66
9 Particular.Subvencionado 381 0.15 2156 0.85 491 0.22 1751 0.78 539 0.28 1409 0.72
10 SLE 3 0.20 12 0.80 2 0.20 8 0.80 0 0.00 4 1.00
Rama
12 Cientifico.Humanista 581 0.16 3037 0.84 739 0.23 2432 0.77 806 0.30 1913 0.70
13 Sin.Informacion 1 1.00 0 0.00 1 1.00 0 0.00 1 1.00 0 0.00
14 Tecnico.Profesional 92 0.17 458 0.83 116 0.23 396 0.77 131 0.28 331 0.72

Anexo 3

A continuación se describe el porcentaje de estudiantes que regresa a la institución, luego de ser considerado como no retenido.
Tabla Estudiantes no retenidos que regresan
Año frec_1 prop_1 frec_2 prop_2 total
2014 2 2.78% 1 0.98% 3
2016 3 4.11% 5 4.9% 8
2017 1 1.43% 1 0.94% 2
2018 2 2.15% 2 1.65% 4
2019 NA NA 2 2.02% NA
2020 2 2.63% 0 0 2
2021 1 2.04% NA NA NA