Antecedentes

A continuación, se elabora una propuesta de estudio que busca sentar los objetivos, metodologías e insumos necesarios que permitan analizar y evaluar el impacto de modificar la ponderación de selección asignada a las calificaciones de enseñanza secundaria. Para tal fin se busca caracterizar y sistematizar la relación entre el rendimiento académico temprano, a partir de las calificaciones de la instrucción secundaria, y factores de progresión académica tales como tasa de retención y/o permanencia. La USACH, busca establecer el mejor criterio de ponderación del factor de admisión, asociado a las calificaciones de enseñanza media que permitan una selección responsable de los estudiantes.

El Puntaje NEM corresponde al promedio de calificaciones de enseñanza media que se obtienen en cada nivel cursado, transformado a un puntaje estándar. El Puntaje Ranking se otorga a la posición relativa de las calificaciones de enseñanza media en comparación con las tres generaciones del o de las estudiantes en su contexto educativo.

Actualmente, la ponderación del puntaje de selección en USACH se desglosa en 10% para el rendimiento académico de las notas de enseñanza media (NEM) que se considera un registro absoluto y 40% con el Puntaje Ranking (PR), que busca establecer una posición relativa en su contexto educativo particular, asignando importancia a la posición obtenida de los estudiantes como factor de admisión. La adición de ambos factores constituye el 50% de la ponderación para la selección de ingreso a las 73 carreras de pregrado que conforman la oferta regular 2023 vigente con alumnos nuevos.

El otro 50 % corresponde a las pruebas de selección universitaria, actuales o pasadas. La institución busca conocer el impacto de alterar la actual ponderación Esto con el fin de determinar si es oportuno o requiere modificación, para una admisión con responsabilidad.

Objetivo General

  • Describir, relacionar y modelar los registros DEMRE-E de calificaciones de enseñanza media, puntaje ranking y los resultados de lenguaje y matemática, respecto de los registros de matrícula por carrera en torno a las tasas de retención, desde primer a tercer año.

Objetivos Específicos

  • Identificar las variables que resulten estadísticamente significativas en torno a la retención al primer, segundo y tercer año.

  • Determinar los efectos de NEM, RNK y LMAT como variables independientes, para los registros de retención por facultad.

  • Establecer comparaciones de los tres factores de selección indicados, de modo de identificar el tamaño de cada efecto y su nivel de significación y de esta manera determinar factores protectores en torno a la retención.

Metodología

  • Se trabajó con Información de postulaciones efectivas DEMRE-E desde el año 2014 hasta 2022. Se excluye el año de proceso 2023, dado que en este año se efectúa un cambio de escala (0 - 1000) y se producen cambios en las pruebas de selección.

  • Se consolidó la información y se procedió a relacionar con los registros de cohortes y retención para los años de cohorte 2014 - 2022. Esto resulta en 5713 registros con información DEMRE de matrículas efectivas en programas regulares.

Estos programas incluyen:

  • CUPO P.S.U.
  • CUPO P.D.T.
  • CUPO BEA
  • CUPO OFICIO DEMRE

I Descripción de las Variables Explicativas

1.1 NEM, Ranking, Lenguaje y Matemática

A continuación se describen los registros asociados a los Puntaje de Notas de Enseñanza Media (NEM) y Puntaje Ranking presentes en la información de DEMRE-E consolidada, además de los registros del promedio obtenidos de lenguaje y matemática (LMAT). Importante señalar que las medidas de tendencia central, media y mediana indican que las calificaciones del nivel secundario de los postulantes a la Universidad de Santiago de Chile (USACH) serían cada vez más altas, lo que denota que la institución habría aumentado su demanda, en cuanto a estudiantes con mejor rendimiento secundario. El caso de LMAT es menos claro a este respecto.

Tabla Descriptiva Inicial

Variables Continuas

Variable n media mediana sd min max
PTJE_NEM 5713 670.95 669 49.89 481.0 834.0
PTJE_RANKING 5713 731.37 730 70.17 482.0 850.0
PROMEDIO_LMAT_REC 5713 583.94 585 52.97 333.5 775.5
EDAD_2 5713 18.72 18 2.31 17.0 66.0

Variables Categóricas

Categoría Frecuencia Proporción
Sexo
H 2527 0.44
M 3186 0.56
Sum 5713 1.00
Grupo Dependencia
Municipal 1514 0.27
Particular Pagado 375 0.07
Particular Subvencionado 3799 0.67
SLE 16 0.00
Sum 5704 1.00
Categoría Frecuencia Proporción
Region
Region 798 0.14
RM 4913 0.86
Sum 5711 1.00
Rama
Cientifico Humanista 4111 0.72
Sin Informacion 2 0.00
Tecnico Profesional 1600 0.28
Sum 5713 1.00


\[ \] \[ \]

A continuación se muestra, por medio de tres histogramas, información de los registros de los tres factores de selección: NEM, Ranking y LMAT (media de los resultados obtenidos de lenguaje y matemática).

Importante señalar la frecuencia anómala de aquellos puntajes iguales a 850 puntos para el Puntaje Ranking, que resultan escapar de la probabilidad esperada para esa región de la curva. En efecto, se espera una baja probabilidad de puntajes tan altos. Una posible explicación resulta en la naturaleza de la asignación del puntaje a los mejores estudiantes de cada generación. Esto implicaría la posibilidad de puntajes asociados a calificaciones medias o bajas con una alta asignación de Puntaje Ranking.

1.2 Distribución Variables Puntaje NEM, Ranking y LMAT

  • Respecto a la distribución de los datos, la mediana del puntaje NEM en 2014 corresponde a 673 la cual aumenta hasta 698 puntos ponderados en 2022.

  • En efecto, este aumento también se verifica en el puntaje Ranking.755.5 la cual aumenta hasta 745 puntos ponderados en 2022.

  • La serie, para Lenguaje y matemática inicia con una mediana de 594.75, en tanto que en 2022 esta corresponde a 567.75

Puntaje NEM, Ranking y LMAT 2014 - 2022 por Año de Proceso
PROCESO
NEM
RNK
LMAT
Año n media med min max sd asim media med min max sd asim n media med min max sd asim
2014 398 674.9 673.0 556 804 49.1 0.1 752.1 755.5 556 850 70.6 -0.3 398 592.4 594.8 477.5 738.0 52.3 0.0
2015 642 665.3 663.5 544 793 48.1 0.2 741.4 736.5 544 850 70.8 -0.1 642 590.4 589.5 475.0 751.5 53.2 0.2
2016 613 666.2 667.0 513 785 45.4 0.0 732.6 733.0 520 850 68.2 -0.2 613 594.3 597.0 479.0 755.0 49.4 0.1
2017 642 668.6 667.0 515 811 44.9 0.1 733.2 730.5 524 850 65.9 0.0 642 591.0 593.0 478.0 736.0 49.8 0.1
2018 679 666.4 662.0 513 805 47.4 0.2 731.1 730.0 513 850 68.2 0.0 679 589.2 588.5 480.5 746.0 53.0 0.1
2019 672 668.1 666.5 481 805 48.9 0.0 726.5 726.0 482 850 70.2 -0.1 672 587.7 588.5 475.0 735.0 50.1 0.1
2020 740 654.1 650.0 534 823 49.2 0.3 702.1 694.0 537 850 70.6 0.3 740 580.7 578.5 477.0 775.5 52.1 0.2
2021 679 681.2 678.0 541 828 50.4 0.2 731.6 729.0 565 850 68.6 0.1 679 566.9 566.0 333.5 757.5 54.5 -0.1
2022 648 697.1 698.0 519 834 52.6 -0.2 744.2 745.0 537 850 67.6 -0.3 648 567.8 567.8 354.5 760.0 53.8 0.0

Es posible indicar, que de acuerdo a la información expuesta y según a lo registrado por DEMRE, los estudiantes que ingresan a la USACH en el periodo descrito, pueden considerarse aptos para el nivel universitario.

En efecto, solo el 25% de los puntajes se encuentra por debajo de 637 para el Puntaje NEM y 681 para Ranking, cual indicaría una población que evidencia aptitudes adecuadas para el nivel universitario, considerando que el 75% de las postulaciones presenta un puntaje medio o medio alto.

La distribución para los puntajes asociados a Lenguaje y Matemática indican que el primer cuartil se encuentra en torno a 546.5, es decir el 25% de los resultados de LEnaguaje y matemática se encuentra por debajo de este indicador. En tanto que el tercer cuartil se verifica en 619.5

1.2.1 Distribución Variables Puntaje NEM, Ranking y LMAT según SEXO

  • En efecto, la mediana del periodo 2014-2022 para el grupo masculino del puntaje NEM corresponde a 657.5 en tanto que para el grupo femenino 678.

  • La mediana del periodo 2014-2022 para el grupo masculino del puntaje Ranking corresponde a 715 en tanto que para el grupo femenino 741.

  • La mediana del periodo 2014-2022 para el grupo masculino del puntaje del promedio de Lenguaje y matemática corresponde a 596.5 en tanto que para el grupo femenino 574.5.

1.2.2 Distribución Variables Puntaje NEM, Ranking y LMAT - Establecimiento de Origen

A continuación se muestra los resultados de los tres factores de selección por establecimientos de origen.

II Descripción de las Variable Dependiente - Retención

En este apartado se describe la variable dependiente, la cual corresponde a una variable de tipo dicotómica, es decir, de respuesta binaria, donde si la variable toma el valor 0 corresponde a aquellos/aquellas estudiantes “No Retenidos” y 1 los/las estudiantes “Retenidos”.

2.1 Gráficos: Box plot

En los siguientes gráficos se muestra la relación entre las variables Puntaje NEM, Ranking y LMAT según el grupo de No Retenidos (0) y Retenidos (1). Donde si la pendiente es positiva implica que los retenidos tienen un mejor rendimiento, si la pendiente es negativa implica que los no retenidos tienen un mejor rendimiento y si la pendiente es nula implica que los rendimientos son similares entre retenidos y no retenidos.

Facultad

Cluster 1

Carreras
Cluster 1
INGENIERÍA COMERCIAL
  • En primer año la diferencia porcentual de la media de los puntajes normalizados para NEM entre retenidos y no retenidos corresponde a -0.017 y la diferencia de la mediana es -0.011 . En la retención al tercer año esta diferencia corresponde a -0.008 y -0.013 , respectivamente.
  • En primer año la diferencia porcentual de la media de los puntajes normalizados para Ranking entre retenidos y no retenidos corresponde a -0.036 y la diferencia de la mediana es -0.054 . En la retención al tercer año esta diferencia corresponde a -0.035 y -0.06 , respectivamente.
  • En primer año la diferencia porcentual de la media de los puntajes normalizados para LMAT entre retenidos y no retenidos corresponde a 0.028 y la diferencia de la mediana es 0.032 . En la retención al tercer año esta diferencia corresponde a 0.025 y 0.028 , respectivamente.

Cluster 2

Carreras
Cluster 2
ADMINISTRACIÓN PÚBLICA
CONTADOR PÚBLICO Y AUDITOR (DIURNO)
CONTADOR PÚBLICO Y AUDITOR (VESPERTINO)
  • En primer año la diferencia porcentual de la media de los puntajes normalizados para NEM entre retenidos y no retenidos corresponde a 0.0044 y la diferencia de la mediana es 0.0028 . En la retención al tercer año esta diferencia corresponde a -0.0067 y -0.0085 , respectivamente.
  • En primer año la diferencia porcentual de la media de los puntajes normalizados para Ranking entre retenidos y no retenidos corresponde a -0.0246 y la diferencia de la mediana es -0.0258 . En la retención al tercer año esta diferencia corresponde a -0.0309 y -0.0218 , respectivamente.
  • En primer año la diferencia porcentual de la media de los puntajes normalizados para LMAT entre retenidos y no retenidos corresponde a 0.024 y la diferencia de la mediana es 0.0278 . En la retención al tercer año esta diferencia corresponde a 0.0233 y 0.0226 , respectivamente.

Cluster 3

Carreras
Cluster 3
## [1] "No existe Cluster 3 para esta facultad"

[1] “No existe C3”

2.1 Modelos

2.1.1 Modelos de regresión logística

En primera instancia se realiza un modelo de regresión logística, el cual opera a través de una variable respuesta que se define como:

\[ y= \left\{ \begin{array}{l} 0 \hspace{3mm} Estudiante \hspace{1mm} No \hspace{1mm} Retenido\\ 1 \hspace{3mm} Estudiante \hspace{1mm} Retenido \end{array} \right. \] Esta regresión utiliza la función Logit, la cual se define como:

\[ F(x^t\beta) = \frac{e^{(x^t\beta)}}{1+e^{(x^t\beta)}} \]

En esta primera iteración se utilizan las siguientes variables explicativas: Año de ingreso, carrera, Puntaje NEM, puntaje Ranking, puntaje Promedio(Comprensión Lectora y Matemática), edad, sexo, nivel socio económico, dependencia establecimiento educacional (Público, Subvencionado o Particular) y tipo de establecimiento (Científico Humanista o Técnico Profesional). Y se define un nivel de significancia de \(\alpha=0.05\).

De esta forma, en la siguiente tabla se observan los coeficientes, los odds ratio, que expresan la fuerza de la relación, y que variables son significativas para la explicación de la retención de primer año (Modelo 1), retención al segundo año (Modelo 2) y retención al tercer año (Modelo 3).

Modelo Logístico

Interpretaciones

Las siguientes interpretaciones son para el Modelo 1, el cual corresponde a la Retención al primer año.

  • El Odd Ratio para la variable Puntaje NEM corresponde a 1.005, esta variable resulta ser significativa y es un factor protector.

  • El Odd Ratio para la variable Puntaje Ranking corresponde a 0.9963, esta variable resulta ser significativa y es un factor de riesgo.

  • El Odd Ratio para la variable Puntaje Lenguaje y Matemática corresponde a 1.0054, esta variable resulta ser significativa y es un factor protector.

  • El Odd Ratio para la variable de estudiantes de la región metropolitana corresponde a 1.2122, esta variable resulta ser no significativa y es un factor protector.

  • El Odd Ratio para la variable Origen Educacional de establecimientos pagados corresponde a 0.5469, esta variable resulta ser significativa y es un factor de riesgo.

  • El Odd Ratio para la variable Origen Educacional de establecimientos Subvencionados corresponde a 1.0721, esta variable resulta ser no significativa y es un factor protector.

  • El Odd Ratio para la variable rama Educacional de estudiantes técnico profesionales corresponde a 1.2642, esta variable resulta ser significativa y es un factor protector.

Notas

  • Para retención al primer año 5713, están todas las cohortes.

  • Para retención al segundo año 5065, están todas las cohortes menos 2022.

  • Para retención al tercer año 4386, están todas las cohortes excepto 2021 y 2022.

Modelo Logístico cluster

2.1.2 Modelo Cox

En esta instancia se utiliza la regresión de Cox, el cual expresa una función de riesgo \(h(t)\) en función del tiempo \(t\) y un conjunto de variables explicativas \((X)\). La variable tiempo se define como:

\[ t: \text{años hasta que el estudiante aparece como No Retenido.}\hspace{2mm} t=1,2,3\]

Esta regresión utiliza la función Logit, la cual se define como: \[ h(t,X)=h_0(t) \cdot exp{\sum_{j=1}^{p}\beta_jX_j}\]

Modelo de Cox

En las siguientes tablas se observan los resultados de dos tablas sumarias del análisis de cox. En la primera de ellas se indica la cantidad casos en “riesgo” en este caso 5713 de los cuales se observan 723 no retenciones que equivalen a una tasa de “sobreviviencia” de 0.87. La sobrevivencia al tercer año corresponde a 0.79

time n.risk n.event survival
1 5713 723 0.873
2 4423 263 0.822
3 3613 139 0.790

La interpretación del modelo se presenta a través de la \(exp(\beta_i)\). Importante señalar que en esta tabla se omiten los coeficientes, ya que se trabaja directamente con los HR (Hazard Ratio). Cuando el HR es mayor que 1 indica que la relación es directa respecto de la variable dependiente. Asimismo, cuando el HR es menor que 1 indica una relación inversa.

Como el evento que se busca evaluar es relativo a la “No Retención”, los factores están invertidos respecto del Modelo Logístico ya presentado, es decir, aquí el evento es justamente opuesto: “No Retenido - No Retenida”.

  • De acuerdo a lo anterior podemos señalar que la variable asociada a las mujeres demuestra ser una variable no significativa. El HR asociado corresponde a 0.918 por tanto la relación respecto del evento de no retención correspondería a un factor protector.

  • Es posible indicar que NEM es una variable significativa. El HR asociado corresponde a 0.995, por tanto la relación respecto del evento de no retención correspondería a un factor protector.

  • Es posible indicar que Ranking es una variable significativa. El HR corresponde a 1.004 , por tanto la relación respecto del evento de no retención correspondería a un factor de riesgo..

  • La variable LMAT, resulta ser significativa. El HR asociado corresponde a 0.996, y por tanto sería protector..

  • Es posible indicar que Región es una variable significativa. El HR asociado a 0.809, por tanto la relación respecto del evento de no retención correspondería a un factor protector., respecto de ser de Región Metropolitana que de Región.

  • Es posible indicar que los estudiantes de establecimientos Pagados resulta ser significativa. El HR asociado corresponde a 1.359, por tanto la relación respecto del evento de no retención correspondería a un factor de riesgo.

  • Es posible indicar que los estudiantes de establecimientos Subvencionados resulta ser significativa. El HR asociado corresponde a 0.847, por tanto la relación respecto del evento de no retención correspondería a un factor protector..

  • Es posible indicar que los estudiantes técnico profesionales de la variable rama educacional resulta ser no significativa. El HR asociado corresponde a 0.873, por tanto la relación respecto del evento de no retención correspondería a un factor protector..

Modelo Cox Cluster

  • La suma tiempo persona para C1 es 5897

  • La suma tiempo persona para C2 es 7852

  • La suma tiempo persona para C3 es No Aplica

Anexos

Anexo 1

Tablas Continuas

Resultado Variables Continuas
Estado
ret 1
ret 2
ret 3
Año Ret
no ret
ret
no ret
ret
no ret
ret
Var Media Sd Media Sd Media Sd Media Sd Media Sd Media Sd
EDAD_2 18.94 3.21 18.69 2.15 18.95 3.05 18.71 2.09 18.99 2.90 18.74 2.06
PTJE_NEM 672.43 49.34 670.73 49.97 668.63 47.68 667.38 48.70 666.40 46.75 665.26 48.18
PTJE_RANKING 740.94 71.06 729.99 69.93 737.64 71.64 728.03 69.92 737.49 71.79 727.35 70.13
PROMEDIO_LMAT_REC 574.04 56.61 585.37 52.27 576.05 55.04 588.15 51.70 579.83 53.20 591.33 50.88

Gráfico Facultad

Gráfico Cluster 1

Gráfico Cluster 2

Gráfico Cluster 3

## [1] "No existe Cluster 3 para esta facultad"

Anexo 2

Tabla Columnas

Resultado Variables categoricas columnas
var
ret 1
ret 2
ret 3
var
no ret
ret
no ret
ret
no ret
ret
freq prop freq prop freq prop freq prop freq prop freq prop
Sexo
H 331 0.46 2196 0.44 394 0.44 1789 0.43 394 0.44 1478 0.42
M 392 0.54 2794 0.56 503 0.56 2379 0.57 508 0.56 2006 0.58
Sum 723 1.00 4990 1.00 897 1.00 4168 1.00 902 1.00 3484 1.00
Region
Region 115 0.16 683 0.14 144 0.16 586 0.14 153 0.17 483 0.14
RM 608 0.84 4305 0.86 753 0.84 3581 0.86 749 0.83 3000 0.86
Sum 723 1.00 4988 1.00 897 1.00 4167 1.00 902 1.00 3483 1.00
Grupo Dependencia
Municipal 197 0.27 1317 0.26 269 0.30 1076 0.26 260 0.29 870 0.25
Particular Pagado 65 0.09 310 0.06 72 0.08 252 0.06 66 0.07 219 0.06
Particular Subvencionado 455 0.63 3344 0.67 550 0.61 2827 0.68 573 0.64 2385 0.69
SLE 5 0.01 11 0.00 5 0.01 7 0.00 3 0.00 4 0.00
Sum 722 1.00 4982 1.00 896 1.00 4162 1.00 902 1.00 3478 1.00
Rama
Cientifico Humanista 514 0.71 3597 0.72 637 0.71 2991 0.72 635 0.70 2507 0.72
Sin Informacion 1 0.00 1 0.00 1 0.00 1 0.00 1 0.00 1 0.00
Tecnico Profesional 208 0.29 1392 0.28 259 0.29 1176 0.28 266 0.29 976 0.28
Sum 723 1.00 4990 1.00 897 1.00 4168 1.00 902 1.00 3484 1.00

Tabla Filas

Resultado Variables categoricas Filas
id
ret 1
ret 2
ret 3
id
no ret
ret
no ret
ret
no ret
ret
id freq prop freq prop freq prop freq prop freq prop freq prop
Sexo
1 H 331 0.13 2196 0.87 394 0.18 1789 0.82 394 0.21 1478 0.79
2 M 392 0.12 2794 0.88 503 0.17 2379 0.83 508 0.20 2006 0.80
Region
4 Region 115 0.14 683 0.86 144 0.20 586 0.80 153 0.24 483 0.76
5 RM 608 0.12 4305 0.88 753 0.17 3581 0.83 749 0.20 3000 0.80
grupo dep
7 Municipal 197 0.13 1317 0.87 269 0.20 1076 0.80 260 0.23 870 0.77
8 Particular.Pagado 65 0.17 310 0.83 72 0.22 252 0.78 66 0.23 219 0.77
9 Particular.Subvencionado 455 0.12 3344 0.88 550 0.16 2827 0.84 573 0.19 2385 0.81
10 SLE 5 0.31 11 0.69 5 0.42 7 0.58 3 0.43 4 0.57
Rama
12 Cientifico.Humanista 514 0.13 3597 0.87 637 0.18 2991 0.82 635 0.20 2507 0.80
13 Sin.Informacion 1 0.50 1 0.50 1 0.50 1 0.50 1 0.50 1 0.50
14 Tecnico.Profesional 208 0.13 1392 0.87 259 0.18 1176 0.82 266 0.21 976 0.79

Anexo 3

A continuación se describe el porcentaje de estudiantes que regresa a la institución, luego de ser considerado como no retenido.
Tabla Estudiantes no retenidos que regresan
Año frec_1 prop_1 frec_2 prop_2 total
2014 3 5.77% NA NA NA
2015 NA NA 1 0.66% NA
2016 1 1.16% 3 2.46% 4
2017 NA NA 1 0.81% NA
2018 1 1.11% NA NA NA
2019 1 1.37% 1 1.11% 2
2020 3 4.76% 1 1.05% 4
2020 3 4.76% 0 0 3