Antecedentes

A continuación, se elabora una propuesta de estudio que busca sentar los objetivos, metodologías e insumos necesarios que permitan analizar y evaluar el impacto de modificar la ponderación de selección asignada a las calificaciones de enseñanza secundaria. Para tal fin se busca caracterizar y sistematizar la relación entre el rendimiento académico temprano, a partir de las calificaciones de la instrucción secundaria, y factores de progresión académica tales como tasa de retención y/o permanencia. La USACH, busca establecer el mejor criterio de ponderación del factor de admisión, asociado a las calificaciones de enseñanza media que permitan una selección responsable de los estudiantes.

El Puntaje NEM corresponde al promedio de calificaciones de enseñanza media que se obtienen en cada nivel cursado, transformado a un puntaje estándar. El Puntaje Ranking se otorga a la posición relativa de las calificaciones de enseñanza media en comparación con las tres generaciones del o de las estudiantes en su contexto educativo.

Actualmente, la ponderación del puntaje de selección en USACH se desglosa en 10% para el rendimiento académico de las notas de enseñanza media (NEM) que se considera un registro absoluto y 40% con el Puntaje Ranking (PR), que busca establecer una posición relativa en su contexto educativo particular, asignando importancia a la posición obtenida de los estudiantes como factor de admisión. La adición de ambos factores constituye el 50% de la ponderación para la selección de ingreso a las 73 carreras de pregrado que conforman la oferta regular 2023 vigente con alumnos nuevos.

El otro 50 % corresponde a las pruebas de selección universitaria, actuales o pasadas. La institución busca conocer el impacto de alterar la actual ponderación Esto con el fin de determinar si es oportuno o requiere modificación, para una admisión con responsabilidad.

Objetivo General

  • Describir, relacionar y modelar los registros DEMRE-E de calificaciones de enseñanza media, puntaje ranking y los resultados de lenguaje y matemática, respecto de los registros de matrícula por carrera en torno a las tasas de retención, desde primer a tercer año.

Objetivos Específicos

  • Identificar las variables que resulten estadísticamente significativas en torno a la retención al primer, segundo y tercer año.

  • Determinar los efectos de NEM, RNK y LMAT como variables independientes, para los registros de retención por facultad.

  • Establecer comparaciones de los tres factores de selección indicados, de modo de identificar el tamaño de cada efecto y su nivel de significación y de esta manera determinar factores protectores en torno a la retención.

Metodología

  • Se trabajó con Información de postulaciones efectivas DEMRE-E desde el año 2014 hasta 2022. Se excluye el año de proceso 2023, dado que en este año se efectúa un cambio de escala (0 - 1000) y se producen cambios en las pruebas de selección.

  • Se consolidó la información y se procedió a relacionar con los registros de cohortes y retención para los años de cohorte 2014 - 2022. Esto resulta en 2726 registros con información DEMRE de matrículas efectivas en programas regulares.

Estos programas incluyen:

  • CUPO P.S.U.
  • CUPO P.D.T.
  • CUPO BEA
  • CUPO OFICIO DEMRE

I Descripción de las Variables Explicativas

1.1 NEM, Ranking, Lenguaje y Matemática

A continuación se describen los registros asociados a los Puntaje de Notas de Enseñanza Media (NEM) y Puntaje Ranking presentes en la información de DEMRE-E consolidada, además de los registros del promedio obtenidos de lenguaje y matemática (LMAT). Importante señalar que las medidas de tendencia central, media y mediana indican que las calificaciones del nivel secundario de los postulantes a la Universidad de Santiago de Chile (USACH) serían cada vez más altas, lo que denota que la institución habría aumentado su demanda, en cuanto a estudiantes con mejor rendimiento secundario. El caso de LMAT es menos claro a este respecto.

Tabla Descriptiva Inicial

Variables Continuas

Variable n media mediana sd min max
PTJE_NEM 2726 717.33 725.0 62.65 430 845
PTJE_RANKING 2726 784.66 809.5 74.53 430 850
PROMEDIO_LMAT_REC 2726 627.73 619.5 70.09 414 814
EDAD_2 2726 18.81 18.0 2.14 17 68

Variables Categóricas

Categoría Frecuencia Proporción
Sexo
H 859 0.32
M 1867 0.68
Sum 2726 1.00
Grupo Dependencia
Municipal 657 0.24
Particular Pagado 403 0.15
Particular Subvencionado 1652 0.61
SLE 10 0.00
Sum 2722 1.00
Categoría Frecuencia Proporción
Region
Region 492 0.18
RM 2233 0.82
Sum 2725 1.00
Rama
Cientifico Humanista 2486 0.91
Tecnico Profesional 240 0.09
Sum 2726 1.00
NA NA NA


\[ \] \[ \]

A continuación se muestra, por medio de tres histogramas, información de los registros de los tres factores de selección: NEM, Ranking y LMAT (media de los resultados obtenidos de lenguaje y matemática).

Importante señalar la frecuencia anómala de aquellos puntajes iguales a 850 puntos para el Puntaje Ranking, que resultan escapar de la probabilidad esperada para esa región de la curva. En efecto, se espera una baja probabilidad de puntajes tan altos. Una posible explicación resulta en la naturaleza de la asignación del puntaje a los mejores estudiantes de cada generación. Esto implicaría la posibilidad de puntajes asociados a calificaciones medias o bajas con una alta asignación de Puntaje Ranking.

1.2 Distribución Variables Puntaje NEM, Ranking y LMAT

  • Respecto a la distribución de los datos, la mediana del puntaje NEM en 2014 corresponde a 725 la cual aumenta hasta 753 puntos ponderados en 2022.

  • En efecto, este aumento también se verifica en el puntaje Ranking.816 la cual aumenta hasta 814.5 puntos ponderados en 2022.

  • La serie, para Lenguaje y matemática inicia con una mediana de 620, en tanto que en 2022 esta corresponde a 608

Puntaje NEM, Ranking y LMAT 2014 - 2022 por Año de Proceso
PROCESO
NEM
RNK
LMAT
Año n media med min max sd asim media med min max sd asim n media med min max sd asim
2014 251 713.1 725 540 818 59.9 -0.7 791.7 816.0 569 850 71.8 -1.3 251 628.0 620.0 503.0 787.5 69.1 0.3
2015 258 702.6 712 542 816 63.7 -0.4 779.1 804.0 542 850 79.9 -1.0 258 640.9 633.0 500.0 814.0 67.1 0.2
2016 301 710.8 719 564 826 56.1 -0.4 785.9 808.0 568 850 68.8 -1.0 301 630.4 622.0 492.0 786.5 65.0 0.3
2017 270 714.4 723 515 816 58.3 -0.8 787.0 811.0 526 850 72.5 -1.4 270 637.9 625.0 501.0 792.5 66.4 0.3
2018 309 715.1 723 513 816 55.5 -0.6 787.8 811.0 513 850 68.3 -1.2 309 641.1 632.0 488.0 797.0 67.5 0.4
2019 322 717.6 725 534 825 57.8 -0.7 789.9 817.0 554 850 71.5 -1.3 322 628.6 621.0 477.5 790.5 69.1 0.3
2020 357 721.5 729 544 835 60.3 -0.5 784.4 806.0 550 850 71.0 -1.1 357 622.0 614.0 477.5 798.0 70.2 0.2
2021 346 716.5 728 479 840 73.1 -0.8 772.8 799.5 481 850 84.2 -1.2 346 610.0 600.5 414.0 804.5 75.4 0.3
2022 312 739.8 753 430 845 69.4 -1.1 785.3 814.5 430 850 79.7 -1.6 312 617.3 608.0 425.0 786.5 72.7 0.2

Es posible indicar, que de acuerdo a la información expuesta y según a lo registrado por DEMRE, los estudiantes que ingresan a la USACH en el periodo descrito, pueden considerarse aptos para el nivel universitario.

En efecto, solo el 25% de los puntajes se encuentra por debajo de 682 para el Puntaje NEM y 746 para Ranking, cual indicaría una población que evidencia aptitudes adecuadas para el nivel universitario, considerando que el 75% de las postulaciones presenta un puntaje medio o medio alto.

La distribución para los puntajes asociados a Lenguaje y Matemática indican que el primer cuartil se encuentra en torno a 578, es decir el 25% de los resultados de LEnaguaje y matemática se encuentra por debajo de este indicador. En tanto que el tercer cuartil se verifica en 673.62

1.2.1 Distribución Variables Puntaje NEM, Ranking y LMAT según SEXO

  • En efecto, la mediana del periodo 2014-2022 para el grupo masculino del puntaje NEM corresponde a 698 en tanto que para el grupo femenino 732.

  • La mediana del periodo 2014-2022 para el grupo masculino del puntaje Ranking corresponde a 781 en tanto que para el grupo femenino 817.

  • La mediana del periodo 2014-2022 para el grupo masculino del puntaje del promedio de Lenguaje y matemática corresponde a 616 en tanto que para el grupo femenino 620.

1.2.2 Distribución Variables Puntaje NEM, Ranking y LMAT - Establecimiento de Origen

A continuación se muestra los resultados de los tres factores de selección por establecimientos de origen.

II Descripción de las Variable Dependiente - Retención

En este apartado se describe la variable dependiente, la cual corresponde a una variable de tipo dicotómica, es decir, de respuesta binaria, donde si la variable toma el valor 0 corresponde a aquellos/aquellas estudiantes “No Retenidos” y 1 los/las estudiantes “Retenidos”.

2.1 Gráficos: Box plot

En los siguientes gráficos se muestra la relación entre las variables Puntaje NEM, Ranking y LMAT según el grupo de No Retenidos (0) y Retenidos (1). Donde si la pendiente es positiva implica que los retenidos tienen un mejor rendimiento, si la pendiente es negativa implica que los no retenidos tienen un mejor rendimiento y si la pendiente es nula implica que los rendimientos son similares entre retenidos y no retenidos.

Facultad

Cluster 1

Carreras
Cluster 1
LICENCIATURA EN CIENCIAS DE LA ACTIVIDAD FÍSICA / ENTRENADOR DEPORTIVO
LICENCIATURA EN CS DE LA ACTIVIDAD FÍSICA / TERAPEUTA EN ACT FÍSICA Y SALUD
PEDAGOGÍA EN EDUCACIÓN FÍSICA
TERAPIA OCUPACIONAL
  • En primer año la diferencia porcentual de la media de los puntajes normalizados para NEM entre retenidos y no retenidos corresponde a 0.062 y la diferencia de la mediana es 0.079 . En la retención al tercer año esta diferencia corresponde a 0.042 y 0.048 , respectivamente.
  • En primer año la diferencia porcentual de la media de los puntajes normalizados para Ranking entre retenidos y no retenidos corresponde a 0.076 y la diferencia de la mediana es 0.105 . En la retención al tercer año esta diferencia corresponde a 0.058 y 0.088 , respectivamente.
  • En primer año la diferencia porcentual de la media de los puntajes normalizados para LMAT entre retenidos y no retenidos corresponde a 0.023 y la diferencia de la mediana es 0.009 . En la retención al tercer año esta diferencia corresponde a 0.043 y 0.028 , respectivamente.

Cluster 2

Carreras
Cluster 2
ENFERMERÍA
KINESIOLOGÍA
MEDICINA
OBSTETRICIA Y PUERICULTURA
  • En primer año la diferencia porcentual de la media de los puntajes normalizados para NEM entre retenidos y no retenidos corresponde a 0.0051 y la diferencia de la mediana es 0.0096 . En la retención al tercer año esta diferencia corresponde a 0.0168 y 0.0169 , respectivamente.
  • En primer año la diferencia porcentual de la media de los puntajes normalizados para Ranking entre retenidos y no retenidos corresponde a 0.012 y la diferencia de la mediana es 0.0095 . En la retención al tercer año esta diferencia corresponde a 0.0194 y 0.0262 , respectivamente.
  • En primer año la diferencia porcentual de la media de los puntajes normalizados para LMAT entre retenidos y no retenidos corresponde a 0.0135 y la diferencia de la mediana es -0.0025 . En la retención al tercer año esta diferencia corresponde a 0.0298 y 0.0138 , respectivamente.

Cluster 3

Carreras
Cluster 3
## [1] "No existe Cluster 3 para esta facultad"

[1] “No existe C3”

2.1 Modelos

2.1.1 Modelos de regresión logística

En primera instancia se realiza un modelo de regresión logística, el cual opera a través de una variable respuesta que se define como:

\[ y= \left\{ \begin{array}{l} 0 \hspace{3mm} Estudiante \hspace{1mm} No \hspace{1mm} Retenido\\ 1 \hspace{3mm} Estudiante \hspace{1mm} Retenido \end{array} \right. \] Esta regresión utiliza la función Logit, la cual se define como:

\[ F(x^t\beta) = \frac{e^{(x^t\beta)}}{1+e^{(x^t\beta)}} \]

En esta primera iteración se utilizan las siguientes variables explicativas: Año de ingreso, carrera, Puntaje NEM, puntaje Ranking, puntaje Promedio(Comprensión Lectora y Matemática), edad, sexo, nivel socio económico, dependencia establecimiento educacional (Público, Subvencionado o Particular) y tipo de establecimiento (Científico Humanista o Técnico Profesional). Y se define un nivel de significancia de \(\alpha=0.05\).

De esta forma, en la siguiente tabla se observan los coeficientes, los odds ratio, que expresan la fuerza de la relación, y que variables son significativas para la explicación de la retención de primer año (Modelo 1), retención al segundo año (Modelo 2) y retención al tercer año (Modelo 3).

Modelo Logístico

Interpretaciones

Las siguientes interpretaciones son para el Modelo 1, el cual corresponde a la Retención al primer año.

  • El Odd Ratio para la variable Puntaje NEM corresponde a 0.9987, esta variable resulta ser no significativa y es un factor de riesgo.

  • El Odd Ratio para la variable Puntaje Ranking corresponde a 1.0014, esta variable resulta ser no significativa y es un factor protector.

  • El Odd Ratio para la variable Puntaje Lenguaje y Matemática corresponde a 1.0007, esta variable resulta ser no significativa y es un factor protector.

  • El Odd Ratio para la variable de estudiantes de la región metropolitana corresponde a 1.2302, esta variable resulta ser no significativa y es un factor protector.

  • El Odd Ratio para la variable Origen Educacional de establecimientos pagados corresponde a 0.4268, esta variable resulta ser significativa y es un factor de riesgo.

  • El Odd Ratio para la variable Origen Educacional de establecimientos Subvencionados corresponde a 0.8984, esta variable resulta ser no significativa y es un factor de riesgo.

  • El Odd Ratio para la variable rama Educacional de estudiantes técnico profesionales corresponde a 1.1459, esta variable resulta ser no significativa y es un factor protector.

Notas

  • Para retención al primer año 2726, están todas las cohortes.

  • Para retención al segundo año 2414, están todas las cohortes menos 2022.

  • Para retención al tercer año 2068, están todas las cohortes excepto 2021 y 2022.

Modelo Logístico cluster

2.1.2 Modelo Cox

En esta instancia se utiliza la regresión de Cox, el cual expresa una función de riesgo \(h(t)\) en función del tiempo \(t\) y un conjunto de variables explicativas \((X)\). La variable tiempo se define como:

\[ t: \text{años hasta que el estudiante aparece como No Retenido.}\hspace{2mm} t=1,2,3\]

Esta regresión utiliza la función Logit, la cual se define como: \[ h(t,X)=h_0(t) \cdot exp{\sum_{j=1}^{p}\beta_jX_j}\]

Modelo de Cox

En las siguientes tablas se observan los resultados de dos tablas sumarias del análisis de cox. En la primera de ellas se indica la cantidad casos en “riesgo” en este caso 2726 de los cuales se observan 306 no retenciones que equivalen a una tasa de “sobreviviencia” de 0.89. La sobrevivencia al tercer año corresponde a 0.81

time n.risk n.event survival
1 2726 306 0.888
2 2136 117 0.839
3 1738 56 0.812

La interpretación del modelo se presenta a través de la \(exp(\beta_i)\). Importante señalar que en esta tabla se omiten los coeficientes, ya que se trabaja directamente con los HR (Hazard Ratio). Cuando el HR es mayor que 1 indica que la relación es directa respecto de la variable dependiente. Asimismo, cuando el HR es menor que 1 indica una relación inversa.

Como el evento que se busca evaluar es relativo a la “No Retención”, los factores están invertidos respecto del Modelo Logístico ya presentado, es decir, aquí el evento es justamente opuesto: “No Retenido - No Retenida”.

  • De acuerdo a lo anterior podemos señalar que la variable asociada a las mujeres demuestra ser una variable no significativa. El HR asociado corresponde a 0.895 por tanto la relación respecto del evento de no retención correspondería a un factor protector.

  • Es posible indicar que NEM es una variable no significativa. El HR asociado corresponde a 0.999, por tanto la relación respecto del evento de no retención correspondería a un factor protector.

  • Es posible indicar que Ranking es una variable no significativa. El HR corresponde a 0.998 , por tanto la relación respecto del evento de no retención correspondería a un factor protector..

  • La variable LMAT, resulta ser significativa. El HR asociado corresponde a 0.996, y por tanto sería protector..

  • Es posible indicar que Región es una variable no significativa. El HR asociado a 0.856, por tanto la relación respecto del evento de no retención correspondería a un factor protector., respecto de ser de Región Metropolitana que de Región.

  • Es posible indicar que los estudiantes de establecimientos Pagados resulta ser significativa. El HR asociado corresponde a 1.663, por tanto la relación respecto del evento de no retención correspondería a un factor de riesgo.

  • Es posible indicar que los estudiantes de establecimientos Subvencionados resulta ser no significativa. El HR asociado corresponde a 0.938, por tanto la relación respecto del evento de no retención correspondería a un factor protector..

  • Es posible indicar que los estudiantes técnico profesionales de la variable rama educacional resulta ser no significativa. El HR asociado corresponde a 0.848, por tanto la relación respecto del evento de no retención correspondería a un factor protector..

Modelo Cox Cluster

  • La suma tiempo persona para C1 es 2003

  • La suma tiempo persona para C2 es 4597

  • La suma tiempo persona para C3 es No Aplica

Anexos

Anexo 1

Tablas Continuas

Resultado Variables Continuas
Estado
ret 1
ret 2
ret 3
Año Ret
no ret
ret
no ret
ret
no ret
ret
Var Media Sd Media Sd Media Sd Media Sd Media Sd Media Sd
EDAD_2 18.91 2.21 18.80 2.14 19.03 3.26 18.80 1.92 18.93 2.13 18.81 1.94
PTJE_NEM 701.99 68.46 719.27 61.62 699.37 65.86 717.34 59.75 699.24 62.47 717.44 57.56
PTJE_RANKING 764.09 83.86 787.26 72.88 763.84 82.16 788.60 71.47 767.21 79.44 790.92 69.25
PROMEDIO_LMAT_REC 617.06 70.11 629.08 69.99 612.57 67.60 632.29 69.60 616.00 64.46 635.96 68.42

Gráfico Facultad

Gráfico Cluster 1

Gráfico Cluster 2

Gráfico Cluster 3

## [1] "No existe Cluster 3 para esta facultad"

Anexo 2

Tabla Columnas

Resultado Variables categoricas columnas
var
ret 1
ret 2
ret 3
var
no ret
ret
no ret
ret
no ret
ret
freq prop freq prop freq prop freq prop freq prop freq prop
Sexo
H 119 0.39 740 0.31 146 0.37 609 0.30 136 0.36 505 0.30
M 187 0.61 1680 0.69 246 0.63 1413 0.70 246 0.64 1181 0.70
Sum 306 1.00 2420 1.00 392 1.00 2022 1.00 382 1.00 1686 1.00
Region
Region 59 0.19 433 0.18 77 0.20 363 0.18 75 0.20 320 0.19
RM 247 0.81 1986 0.82 315 0.80 1658 0.82 307 0.80 1365 0.81
Sum 306 1.00 2419 1.00 392 1.00 2021 1.00 382 1.00 1685 1.00
Grupo Dependencia
Municipal 68 0.22 589 0.24 101 0.26 486 0.24 95 0.25 411 0.24
Particular Pagado 63 0.21 340 0.14 70 0.18 285 0.14 71 0.19 237 0.14
Particular Subvencionado 172 0.56 1480 0.61 218 0.56 1244 0.62 213 0.56 1033 0.61
SLE 2 0.01 8 0.00 1 0.00 5 0.00 1 0.00 4 0.00
Sum 305 1.00 2417 1.00 390 1.00 2020 1.00 380 1.00 1685 1.00
Rama
Cientifico Humanista 282 0.92 2204 0.91 359 0.92 1834 0.91 352 0.92 1529 0.91
Tecnico Profesional 24 0.08 216 0.09 33 0.08 188 0.09 30 0.08 157 0.09
Sum 306 1.00 2420 1.00 392 1.00 2022 1.00 382 1.00 1686 1.00

Tabla Filas

Resultado Variables categoricas Filas
id
ret 1
ret 2
ret 3
id
no ret
ret
no ret
ret
no ret
ret
id freq prop freq prop freq prop freq prop freq prop freq prop
Sexo
1 H 119 0.14 740 0.86 146 0.19 609 0.81 136 0.21 505 0.79
2 M 187 0.10 1680 0.90 246 0.15 1413 0.85 246 0.17 1181 0.83
Region
4 Region 59 0.12 433 0.88 77 0.17 363 0.82 75 0.19 320 0.81
5 RM 247 0.11 1986 0.89 315 0.16 1658 0.84 307 0.18 1365 0.82
grupo dep
7 Municipal 68 0.10 589 0.90 101 0.17 486 0.83 95 0.19 411 0.81
8 Particular.Pagado 63 0.16 340 0.84 70 0.20 285 0.80 71 0.23 237 0.77
9 Particular.Subvencionado 172 0.10 1480 0.90 218 0.15 1244 0.85 213 0.17 1033 0.83
10 SLE 2 0.20 8 0.80 1 0.17 5 0.83 1 0.20 4 0.80
Rama
12 Cientifico.Humanista 282 0.11 2204 0.89 359 0.16 1834 0.84 352 0.19 1529 0.81
13 Tecnico.Profesional 24 0.10 216 0.90 33 0.15 188 0.85 30 0.16 157 0.84

Anexo 3

A continuación se describe el porcentaje de estudiantes que regresa a la institución, luego de ser considerado como no retenido.
Tabla Estudiantes no retenidos que regresan
Año frec_1 prop_1 frec_2 prop_2 total
2015 1 2.56% NA NA NA
2016 2 7.69% NA NA NA
2018 NA NA 1 1.82% NA
2020 NA NA 0 0 NA