Antecedentes

A continuación, se elabora una propuesta de estudio que busca sentar los objetivos, metodologías e insumos necesarios que permitan analizar y evaluar el impacto de modificar la ponderación de selección asignada a las calificaciones de enseñanza secundaria. Para tal fin se busca caracterizar y sistematizar la relación entre el rendimiento académico temprano, a partir de las calificaciones de la instrucción secundaria, y factores de progresión académica tales como tasa de retención y/o permanencia. La USACH, busca establecer el mejor criterio de ponderación del factor de admisión, asociado a las calificaciones de enseñanza media que permitan una selección responsable de los estudiantes.

El Puntaje NEM corresponde al promedio de calificaciones de enseñanza media que se obtienen en cada nivel cursado, transformado a un puntaje estándar. El Puntaje Ranking se otorga a la posición relativa de las calificaciones de enseñanza media en comparación con las tres generaciones del o de las estudiantes en su contexto educativo.

Actualmente, la ponderación del puntaje de selección en USACH se desglosa en 10% para el rendimiento académico de las notas de enseñanza media (NEM) que se considera un registro absoluto y 40% con el Puntaje Ranking (PR), que busca establecer una posición relativa en su contexto educativo particular, asignando importancia a la posición obtenida de los estudiantes como factor de admisión. La adición de ambos factores constituye el 50% de la ponderación para la selección de ingreso a las 73 carreras de pregrado que conforman la oferta regular 2023 vigente con alumnos nuevos.

El otro 50 % corresponde a las pruebas de selección universitaria, actuales o pasadas. La institución busca conocer el impacto de alterar la actual ponderación Esto con el fin de determinar si es oportuno o requiere modificación, para una admisión con responsabilidad.

Objetivo General

  • Describir, relacionar y modelar los registros DEMRE-E de calificaciones de enseñanza media, puntaje ranking y los resultados de lenguaje y matemática, respecto de los registros de matrícula por carrera en torno a las tasas de retención, desde primer a tercer año.

Objetivos Específicos

  • Identificar las variables que resulten estadísticamente significativas en torno a la retención al primer, segundo y tercer año.

  • Determinar los efectos de NEM, RNK y LMAT como variables independientes, para los registros de retención por facultad.

  • Establecer comparaciones de los tres factores de selección indicados, de modo de identificar el tamaño de cada efecto y su nivel de significación y de esta manera determinar factores protectores en torno a la retención.

Metodología

  • Se trabajó con Información de postulaciones efectivas DEMRE-E desde el año 2014 hasta 2022. Se excluye el año de proceso 2023, dado que en este año se efectúa un cambio de escala (0 - 1000) y se producen cambios en las pruebas de selección.

  • Se consolidó la información y se procedió a relacionar con los registros de cohortes y retención para los años de cohorte 2014 - 2022. Esto resulta en 3914 registros con información DEMRE de matrículas efectivas en programas regulares.

Estos programas incluyen:

  • CUPO P.S.U.
  • CUPO P.D.T.
  • CUPO BEA
  • CUPO OFICIO DEMRE

I Descripción de las Variables Explicativas

1.1 NEM, Ranking, Lenguaje y Matemática

A continuación se describen los registros asociados a los Puntaje de Notas de Enseñanza Media (NEM) y Puntaje Ranking presentes en la información de DEMRE-E consolidada, además de los registros del promedio obtenidos de lenguaje y matemática (LMAT). Importante señalar que las medidas de tendencia central, media y mediana indican que las calificaciones del nivel secundario de los postulantes a la Universidad de Santiago de Chile (USACH) serían cada vez más altas, lo que denota que la institución habría aumentado su demanda, en cuanto a estudiantes con mejor rendimiento secundario. El caso de LMAT es menos claro a este respecto.

Tabla Descriptiva Inicial

Variables Continuas

Variable n media mediana sd min max
PTJE_NEM 3914 584.32 582 65.81 368 818.0
PTJE_RANKING 3914 615.67 609 88.81 383 850.0
PROMEDIO_LMAT_REC 3914 562.56 561 48.15 306 731.5
EDAD_2 3914 19.21 18 2.72 17 54.0

Variables Categóricas

Categoría Frecuencia Proporción
Sexo
H 2262 0.58
M 1652 0.42
Sum 3914 1.00
Grupo Dependencia
Municipal 1136 0.29
Particular Pagado 285 0.07
Particular Subvencionado 2476 0.63
SLE 12 0.00
Sum 3909 1.00
Categoría Frecuencia Proporción
Region
Region 432 0.11
RM 3482 0.89
Sum 3914 1.00
Rama
Cientifico Humanista 3018 0.77
Tecnico Profesional 896 0.23
Sum 3914 1.00
NA NA NA


\[ \] \[ \]

A continuación se muestra, por medio de tres histogramas, información de los registros de los tres factores de selección: NEM, Ranking y LMAT (media de los resultados obtenidos de lenguaje y matemática).

Importante señalar la frecuencia anómala de aquellos puntajes iguales a 850 puntos para el Puntaje Ranking, que resultan escapar de la probabilidad esperada para esa región de la curva. En efecto, se espera una baja probabilidad de puntajes tan altos. Una posible explicación resulta en la naturaleza de la asignación del puntaje a los mejores estudiantes de cada generación. Esto implicaría la posibilidad de puntajes asociados a calificaciones medias o bajas con una alta asignación de Puntaje Ranking.

1.2 Distribución Variables Puntaje NEM, Ranking y LMAT

  • Respecto a la distribución de los datos, la mediana del puntaje NEM en 2014 corresponde a 569 la cual aumenta hasta 648 puntos ponderados en 2022.

  • En efecto, este aumento también se verifica en el puntaje Ranking.592 la cual aumenta hasta 679 puntos ponderados en 2022.

  • La serie, para Lenguaje y matemática inicia con una mediana de 569.5, en tanto que en 2022 esta corresponde a 545

Puntaje NEM, Ranking y LMAT 2014 - 2022 por Año de Proceso
PROCESO
NEM
RNK
LMAT
Año n media med min max sd asim media med min max sd asim n media med min max sd asim
2014 617 571.8 569.0 431 764 57.3 0.3 601.6 592 431 850 84.0 0.7 617 567.7 569.5 476.0 731.5 46.2 0.2
2015 622 580.6 578.5 441 756 56.2 0.2 618.2 612 441 850 82.4 0.4 622 568.0 566.8 475.0 721.5 47.1 0.2
2016 425 578.2 579.0 414 743 51.3 0.1 610.0 611 414 850 72.6 0.3 425 568.0 566.0 475.0 684.0 45.0 0.1
2017 416 590.4 589.0 427 801 59.6 0.4 626.4 619 427 850 84.2 0.5 416 564.9 566.5 475.0 709.0 45.9 0.4
2018 419 577.8 579.0 435 775 60.3 0.1 607.4 605 435 850 84.8 0.4 419 567.6 565.0 475.5 700.5 45.5 0.3
2019 433 571.0 575.0 410 753 65.6 0.1 598.0 595 414 850 89.5 0.5 433 560.8 556.0 475.0 715.5 46.9 0.4
2020 404 582.4 580.0 407 767 70.5 0.0 608.7 602 410 850 91.3 0.3 404 557.4 556.0 476.0 690.0 45.3 0.3
2021 315 600.5 609.0 368 812 83.8 -0.2 630.0 634 383 850 106.2 0.0 315 544.3 543.0 306.0 731.0 59.3 -0.5
2022 263 638.6 648.0 389 818 80.7 -0.4 670.8 679 407 850 98.3 -0.3 263 549.8 545.0 330.0 704.5 50.9 -0.3

Es posible indicar, que de acuerdo a la información expuesta y según a lo registrado por DEMRE, los estudiantes que ingresan a la USACH en el periodo descrito, pueden considerarse aptos para el nivel universitario.

En efecto, solo el 25% de los puntajes se encuentra por debajo de 538 para el Puntaje NEM y 549 para Ranking, cual indicaría una población que evidencia aptitudes adecuadas para el nivel universitario, considerando que el 75% de las postulaciones presenta un puntaje medio o medio alto.

La distribución para los puntajes asociados a Lenguaje y Matemática indican que el primer cuartil se encuentra en torno a 528, es decir el 25% de los resultados de LEnaguaje y matemática se encuentra por debajo de este indicador. En tanto que el tercer cuartil se verifica en 594.5

1.2.1 Distribución Variables Puntaje NEM, Ranking y LMAT según SEXO

  • En efecto, la mediana del periodo 2014-2022 para el grupo masculino del puntaje NEM corresponde a 567 en tanto que para el grupo femenino 600.

  • La mediana del periodo 2014-2022 para el grupo masculino del puntaje Ranking corresponde a 589 en tanto que para el grupo femenino 634.

  • La mediana del periodo 2014-2022 para el grupo masculino del puntaje del promedio de Lenguaje y matemática corresponde a 566.5 en tanto que para el grupo femenino 555.

1.2.2 Distribución Variables Puntaje NEM, Ranking y LMAT - Establecimiento de Origen

A continuación se muestra los resultados de los tres factores de selección por establecimientos de origen.

II Descripción de las Variable Dependiente - Retención

En este apartado se describe la variable dependiente, la cual corresponde a una variable de tipo dicotómica, es decir, de respuesta binaria, donde si la variable toma el valor 0 corresponde a aquellos/aquellas estudiantes “No Retenidos” y 1 los/las estudiantes “Retenidos”.

2.1 Gráficos: Box plot

En los siguientes gráficos se muestra la relación entre las variables Puntaje NEM, Ranking y LMAT según el grupo de No Retenidos (0) y Retenidos (1). Donde si la pendiente es positiva implica que los retenidos tienen un mejor rendimiento, si la pendiente es negativa implica que los no retenidos tienen un mejor rendimiento y si la pendiente es nula implica que los rendimientos son similares entre retenidos y no retenidos.

Facultad

Cluster 1

Carreras
Cluster 1
DISEÑO EN COMUNICACIÓN VISUAL
DISEÑO INDUSTRIAL
PUBLICIDAD
TECNOLOGÍA EN DISEÑO INDUSTRIAL
  • En primer año la diferencia porcentual de la media de los puntajes normalizados para NEM entre retenidos y no retenidos corresponde a 0.054 y la diferencia de la mediana es 0.078 . En la retención al tercer año esta diferencia corresponde a 0.052 y 0.063 , respectivamente.
  • En primer año la diferencia porcentual de la media de los puntajes normalizados para Ranking entre retenidos y no retenidos corresponde a 0.054 y la diferencia de la mediana es 0.073 . En la retención al tercer año esta diferencia corresponde a 0.056 y 0.075 , respectivamente.
  • En primer año la diferencia porcentual de la media de los puntajes normalizados para LMAT entre retenidos y no retenidos corresponde a 0.005 y la diferencia de la mediana es -0.012 . En la retención al tercer año esta diferencia corresponde a 0.002 y -0.001 , respectivamente.

Cluster 2

Carreras
Cluster 2
TECNOLOGÍA EN ADMINISTRACIÓN DE PERSONAL
TECNOLOGÍA EN ALIMENTOS
TECNOLOGÍA EN AUTOMATIZACIÓN INDUSTRIAL
TECNOLOGÍA EN CONSTRUCCIONES
TECNOLOGÍA EN CONTROL INDUSTRIAL
TECNOLOGÍA EN MANTENIMIENTO INDUSTRIAL
TECNOLOGÍA EN TELECOMUNICACIONES
  • En primer año la diferencia porcentual de la media de los puntajes normalizados para NEM entre retenidos y no retenidos corresponde a 0.0178 y la diferencia de la mediana es 0.0234 . En la retención al tercer año esta diferencia corresponde a -8e-04 y -0.0067 , respectivamente.
  • En primer año la diferencia porcentual de la media de los puntajes normalizados para Ranking entre retenidos y no retenidos corresponde a 0.021 y la diferencia de la mediana es 0.0214 . En la retención al tercer año esta diferencia corresponde a -0.0029 y -0.0096 , respectivamente.
  • En primer año la diferencia porcentual de la media de los puntajes normalizados para LMAT entre retenidos y no retenidos corresponde a 0.0207 y la diferencia de la mediana es 0.0294 . En la retención al tercer año esta diferencia corresponde a -0.0043 y -0.0105 , respectivamente.

Cluster 3

Carreras
Cluster 3
INGENIERÍA DE ALIMENTOS
INGENIERÍA EN AGRONEGOCIOS
  • En primer año la diferencia porcentual de la media de los puntajes normalizados para NEM entre retenidos y no retenidos corresponde a -0.0072 y la diferencia de la mediana es -0.0011 . En la retención al tercer año esta diferencia corresponde a 0.0039 y 0 , respectivamente.
  • En primer año la diferencia porcentual de la media de los puntajes normalizados para Ranking entre retenidos y no retenidos corresponde a -0.039 y la diferencia de la mediana es -0.0364 . En la retención al tercer año esta diferencia corresponde a -0.0228 y -0.0128 , respectivamente.
  • En primer año la diferencia porcentual de la media de los puntajes normalizados para LMAT entre retenidos y no retenidos corresponde a 0.0203 y la diferencia de la mediana es 0.0176 . En la retención al tercer año esta diferencia corresponde a 0.0313 y 0.0235 , respectivamente.

2.1 Modelos

2.1.1 Modelos de regresión logística

En primera instancia se realiza un modelo de regresión logística, el cual opera a través de una variable respuesta que se define como:

\[ y= \left\{ \begin{array}{l} 0 \hspace{3mm} Estudiante \hspace{1mm} No \hspace{1mm} Retenido\\ 1 \hspace{3mm} Estudiante \hspace{1mm} Retenido \end{array} \right. \] Esta regresión utiliza la función Logit, la cual se define como:

\[ F(x^t\beta) = \frac{e^{(x^t\beta)}}{1+e^{(x^t\beta)}} \]

En esta primera iteración se utilizan las siguientes variables explicativas: Año de ingreso, carrera, Puntaje NEM, puntaje Ranking, puntaje Promedio(Comprensión Lectora y Matemática), edad, sexo, nivel socio económico, dependencia establecimiento educacional (Público, Subvencionado o Particular) y tipo de establecimiento (Científico Humanista o Técnico Profesional). Y se define un nivel de significancia de \(\alpha=0.05\).

De esta forma, en la siguiente tabla se observan los coeficientes, los odds ratio, que expresan la fuerza de la relación, y que variables son significativas para la explicación de la retención de primer año (Modelo 1), retención al segundo año (Modelo 2) y retención al tercer año (Modelo 3).

Modelo Logístico

Interpretaciones

Las siguientes interpretaciones son para el Modelo 1, el cual corresponde a la Retención al primer año.

  • El Odd Ratio para la variable Puntaje NEM corresponde a 1.0076, esta variable resulta ser significativa y es un factor protector.

  • El Odd Ratio para la variable Puntaje Ranking corresponde a 0.9963, esta variable resulta ser significativa y es un factor de riesgo.

  • El Odd Ratio para la variable Puntaje Lenguaje y Matemática corresponde a 1.0035, esta variable resulta ser significativa y es un factor protector.

  • El Odd Ratio para la variable de estudiantes de la región metropolitana corresponde a 1.3178, esta variable resulta ser significativa y es un factor protector.

  • El Odd Ratio para la variable Origen Educacional de establecimientos pagados corresponde a 0.9624, esta variable resulta ser no significativa y es un factor de riesgo.

  • El Odd Ratio para la variable Origen Educacional de establecimientos Subvencionados corresponde a 1.2729, esta variable resulta ser significativa y es un factor protector.

  • El Odd Ratio para la variable rama Educacional de estudiantes técnico profesionales corresponde a 0.9962, esta variable resulta ser no significativa y es un factor de riesgo.

Notas

  • Para retención al primer año 3914, están todas las cohortes.

  • Para retención al segundo año 3651, están todas las cohortes menos 2022.

  • Para retención al tercer año 3336, están todas las cohortes excepto 2021 y 2022.

Modelo Logístico cluster

2.1.2 Modelo Cox

En esta instancia se utiliza la regresión de Cox, el cual expresa una función de riesgo \(h(t)\) en función del tiempo \(t\) y un conjunto de variables explicativas \((X)\). La variable tiempo se define como:

\[ t: \text{años hasta que el estudiante aparece como No Retenido.}\hspace{2mm} t=1,2,3\]

Esta regresión utiliza la función Logit, la cual se define como: \[ h(t,X)=h_0(t) \cdot exp{\sum_{j=1}^{p}\beta_jX_j}\]

Modelo de Cox

En las siguientes tablas se observan los resultados de dos tablas sumarias del análisis de cox. En la primera de ellas se indica la cantidad casos en “riesgo” en este caso 3914 de los cuales se observan 706 no retenciones que equivalen a una tasa de “sobreviviencia” de 0.82. La sobrevivencia al tercer año corresponde a 0.49

time n.risk n.event survival
1 3914 706 0.820
2 2988 368 0.719
3 2405 760 0.492

La interpretación del modelo se presenta a través de la \(exp(\beta_i)\). Importante señalar que en esta tabla se omiten los coeficientes, ya que se trabaja directamente con los HR (Hazard Ratio). Cuando el HR es mayor que 1 indica que la relación es directa respecto de la variable dependiente. Asimismo, cuando el HR es menor que 1 indica una relación inversa.

Como el evento que se busca evaluar es relativo a la “No Retención”, los factores están invertidos respecto del Modelo Logístico ya presentado, es decir, aquí el evento es justamente opuesto: “No Retenido - No Retenida”.

  • De acuerdo a lo anterior podemos señalar que la variable asociada a las mujeres demuestra ser una variable significativa. El HR asociado corresponde a 0.864 por tanto la relación respecto del evento de no retención correspondería a un factor protector.

  • Es posible indicar que NEM es una variable significativa. El HR asociado corresponde a 0.995, por tanto la relación respecto del evento de no retención correspondería a un factor protector.

  • Es posible indicar que Ranking es una variable significativa. El HR corresponde a 1.002 , por tanto la relación respecto del evento de no retención correspondería a un factor de riesgo..

  • La variable LMAT, resulta ser significativa. El HR asociado corresponde a 0.998, y por tanto sería protector..

  • Es posible indicar que Región es una variable no significativa. El HR asociado a 0.96, por tanto la relación respecto del evento de no retención correspondería a un factor protector., respecto de ser de Región Metropolitana que de Región.

  • Es posible indicar que los estudiantes de establecimientos Pagados resulta ser no significativa. El HR asociado corresponde a 0.955, por tanto la relación respecto del evento de no retención correspondería a un factor protector.

  • Es posible indicar que los estudiantes de establecimientos Subvencionados resulta ser significativa. El HR asociado corresponde a 0.851, por tanto la relación respecto del evento de no retención correspondería a un factor protector..

  • Es posible indicar que los estudiantes técnico profesionales de la variable rama educacional resulta ser no significativa. El HR asociado corresponde a 1.089, por tanto la relación respecto del evento de no retención correspondería a un factor de riesgo..

Modelo Cox Cluster

  • La suma tiempo persona para C1 es 2212

  • La suma tiempo persona para C2 es 5532

  • La suma tiempo persona para C3 es 1563

Anexos

Anexo 1

Tablas Continuas

Resultado Variables Continuas
Estado
ret 1
ret 2
ret 3
Año Ret
no ret
ret
no ret
ret
no ret
ret
Var Media Sd Media Sd Media Sd Media Sd Media Sd Media Sd
EDAD_2 19.31 3.09 19.19 2.63 19.39 3.08 19.18 2.65 19.29 2.77 19.14 2.51
PTJE_NEM 576.56 65.72 586.03 65.72 572.26 64.15 583.56 62.06 572.70 60.95 584.34 58.79
PTJE_RANKING 609.38 91.69 617.05 88.12 603.74 90.25 614.77 85.20 604.57 87.52 615.39 81.05
PROMEDIO_LMAT_REC 556.71 49.33 563.85 47.80 559.33 48.24 565.09 47.56 563.84 46.78 566.75 45.56

Gráfico Facultad

Gráfico Cluster 1

Gráfico Cluster 2

Gráfico Cluster 3

Anexo 2

Tabla Columnas

Resultado Variables categoricas columnas
var
ret 1
ret 2
ret 3
var
no ret
ret
no ret
ret
no ret
ret
freq prop freq prop freq prop freq prop freq prop freq prop
Sexo
H 423 0.60 1839 0.57 625 0.61 1496 0.57 1036 0.62 914 0.55
M 283 0.40 1369 0.43 394 0.39 1136 0.43 635 0.38 751 0.45
Sum 706 1.00 3208 1.00 1019 1.00 2632 1.00 1671 1.00 1665 1.00
Region
Region 90 0.13 342 0.11 127 0.12 268 0.10 164 0.10 185 0.11
RM 616 0.87 2866 0.89 892 0.88 2364 0.90 1507 0.90 1480 0.89
Sum 706 1.00 3208 1.00 1019 1.00 2632 1.00 1671 1.00 1665 1.00
Grupo Dependencia
Municipal 235 0.33 901 0.28 338 0.33 732 0.28 532 0.32 447 0.27
Particular Pagado 55 0.08 230 0.07 77 0.08 179 0.07 112 0.07 115 0.07
Particular Subvencionado 409 0.58 2067 0.65 599 0.59 1714 0.65 1023 0.61 1099 0.66
SLE 6 0.01 6 0.00 4 0.00 4 0.00 3 0.00 2 0.00
Sum 705 1.00 3204 1.00 1018 1.00 2629 1.00 1670 1.00 1663 1.00
Rama
Cientifico Humanista 534 0.76 2484 0.77 769 0.75 2036 0.77 1241 0.74 1321 0.79
Tecnico Profesional 172 0.24 724 0.23 250 0.25 596 0.23 430 0.26 344 0.21
Sum 706 1.00 3208 1.00 1019 1.00 2632 1.00 1671 1.00 1665 1.00

Tabla Filas

Resultado Variables categoricas Filas
id
ret 1
ret 2
ret 3
id
no ret
ret
no ret
ret
no ret
ret
id freq prop freq prop freq prop freq prop freq prop freq prop
Sexo
1 H 423 0.19 1839 0.81 625 0.29 1496 0.71 1036 0.53 914 0.47
2 M 283 0.17 1369 0.83 394 0.26 1136 0.74 635 0.46 751 0.54
Region
4 Region 90 0.21 342 0.79 127 0.32 268 0.68 164 0.47 185 0.53
5 RM 616 0.18 2866 0.82 892 0.27 2364 0.73 1507 0.50 1480 0.50
grupo dep
7 Municipal 235 0.21 901 0.79 338 0.32 732 0.68 532 0.54 447 0.46
8 Particular.Pagado 55 0.19 230 0.81 77 0.30 179 0.70 112 0.49 115 0.51
9 Particular.Subvencionado 409 0.17 2067 0.83 599 0.26 1714 0.74 1023 0.48 1099 0.52
10 SLE 6 0.50 6 0.50 4 0.50 4 0.50 3 0.60 2 0.40
Rama
12 Cientifico.Humanista 534 0.18 2484 0.82 769 0.27 2036 0.73 1241 0.48 1321 0.52
13 Tecnico.Profesional 172 0.19 724 0.81 250 0.30 596 0.70 430 0.56 344 0.44

Anexo 3

A continuación se describe el porcentaje de estudiantes que regresa a la institución, luego de ser considerado como no retenido.
Tabla Estudiantes no retenidos que regresan
Año frec_1 prop_1 frec_2 prop_2 total
2014 1 0.9% 2 1.07% 3
2015 1 0.81% NA NA NA
2016 1 1.45% 3 2.78% 4
2017 NA NA 1 0.98% NA
2018 1 1.3% 5 3.85% 6
2019 3 3.9% 1 0.96% 4
2020 6 8.96% 0 0 6
2021 1 1.52% NA NA NA