A continuación, se elabora una propuesta de estudio que busca sentar los objetivos, metodologías e insumos necesarios que permitan analizar y evaluar el impacto de modificar la ponderación de selección asignada a las calificaciones de enseñanza secundaria. Para tal fin se busca caracterizar y sistematizar la relación entre el rendimiento académico temprano, a partir de las calificaciones de la instrucción secundaria, y factores de progresión académica tales como tasa de retención y/o permanencia. La USACH, busca establecer el mejor criterio de ponderación del factor de admisión, asociado a las calificaciones de enseñanza media que permitan una selección responsable de los estudiantes.
El Puntaje NEM corresponde al promedio de calificaciones de enseñanza media que se obtienen en cada nivel cursado, transformado a un puntaje estándar. El Puntaje Ranking se otorga a la posición relativa de las calificaciones de enseñanza media en comparación con las tres generaciones del o de las estudiantes en su contexto educativo.
Actualmente, la ponderación del puntaje de selección en USACH se desglosa en 10% para el rendimiento académico de las notas de enseñanza media (NEM) que se considera un registro absoluto y 40% con el Puntaje Ranking (PR), que busca establecer una posición relativa en su contexto educativo particular, asignando importancia a la posición obtenida de los estudiantes como factor de admisión. La adición de ambos factores constituye el 50% de la ponderación para la selección de ingreso a las 73 carreras de pregrado que conforman la oferta regular 2023 vigente con alumnos nuevos.
El otro 50 % corresponde a las pruebas de selección universitaria, actuales o pasadas. La institución busca conocer el impacto de alterar la actual ponderación Esto con el fin de determinar si es oportuno o requiere modificación, para una admisión con responsabilidad.
Identificar las variables que resulten estadísticamente significativas en torno a la retención al primer, segundo y tercer año.
Determinar los efectos de NEM, RNK y LMAT como variables independientes, para los registros de retención por facultad.
Establecer comparaciones de los tres factores de selección indicados, de modo de identificar el tamaño de cada efecto y su nivel de significación y de esta manera determinar factores protectores en torno a la retención.
Se trabajó con Información de postulaciones efectivas DEMRE-E desde el año 2014 hasta 2022. Se excluye el año de proceso 2023, dado que en este año se efectúa un cambio de escala (0 - 1000) y se producen cambios en las pruebas de selección.
Se consolidó la información y se procedió a relacionar con los registros de cohortes y retención para los años de cohorte 2014 - 2022. Esto resulta en 759 registros con información DEMRE de matrículas efectivas en programas regulares.
Estos programas incluyen:
A continuación se describen los registros asociados a los Puntaje de Notas de Enseñanza Media (NEM) y Puntaje Ranking presentes en la información de DEMRE-E consolidada, además de los registros del promedio obtenidos de lenguaje y matemática (LMAT). Importante señalar que las medidas de tendencia central, media y mediana indican que las calificaciones del nivel secundario de los postulantes a la Universidad de Santiago de Chile (USACH) serían cada vez más altas, lo que denota que la institución habría aumentado su demanda, en cuanto a estudiantes con mejor rendimiento secundario. El caso de LMAT es menos claro a este respecto.
| Variable | n | media | mediana | sd | min | max |
|---|---|---|---|---|---|---|
| PTJE_NEM | 759 | 693.48 | 692 | 42.17 | 570 | 828 |
| PTJE_RANKING | 759 | 756.17 | 753 | 56.09 | 586 | 850 |
| PROMEDIO_LMAT_REC | 759 | 584.22 | 587 | 50.76 | 444 | 741 |
| EDAD_2 | 759 | 18.87 | 18 | 3.67 | 17 | 61 |
| Categoría | Frecuencia | Proporción |
|---|---|---|
| Sexo | ||
| H | 292 | 0.38 |
| M | 467 | 0.62 |
| Sum | 759 | 1.00 |
| Grupo Dependencia | ||
| Municipal | 170 | 0.22 |
| Particular Pagado | 86 | 0.11 |
| Particular Subvencionado | 493 | 0.65 |
| SLE | 7 | 0.01 |
| Sum | 756 | 1.00 |
| Categoría | Frecuencia | Proporción |
|---|---|---|
| Region | ||
| Region | 157 | 0.21 |
| RM | 601 | 0.79 |
| Sum | 758 | 1.00 |
| Rama | ||
| Cientifico Humanista | 653 | 0.86 |
| Sin Informacion | 1 | 0.00 |
| Tecnico Profesional | 105 | 0.14 |
| Sum | 759 | 1.00 |
\[ \] \[ \]
A continuación se muestra, por medio de tres histogramas, información de los registros de los tres factores de selección: NEM, Ranking y LMAT (media de los resultados obtenidos de lenguaje y matemática).
Importante señalar la frecuencia anómala de aquellos puntajes iguales a 850 puntos para el Puntaje Ranking, que resultan escapar de la probabilidad esperada para esa región de la curva. En efecto, se espera una baja probabilidad de puntajes tan altos. Una posible explicación resulta en la naturaleza de la asignación del puntaje a los mejores estudiantes de cada generación. Esto implicaría la posibilidad de puntajes asociados a calificaciones medias o bajas con una alta asignación de Puntaje Ranking.
Respecto a la distribución de los datos, la mediana del puntaje NEM en 2014 corresponde a NA la cual aumenta hasta 720 puntos ponderados en 2022.
En efecto, este aumento también se verifica en el puntaje Ranking.NA la cual aumenta hasta 769 puntos ponderados en 2022.
La serie, para Lenguaje y matemática inicia con una mediana de NA, en tanto que en 2022 esta corresponde a 593.25
| Año | n | media | med | min | max | sd | asim | media | med | min | max | sd | asim | n | media | med | min | max | sd | asim |
|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|
| 2017 | 59 | 683.0 | 682 | 605 | 770 | 41.0 | 0.0 | 761.3 | 756 | 643 | 850 | 58.9 | -0.1 | 59 | 614.0 | 614.0 | 493.0 | 714.5 | 48.5 | -0.1 |
| 2018 | 76 | 686.1 | 682 | 610 | 764 | 36.8 | 0.1 | 763.6 | 765 | 641 | 850 | 59.9 | -0.2 | 76 | 592.7 | 589.5 | 479.5 | 684.0 | 49.1 | -0.2 |
| 2019 | 94 | 689.2 | 690 | 607 | 787 | 38.1 | 0.2 | 764.9 | 759 | 656 | 850 | 54.5 | 0.1 | 94 | 584.7 | 590.0 | 475.0 | 702.0 | 46.5 | -0.2 |
| 2020 | 165 | 675.4 | 676 | 587 | 767 | 32.0 | -0.1 | 738.5 | 733 | 586 | 850 | 45.3 | 0.1 | 165 | 572.6 | 573.5 | 476.0 | 683.5 | 45.8 | 0.2 |
| 2021 | 177 | 693.4 | 689 | 570 | 828 | 44.7 | 0.1 | 749.4 | 749 | 598 | 850 | 61.2 | -0.1 | 177 | 575.5 | 577.0 | 444.0 | 741.0 | 54.2 | 0.0 |
| 2022 | 188 | 717.9 | 720 | 606 | 823 | 41.1 | 0.0 | 769.0 | 769 | 645 | 850 | 53.7 | -0.1 | 188 | 589.6 | 593.2 | 476.5 | 727.0 | 50.3 | -0.1 |
Es posible indicar, que de acuerdo a la información expuesta y según a lo registrado por DEMRE, los estudiantes que ingresan a la USACH en el periodo descrito, pueden considerarse aptos para el nivel universitario.
En efecto, solo el 25% de los puntajes se encuentra por debajo de 665 para el Puntaje NEM y 715 para Ranking, cual indicaría una población que evidencia aptitudes adecuadas para el nivel universitario, considerando que el 75% de las postulaciones presenta un puntaje medio o medio alto.
La distribución para los puntajes asociados a Lenguaje y Matemática indican que el primer cuartil se encuentra en torno a 547, es decir el 25% de los resultados de LEnaguaje y matemática se encuentra por debajo de este indicador. En tanto que el tercer cuartil se verifica en 618.5
En efecto, la mediana del periodo 2014-2022 para el grupo masculino del puntaje NEM corresponde a 680 en tanto que para el grupo femenino 698.
La mediana del periodo 2014-2022 para el grupo masculino del puntaje Ranking corresponde a 737 en tanto que para el grupo femenino 763.
La mediana del periodo 2014-2022 para el grupo masculino del puntaje del promedio de Lenguaje y matemática corresponde a 593.75 en tanto que para el grupo femenino 581.
A continuación se muestra los resultados de los tres factores de selección por establecimientos de origen.
En este apartado se describe la variable dependiente, la cual corresponde a una variable de tipo dicotómica, es decir, de respuesta binaria, donde si la variable toma el valor 0 corresponde a aquellos/aquellas estudiantes “No Retenidos” y 1 los/las estudiantes “Retenidos”.
En los siguientes gráficos se muestra la relación entre las variables Puntaje NEM, Ranking y LMAT según el grupo de No Retenidos (0) y Retenidos (1). Donde si la pendiente es positiva implica que los retenidos tienen un mejor rendimiento, si la pendiente es negativa implica que los no retenidos tienen un mejor rendimiento y si la pendiente es nula implica que los rendimientos son similares entre retenidos y no retenidos.
| Cluster 2 |
|---|
## [1] "No existe Cluster 2 para esta facultad"
[1] “No existe C2”
| Cluster 3 |
|---|
## [1] "No existe Cluster 3 para esta facultad"
[1] “No existe C3”
En primera instancia se realiza un modelo de regresión logística, el cual opera a través de una variable respuesta que se define como:
\[ y= \left\{ \begin{array}{l} 0 \hspace{3mm} Estudiante \hspace{1mm} No \hspace{1mm} Retenido\\ 1 \hspace{3mm} Estudiante \hspace{1mm} Retenido \end{array} \right. \] Esta regresión utiliza la función Logit, la cual se define como:
\[ F(x^t\beta) = \frac{e^{(x^t\beta)}}{1+e^{(x^t\beta)}} \]
En esta primera iteración se utilizan las siguientes variables explicativas: Año de ingreso, carrera, Puntaje NEM, puntaje Ranking, puntaje Promedio(Comprensión Lectora y Matemática), edad, sexo, nivel socio económico, dependencia establecimiento educacional (Público, Subvencionado o Particular) y tipo de establecimiento (Científico Humanista o Técnico Profesional). Y se define un nivel de significancia de \(\alpha=0.05\).
De esta forma, en la siguiente tabla se observan los coeficientes, los odds ratio, que expresan la fuerza de la relación, y que variables son significativas para la explicación de la retención de primer año (Modelo 1), retención al segundo año (Modelo 2) y retención al tercer año (Modelo 3).
Interpretaciones
Las siguientes interpretaciones son para el Modelo 1, el cual corresponde a la Retención al primer año.
El Odd Ratio para la variable Puntaje NEM corresponde a 1.0004, esta variable resulta ser no significativa y es un factor protector.
El Odd Ratio para la variable Puntaje Ranking corresponde a 0.9939, esta variable resulta ser significativa y es un factor de riesgo.
El Odd Ratio para la variable Puntaje Lenguaje y Matemática corresponde a 1.0003, esta variable resulta ser no significativa y es un factor protector.
El Odd Ratio para la variable de estudiantes de la región metropolitana corresponde a 0.9082, esta variable resulta ser no significativa y es un factor de riesgo.
El Odd Ratio para la variable Origen Educacional de establecimientos pagados corresponde a 0.4883, esta variable resulta ser significativa y es un factor de riesgo.
El Odd Ratio para la variable Origen Educacional de establecimientos Subvencionados corresponde a 1.0708, esta variable resulta ser no significativa y es un factor protector.
El Odd Ratio para la variable rama Educacional de estudiantes técnico profesionales corresponde a 0.6136, esta variable resulta ser no significativa y es un factor de riesgo.
Notas
Para retención al primer año 759, están todas las cohortes.
Para retención al segundo año 571, están todas las cohortes menos 2022.
Para retención al tercer año 394, están todas las cohortes excepto 2021 y 2022.
## [1] "No existe Cluster 2 y 3 para esta facultad"
En esta instancia se utiliza la regresión de Cox, el cual expresa una función de riesgo \(h(t)\) en función del tiempo \(t\) y un conjunto de variables explicativas \((X)\). La variable tiempo se define como:
\[ t: \text{años hasta que el estudiante aparece como No Retenido.}\hspace{2mm} t=1,2,3\]
Esta regresión utiliza la función Logit, la cual se define como: \[ h(t,X)=h_0(t) \cdot exp{\sum_{j=1}^{p}\beta_jX_j}\]
En las siguientes tablas se observan los resultados de dos tablas sumarias del análisis de cox. En la primera de ellas se indica la cantidad casos en “riesgo” en este caso 759 de los cuales se observan 140 no retenciones que equivalen a una tasa de “sobreviviencia” de 0.82. La sobrevivencia al tercer año corresponde a 0.68
| time | n.risk | n.event | survival |
|---|---|---|---|
| 1 | 759 | 140 | 0.816 |
| 2 | 467 | 48 | 0.732 |
| 3 | 293 | 21 | 0.679 |
La interpretación del modelo se presenta a través de la \(exp(\beta_i)\). Importante señalar que en esta tabla se omiten los coeficientes, ya que se trabaja directamente con los HR (Hazard Ratio). Cuando el HR es mayor que 1 indica que la relación es directa respecto de la variable dependiente. Asimismo, cuando el HR es menor que 1 indica una relación inversa.
Como el evento que se busca evaluar es relativo a la “No Retención”, los factores están invertidos respecto del Modelo Logístico ya presentado, es decir, aquí el evento es justamente opuesto: “No Retenido - No Retenida”.
De acuerdo a lo anterior podemos señalar que la variable asociada a las mujeres demuestra ser una variable no significativa. El HR asociado corresponde a 0.971 por tanto la relación respecto del evento de no retención correspondería a un factor protector.
Es posible indicar que NEM es una variable no significativa. El HR asociado corresponde a 0.999, por tanto la relación respecto del evento de no retención correspondería a un factor protector.
Es posible indicar que Ranking es una variable significativa. El HR corresponde a 1.005 , por tanto la relación respecto del evento de no retención correspondería a un factor de riesgo..
La variable LMAT, resulta ser no significativa. El HR asociado corresponde a 0.998, y por tanto sería protector..
Es posible indicar que Región es una variable no significativa. El HR asociado a 0.896, por tanto la relación respecto del evento de no retención correspondería a un factor protector., respecto de ser de Región Metropolitana que de Región.
Es posible indicar que los estudiantes de establecimientos Pagados resulta ser no significativa. El HR asociado corresponde a 1.512, por tanto la relación respecto del evento de no retención correspondería a un factor de riesgo.
Es posible indicar que los estudiantes de establecimientos Subvencionados resulta ser no significativa. El HR asociado corresponde a 0.95, por tanto la relación respecto del evento de no retención correspondería a un factor protector..
Es posible indicar que los estudiantes técnico profesionales de la variable rama educacional resulta ser no significativa. El HR asociado corresponde a 1.356, por tanto la relación respecto del evento de no retención correspondería a un factor de riesgo..
La suma tiempo persona para C1 es 1519
La suma tiempo persona para C2 es 0
La suma tiempo persona para C3 es No Aplica
| Var | Media | Sd | Media | Sd | Media | Sd | Media | Sd | Media | Sd | Media | Sd |
|---|---|---|---|---|---|---|---|---|---|---|---|---|
| EDAD_2 | 19.43 | 5.31 | 18.74 | 3.18 | 19.91 | 5.88 | 18.55 | 1.92 | 19.93 | 5.56 | 18.65 | 2.27 |
| PTJE_NEM | 700.66 | 48.62 | 691.85 | 40.44 | 691.63 | 44.12 | 683.23 | 37.33 | 684.36 | 39.34 | 680.81 | 34.79 |
| PTJE_RANKING | 772.64 | 58.40 | 752.44 | 54.93 | 767.33 | 59.37 | 746.41 | 54.11 | 762.06 | 52.63 | 749.12 | 54.15 |
| PROMEDIO_LMAT_REC | 576.71 | 52.85 | 585.91 | 50.17 | 574.11 | 55.08 | 585.45 | 48.92 | 576.50 | 49.21 | 589.53 | 48.41 |
## [1] "No existe Cluster 3 para esta facultad"
## [1] "No existe Cluster 3 para esta facultad"
| freq | prop | freq | prop | freq | prop | freq | prop | freq | prop | freq | prop | |
|---|---|---|---|---|---|---|---|---|---|---|---|---|
| Sexo | ||||||||||||
| H | 52 | 0.37 | 240 | 0.39 | 56 | 0.37 | 147 | 0.35 | 46 | 0.38 | 93 | 0.34 |
| M | 88 | 0.63 | 379 | 0.61 | 95 | 0.63 | 273 | 0.65 | 74 | 0.62 | 181 | 0.66 |
| Sum | 140 | 1.00 | 619 | 1.00 | 151 | 1.00 | 420 | 1.00 | 120 | 1.00 | 274 | 1.00 |
| Region | ||||||||||||
| Region | 26 | 0.19 | 131 | 0.21 | 34 | 0.23 | 85 | 0.20 | 28 | 0.24 | 57 | 0.21 |
| RM | 114 | 0.81 | 487 | 0.79 | 116 | 0.77 | 335 | 0.80 | 91 | 0.76 | 217 | 0.79 |
| Sum | 140 | 1.00 | 618 | 1.00 | 150 | 1.00 | 420 | 1.00 | 119 | 1.00 | 274 | 1.00 |
| Grupo Dependencia | ||||||||||||
| Municipal | 30 | 0.22 | 140 | 0.23 | 35 | 0.23 | 88 | 0.21 | 24 | 0.20 | 63 | 0.23 |
| Particular Pagado | 22 | 0.16 | 64 | 0.10 | 16 | 0.11 | 43 | 0.10 | 12 | 0.10 | 21 | 0.08 |
| Particular Subvencionado | 86 | 0.62 | 407 | 0.66 | 98 | 0.65 | 285 | 0.68 | 83 | 0.70 | 188 | 0.69 |
| SLE | 1 | 0.01 | 6 | 0.01 | 1 | 0.01 | 3 | 0.01 | 0 | 0.00 | 1 | 0.00 |
| Sum | 139 | 1.00 | 617 | 1.00 | 150 | 1.00 | 419 | 1.00 | 119 | 1.00 | 273 | 1.00 |
| Rama | ||||||||||||
| Cientifico Humanista | 112 | 0.80 | 541 | 0.87 | 120 | 0.79 | 365 | 0.87 | 95 | 0.79 | 234 | 0.85 |
| Sin Informacion | 0 | 0.00 | 1 | 0.00 | 1 | 0.01 | 0 | 0.00 | 1 | 0.01 | 0 | 0.00 |
| Tecnico Profesional | 28 | 0.20 | 77 | 0.12 | 30 | 0.20 | 55 | 0.13 | 24 | 0.20 | 40 | 0.15 |
| Sum | 140 | 1.00 | 619 | 1.00 | 151 | 1.00 | 420 | 1.00 | 120 | 1.00 | 274 | 1.00 |
| id | freq | prop | freq | prop | freq | prop | freq | prop | freq | prop | freq | prop | |
|---|---|---|---|---|---|---|---|---|---|---|---|---|---|
| Sexo | |||||||||||||
| 1 | H | 52 | 0.18 | 240 | 0.82 | 56 | 0.28 | 147 | 0.72 | 46 | 0.33 | 93 | 0.67 |
| 2 | M | 88 | 0.19 | 379 | 0.81 | 95 | 0.26 | 273 | 0.74 | 74 | 0.29 | 181 | 0.71 |
| Region | |||||||||||||
| 4 | Region | 26 | 0.17 | 131 | 0.83 | 34 | 0.29 | 85 | 0.71 | 28 | 0.33 | 57 | 0.67 |
| 5 | RM | 114 | 0.19 | 487 | 0.81 | 116 | 0.26 | 335 | 0.74 | 91 | 0.30 | 217 | 0.70 |
| grupo dep | |||||||||||||
| 7 | Municipal | 30 | 0.18 | 140 | 0.82 | 35 | 0.28 | 88 | 0.72 | 24 | 0.28 | 63 | 0.72 |
| 8 | Particular.Pagado | 22 | 0.26 | 64 | 0.74 | 16 | 0.27 | 43 | 0.73 | 12 | 0.36 | 21 | 0.64 |
| 9 | Particular.Subvencionado | 86 | 0.17 | 407 | 0.83 | 98 | 0.26 | 285 | 0.74 | 83 | 0.31 | 188 | 0.69 |
| 10 | SLE | 1 | 0.14 | 6 | 0.86 | 1 | 0.25 | 3 | 0.75 | 0 | 0.00 | 1 | 1.00 |
| Rama | |||||||||||||
| 12 | Cientifico.Humanista | 112 | 0.17 | 541 | 0.83 | 120 | 0.25 | 365 | 0.75 | 95 | 0.29 | 234 | 0.71 |
| 13 | Sin.Informacion | 0 | 0.00 | 1 | 1.00 | 1 | 1.00 | 0 | 0.00 | 1 | 1.00 | 0 | 0.00 |
| 14 | Tecnico.Profesional | 28 | 0.27 | 77 | 0.73 | 30 | 0.35 | 55 | 0.65 | 24 | 0.38 | 40 | 0.62 |
| Año | frec_1 | prop_1 | frec_2 | prop_2 | total |
|---|---|---|---|---|---|
| 2017 | NA | NA | 1 | 6.25% | NA |
| 2019 | 1 | 4.35% | NA | NA | NA |
| 2020 | NA | NA | 0 | 0 | NA |