TRABAJO FINAL - MODELOS DE SIMULACION - MAESTRÍA EN METODOLOGÌA DE LA INVESTIGACIÒN - UNER
El presente trabajo aborda el diseño y validación de un Modelo Basado en Agentes (ABM) implementado en la plataforma NetLogo, cuyo propósito es simular y proyectar las trayectorias de egreso en estudiantes de la Facultad de Educación y Salud de la Universidad Provincial de Córdoba (FES-UPC). La construcción de este simulador se inscribe en lo que se denomina un modelo in-silico, definido como una representación matemática procesada por computadora que permite analizar relaciones complejas bajo condiciones específicas. Al ser un modelo in-simulacra, no pretende ser una réplica exacta de la realidad, sino una simplificación funcional que permite aislar las piezas esenciales del fenómeno del egreso para hacerlas manejables y comprensibles (Griffiths, 2025). El estudio se focaliza en las profesiones del cuidado del ámbito de la educación y la salud, caracterizadas por una compleja intersección entre mandatos de cuidado, inserción laboral temprana y exigencias curriculares específicas.
La investigación parte de una constatación empírica observada en el tramo final de las carreras: una marcada heterogeneidad en los ritmos de titulación que deriva en un fenómeno de desaceleración progresiva. Datos previos indican que, si bien una proporción significativa de estudiantes logra el egreso en el primer semestre tras finalizar el cursado, existe un núcleo duro (aproximadamente el 15%) que permanece en situación de rezago tras dos años de seguimiento. Este rezago no se interpreta como un evento administrativo aislado, sino como el resultado de una negociación de tiempos vitales y productivos. El modelo busca representar cómo variables de fricción estructural (cargas de cuidado, informalidad laboral) y variables de agencia humana (expectativas y autoeficacia) condicionan la probabilidad de graduación. Al restituir la dimensión temporal en al análisis estadístico, podemos pasar de modelos logísticos estáticos a una representación dinámica que permita experimentar con escenarios virtuales.
El modelo se nutre del cruce de dos fuentes primarias consolidadas. Por un lado, una base de datos proveniente de la encuesta realizada en la etapa 1 a \(n203\) estudiantes que de la FES-UPC a los que les restaba una o dos asignaturas para finalizar su carrera. Esta fuente constituyó la base del libro “Egresar de la universidad: factores estructurales, recorridos formativos y expectativas del estudiantado” (Rodríguez Rocha, Abascal y Maturo, 2025), que sistematiza la fase diagnóstica de la población. Por otra parte, registros administrativos oficiales provistos por la Oficialía de Títulos de la institución, que permiten contrastar las proyecciones de la simulación con las fechas reales de aprobación de la última unidad curricular entre 2023 y 2026. De esta manera, se establece un horizonte temporal de simulación de 30 meses (ticks), partiendo del momento \(O_1\) (encuesta 2023) permitiendo evaluar el impacto de distintas hipótesis sobre eventos vitales (\(X_1\), \(X_2\)) y orientar la construcción de guiones de entrevistas cualitativas y formularios autoadministrados para las fases subsiguientes de la investigación a desarrollarse a futuro en el momento \(O_2\) (entrevistas y formularios 2026). De esta manera, el objetivo en esta etapa es lograr construir la base de un diseño de modelado ABM que en desarrollos posteriores se pueda ir ajustando con los datos obtenidos de las entrevistas y los formularios autoadministrados.
La propuesta metodológica para el desarrollo de este modelado preliminar se articula en cuatro etapas secuenciales. En la primera fase, se desarrolla el modelado conceptual mediante la combinación de diferentes técnicas estadísticas ejecutadas en RStudio. Por un lado, se propone un Análisis de Correspondencias Múltiples (ACM) y Clustering (HCPC) para mapear el espacio social de los 203 estudiantes y definir cuatro macro-regímenes de trayectoria. Por otra parte, el uso de regresiones (Firth y Lineal) provee los coeficientes de fricción o aceleración necesarios para el motor del modelo. Luego, en la segunda fase, exportamos los datos de RStudio a NetLogo para proceder a la especificación del modelo ABM, donde se programan las entidades con sus atributos y se define una dinámica temporal de 30 meses basada en algoritmos de Monte Carlo para determinar el egreso mensual. Por último, la tercera etapa consiste en la validación y análisis de resultados, comparando las trayectorias simuladas con la realidad administrativa para verificar la réplica de patrones de rezago y realizar análisis de sensibilidad mediante la manipulación de variables críticas. Finalmente, el trabajo culmina con una discusión y conclusiones que evalúan el salto cualitativo hacia un modelo generativo y el uso de casos paragones para orientar la fase cualitativa del proyecto de investigación vigente. Esta metodología se propone como una tercera vía de investigación que media entre la inducción de los datos y la deducción teórica (Cova, 2016), permitiendo no solo predecir resultados, sino realizar una explicación generativa del rezago académico: para explicar el fenómeno, el modelo debe ser capaz de “hacerlo crecer” virtualmente (Aguilera Ontiveros, 2025)
Antes de avanzar con el modelo conceptual, lo primero que debemos realizar es una análisis exploratorio de los datos provistos por la encuesta realizada en \(O_1\), junto con una selección y reconfiguración de las variables fundamentales que luego utilizaremos. Para ello cargamos las bases en RStudio, realizamos la limpieza de datos sobre la encuesta realizada en el año 2023 y obtenemos \(n203\) estudiantes identificados por DNI. Luego cargamos y depuramos la base de datos de egreso provista por Oficialía Títulos y realizamos el cruce por DNI para agregar el dato correspondiente a la fecha de aprobación de la ultima unidad curricular.
Con la nueva base consolidada elaboramos una tabla de distribución preliminar para explorar algunas de las principales variables que podríamos utilizar en la preparación del modelo ACM. Lo primero que se observa en la muestra es una clara tendencia de género en la matricula con una mayoría femenina correspondiente a las profesiones del cuidado que se cursan en esta facultad. De esta exploración se desprende que, si bien la tasa global de egreso es alta (85.2%), las trayectorias están fuertemente condicionadas por la estructura de la carrera, la edad y las responsabilidades de cuidado. El contraste más crítico se observa en la carrera LPSC: esta titulación concentra a la población con mayor edad media (31 años) y la proporción más alta de estudiantes con familiares a cargo (26.7%), variables de fricción que se traducen en un pronunciado rezago, siendo la única carrera donde la mayoría (53.3%) no logró egresar, en franca oposición al resto de las carreras que superan el 86% de éxito.
| Perfil del Estudiante Pronto a Egresar (2023) y Situación de Egreso (2025) | ||||||||||||||||||||
| Demografía, Situación Laboral, Familiar y Académica (Datos 2023 - Egreso 2025) | ||||||||||||||||||||
| Carrera |
Datos Generales
|
Género (n)
|
Edad (Años)
|
Trabajan
|
No Trabajan
|
Con Familiar a Cargo
|
Sin Familiar a Cargo
|
Egresaron
|
No Egresaron
|
|||||||||||
|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|
| N | % Total | Mujer | Varón | LGTBIQ+ | Media | Mín | Máx | n | % | n | % | n | % | n | % | n | % | n | % | |
| LPSP | 100 | 49.26% | 96 | 2 | 1 | 27.6 | 22 | 52 | 53 | 53.0% | 47 | 47.0% | 22 | 22.0% | 78 | 78.0% | 87 | 87.0% | 13 | 13.0% |
| LPSM | 61 | 30.05% | 60 | 1 | 0 | 26.9 | 22 | 52 | 38 | 62.3% | 23 | 37.7% | 7 | 11.5% | 54 | 88.5% | 53 | 86.9% | 8 | 13.1% |
| PUEE | 27 | 13.30% | 26 | 0 | 0 | 27.9 | 22 | 48 | 19 | 70.4% | 8 | 29.6% | 5 | 18.5% | 22 | 81.5% | 26 | 96.3% | 1 | 3.7% |
| LPSC | 15 | 7.39% | 15 | 0 | 0 | 31.0 | 22 | 60 | 9 | 60.0% | 6 | 40.0% | 4 | 26.7% | 11 | 73.3% | 7 | 46.7% | 8 | 53.3% |
| TOTAL | 203 | 100.00% | 197 | 3 | 1 | 27.7 | 22 | 60 | 119 | 58.6% | 84 | 41.4% | 38 | 18.7% | 165 | 81.3% | 173 | 85.2% | 30 | 14.8% |
| Fuente: Elaboración propia a partir de datos FES-UPC y registros académicos. | ||||||||||||||||||||
Para visibilizar el desarrollo del egreso desde \(O_1\) a \(O_2\) presentamos de un histograma de distribución temporal de egresos que permite revelar la dinámica calendárica en la que se concentran las graduaciones de la muestra, aportando el sustento empírico para la parametrización del horizonte temporal en el Modelo Basado en Agentes (ABM). Los datos registran un rango operativo que se extiende desde el primer egreso efectivo el 21 de noviembre de 2023 hasta el último registrado el 6 de marzo de 2026, configurando una ventana de observación real de 27.5 meses. Adicionalmente, la presencia de 30 casos sin fecha registrada (NAs) da cuenta de la población en condición de rezago activo al momento del corte de la base.
Como podemos observar en el siguiente histograma interactivo, la distribución presenta un comportamiento asimétrico positivo, la mediana se ubica en el 14 de junio de 2024, indicando que el 50% del total de los egresos se acumuló de manera intensiva durante los primeros siete meses del período analizado. Posterior a este bloque de alta concentración, se observa visualmente en el histograma una progresiva ralentización de las graduaciones, extendiendo la curva en una cola larga hacia finales de 2025 y principios de 2026. Esta estructura de reactividad inicial seguida por un estancamiento paulatino justifica la selección de un ciclo de simulación de 30 ticks (meses) en NetLogo, permitiendo al modelo capturar tanto la velocidad de la transición temprana como la resistencia estocástica de los estudiantes propensos al rezago crónico.
En suma, el análisis descriptivo preliminar de la base consolidada no solo confirma la existencia de marcadas heterogeneidades en los tiempos de graduación, sino que expone cómo el rezago se encuentra estructurado en torno a configuraciones específicas de edad, exigencias institucionales de la carrera y responsabilidades de cuidado. No obstante, las distribuciones bivariadas resultan insuficientes para capturar la simultaneidad y el peso relativo de estas interacciones en un espacio multidimensional. Con el propósito de mapear las proximidades estadísticas de estas variables, identificar perfiles sintéticos de estudiantes y proveer la base empírica de calibración para el modelo algorítmico en NetLogo, el siguiente apartado aborda el desarrollo del Análisis de Correspondencias Múltiples (ACM) y la consecuente tipificación jerárquica de la población.
Antes de avanzar con el mapeo mediante ACM+HCPC debemos revisar las variables que utilizaremos con el fin de asegurar la viabilidad estadística y mitigar problemas de baja densidad muestral. Este proceso incluyó la discretización de la edad en tres tramos vitales, la unificación de las cargas de cuidado y situación habitacional en un indicador de vulnerabilidad, y la síntesis de las expectativas laborales en una estructura binaria. Asimismo, la variable dependiente de egreso se dicotomizó en “A término” y “Demorado”, integrando en esta última el rezago y el no-egreso activo, mientras que la dimensión laboral se refinó según la condición de actividad y su vínculo técnico con la carrera. Para la selección final de las variables que alimentan el modelo se fueron seleccionando y probando diferentes combinaciones, hasta encontrar aquellas que pueden generar el modelado de un espacio social que sea representativo de los grupos conformados en cada cluster, la seleccion final queda plasmada en la siguiente tabla.
| Distribución Frecuencial de las Variables del Modelo | ||
| Población bajo análisis FES-UPC (N = 203 casos limpios) | ||
| Categoría | Frecuencia absoluta (n) | Porcentaje (%) |
|---|---|---|
| Edad (Activa) | ||
| 26 a 30 años | 46 | 22.7 |
| Hasta 25 años | 112 | 55.2 |
| Más de 30 años | 45 | 22.2 |
| Inserción Laboral (Activa) | ||
| formal | 68 | 33.5 |
| informal | 54 | 26.6 |
| No trabaja | 81 | 39.9 |
| Vínculo Trabajo/Carrera (Activa) | ||
| NO | 79 | 38.9 |
| SI | 43 | 21.2 |
| Sin respuesta | 81 | 39.9 |
| Cargas de Cuidado y Curso de Vida (Activa) | ||
| 1.Carga Familiar | 38 | 18.7 |
| 2.Carga Media | 85 | 41.9 |
| 3.Carga Baja | 80 | 39.4 |
| Nivel educativo materno (Activa) | ||
| 1.Básico | 73 | 36.0 |
| 2.Medio | 65 | 32.0 |
| 3.Superior | 65 | 32.0 |
| Condición de Egreso (Ilustrativa) | ||
| A término | 138 | 68.0 |
| No a término | 35 | 17.2 |
| No egresado | 30 | 14.8 |
| Expectativas de Inserción Laboral (Activa) | ||
| 1.Favorable | 87 | 42.9 |
| 2.Incierta | 116 | 57.1 |
| Carrera (Ilustrativa) | ||
| LPSP | 100 | 49.3 |
| LPSC | 15 | 7.4 |
| LPSM | 61 | 30.0 |
| PUEE | 27 | 13.3 |
De esta manera, si bien podemos observar una prevalencia de estudiantes en el tramo de inserción tradicional de hasta 25 años (55.2%) y una mayoría que ha logrado el egreso “A término” (68.0%), no obstante, la muestra presenta un equilibrio robusto en dimensiones críticas: la condición laboral se distribuye de forma tripartita entre el sector formal, informal y la inactividad, mientras que el capital cultural (educación materna) y las cargas de cuidado muestran frecuencias equilibradas que garantizan la representatividad de los perfiles vulnerables en el análisis multidimensional. Con esta seleccion de variables ya estamos en condiciones de avanzar en el ACM-HCPC.
Para la ejecución del modelo definitivo mediante la librería
FactoMineR de R, se seleccionaron ocho variables, las
cuales fueron clasificadas según su función metodológica en activas e
ilustrativas (o suplementarias). Las primeras seis variables operan como
activas, siendo las encargadas de determinar las distancias geométricas,
calcular las varianzas y estructurar las coordenadas de los ejes
factoriales principales: Edad_Cat,
Trabaja_Condicion, Vinculo_TC,
Condicion_Curso_Vida_Rec, Madre_NivelEducativo
y Expectativa_Laboral.
Por otra parte, las últimas dos variables,
condicion_egreso y Carrera, se incorporaron
con carácter ilustrativo. Esto implica que no intervienen en el cálculo
de las inercias ni en la construcción del espacio geométrico
fundamental, sino que sus coordenadas se proyectan a posteriori sobre el
mapa factorial ya constituido, permitiendo analizar de manera exógena la
posición de las trayectorias académicas y de las distintas titulaciones
institucionales frente a los perfiles socio-laborales. (Husson, Lê, y
Pagès, 2012).
Luego de ejecutar el modelo ACM realizamos una Clasificación Jerárquica (HCPC) sobre los resultados, esto nos permite identificar cuatro macro-regímenes de trayectoria (clústeres) que sintetizan la diversidad del estudiantado en la FES-UPC. A partir del análisis de los porcentajes y v.test obtenidos en los resultados del HCPC podemos conceptualizar y describir cada uno estos perfiles y sus respectivos casos paragones (individuos reales que representan matemáticamente el centro de cada grupo):
Clúster 1 Estudiantes de Dedicación Exclusiva: Encarna el patrón de inserción académica tradicional y lineal. Se define por la inactividad económica y la juventud. Mayoritariamente menores de 25 años (\(75\%\)) con una carga de cuidados baja (\(52\%\)). Poseen una fuerte asociación con la inactividad laboral (\(99\%\) \(v.test = 13.84\)), lo que les permite una dedicación casi exclusiva al estudio pero con una expectativa laboral incierta (\(68\%\) \(v.test = 2.43\)).
Clúster 2 Estudiante Trabajador No Vinculado: Este segmento representa a quienes deben sostener sus estudios acompañados de una inserción laboral precaria y sin relación con su formación. En su mayoría son jóvenes y adultos jóvenes (el \(100\%\) tiene menos de 30 años, \(v.test = -4.36\) para mayores de 30), con un capital cultural heredado alto (\(52.6\%\)). Su inserción laboral es informal (\(71.9\%\) y \(v.test = 8.83\)) y desvincuda de su carrera (\(100\%\) y \(v.test = 11.88\)). Suelen enfrentar una carga de cuidados media.
Clúster 3 Estudiante Trabajador Vinculado: Agrupa a estudiantes que han logrado una inserción laboral estable y profesionalizante antes de titularse. Mayoritariamente adultos jóvenes de 26 a 30 años (\(v.test = 2.30\)), con madres de nivel educativo medio (\(54\%\)). Su inserción laboral es principalmente formal (\(72.9\%\) y \(v.test = 5.41\)) en vínculo con su carrera (\(72.9\%\) y \(v.test = 8.96\)).
Clúster 4 Estudiante Trabajador Sobrecargado: Es el núcleo de mayor vulnerabilidad académica y el único grupo asociado estadísticamente de forma directa al egreso demorado. En este cluster, la etiqueta condicion_egreso = No egresado aparece de forma positiva (\(v.test = 2.22\)), mientras que condicion_egreso = A término se hunde en el polo negativo (\(v.test = -2.64\)). Su perfil representa la intersección de múltiples presiones: más de 30 años (\(88.8\%\) y \(v.test = 9.76\)), altas cargas de cuidado familiar (\(86.1\%\) y v.test = \(10.26\)) y empleo formal (\(72.2\%\)) con un \(36.1\%\) en vínculo con su carrera. Provienen mayoritariamente de hogares con capital cultural básico (\(61.1\%\) y \(v.test = 3.35\)).
| Análisis de Composición Estructural por Macro-Régimen | |||||
| Auditoría de variables categóricas según clusters (HCPC) | |||||
| Characteristic | Total Muestra1 | C1: Dedicación Exclusiva N = 731 |
C2: Trabajador No Vinculado N = 571 |
C3: Trabajador Vinculado N = 371 |
C4: Trabajador Sobrecargado N = 361 |
|---|---|---|---|---|---|
| Edad | |||||
| 26 a 30 años | 46 (23%) | 12 (16%) | 18 (32%) | 14 (38%) | 2 (5.6%) |
| Hasta 25 años | 112 (55%) | 55 (75%) | 37 (65%) | 18 (49%) | 2 (5.6%) |
| Más de 30 años | 45 (22%) | 6 (8.2%) | 2 (3.5%) | 5 (14%) | 32 (89%) |
| Nivel educativo materno | |||||
| 1.Básico | 73 (36%) | 24 (33%) | 15 (26%) | 12 (32%) | 22 (61%) |
| 2.Medio | 65 (32%) | 25 (34%) | 12 (21%) | 20 (54%) | 8 (22%) |
| 3.Superior | 65 (32%) | 24 (33%) | 30 (53%) | 5 (14%) | 6 (17%) |
| Condición curso de vida | |||||
| 1.Carga Familiar | 38 (19%) | 3 (4.1%) | 3 (5.3%) | 1 (2.7%) | 31 (86%) |
| 2.Carga Media | 85 (42%) | 32 (44%) | 31 (54%) | 21 (57%) | 1 (2.8%) |
| 3.Carga Baja | 80 (39%) | 38 (52%) | 23 (40%) | 15 (41%) | 4 (11%) |
| Condición laboral | |||||
| formal | 68 (33%) | 0 (0%) | 15 (26%) | 27 (73%) | 26 (72%) |
| informal | 54 (27%) | 1 (1.4%) | 41 (72%) | 10 (27%) | 2 (5.6%) |
| No trabaja | 81 (40%) | 72 (99%) | 1 (1.8%) | 0 (0%) | 8 (22%) |
| Vínculo Trabajo/Carrera | |||||
| NO | 79 (39%) | 0 (0%) | 57 (100%) | 7 (19%) | 15 (42%) |
| SI | 43 (21%) | 0 (0%) | 0 (0%) | 30 (81%) | 13 (36%) |
| Sin respuesta | 81 (40%) | 73 (100%) | 0 (0%) | 0 (0%) | 8 (22%) |
| Expectativas Inserción Laboral | |||||
| 1.Favorable | 87 (43%) | 23 (32%) | 29 (51%) | 14 (38%) | 21 (58%) |
| 2.Incierta | 116 (57%) | 50 (68%) | 28 (49%) | 23 (62%) | 15 (42%) |
| Condición de Egreso | |||||
| A término | 138 (68%) | 51 (70%) | 42 (74%) | 28 (76%) | 17 (47%) |
| No a término | 35 (17%) | 11 (15%) | 8 (14%) | 5 (14%) | 11 (31%) |
| No egresado | 30 (15%) | 11 (15%) | 7 (12%) | 4 (11%) | 8 (22%) |
| Carrera | |||||
| LPSP | 100 (49%) | 43 (59%) | 20 (35%) | 16 (43%) | 21 (58%) |
| LPSC | 15 (7.4%) | 6 (8.2%) | 2 (3.5%) | 4 (11%) | 3 (8.3%) |
| LPSM | 61 (30%) | 18 (25%) | 27 (47%) | 9 (24%) | 7 (19%) |
| PUEE | 27 (13%) | 6 (8.2%) | 8 (14%) | 8 (22%) | 5 (14%) |
| 1 n (%) | |||||
Los casos paragones obtenidos corresponden todos a la carrera de Psicopedagogía. Como representante del C1 estudiantes de dedicación exclusiva (ID 30), tenemos a una estudiante de hasta 25 años que no trabaja, posee carga baja (sin cargas familiares y vivienda propia) y un capital cultural heredado alto, y si bien logró el egreso a término su expectativa laboral es incierta. Por su parte, en el C2 estudiantes trabajadores no vinculados (ID 26), también tenemos una estudiante joven pero con trabajo informal desvinculado de la carrera, posee carga media (sin cargas familiares pero con vivienda alquilada) y cuyo origen social es de nivel básico. por otra parte, a pesar de presentar un egreso demorado sus expectativas laborales son favorables. El siguiente caso corresponde al C3 estudiantes trabajadores vinculados (ID 245), nos encontramos con una estudiante de entre 26 a 30 años con empleo formal vinculado, pero que al momento del corte de la base de datos figuraba como no egresado, evidenciando que la estabilidad laboral también puede ralentizar el tramo final, a pesar de tenber expectativas de insercion laboral favorables. Finalmente, en el caso paragón correspondiente al C4 estudiantes trabajadores sobrecargados (ID 37), observamos a una estudiante mayor de 30 años con empleo formal y responsabilidades de cuidado familiar, cuyo egreso fue no a término, con expectativas laborales luego de obtener el título inciertas, personificando la posición de máxima resistencia estructural en el sistema. Cada uno de estos casos se pueden observar claramente en la siguiente tabla.
| Nuevos Casos Paragones (Solución Automática de 4 Clusters) | |||||||||
| Casos con la menor distancia matemática al centroide de cada micro-perfil | |||||||||
| Cluster | ID Caso | Tramo de Edad | Condición Laboral | Curso de Vida / Cargas | Educación Materna | Egreso | Expectativa Laboral | Vinculo Trabajo/Carrera | Carrera |
|---|---|---|---|---|---|---|---|---|---|
| 1 | 30 | Hasta 25 años | No trabaja | 3.Carga Baja | 3.Superior | A término | 2.Incierta | Sin respuesta | LPSP |
| 2 | 26 | Hasta 25 años | informal | 2.Carga Media | 1.Básico | No a término | 1.Favorable | NO | LPSP |
| 3 | 245 | 26 a 30 años | formal | 2.Carga Media | 1.Básico | No egresado | 1.Favorable | SI | LPSP |
| 4 | 37 | Más de 30 años | formal | 1.Carga Familiar | 2.Medio | No a término | 2.Incierta | NO | LPSP |
Habiendo definido conceptualmente cada uno de los clusters, junto con
su distribucion de variables, y detectados los principales casos
paragones, el siguiente paso es reconocer las dimensiones sobre las
cuales se ubicaran cada uno de los estudiantes en el espacio social
estructurado por el ACM, para luego utilizarlas en el entrenamiento del
ABM. Para identificarlas calculamos la distribucion de variables en cada
una de las dimensiones relevadas y analizamos las correlaciones (\(R^2\)) y las coordenadas estimadas
(Estimate) de las variables activas sobre los tres primeros
ejes factoriales, obtenidas mediante la función dimdesc().
En el siguiente gráfico interactivo podemos observar visualmente esta
distribución. El eje horizontal (X) funciona como una balanza de
polaridad social; las categorías que se ubican hacia la derecha (valores
positivos) configuran un polo de atracción opuesto al de las categorías
situadas hacia la izquierda (valores negativos). Por otra parte, el
tamaño de cada burbuja esta asociado al \(R^2\), mostrando un volumen mayor cuanto
más determinante es la variable en esa dimensión específica. Al hacer un
solo clic en las dimensiones de la leyenda lateral se pueden encender o
apagar para limpiar el ruido visual, aislar cada eje factorial y
analizar la estructura sociológica de los datos de manera
independiente.
Teniendo en cuenta la información analizada podemos definir cada una de las dimensiones de la siguiente manera:
Dimensión 1 Intensidad de la carga biográfico-laboral: Este eje explica la mayor parte de la varianza del modelo y captura la disponibilidad u opresión temporal del estudiante en función de su inserción laboral y sus responsabilidades biográficas. Su asociación global (\(R^2\)) está determinada principalmente por la condición de trabajo (\(0.713\)) y el vínculo trabajo/carrera (\(0.654\)), seguidos por la edad (\(0.418\)) y la carga de cuidados (\(0.310\)). En su polo positivo encontramos a estudiantes con una inserción plena en el mercado y dinámicas de autonomía o cargas familiares avanzadas. Destacan el empleo formal (\(0.582\)), la tenencia de familiares a cargo (\(0.585\)), la vinculación técnica (\(0.525\)) y ser mayor de 30 años (\(0.475\)). Aquí se ubican principalmente las estudiantes trabajadoras sobrecargadas. Por otra parte, su polo negativo representa el perfil de inserción tradicional con dedicación exclusiva al estudio. Se asocia a la inactividad laboral (\(-0.630\)), la ausencia de vínculo laboral (\(-0.688\)), la edad temprana de hasta 25 años (\(-0.494\)) y una baja presión de cuidados (\(-0.319\)). Aquí encontraremos a las estudiantes tradicionales, jóvenes que no trabajan y sin cargas familiares.
Dimensión 2 Segmentación por vulnerabilidad laboral: Esta dimensión ordena la muestra según el grado de vulnerabilidad estructural y la calidad de la inserción laboral, distinguiendo entre la protección de las redes de contención y la desprotección del mercado informal. Su asociación global (\(R^2\)) mantiene una fuerte ligazón con la condición laboral (\(0.590\)) y el vínculo trabajo/carrera (\(0.491\)). Su polo positivo concentra perfiles de inactividad con soporte familiar o institucional (No trabaja: \(0.470\)) y adultos con riesgo de rezago (Más de 30 años: \(0.527\); Carga Familiar: \(0.444\)). Se vincula institucionalmente a la carrera de Psicopedagogia (LPSP). Por su parte, el polo negativo queda determinado por la informalidad laboral (\(-0.590\)) y la ausencia de vinculo carrera/trabajo (\(-0.478\)). Se vincula institucionalmente a la carrera de Psicomotricidad (LPSM).
Dimensión 3 Edad y capital cultural heredado: Este eje captura la varianza de los estratos intermedios, neutralizando los extremos de la muestra (como el estudiante muy joven o el adulto con cargas máximas). Su asociación global (\(R^2\)) está explicado casi exclusivamente por el origen social (educación materna: \(0.456\)) y la ubicación etaria (\(0.421\)). Su polo Positivo Definido estrictamente por el segmento de edad intermedia (26 a 30 años) (\(0.463\)) y hogares con capital cultural medio (\(0.351\)). Coexiste con situaciones de inserción laboral informal (\(0.158\)). Mientras que en su polo negativo esta configurado por hogares con madre de nivel superior (\(-0.398\)), el tramo etario tradicional de hasta 25 años (\(-0.227\)) y el tramo adulto ligado al empleo formal (\(-0.236\)).
Con las coordenadas factoriales de las primeras tres dimensiones del Análisis de Correspondencias Múltiples (ACM) y segmentada en cuatro grupos mediante la Clasificación Jerárquica sobre Componentes Principales (HCPC) podemos representa la topografía social de la muestra en el espacio tridimensional. Para facilitar el examen metodológico de las distancias geométricas y las proximidades de los perfiles estudiantiles, la interfaz dispone de dos herramientas de interacción dinámica:
(Salvedad, el modelo deberia presentar los casos paragones resaltados, pero aun no consigo que los recupere fielmente, es un punto a mejorar en una version mejorada, para el analisis seguimos utilizando los previamente detectados)
Habiendo finalizado el modelado del ACM+HCPC exportamos la base consolidad< con las nuevas variables y la asiognacion de clusters a un archivo xls y generamos otro archivo csv con las dimensiones y variables que exportaremos a Netlogo para generar el mapa del posicionamiento de los agentes en el momento \(O_1\) (realización de la encuesta, Noviembre de 2023) desde el cual se inicializará el modelo de simulación ABM. Para el mapeo de los agentes en este último modelo utilizaremos solo las primeras dos dimensiones. A continuación presentamos una foto de como quedará organizado el mapa de agentes al exportarlos a NetLogo.
Para analizar los condicionantes de la graduación de los estudiantes se implementó un modelo de regresión logística multivariada. Debido a que la distribución institucional de la muestra presenta una fuerte asimetría en la variable Carrera, donde coexisten carreras mayoritarias (como LPSP con 100 casos) junto a una categoría altamente minoritaria (LPSC con apenas 15 casos), y para evitar el riesgo de sufrir separación perfecta o cuasi-completa, se optó por la regresión logística con penalización de Firth, ejecutada mediante la función logistf en R. Este método introduce una corrección en la función de verosimilitud que estabiliza los coeficientes estadísticos y permite procesar categorías de baja frecuencia sin sesgos, asegurando intervalos de confianza y p-valores fiables para la totalidad de las carreras analizadas.
Cabe destacar que, de manera complementaria y exploratoria, se ejecutó un Modelo Lineal Múltiple por Mínimos Cuadrados Ordinarios (OLS) orientado a predecir el tiempo continuo hacia el egreso (medido en meses). Sin embargo, este abordaje fue descartado para la calibración del modelo de simulación. La imputación de una penalidad temporal extrema a los casos de rezago generó una fuerte polarización en la variable dependiente, provocando que las dimensiones continuas del Análisis de Correspondencias Múltiples (ACM) perdieran significancia estadística frente al peso absorbente de la estructura institucional. En consecuencia, se reafirmó la pertinencia del modelo logístico probabilístico, dado que este logra capturar de manera simultánea e insesgada tanto el efecto neto de la matriz institucional como el impacto de las configuraciones socio-laborales de los estudiantes. Esta sensibilidad a las variables biográficas resulta indispensable para programar reglas de transición micro-sociales robustas en el Modelo Basado en Agentes (ABM).”
Para la modelización del egreso estudiantil se descartó el uso de las variables sociodemográficas y laborales de forma aislada, optando en su lugar por una estrategia de regresión sobre coordenadas factoriales. Introducir las variables originales en un modelo logístico tradicional habría generado severos problemas de multicolinealidad, dado el alto grado de asociación intrínseca entre la inserción laboral, el ciclo vital y las cargas de cuidado. Al utilizar como predictores continuos las puntuaciones objetivas de las dimensiones extraídas del Análisis de Correspondencias Múltiples (ACM), se garantiza la ortogonalidad de las variables independientes. Esta metodología permite evaluar el impacto neto de perfiles estructurales complejos y multidimensionales, previamente validados en el espacio social, sobre la probabilidad de graduación, optimizando la eficiencia paramétrica del modelo y ofreciendo reglas de transición empíricas y estables para su posterior programación en el Modelo Basado en Agentes (ABM)
| Variable / Predictor | Coeficiente (β) | Odds Ratio (OR) | IC 95% (OR) | Valor p | Sig. | Uso en NetLogo (ABM) |
|---|---|---|---|---|---|---|
| (Intercept) | 1.0120 | 2.7512 | [1.775 ; 4.4] | 0.0000 | *** | Base de la Ecuación (Constante) |
| Dim1 | -0.4422 | 0.6426 | [0.391 ; 1.043] | 0.0738 | . | Beta = -0.4422 (Modificador) |
| Dim2 | -0.5810 | 0.5593 | [0.31 ; 0.99] | 0.0461 |
|
Beta = -0.581 (Modificador) |
| Dim3 | -0.1951 | 0.8227 | [0.413 ; 1.648] | 0.5792 | ns | Descartar (Efecto no significativo) |
| CarreraLPSC | -1.9298 | 0.1452 | [0.039 ; 0.457] | 0.0008 | *** | Beta = -1.9298 (Modificador) |
| CarreraLPSM | -0.2037 | 0.8157 | [0.39 ; 1.722] | 0.5898 | ns | Descartar (Efecto no significativo) |
| CarreraPUEE | -0.2536 | 0.7760 | [0.313 ; 2] | 0.5911 | ns | Descartar (Efecto no significativo) |
Para evaluar las probabilidades de egreso a término se consolidó una variable dependiente dicotómica, tomando como categoría de referencia (0) a los estudiantes en situación de rezago o no egreso (“Demorado”), y prediciendo la probabilidad del egreso “A término” (1). El modelo logístico penalizado de Firth demostró un ajuste global estadísticamente significativo (p < 0.01; N = 203), validando la capacidad predictiva de las variables introducidas.
Los resultados revelan que la inercia institucional base, representada por el intercepto asociado a la carrera mayoritaria LPSP, es fuertemente positiva (OR = 2.75; p < 0.001), indicando que, en ausencia de sobrecargas sociolaborales extremas, los estudiantes tienden estructuralmente hacia la graduación. Sin embargo, esta inercia se ve penalizada por factores biográficos e institucionales. En el plano socioestructural, la Dimensión 2 (asociada al polo de precariedad e informalidad laboral) presenta un efecto negativo significativo (β = -0.5810; p < 0.05), reduciendo las chances de egreso a término en un 44% por cada punto de desplazamiento en dicho eje (OR = 0.559). La Dimensión 1 (sobrecarga laboral adulta) exhibe una tendencia penalizadora similar (β = -0.4422; p < 0.10).
En el plano institucional, se comprobó la existencia de un “cuello de botella” significativo en la carrera LPSC. Cursar esta carrera disminuye drásticamente las probabilidades de graduación a término (β = -1.9298; p < 0.001), reduciendo los Odds de éxito en casi un 85% frente a la carrera de referencia, incluso controlando por el perfil socio-laboral del estudiante. Finalmente, ni la Dimensión 3 (origen social) ni las demás carreras (LPSM y PUEE) mostraron efectos estadísticamente significativos, por lo que fueron descartadas como reglas de transición en la simulación computacional.
Para trascender el análisis estático de las probabilidades de egreso y observar la dinámica temporal del fenómeno, se desarrolló un Modelo Basado en Agentes (ABM, por sus siglas en inglés). Este enfoque computacional permite simular cómo las características estructurales e institucionales, modeladas previamente a nivel macroestadístico, operan a nivel microsocial en las trayectorias individuales de los estudiantes a lo largo del tiempo. La especificación del modelo en NetLogo se estructuró bajo el protocolo ODD (Overview, Design concepts, Details), garantizando la replicabilidad de la maquinaria algorítmica (Aguilera Ontiveros, 2025). El motor de transición utiliza un algoritmo de Monte Carlo, permitiendo captar la estocasticidad propia de los sistemas humanos y la capacidad de agencia de los estudiantes frente a las fricciones estructurales (Wilensky y Rand, 2015; Cova, 2016).
Para la programación y ejecución de la simulación se seleccionó el entorno NetLogo. La elección de este software se fundamenta en tres ventajas metodológicas para las ciencias sociales. En primer lugar, permite la importación directa de microdatos a través de archivos CSV, garantizando que cada agente virtual sea una réplica exacta de un estudiante real de la muestra, conservando su memoria sociodemográfica y trasladando las dimensiones y variables de los modos programados en R. Por otra parte, su entorno gráfico nos permite obtener una representación espacial bidimensional ideal para proyectar las coordenadas obtenidas en el Análisis de Correspondencias Múltiples (ACM), además facilita la creación de modificadores (switchers, sliders, etc.), permitiendo alterar variables en tiempo real para evaluar escenarios contrafácticos. Finalmente, NetLogo nos permite generar una copia del simulador en formato html que podemos incrustar a nuestro documento de R para icorporarlo a esta presentación final.
El motor computacional de la simulación se estructuró en dos grandes fases de ejecución. En la primera fase de inicialización el modelo comienza importando la base de datos definitiva de los estudiantes que se encuentran a una o dos materias de egresar (Noviembre 2023). Al inicializar, el código crea un agente (estudiante) por cada caso del dataset, asignándole individualmente sus coordenadas espaciales (Dimensión 1 y Dimensión 2 del ACM) y sus atributos biográficos e institucionales (carrera, condición laboral, clúster de pertenencia, entre otros). En la segunda fase se establece la dinámica temporal y reglas de ejecuación. El horizonte temporal de la simulación se fijó en 30 ciclos o ticks, representando los 30 meses transcurridos hasta mayo de 2026. En cada iteración mensual, los agentes que aún no se han graduado evalúan sus posibilidades de hacerlo mediante una regla de transición estrictamente calibrada con el modelo logístico penalizado de Firth. El algoritmo calcula la probabilidad de éxito de cada agente combinando la inercia institucional de su carrera con los factores de penalización derivados de su posición en el espacio social (coordenadas del ACM). Esta probabilidad global se transforma en una tasa de éxito mensual, frente a la cual el agente se somete a un sorteo estocástico (método de Monte Carlo). Si el agente logra vencer sus condicionantes estructurales en ese mes, cambia su estado a egresado.
Una vez configurado el código pasamos a la ejecución. Para interpretar el comportamiento emergente del sistema, se diseñó una interfaz gráfica o Dashboard compuesta que ha sido organizada en dos sectores, el superior e inferiro. En el ector superior tenemos la representación del espacio social (Topología), donde los agentes no se mueven al azar, sino que nacen anclados en sus coordenadas factoriales (Dim1 y Dim2). Visualmente, el modelo permite observar que estudiantes tienden a apagarse (egresar) más rápido, mientras que otros permanecen activos (rezagados) por más tiempo. Los agentes cambian de color y forma al momento de graduarse para evidenciar la transición. En el sector inferior se programaron herramientas de ploteo que dibujan curvas de evolución durante la simulación. Estos gráficos permiten comparar empíricamente la velocidad de escape de distintos perfiles, contrastando las tasas de graduación entre clústeres sociológicos, condiciones de inserción laboral y las distintas carreras de la facultad, haciendo visible el embudo institucional de manera dinámica. Tambien se incorporaron contadores globales en tiempo real que registran el volumen de egresados totales y de estudiantes que continúan en situación de rezago. Finalmente se incorporaron en la interfaz gráfica controladores de parámetros dinámicos (Sliders y Switches), los cuales permiten al investigador alterar las condiciones de la simulación en tiempo real y evaluar escenarios contrafácticos.
La primera ejecución del Modelo Basado en Agentes (ABM) se configuró como el escenario cero o línea de base. Para esta test, todos los parámetros de intervención institucional se mantuvieron inactivos (los sliders de apoyo económico y flexibilización en 0%, y el switch de reforma curricular de LPSC en estado Off). El objetivo de esta ejecución no fue proyectar escenarios alternativos, sino evaluar la capacidad del algoritmo para replicar el comportamiento histórico observado en la cohorte. Para poder realizar esta comparación generamos primero un gráfico de temporalidades de egreso con los datos que ya tenemos correspondiente a la fecha de egreso de cada estudiante.
Como podemos observar en este gráfico empírico, el perfil de estudiante sobrecargado es el que mayores dificultades experimenta para egresar. Es aproximadamente a partir del sexto mes de observación cuando se evidencia el comienzo de un distanciamiento cada vez más pronunciado de sus trayectorias respecto al resto de las tipologías.
Al correr las simulaciones de prueba en la línea de base (sin modificadores institucionales activados), obtenemos resultados estructuralmente similares, reafirmando la tendencia general. No obstante, como ilustra la siguiente imagen, emergen algunas variaciones estocásticas: las tasas de egreso simuladas tienden a ser levemente menores, arrojando una mayor proporción final de estudiantes en situación de rezago en comparación con los datos históricos. Asimismo, se registran sutiles diferencias en el ritmo de graduación de los clústeres 1, 2 y 3, siendo estas variaciones particularmente notorias en el clúster 2.
Esta leve subestimación en las tasas de éxito podría sugerir, en primera instancia, que el modelo requiere mayores ajustes de calibración empírica. Sin embargo, desde una perspectiva metodológica, resulta crucial actuar con cautela frente a esta discrepancia. Si forzamos los parámetros del algoritmo para que repliquen con exactitud milimétrica el dato histórico, correríamos el riesgo de caer en un sobreajuste (overfitting). De ocurrir esto, perderíamos la capacidad de generalización del modelo; dejaría de ser un laboratorio sociológico capaz de proyectar escenarios contrafácticos válidos, para convertirse en un mero reproductor memorístico de una muestra pasada.
A partir de la calibración del escenario base, se realizaron cuatro pruebas de estrés para evaluar el impacto de distintas políticas institucionales sobre el rezago académico. Las imágenes analizadas muestran la respuesta del sistema ante la manipulación de los parámetros de intervención.
En esta prueba se activó la reforma curricular de la carrera LPSC junto con un nivel intermedio (60%) de becas económicas y flexibilización horaria. El resultado arroja un 73.4% de egresados totales. Se observa que, aunque la tasa general sube, las curvas de egreso por macro-régimen aún mantienen una distancia significativa, lo que sugiere que intervenciones parciales no logran neutralizar totalmente el peso de la fricción estructural.
Al comparar el impacto de las becas frente a la flexibilización horaria de forma aislada, emergen datos interesantes: - Becas al 100%: Logran una tasa de egreso del 74.9%. Este escenario parece favorecer especialmente la velocidad de escape del Clúster 1 (Azul) y el Clúster 2 (Verde), quienes pueden dedicar más tiempo al tramo final al reducir la presión laboral. - Flexibilización al 100%: Resulta en un 74.4% de egreso. Si bien el impacto global es levemente menor al de las becas, se observa visualmente en las curvas una mejora en la pendiente del Clúster 4 (Rojo), sugiriendo que el tiempo es el recurso más crítico para las estudiantes sobrecargadas.
Este último test representa la política de máximos: reforma del plan LPSC activa combinada con el 100% de apoyo económico y flexibilización. El resultado es el más alto de todas las simulaciones: 81.8% de egresados totales y solo un 18.2% de rezago. Lo más relevante de este escenario es la convergencia de las curvas: la brecha entre el Clúster 1 (Dedicación Exclusiva) y el Clúster 4 (Sobrecargado) se reduce a su mínima expresión histórica. Esto sugiera que la vulnerabilidad académica no es un destino biográfico inamovible, sino una condición sensible a la sinergia entre reformas estructurales y apoyos personalizados.
Una de las limitaciones inherentes a la observación de una única corrida en un Modelo Basado en Agentes (MBA) es el riesgo de extraer conclusiones a partir de un escenario atípico. Dado que la trayectoria de cada estudiante simulado contiene variables estocásticas, es decir pequeñas variaciones aleatorias introducidas para emular la incertidumbre y heterogeneidad de los recorridos vitales reales, dos simulaciones idénticas en sus parámetros iniciales nunca producirán exactamente la misma curva de egreso.
Para superar esta limitación metodológica y otorgar validez estadística a los hallazgos, se recurrió a la experimentación computacional masiva utilizando la herramienta BehaviorSpace integrada en el entorno NetLogo. Este módulo permite parametrizar el modelo y ejecutar iteraciones de Monte Carlo; es decir, repetir el mismo escenario experimental múltiples veces de forma automatizada y silenciosa para registrar la distribución real de todos los resultados posibles. De este modo, el diseño de este modelo no busca únicamente la réplica de datos históricos, sino que se constituye como una herramienta para dar respuestas a preguntas del tipo «¿qué pasaría si…?» (Cova 2016) mediante experimentos computacionales que no implican riesgos físicos ni daños morales, permitiendo evaluar diversas alternativas operacionales del sistema universitario.
Con este objetivo, y utilizando el escenario base de esta investigación, se configuró un experimento de 1.000 repeticiones independientes (runs). En cada paso de tiempo (mes simulado), el sistema registró la cantidad acumulada de estudiantes que lograron el estatus de egreso. El análisis agregado de este volumen de datos permite aislar el ruido estocástico del micro-comportamiento individual y develar la tendencia estructural macroscópica del sistema educativo modelado. A continuación, se presenta la gráfica resultante de este procesamiento analítico. En las representaciones visuales, la tendencia central ilustra la media aritmética de egresados a través del tiempo, mientras que los márgenes de variabilidad evidencian la robustez y los límites de dispersión del fenómeno observado a lo largo de las 1.000 simulaciones.
En el gráfico interactivo podemos observar con claridad la curva ascendente de cada perfil de estudiante junto con su variabilidad, qué grupo tiene la curva más empinada (egresan rápido) y qué grupo tiene la curva más achatada o con sombras más anchas (mucha imprevisibilidad y rezago). Las curvas de los Clústers 1, 2 y 3 muestran las pendientes más pronunciadas, validando que estos perfiles tienen la mayor velocidad de egreso. Por el contrario, el Clúster 4 (Rojo) presenta una curva aplanada que apenas supera el 50% al finalizar los 30 meses, confirmando su condición de mayor fricción estructural. Lo más revelador sin duda es el ancho de las sombras (variabilidad). El Clúster 4 posee la sombra más ancha, lo que indica que sus trayectorias son las más impredecibles y sensibles a variaciones estocásticas, sugiriendo que su egreso puede depender más de eventos vitales azarosos que de la inercia institucional.
Estos hallazgos proporcionan una base empírica preliminar para el proyecto del equipo de investigación y para mi trabajo de tesis de Maestría, siendo una muestra de la potencialidad de este tipo de herramientas construidas sobre una base metodológica que se puede ir mejorando. Uno de los aspectos que se introdujo pero que no hemos tenido tiempo para detenernos a analizar por el momento es la visualización del comportamiento de las variables relacionadas con la inserción laboral, para observar la incidencia del trabajo formal, informal y su vinculo con la carrera en las trayectorias de egreso. También sería interesante desarrollar otro tipo de experimentos utilizando las variaciones que se pueden incorporar al modelo generando escenarios ficticios contrafácticos para visualizar que sucede cuando se modifican las condiciones como habíamos explorado preliminarmente al testear el modelo.
Finalmente, dejamos a disposición el simulador para que puedan utilizarlo y realizar sus propias pruebas (aquí debería incrustarse el simulador enlazado al archivo simulador.html, esto funciona en un entorno local o si se pudiera alojar en un servidor, pero no al publicarse en rpubs, por lo que se adjunta el archivo html para la entrega del trabajo)
Aguilera Ontiveros, A. (Coord.). (2025). Nuevas fronteras en ciencias sociales computacionales: Análisis del discurso, la opinión y la dinámica social. AMIDI.
Cova, W. J. D. (2016). Sistemas, modelos, simulación y un toque de epistemología. edUTecNe.
Griffiths, E. (2025). ¿Qué es un modelo? [Traducción de Sheffield University, 2010]. Apunte del curso Modelos de Simulación.
Husson, F., Lê, S., y Pagès, J. (2012). Análisis de datos con R. Escuela Colombiana de Ingeniería Julio Garavito.
Lodeyro, P. (2009). Modelos científicos: aproximaciones desde una simulación computacional. Epistemología e Historia de la Ciencia, 15. Universidad Nacional de Córdoba.
Rodríguez Rocha, E., Abascal, M., y Maturo, Y. D. (Comps.). (2025). Egresar de la universidad: factores estructurales, recorridos formativos y expectativas del estudiantado. Universidad Provincial de Córdoba Ediciones.