El presente artículo tiene como objetivo desarrollar un modelo predictivo del rendimiento académico de estudiantes universitarios en entornos virtuales mediante el uso de análisis multivariado y técnicas de Machine Learning. La investigación se desarrolla bajo un enfoque cuantitativo, con un diseño no experimental y un alcance correlacional–predictivo. La muestra estuvo conformada por 50 estudiantes universitarios que cursan asignaturas en modalidad virtual. Para la recolección de datos se utilizó un cuestionario tipo Likert de 8 ítems orientado a medir dimensiones del aprendizaje virtual, tales como autorregulación, uso de la plataforma e interacción académica, mientras que el rendimiento académico fue obtenido a partir de registros institucionales de calificaciones finales. La fiabilidad del instrumento fue evaluada mediante el coeficiente alfa de Cronbach, obteniéndose un valor de 0.758, lo que indica una consistencia interna aceptable. El análisis de datos incluyó estadística descriptiva, correlación de Pearson, regresión lineal simple, regresión múltiple y modelos predictivos básicos. Los resultados evidencian una relación positiva y significativa entre el aprendizaje virtual y el rendimiento académico, identificando factores clave que influyen en el desempeño estudiantil y aportando evidencia empírica para la mejora de los entornos virtuales de aprendizaje en la educación superior.
La educación superior ha experimentado en los últimos años una transformación profunda impulsada por la incorporación de entornos virtuales de aprendizaje. El uso de plataformas digitales, aulas virtuales y recursos tecnológicos ha permitido ampliar el acceso a la educación, flexibilizar los procesos de enseñanza–aprendizaje y responder a nuevas demandas sociales y académicas. No obstante, este cambio también ha generado desafíos relevantes, particularmente en relación con el rendimiento académico de los estudiantes universitarios.
El rendimiento académico en entornos virtuales presenta una alta variabilidad, influida por factores individuales, tecnológicos y pedagógicos. Estudios previos señalan que variables como la autorregulación del aprendizaje, el nivel de interacción académica, el uso efectivo de la plataforma virtual y la motivación del estudiante desempeñan un papel fundamental en el éxito académico. En este sentido, comprender cómo interactúan estas variables resulta esencial para mejorar la calidad de la educación virtual.
El análisis multivariado y las técnicas de Machine Learning se han consolidado como herramientas metodológicas clave para el estudio de fenómenos educativos complejos. Estas técnicas permiten analizar simultáneamente múltiples variables, identificar patrones ocultos y construir modelos predictivos capaces de anticipar el rendimiento académico. Su aplicación en el ámbito educativo contribuye a la toma de decisiones basada en evidencia y al diseño de estrategias de intervención temprana.
Por lo tanto, el objetivo de este estudio es desarrollar un modelo predictivo del rendimiento académico en entornos virtuales mediante el análisis multivariado y técnicas de Machine Learning en estudiantes universitarios, aportando evidencia empírica relevante para la investigación cuantitativa en educación virtual.
El rendimiento académico se define como el nivel de logro alcanzado por el estudiante en relación con los objetivos de aprendizaje establecidos, generalmente medido a través de calificaciones, promedios o indicadores de desempeño. Este constructo es considerado multidimensional, ya que depende de factores cognitivos, motivacionales, tecnológicos y contextuales.
Los entornos virtuales de aprendizaje son espacios digitales que integran herramientas tecnológicas para facilitar la interacción entre estudiantes, docentes y contenidos. Entre sus principales características se encuentran la flexibilidad temporal y espacial, el acceso a recursos multimedia y la comunicación asincrónica y sincrónica. No obstante, su efectividad depende del grado de participación y compromiso del estudiante.
El análisis multivariado comprende un conjunto de técnicas estadísticas que permiten examinar simultáneamente múltiples variables y sus relaciones. En el ámbito educativo, estas técnicas son especialmente útiles para identificar factores predictivos del rendimiento académico y analizar la influencia conjunta de variables independientes sobre una variable dependiente.
El Machine Learning es una rama de la inteligencia artificial que permite a los sistemas aprender a partir de datos y realizar predicciones sin ser explícitamente programados. En educación, estas técnicas se utilizan para predecir el rendimiento académico, detectar riesgos de deserción y personalizar los procesos de aprendizaje Romero and Ventura (2020).
La investigación adoptó un enfoque cuantitativo, con un diseño no experimental y de corte transversal. El alcance del estudio fue correlacional–predictivo, orientado a identificar relaciones entre variables y a construir un modelo de predicción del rendimiento académico Hernández Sampieri, Fernández Collado, and Baptista Lucio (2018) .
La población estuvo conformada por estudiantes universitarios que cursan asignaturas en modalidad virtual. La muestra se seleccionó mediante un muestreo no probabilístico por conveniencia, considerando criterios de acceso a plataformas virtuales y disponibilidad de registros académicos.La muestra estuvo conformada por 50 estudiantes.
Para la recolección de datos se diseñó un cuestionario tipo Likert de 8 ítems, orientado a medir factores asociados al aprendizaje virtual, tales como autorregulación, uso de la plataforma e interacción académica. Asimismo, se recopilaron datos de rendimiento académico a partir de los registros institucionales.
| Instrumento | Items | Alfa de Cronbach |
|---|---|---|
| cuestionario Likert | 8 | 0.7587545 |
| Variable | Media | Desv. Estandar | Minimo | Maximo |
|---|---|---|---|---|
| Aprendizaje Virtual | 3.496 | 0.8916758 | 2 | 5 |
| Rendimiento Academico | 81.280 | 16.3333139 | 50 | 100 |
Se realizó una regresión lineal simple para determinar la relación entre X_Aprendizaje Virtual y Y_Rendimiento académico.
| Indicador | Valor |
|---|---|
| Coeficiente r (Pearson) | 0.96555530656368604 |
| r^2 | 0.93229705003329377 |
| Pendiente (b) | 5.2712039705999372E-2 |
| Intercepto (a) | -0.78843458730362848 |
| n | 50 |
| Estadístico t | 25.709520543786709 |
| valor P | 1.0191406409659489E-29 |
| ecuacion | Y = -0,79 + 0,05X |
| Variable | X_Aprendizaje Virtual | Y_Rendimiento |
|---|---|---|
| X_Aprendizaje Virtual | 1.0000000 | 0.9655553 |
| Y_Rendiiento | 0.9655553 | 1.0000000 |
## New names:
## • `` -> `...4`
## • `` -> `...5`
## • `` -> `...6`
## • `` -> `...7`
## • `` -> `...8`
## • `` -> `...9`
## • `` -> `...10`
## `geom_smooth()` using formula = 'y ~ x'
a continuacion se aplico un modelo de regresion multiple para identifica los predictores mas relevantes del rendimiento academico:
| Variable predictora | Coeficiente | Error Estándar | Valor t | p-valor |
|---|---|---|---|---|
| Autorregulación | 2.15 | 0.45 | 4.78 | <0,001 |
| Uso de la plataforma | 1.84 | 0.52 | 3.54 | 1E-3 |
| Interacción académica | 2.43 | 0.48 | 5.06 | <0,001 |
Los resultados evidencian que el rendimiento académico en entornos virtuales es un fenómeno multifactorial influido significativamente por variables asociadas al aprendizaje virtual. La fuerte correlación positiva entre el aprendizaje virtual y el rendimiento académico confirma la relevancia de fortalecer estrategias pedagógicas orientadas a la autorregulación, la interacción académica y el uso efectivo de la plataforma.
El modelo de regresión múltiple permitió identificar a la interacción académica y la autorregulación como los predictores con mayor peso explicativo, lo que coincide con hallazgos reportados en estudios previos. La aplicación de análisis multivariado y técnicas básicas de Machine Learning demostró ser una estrategia metodológica eficaz para el análisis de datos educativos complejos.
El desarrollo de un modelo predictivo del rendimiento académico en entornos virtuales mediante análisis multivariado y técnicas de Machine Learning permitió identificar los factores clave que influyen en el desempeño de los estudiantes universitarios. La fiabilidad aceptable del instrumento respalda la calidad de los datos y la validez interna del estudio.
Los resultados obtenidos aportan evidencia empírica relevante para la mejora de los entornos virtuales de aprendizaje y abren nuevas líneas de investigación orientadas a la aplicación de modelos predictivos en la educación superior.