1. Resumen teórico sesiones 7 y 8

DISEÑOS FACTORIALES

Definicion El diseño factorial permite estudiar simultáneamente el efecto individual y el efecto de interacción de dos o más factores sobre una variable respuesta. Este tipo de diseño es más eficiente que los diseños de un solo factor, ya que permite evaluar múltiples variables en un mismo experimento.

En los diseños factoriales se consideran los siguientes elementos:

- Factor cualitativo: variable categórica con niveles discretos.

- Factor cuantitativo: variable numérica con valores continuos.

- Arreglo factorial: estructura que combina todos los niveles de los factores, generalmente representada en forma matricial.

- Efecto de un factor: cambio producido en la variable respuesta debido a la variación de un factor.

- Efecto principal: efecto promedio de un factor sobre la variable respuesta.

- Efecto de interacción: ocurre cuando el efecto de un factor depende del nivel de otro factor.

- Réplica: repetición completa de todas las combinaciones de tratamientos, lo cual permite estimar el error experimental.

Características

Permiten estudiar dos o más factores simultáneamente.

Analizan tanto efectos principales como efectos de interacción.

Utilizan un arreglo factorial, donde se combinan todos los niveles de los factores.

Pueden incluir factores cualitativos o cuantitativos.

Requieren aleatorización de las unidades experimentales.

Pueden incorporar réplicas para estimar el error experimental.

Son más eficientes que realizar experimentos separados para cada factor.

Ventajas y desventajas de los diseños factoriales

Ventajas Desventajas
Diseños factoriales Permiten evaluar interacciones entre factores, algo que no es posible en diseños de un solo factor. El análisis estadístico es más complejo.
Mayor eficiencia experimental: se obtiene más información con menos corridas. Aumenta el número de tratamientos cuando crece el número de factores.
Mejor comprensión del fenómeno estudiado. Puede requerir mayor número de unidades experimentales.
Permiten optimizar procesos identificando combinaciones óptimas. La interpretación puede ser difícil cuando existen múltiples interacciones.
Reducen tiempo y costos frente a múltiples experimentos independientes. Si no se planea adecuadamente, puede generar sobrecarga de datos.


Ejemplo simple.

Diseño 2x2 Horas de sueño
Mucho Poco
Con café VD VD
Sin café VD VD


VD: variable dependiente, pueden ser nivel de concentración, rendimiento, tiempo de reacción, etc


Tipos de Diseños Factoriales

1. Diseño Factorial Completo. Incluye todas las combinaciones posibles de los niveles de los factores. Son los más utilizados en investigación experimental.

2. Diseño Factorial Fraccionado. Se utiliza solo una fracción de las combinaciones posibles. Se usa cuando hay muchos factores. La ventaja es que reduce el número de experimentos y la desventaja es que puede confundir efectos (aliasing).

3. Diseño Factorial Mixto. Combina factores con diferente número de niveles. P.Ej: Un factor con 2 niveles y otro con 3 niveles → diseño 2×3.

4. Diseño Factorial con Réplicas. Incluye repeticiones completas de todas las combinaciones, permitiendo estimar el error experimental y mejorar la precisión.


Los diseños factoriales también pueden clasificarse según el número de factores involucrados (dos, tres o k factores). Asimismo, pueden estructurarse como diseños 2ᵏ cuando todos los factores presentan dos niveles, lo cual es común en experimentos exploratorios. Cuando el número de factores es elevado, se emplean diseños factoriales fraccionados para reducir el número de corridas experimentales.

Clasificación de los factores

Clasificación de los factores N° de factores / Tipo Representación N° total de tratamientos
1. Según el número de factores Diseño factorial de dos factores A con a niveles
B con b niveles
N = a × b
Diseño factorial de tres factores A con a niveles
B con b niveles
C con c niveles
N = a × b × c
2. Según el número de niveles por factor Diseños 2k k representa el número de factores.
Todos los factores tienen 2 niveles.
N = 2k
Diseños mixtos A con a niveles
B con b niveles
(a ≠ b)
N = a × b
3. Según la fracción del diseño Diseños 2k-p k = número de factores
p = grado de fracción
N = 2k-p
4. Según la réplica Con réplica Cada tratamiento se repite r veces N = (a × b × c) r
Sin réplica Cada combinación se ejecuta una sola vez N = a × b × c
Modelo matemático general del diseño factorial:
Donde ni representa el número de niveles del factor i, k el número total de factores y r el número de réplicas.


Los diseños factoriales permiten una estructuración matemática rigurosa del experimento, facilitando el cálculo del número total de tratamientos, grados de libertad y estimación de efectos principales e interacciones, lo que los convierte en herramientas fundamentales en el Diseño de Experimentos (DOE).


2. Planteamiento del problema.

La enseñanza de la Ingeniería de Software presenta dificultades asociadas a su alto componente teórico y a la brecha existente entre la comprensión conceptual y su aplicación práctica, lo que genera desmotivación y un aprendizaje predominantemente lineal. Aunque la gamificación y los juegos serios han mostrado efectos positivos en la motivación estudiantil, muchas implementaciones carecen de un modelo estructural que integre adaptatividad y retroalimentación oportuna.

En este contexto, la incorporación de inteligencia artificial ofrece la posibilidad de potenciar la gamificación mediante sistemas adaptativos y personalizados. Por ello, se propone evaluar, bajo un diseño factorial 2k, el efecto de la gamificación y la inteligencia artificial así como su interacción sobre el desempeño práctico en Ingeniería de Software, entendido como la capacidad del estudiante para aplicar de manera correcta y contextualizada los conceptos teóricos en la resolución de problemas.

Diseño experimental propuesto: Diseño factorial 2²

Variable dependiente principal (VD). Desempeño práctico en Ingeniería de Software

Variables independientes.

Factor A: Estrategia de gamificación

Niveles:

A1: Enseñanza tradicional (sin gamificación)

A2: Gamificación estructurada

Factor B: Nivel de inteligencia artificial aplicada

Niveles:

B1: Sin IA (retroalimentación manual del docente)

B2: Con IA adaptativa (retroalimentación automática y personalización de retos)

Variable respuesta: Desempeño práctico

El número de tratamientos es 4.

T1 (sin gamificación, sin IA) → promedio más bajo

T2 (con gamificación) → un poco más alto

T3 (solo IA) → mejora moderada

T4 (gamificación + IA) → el promedio más alto

El número total de observaciones: N=2² x r

réplicas (r)= 10

10 estudiantes por tratamiento → 40 observaciones.

Tabla 1 – Tratamientos factoriales 2²

Esta tabla muestra la codificación matemática (A1, A2, B1, B2).

Tratamiento A B
T1 A1 B1
T2 A2 B1
T3 A1 B2
T4 A2 B2

Tabla 2 – Aplicación a mi estudio (Gamificación × IA)

Ésta tabla traduce esa codificación al contexto real de mi investigación.

Grupo Gamificación IA
G1 No No
G2 No
G3 No
G4

Tabla de datos simulados (Diseño 2k, r = 10)


Datos experimentales. La siguiente tabla presenta los datos experimentales correspondientes a un diseño factorial 2² con réplica, en el que se evaluaron dos factores (A y B), cada uno con dos niveles. Se registraron diez observaciones por tratamiento, para un total de 40 mediciones de la variable respuesta “Desempeño”. Esta estructura permite analizar tanto los efectos principales de cada factor como su posible interacción mediante un modelo ANOVA factorial.

# Crear data frame

datos <- data.frame(
  Tratamiento = rep(c("T1","T2","T3","T4"), each = 10),
  A = rep(c("A1","A2","A1","A2"), each = 10),
  B = rep(c("B1","B1","B2","B2"), each = 10),
  Desempeno = c(
    62,68,64,66,63,70,61,67,65,69,
    74,77,72,78,75,73,79,76,74,80,
    70,74,69,73,71,75,72,68,76,70,
    85,90,87,92,88,91,86,89,93,84
  )
)

# Convertir a factores 
datos$Tratamiento <- as.factor(datos$Tratamiento)
datos$A <- as.factor(datos$A)
datos$B <- as.factor(datos$B)

# Mostrar tabla
datos
##    Tratamiento  A  B Desempeno
## 1           T1 A1 B1        62
## 2           T1 A1 B1        68
## 3           T1 A1 B1        64
## 4           T1 A1 B1        66
## 5           T1 A1 B1        63
## 6           T1 A1 B1        70
## 7           T1 A1 B1        61
## 8           T1 A1 B1        67
## 9           T1 A1 B1        65
## 10          T1 A1 B1        69
## 11          T2 A2 B1        74
## 12          T2 A2 B1        77
## 13          T2 A2 B1        72
## 14          T2 A2 B1        78
## 15          T2 A2 B1        75
## 16          T2 A2 B1        73
## 17          T2 A2 B1        79
## 18          T2 A2 B1        76
## 19          T2 A2 B1        74
## 20          T2 A2 B1        80
## 21          T3 A1 B2        70
## 22          T3 A1 B2        74
## 23          T3 A1 B2        69
## 24          T3 A1 B2        73
## 25          T3 A1 B2        71
## 26          T3 A1 B2        75
## 27          T3 A1 B2        72
## 28          T3 A1 B2        68
## 29          T3 A1 B2        76
## 30          T3 A1 B2        70
## 31          T4 A2 B2        85
## 32          T4 A2 B2        90
## 33          T4 A2 B2        87
## 34          T4 A2 B2        92
## 35          T4 A2 B2        88
## 36          T4 A2 B2        91
## 37          T4 A2 B2        86
## 38          T4 A2 B2        89
## 39          T4 A2 B2        93
## 40          T4 A2 B2        84


2. Crear el ANOVA y su significancia estadística

El modelo factorial de dos factores con interacción se representa mediante la siguiente expresión matemática, donde se consideran los efectos de los factores A y B, su interacción y el error experimental.

A continuación, se ajusta el modelo lineal y se realiza el análisis de varianza (ANOVA) para evaluar la significancia estadística de los factores estudiados.

##             Df Sum Sq Mean Sq F value   Pr(>F)    
## A            1 1822.5  1822.5  224.54  < 2e-16 ***
## B            1  902.5   902.5  111.19 1.48e-12 ***
## A:B          1  102.4   102.4   12.62  0.00109 ** 
## Residuals   36  292.2     8.1                     
## ---
## Signif. codes:  0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
Factor p-valor
A (Gamificación) < 2e-16
B (IA) 1.48e-12
A:B (interacción) 0.00109

Interpretación

El análisis de varianza (ANOVA) permite evaluar la influencia de los factores estrategia de gamificación (A) y nivel de inteligencia artificial aplicada (B) sobre el desempeño práctico en Ingeniería de Software.

Los resultados indican que el factor A (gamificación) presenta un efecto estadísticamente significativo sobre la variable respuesta (p < 0.001), lo que sugiere que la implementación de estrategias de gamificación influye de manera significativa en el desempeño práctico de los estudiantes.

De igual manera, el factor B (uso de inteligencia artificial) también muestra un efecto significativo (p < 0.001), indicando que la incorporación de retroalimentación adaptativa basada en IA contribuye a mejorar los resultados obtenidos por los estudiantes.

Adicionalmente, la interacción entre gamificación e inteligencia artificial (A:B) resulta estadísticamente significativa (p = 0.00109), lo que evidencia que el efecto combinado de ambos factores produce un impacto diferente al que se obtendría al analizar cada factor de manera independiente. Esto sugiere que la integración de gamificación con mecanismos de inteligencia artificial puede potenciar el desempeño práctico en mayor medida que la aplicación aislada de cada estrategia.


3. Generar Supuestos del ANOVA y del modelo

Pruebas de normalidad, independencia errores y homogeneidad

a. Prueba Shapiro-Wilks

shapiro.test(modelo$residuals)
## 
##  Shapiro-Wilk normality test
## 
## data:  modelo$residuals
## W = 0.95155, p-value = 0.08578


W = 0.95155

p-value = 0.08578

Interpretación

El test de Shapiro-Wilk se utiliza para evaluar si los residuos del modelo siguen una distribución normal. En este caso se obtuvo un p-value = 0.08578, el cual es mayor que el nivel de significancia α = 0.05. Por lo tanto, no se rechaza la hipótesis nula de normalidad, lo que indica que los residuos del modelo pueden considerarse normalmente distribuidos y se cumple el supuesto de normalidad requerido para el ANOVA.

b. Prueba Durbin-Watson

## 
##  Durbin-Watson test
## 
## data:  modelo
## DW = 3.0903, p-value = 0.9995
## alternative hypothesis: true autocorrelation is greater than 0

DW = 3.0903

p-value = 0.9995

Interpretación

La prueba de Durbin-Watson permite evaluar la independencia de los residuos del modelo. El resultado obtenido fue DW = 3.0903 con p-value = 0.9995, valor mayor que α = 0.05. Por lo tanto, no se rechaza la hipótesis nula de independencia, lo que indica que no existe evidencia estadística de autocorrelación en los residuos. En consecuencia, se cumple el supuesto de independencia de los errores del modelo.

c. Homocedasticidad (varianza constante)

## Non-constant Variance Score Test 
## Variance formula: ~ fitted.values 
## Chisquare = 0.01212177, Df = 1, p = 0.91233

Interpretación

La prueba evalúa si la varianza de los residuos es constante a lo largo de los valores ajustados del modelo.

Hipótesis nula (H₀): la varianza es constante (homocedasticidad).

Hipótesis alternativa (H₁): la varianza no es constante (heterocedasticidad).

Dado que el p-value = 0.91233 es mayor que 0.05, no se rechaza la hipótesis nula. Por lo tanto, no existe evidencia de heterocedasticidad, lo que indica que la varianza de los residuos puede considerarse constante. En consecuencia, se cumple el supuesto de homocedasticidad requerido para aplicar el ANOVA.

d. Boxplot para observar varianza por factores

El boxplot del desempeño según el factor A (estrategia de gamificación) permite observar visualmente la dispersión y tendencia central de los datos.

Interpretación

La gráfica muestra que el nivel A2 (gamificación estructurada) presenta valores de desempeño más altos que A1 (enseñanza tradicional). Además, la dispersión de los datos dentro de cada grupo es relativamente similar, lo que sugiere que las varianzas entre los grupos son comparables, reforzando el cumplimiento del supuesto de homogeneidad de varianzas.

En términos generales, el boxplot evidencia que la implementación de estrategias de gamificación se asocia con un mayor desempeño práctico en Ingeniería de Software, lo cual es consistente con los resultados obtenidos en el análisis ANOVA.

Interpretación

El boxplot muestra la distribución del desempeño práctico de los estudiantes según el nivel del factor B (uso de inteligencia artificial). Se observa que el nivel B2 (con IA adaptativa) presenta valores de desempeño más altos en comparación con B1 (sin IA). Además, la mediana del grupo B2 es superior a la del grupo B1, lo que sugiere que la incorporación de inteligencia artificial en las estrategias educativas puede contribuir a mejorar el desempeño práctico en Ingeniería de Software. La dispersión de los datos en ambos grupos es comparable, lo cual es consistente con el supuesto de homogeneidad de varianzas.



4. Visualización de los efectos de los factores y su interacción

Gráfico de efectos principales

Interpretación

En el gráfico de efectos principales se observa que:

El factor A (gamificación) presenta un incremento notable en el desempeño al pasar del nivel A1 (sin gamificación) al nivel A2 (con gamificación).

El factor B (uso de inteligencia artificial) también muestra un aumento en el desempeño al pasar del nivel B1 (sin IA) al nivel B2 (con IA adaptativa).

La pendiente ascendente en ambos factores indica que tanto la gamificación como la inteligencia artificial tienen un efecto positivo sobre el desempeño práctico de los estudiantes.

Gráfico de interacción

Interpretación

El gráfico de interacción muestra que las líneas correspondientes a los niveles de los factores no son completamente paralelas, lo que sugiere la presencia de interacción entre la gamificación y la inteligencia artificial.

Esto indica que el efecto de la gamificación sobre el desempeño cambia dependiendo de si se utiliza o no inteligencia artificial, lo que coincide con el resultado significativo obtenido previamente en el ANOVA para el término de interacción.

Gráfico alternativo de efectos principales

Interpretación

Este gráfico confirma que el promedio del desempeño es mayor en los niveles A2 y B2, lo cual refuerza la evidencia de que las estrategias de gamificación y el uso de inteligencia artificial contribuyen a mejorar los resultados académicos.

Gráfico de interacción

Interpretación

El gráfico muestra que el desempeño aumenta cuando se pasa de A1 a A2, y este incremento es aún mayor cuando se combina con el nivel B2 (uso de IA). Esto sugiere que la combinación de gamificación con inteligencia artificial produce el mayor impacto en el desempeño práctico.

Coeficientes del modelo

## (Intercept)         AA2         BB2     AA2:BB2 
##        65.5        10.3         6.3         6.4

Interpretación

El experimento muestra que el mejor tratamiento es T4 (Gamificación + IA). Lo que indica que la gamificación potenciada con inteligencia artificial mejora la enseñanza de ingeniería de software.

3. Solución e interpretación de resultados.

Conclusiones finales
  1. El análisis de varianza (ANOVA) mostró que los factores gamificación (A) y uso de inteligencia artificial (B) tienen un efecto estadísticamente significativo sobre el desempeño práctico de los estudiantes. Asimismo, la interacción entre ambos factores también resultó significativa, lo que indica que el efecto de un factor depende del nivel del otro.

  2. La validación de los supuestos del modelo confirmó la normalidad de los residuos, la independencia de los errores y la homogeneidad de varianzas, lo que garantiza la validez estadística del modelo ANOVA aplicado al diseño factorial 2².

  3. El análisis de los gráficos de efectos principales e interacción evidenció que el mayor desempeño se obtiene cuando se combinan la gamificación estructurada con inteligencia artificial adaptativa, lo que sugiere que la integración de estas estrategias pedagógicas puede mejorar significativamente la enseñanza práctica de la Ingeniería de Software.

  4. Estos resultados sugieren que la integración de estrategias de gamificación potenciadas con inteligencia artificial puede constituir una alternativa efectiva para mejorar los procesos de enseñanza en Ingeniería de Software.

Discusión de resultados

Los resultados obtenidos evidencian que tanto la gamificación como la incorporación de inteligencia artificial influyen positivamente en el desempeño práctico de los estudiantes en Ingeniería de Software. El análisis factorial permitió identificar no solo el efecto individual de cada factor, sino también su interacción, mostrando que la combinación de ambas estrategias produce un impacto mayor en comparación con su aplicación por separado.

Desde una perspectiva pedagógica, estos hallazgos sugieren que el uso de estrategias de aprendizaje activas apoyadas por tecnologías inteligentes puede favorecer la comprensión y aplicación de conceptos complejos de la Ingeniería de Software. En particular, la retroalimentación adaptativa proporcionada por sistemas basados en inteligencia artificial puede complementar las dinámicas de gamificación, fortaleciendo la motivación y la participación de los estudiantes en el proceso formativo.