Actitudes hacia la Estadística en Estudiantes Adultos:
Un Análisis Bayesiano con el Modelo de Respuesta Graduada en R
Enver Gerald Tarazona Vargas
Pontificia Universidad Católica del Perú (PUCP), Perú
Contexto
- Crecimiento de estudiantes adultos en educación superior.
- Importancia de la estadística en ingeniería.
- Las actitudes influyen en el aprendizaje estadístico.
- Brecha: poca investigación con adultos de mediana edad.
Antecedentes
Escalas usadas:
- EAE (Estrada, 2002) — 23 ítems.
- EAC (Cazorla et al., 1999/2009) — 20 ítems.
- Aplicadas previamente en Perú y Brasil (Aparicio, Bazán, Aliaga).
- Miden componentes afectivos y cognitivos de la actitud.
Objetivos
- Evaluar propiedades psicométricas de EAE y EAC en adultos.
- Describir niveles de actitud hacia la estadística.
- Comparar actitudes según especialidad, sexo, edad y experiencia previa.
- Aportar evidencia para el diseño y ajuste de programas universitarios para adultos.
Participantes
- N = 137 estudiantes adultos (32–42 años).
- Programa de educación para adultos (2012-II).
- Carreras: Industrial, Sistemas, Civil, Redes.
- 84% hombres; 52% con estadística previa.
Instrumentos
- Escala de Estrada (EAE): 23 ítems, Likert 5 puntos.
- Escala de Cazorla (EAC): 20 ítems, Likert 5 puntos.
- Versiones adaptadas lingüísticamente al contexto peruano.
- Aplicación colectiva en aula.
Metodología — Teoría Clásica de los Test (TCT)
- Análisis descriptivo de los ítems:
media, desviación estándar y distribución de respuestas.
- Calidad de los ítems:
correlación ítem-total corregida.
- Confiabilidad de las escalas: alfa de Cronbach
- Evaluación de normalidad y asimetría (presentes en los puntajes originales).
- En R:
psych.
La TCT permitió una primera evaluación de consistencia interna y de la estructura empírica de ambas escalas antes del análisis TRI.
Metodología — Teoría de Respuesta al Ítem (TRI)
Modelo de Respuesta Graduada (GRM)
- Propuesto por Samejima (1969, 1972) para ítems politómicos ordinales.
- Cada ítem tiene dos tipos de parámetros:
- Discriminación (a) → qué tan bien separa niveles del rasgo.
- Umbrales (b₁, b₂, …) → puntos donde aumenta la probabilidad de elegir una categoría mayor.
- Permite obtener una medida del rasgo latente independiente del conjunto específico de ítems.
En el estudio
- Se empleó el 2PL-GRM (discriminación + umbrales).
- Ajustado mediante inferencía bayesiana con cadenas MCMC en R (R2WinBUGS + coda).
Metodología — Definición del Modelo 2PL-GRM
Sea \(Y_j\) el nivel del rasgo latente para el participante \(j\) y \(X_{ij}\) su respuesta al ítem \(i\), la probabilidad de que un ítem \(i\) sea respondido en la categoría \(k\) se define como:
\[
\small
\pi_{ijk} = P(Y_{ij}=k \mid Y_j) =
\begin{cases}
\Psi(-\eta_{ij1}) & k=1 \\[4pt]
\Psi(-\eta_{ijk}) - \Psi(-\eta_{ij(k-1)}) & 2 \le k < m \\[4pt]
1 - \Psi(-\eta_{ij(m-1)}) & k=m
\end{cases}
\]
donde:
\[
\small
\eta_{ijk} = a_i (Y_j - b_{ik}),
\qquad
\Psi(x)=\frac{1}{1+e^{-x}}
\]
con \(a_i\) la discriminación del ítem \(i\), \(b_{ik}\) el umbral entre categorías y \(m\) el número de categorías de respuesta.
Esta formulación permite modelar la transición entre categorías ordinales según el nivel del rasgo latente.
Metodología — Estimación Bayesiana
La probabilidad del ítem se modela como:
\[
X_{ij} = k \;\mid\; y_j, a_i, b_{ik}
\sim \text{Categorica}\Big(
\Psi(a_i(y_j - b_{ik})) -
\Psi(a_i(y_j - b_{i(k-1)}))
\Big).
\] Con prioris: \[y_j \sim N(0,1)\] \[a_i \sim N^{+}(1,0.5)\] \[b_{ik} = \frac{\kappa_{ik}}{a_i}\]
(ver siguiente lámina para la reparametrización)
El modelo se especificó bajo un enfoque bayesiano para estimar simultáneamente el rasgo latente y los parámetros del ítem.
Metodología — Reparametrización para la Estimación
Para facilitar la inferencia MCMC, se parametrizan los umbrales mediante parámetros auxiliares sin restricciones:
Parámetros auxiliares
\[
\kappa^*_{ik} \sim N(0,2), \qquad k = 1,\dots,m-1.
\]
Luego se ordenan para obtener umbrales válidos:
\[
\kappa_{i1} < \kappa_{i2} < \dots < \kappa_{i,m-1}.
\]
Finalmente, los puntos de corte en la escala del rasgo se obtienen como:
\[
b_{ik} = \frac{\kappa_{ik}}{a_i}.
\]
Esta reparametrización solo se usa para el muestreo MCMC y no forma parte del modelo 2PL-GRM, pero mejora la estabilidad y evita problemas de ordenamiento.
Metodología — Implementación Computacional y MCMC
- El modelo se estimó bajo un enfoque bayesiano, recuperando simultáneamente el rasgo latente y los parámetros del ítem.
- Inferencia mediante cadenas de Markov (MCMC).
- En R:
- R2WinBUGS → envío del modelo y recuperación de cadenas.
- mcmcplots → diagnóstico posterior (trazas, autocorrelación, densidades).
- Especificación:
- 3 cadenas × 10 000 iteraciones.
- Burn-in: 1 000.
- Muestreo posterior: 9 000 por cadena.
La convergencia adecuada aseguró la estabilidad y robustez de las estimaciones del GRM.
Funciones y programas implementados
A continuación se listan las funciones en R y los programas WinBUGS implementados para estimar y representar propiedades del modelo 2PL-GRM:
rgrm.pirt() |
Simula respuestas basadas en modelos 2PL-GRM y LPE-GRM. |
pgrm.pirt() |
Calcula probabilidades acumuladas del GRM. |
grmMCMC |
Ejecuta la estimación bayesiana mediante R + WinBUGS. |
frei.grm.pirt() |
Grafica la función de respuesta en las etapas del ítem (FREI). |
frci.grm.pirt() |
Grafica la función de respuesta por categorías (FRCI). |
fii.grm.pirt() |
Grafica la función de información del ítem (FII-GRM). |
grm1.bug |
Código WinBUGS para el modelo 2PL-GRM. |
La implementación combina la flexibilidad de R con la robustez del motor MCMC de WinBUGS.
Resultados — Diagnóstico de convergencia
- Revisiones gráficas:
- trazas de las cadenas,
- autocorrelación,
- densidades posteriores.
- Estadístico Gelman–Rubin
- \[\hat{R} \approx 1\]
La convergencia adecuada aseguró la estabilidad y robustez de las estimaciones del GRM.
Resultados — Parámetros de los ítems (2PL-GRM)
Escala de Estrada (versión final, 23 ítems)
- Se eliminaron Ítem 3: “No entiendo la estadística” y Ítem 18: “La estadística confunde más que ayuda” por baja discriminación (criterio GRM: \(a < 0.50\)).
- En la versión depurada, las discriminaciones \(a_i\) quedaron en un rango adecuado (0.63–2.01).
- Ítem más informativo: Ítem 12: “La estadística es útil en mi especialidad” (\(a \approx 2.014\)).
- Los umbrales \(b_{ik}\) se ajustaron a valores coherentes con el continuo del rasgo.
Escala de Cazorla (20 ítems)
- Todos los ítems mostraron discriminación aceptable (\(a \ge 1\)).
- Ítem más informativo: Ítem 33: “La estadística es fundamental para tomar decisiones” (\(a \approx 2.116\)).
- Umbrales \(b_{ik}\) entre aprox. –3.5 y –1.1, cubriendo adecuadamente el rango del rasgo.
Resultados — Estimación de las habilidades (2PL-GRM)
Tabla 1. Características definitivas de las escalas
![]()
Puntuaciones transformadas a la escala GRM con media 300 y desviación estándar 50.
Distribuciones (GRM) — Relación entre escalas
- Fuerte asociación entre las puntuaciones transformadas.
- Correlación entre escalas: (r = 0{,}791).
- Consistencia en la medición de una misma dimensión actitudinal.
![]()
Relación entre las escalas transformadas (GRM)
Comparaciones entre grupos
- EAE detecta diferencias entre especialidades:
- Industrial > Redes en actitud positiva.
- Sin diferencias por:
- Sexo
- Edad
- Experiencia previa
- Actitudes relativamente estables entre subgrupos.
Interpretación
- Predomina una actitud positiva hacia la estadística.
- Los estudiantes valoran su utilidad profesional.
- Persiste percepción de dificultad.
- Implicancia: acompañamiento formativo para adultos.
- Enfoque: ajustar programas universitarios, no solo estrategias didácticas.
Conclusiones
- EAE y EAC: válidas y confiables para adultos de ingeniería.
- EAE discrimina mejor entre especialidades.
- EAC tiene mayor consistencia interna.
- Actitudes: positivas pero con percepción de dificultad.
- Aporte metodológico: análisis reproducible en R con enfoque bayesiano.
- Relevancia: insumo para mejorar programas universitarios dirigidos a adultos.
Referencias
Tarazona Vargas, E., Bazán, J. L., & Aparicio, A. S. (2013).
Actitudes hacia la Estadística en universitarios peruanos de mediana edad.
RIDU – Revista Digital de Investigación en Docencia Universitaria, 7(1), 59–75.
Disponible en: https://www.redalyc.org/pdf/4985/498573048005.pdf
Tarazona, E. G. (2013).
Modelos alternativos de respuesta graduada con aplicaciones en la calidad de servicios
(Tesis de maestría). Pontificia Universidad Católica del Perú, Lima, Perú.
Disponible en: https://tesis.pucp.edu.pe/items/3439ca5f-06c6-4213-b3e6-e351396c2836