Actitudes hacia la Estadística en Estudiantes Adultos:

Un Análisis Bayesiano con el Modelo de Respuesta Graduada en R

Enver Gerald Tarazona Vargas

Pontificia Universidad Católica del Perú (PUCP), Perú

Contexto

  • Crecimiento de estudiantes adultos en educación superior.
  • Importancia de la estadística en ingeniería.
  • Las actitudes influyen en el aprendizaje estadístico.
  • Brecha: poca investigación con adultos de mediana edad.

Antecedentes

Escalas usadas:

  • EAE (Estrada, 2002) — 23 ítems.
  • EAC (Cazorla et al., 1999/2009) — 20 ítems.
  • Aplicadas previamente en Perú y Brasil (Aparicio, Bazán, Aliaga).
  • Miden componentes afectivos y cognitivos de la actitud.

Objetivos

  1. Evaluar propiedades psicométricas de EAE y EAC en adultos.
  2. Describir niveles de actitud hacia la estadística.
  3. Comparar actitudes según especialidad, sexo, edad y experiencia previa.
  4. Aportar evidencia para el diseño y ajuste de programas universitarios para adultos.

Participantes

  • N = 137 estudiantes adultos (32–42 años).
  • Programa de educación para adultos (2012-II).
  • Carreras: Industrial, Sistemas, Civil, Redes.
  • 84% hombres; 52% con estadística previa.

Instrumentos

  • Escala de Estrada (EAE): 23 ítems, Likert 5 puntos.
  • Escala de Cazorla (EAC): 20 ítems, Likert 5 puntos.
  • Versiones adaptadas lingüísticamente al contexto peruano.
  • Aplicación colectiva en aula.

Metodología — Teoría Clásica de los Test (TCT)

  • Análisis descriptivo de los ítems:
    media, desviación estándar y distribución de respuestas.
  • Calidad de los ítems:
    correlación ítem-total corregida.
  • Confiabilidad de las escalas: alfa de Cronbach
  • Evaluación de normalidad y asimetría (presentes en los puntajes originales).
  • En R: psych.

La TCT permitió una primera evaluación de consistencia interna y de la estructura empírica de ambas escalas antes del análisis TRI.

Metodología — Teoría de Respuesta al Ítem (TRI)

Modelo de Respuesta Graduada (GRM)

  • Propuesto por Samejima (1969, 1972) para ítems politómicos ordinales.
  • Cada ítem tiene dos tipos de parámetros:
    • Discriminación (a) → qué tan bien separa niveles del rasgo.
    • Umbrales (b₁, b₂, …) → puntos donde aumenta la probabilidad de elegir una categoría mayor.
  • Permite obtener una medida del rasgo latente independiente del conjunto específico de ítems.

En el estudio

  • Se empleó el 2PL-GRM (discriminación + umbrales).
  • Ajustado mediante inferencía bayesiana con cadenas MCMC en R (R2WinBUGS + coda).

Metodología — Definición del Modelo 2PL-GRM

Sea \(Y_j\) el nivel del rasgo latente para el participante \(j\) y \(X_{ij}\) su respuesta al ítem \(i\), la probabilidad de que un ítem \(i\) sea respondido en la categoría \(k\) se define como:

\[ \small \pi_{ijk} = P(Y_{ij}=k \mid Y_j) = \begin{cases} \Psi(-\eta_{ij1}) & k=1 \\[4pt] \Psi(-\eta_{ijk}) - \Psi(-\eta_{ij(k-1)}) & 2 \le k < m \\[4pt] 1 - \Psi(-\eta_{ij(m-1)}) & k=m \end{cases} \]

donde:

\[ \small \eta_{ijk} = a_i (Y_j - b_{ik}), \qquad \Psi(x)=\frac{1}{1+e^{-x}} \]

con \(a_i\) la discriminación del ítem \(i\), \(b_{ik}\) el umbral entre categorías y \(m\) el número de categorías de respuesta.

Esta formulación permite modelar la transición entre categorías ordinales según el nivel del rasgo latente.

Metodología — Estimación Bayesiana

La probabilidad del ítem se modela como:

\[ X_{ij} = k \;\mid\; y_j, a_i, b_{ik} \sim \text{Categorica}\Big( \Psi(a_i(y_j - b_{ik})) - \Psi(a_i(y_j - b_{i(k-1)})) \Big). \] Con prioris: \[y_j \sim N(0,1)\] \[a_i \sim N^{+}(1,0.5)\] \[b_{ik} = \frac{\kappa_{ik}}{a_i}\]
(ver siguiente lámina para la reparametrización)

El modelo se especificó bajo un enfoque bayesiano para estimar simultáneamente el rasgo latente y los parámetros del ítem.

Metodología — Reparametrización para la Estimación

Para facilitar la inferencia MCMC, se parametrizan los umbrales mediante parámetros auxiliares sin restricciones:

Parámetros auxiliares

\[ \kappa^*_{ik} \sim N(0,2), \qquad k = 1,\dots,m-1. \]

Luego se ordenan para obtener umbrales válidos:

\[ \kappa_{i1} < \kappa_{i2} < \dots < \kappa_{i,m-1}. \]

Finalmente, los puntos de corte en la escala del rasgo se obtienen como:

\[ b_{ik} = \frac{\kappa_{ik}}{a_i}. \]

Esta reparametrización solo se usa para el muestreo MCMC y no forma parte del modelo 2PL-GRM, pero mejora la estabilidad y evita problemas de ordenamiento.

Metodología — Implementación Computacional y MCMC

  • El modelo se estimó bajo un enfoque bayesiano, recuperando simultáneamente el rasgo latente y los parámetros del ítem.
  • Inferencia mediante cadenas de Markov (MCMC).
  • En R:
    • R2WinBUGS → envío del modelo y recuperación de cadenas.
    • mcmcplots → diagnóstico posterior (trazas, autocorrelación, densidades).
  • Especificación:
    • 3 cadenas × 10 000 iteraciones.
    • Burn-in: 1 000.
    • Muestreo posterior: 9 000 por cadena.

La convergencia adecuada aseguró la estabilidad y robustez de las estimaciones del GRM.

Funciones y programas implementados

A continuación se listan las funciones en R y los programas WinBUGS implementados para estimar y representar propiedades del modelo 2PL-GRM:

Función / programa Descripción
rgrm.pirt() Simula respuestas basadas en modelos 2PL-GRM y LPE-GRM.
pgrm.pirt() Calcula probabilidades acumuladas del GRM.
grmMCMC Ejecuta la estimación bayesiana mediante R + WinBUGS.
frei.grm.pirt() Grafica la función de respuesta en las etapas del ítem (FREI).
frci.grm.pirt() Grafica la función de respuesta por categorías (FRCI).
fii.grm.pirt() Grafica la función de información del ítem (FII-GRM).
grm1.bug Código WinBUGS para el modelo 2PL-GRM.

La implementación combina la flexibilidad de R con la robustez del motor MCMC de WinBUGS.

Resultados — Diagnóstico de convergencia

  • Revisiones gráficas:
    • trazas de las cadenas,
    • autocorrelación,
    • densidades posteriores.
  • Estadístico Gelman–Rubin
  • \[\hat{R} \approx 1\]

La convergencia adecuada aseguró la estabilidad y robustez de las estimaciones del GRM.

Resultados — Parámetros de los ítems (2PL-GRM)

Escala de Estrada (versión final, 23 ítems)

  • Se eliminaron Ítem 3: “No entiendo la estadística” y Ítem 18: “La estadística confunde más que ayuda” por baja discriminación (criterio GRM: \(a < 0.50\)).
  • En la versión depurada, las discriminaciones \(a_i\) quedaron en un rango adecuado (0.63–2.01).
  • Ítem más informativo: Ítem 12: “La estadística es útil en mi especialidad” (\(a \approx 2.014\)).
  • Los umbrales \(b_{ik}\) se ajustaron a valores coherentes con el continuo del rasgo.

Escala de Cazorla (20 ítems)

  • Todos los ítems mostraron discriminación aceptable (\(a \ge 1\)).
  • Ítem más informativo: Ítem 33: “La estadística es fundamental para tomar decisiones” (\(a \approx 2.116\)).
  • Umbrales \(b_{ik}\) entre aprox. –3.5 y –1.1, cubriendo adecuadamente el rango del rasgo.

Resultados — Estimación de las habilidades (2PL-GRM)

Tabla 1. Características definitivas de las escalas

Puntuaciones transformadas a la escala GRM con media 300 y desviación estándar 50.

Distribuciones (GRM) — Escalas transformadas

  • Ambas escalas muestran actitudes altas y favorables.
  • Se observa mayor dispersión en la escala de Cazorla.
  • Los puntajes corresponden a la escala GRM transformada (media 300, sd 50).

Distribuciones GRM de las escalas transformadas

Distribuciones (GRM) — Relación entre escalas

  • Fuerte asociación entre las puntuaciones transformadas.
  • Correlación entre escalas: (r = 0{,}791).
  • Consistencia en la medición de una misma dimensión actitudinal.

Relación entre las escalas transformadas (GRM)

Comparaciones entre grupos

  • EAE detecta diferencias entre especialidades:
    • Industrial > Redes en actitud positiva.
  • Sin diferencias por:
    • Sexo
    • Edad
    • Experiencia previa
  • Actitudes relativamente estables entre subgrupos.

Interpretación

  • Predomina una actitud positiva hacia la estadística.
  • Los estudiantes valoran su utilidad profesional.
  • Persiste percepción de dificultad.
  • Implicancia: acompañamiento formativo para adultos.
  • Enfoque: ajustar programas universitarios, no solo estrategias didácticas.

Conclusiones

  1. EAE y EAC: válidas y confiables para adultos de ingeniería.
  2. EAE discrimina mejor entre especialidades.
  3. EAC tiene mayor consistencia interna.
  4. Actitudes: positivas pero con percepción de dificultad.
  5. Aporte metodológico: análisis reproducible en R con enfoque bayesiano.
  6. Relevancia: insumo para mejorar programas universitarios dirigidos a adultos.

Referencias

Tarazona Vargas, E., Bazán, J. L., & Aparicio, A. S. (2013).
Actitudes hacia la Estadística en universitarios peruanos de mediana edad.
RIDU – Revista Digital de Investigación en Docencia Universitaria, 7(1), 59–75.
Disponible en: https://www.redalyc.org/pdf/4985/498573048005.pdf

Tarazona, E. G. (2013).
Modelos alternativos de respuesta graduada con aplicaciones en la calidad de servicios
(Tesis de maestría). Pontificia Universidad Católica del Perú, Lima, Perú.
Disponible en: https://tesis.pucp.edu.pe/items/3439ca5f-06c6-4213-b3e6-e351396c2836

Contacto

Enver Gerald Tarazona Vargas
enver.tarazona@pucp.edu.pe
Pontificia Universidad Católica del Perú (PUCP), Perú