Ejercicio 10: Modelo lineal general con efectos mixtos

El objetivo del ejercicio 10 es construir modelos lineales con efectos mixtos, poder elegir el mejor modelo según los diferentes efectos fijos y/o aleatorios, y sacar conclusiones a partir de los resultados obtenidos.

Como ya es costumbre, veremos un par de casos de datos.

Caso 1 - Enojo, tipo de ofertas, sexo y depresión

Bueno, seguro que ya conocen al dedillo los datos del estudio de Valentina Paz et al., de la tarea del Ultimatum Game que venimos usando hace rato…

Recuerden que usaremos un data frame llamado parts3, si no lo tienen a mano sigan el ejercicio 5 hasta lograr el paso 3 (de la sección “datos anchos”).

Tip: a cada modelo lineal que construyan, pónganle un nombre diferente. Sugiero que el nombre siempre comience con el nombre del data frame sobre el que hacen el modelo, seguido de “.lm” o “lmer”, y luego algún tipo de indiciador. Por ejemplo: “parts3.lm0”, “parts3.lm2”, “parts3.beck.sex.lm”, etc.

  1. Ajustar un modelo lineal en el que el enojo tenga a la escala “Beck” de depresión, el tipo de oferta, y su interacción como efectos fijos, y al sujeto como efecto aleatorio (intercepto variable).

  2. ¿Cómo dan los parámetros? Interpretar.

  3. ¿Vale la pena ajustar un modelo con efecto aleatorio? ¿Cuánto de varianza (desvío estándar) ?

  4. Comparar los resultados de un Anova tipo 3 en un modelo sin efecto aleatorio, y en un modelo con efecto aleatorio de sujeto. Discutir diferencias. Tip: usar Anova(modelo,type=3,test="F") para obtener pruebas F en vez de \(\chi^2\).

  5. Mirar los efectos aleatorios con la función ranef() (usar unlist(ranef(modelo)) para obtener un vector de valores, y no una lista). Calcular el promedio y el desvío estándar de estos efectos. ¿Dan los que se supone que tiene que dar?

Caso 2 - ANS (Panamath) y nivel socieconómico: el caso Uruguay 2013.

Usaremos parte de los datos de la intervención en escuelas primarias públicas de Uruguay realizada en 2013 (ver Odic et al., 2016 ValleLisboa et al. 2017.) En la intervención, se colectaron datos de eficiencia en la tarea “Panamath” sobre el sistema numérico aproximado (ANS), en niños de primer año de varias escuelas, antes y después de una intevención. Los datos están en este archivo RData.

Las variables son:

  • w - eficiencia o desempeño en tarea Panamath
  • ses - nivel socieconómico de la escuela
  • dia - momento en que se tomó la medida, puede ser “pre” o “post” intervención
  • escuela- escuela a la que atiende el niño
  • id - identificador de cada niño

Usando estos datos:

  1. Graficar, usando boxplots, el nivel de w según nivel socioeconómico y día.
  2. Ajustar un modelo lineal con efectos fijos, con w como variable de respuesta, y nivel socioeconómico y día como predictores.
  3. Ajustar un modelo lineal con efectos fijos igual que el anterior, pero agregar la interacción, si no la agregaste antes.
  4. Interpretar el modelo (se puede usar Anovas). ¿Hay efecto del nivel socieconómico? ¿Y del día? ¿Hay interacción?
  5. Ajustar un modelo lineal como el anterior pero con efectos mixtos. Agregar efecto aleatorio de sujeto. ¿Qué efectos se observan? Observar la varianza explicada por los efectos aleatorios.
  6. Ajustar un modelo lineal como el del punto 4, pero con efectos mixtos. Agregar efecto aleatorio de escuela. ¿Qué efectos se observan? Observar la varianza explicada por los efectos aleatorios.
  7. Ajustar un modelo lineal como el anterior pero con efectos mixtos. Agregar efecto aleatorio de sujeto, anidado dentro del efecto de escuela (Tip: usar (1|escuela/id) para indicar el anidamiento). ¿Qué efectos se observan? Observar la varianza explicada por los efectos aleatorios.
  8. Comparar los modelos del ítem 5, 6 y 7. ¿Cuál usarías tu?