Este taller está basado en los ejemplos del libro Data Analysis Using Regression and Multilevel/Hierarchical Models. Visite el repositorio del curso en github https://github.com/fhernanb/Modelos_Jerarquicos para descargar los datos del taller.

Instrucciones generales

Para realizar este taller usted debe:

library(haven)
kidiq <- read_dta("kidiq.dta")

Preguntas

En este taller vamos a retomar el ejemplo del capítulo 3 sobre modelos de regresión para explicar el puntaje de una prueba cognitiva (kid_score) en niños de 3 y 4 años en función de la información de la madre de cada uno de los niños.

  1. Explore la base de datos kidiq. ¿Cuántas variables y cuántas observaciones tiene la base de datos?
  2. ¿Cuántas de las covariables tienen información sobre la madre del niño?
  3. Replique en su computador las figuras 3.1, 3.2 y 3.3.
  4. Incluya una leyenda con legend() para mejorar la figura 3.3.
  5. ¿Cuál de los tres modelos presenta mayor \(R^2\)?
  6. Calcule la correlación entre la variable respuesta (\(y\)) y los valores estimados (\(\hat{y}\)), es decir, calcule \(cor(y, \hat{y})\) para los tres modelos. ¿Cuál de los presenta la mayor correlación?
  7. Observe la figura 3.4 del libro, ¿en qué se diferencia la figura 3.4(a) de la figura 3.4(b)? Rta: en nada, son la misma, why?
  8. Replique la figura 3.4 del libro pero incluya una leyenda con legend() para mejorarla.
  9. Incluya las ecuaciones de las rectas de la figura 3.4(b) en la misma figura, use la siguiente ayuda de stackoverflow https://stackoverflow.com/questions/17032300/add-an-equation-into-scatter-plots-in-r.
  10. Complete la tabla usando los modelos ajustados.
Modelo \(R^2\) \(cor(y, \hat{y})\) \(\hat{\sigma}\)
fit.0
fit.1
fit.2
fit.3
  1. Ajuste el siguiente modelo y dibuje la superficie en 3d para representar el modelo ajustado. \[kidScore_i \sim N(\beta_0 + \beta_1 \, momAge_i + \beta_2 \, momIq_i + \beta3 \, momAge_i \, momIq_i, \sigma^2)\]