Este taller está basado en los ejemplos del libro Data
Analysis Using Regression and Multilevel/Hierarchical Models.
Visite el repositorio del curso en github https://github.com/fhernanb/Modelos_Jerarquicos para
descargar los datos del taller.
Instrucciones generales
Para realizar este taller usted debe:
- Visitar el repositorio del
curso en github.
- Ingresar a la carpeta
Datos y luego ingresar a la
subcarperta child.iq.
- Descargar el archivo
kidiq.dta en su computador.
- Instalar el paquete
haven de R para poder leer bases de
datos en formatos de ‘SPSS’, ‘Stata’ y ‘SAS’.
- Utilizar el código de abajo para leer la base de datos.
library(haven)
kidiq <- read_dta("kidiq.dta")
Preguntas
En este taller vamos a retomar el ejemplo del capítulo 3 sobre
modelos de regresión para explicar el puntaje de una prueba cognitiva
(kid_score) en niños de 3 y 4 años en función de la
información de la madre de cada uno de los niños.
- Explore la base de datos
kidiq. ¿Cuántas variables y
cuántas observaciones tiene la base de datos?
- ¿Cuántas de las covariables tienen información sobre la madre del
niño?
- Replique en su computador las figuras 3.1, 3.2 y 3.3.
- Incluya una leyenda con
legend() para mejorar la figura
3.3.
- ¿Cuál de los tres modelos presenta mayor \(R^2\)?
- Calcule la correlación entre la variable respuesta (\(y\)) y los valores estimados (\(\hat{y}\)), es decir, calcule \(cor(y, \hat{y})\) para los tres modelos.
¿Cuál de los presenta la mayor correlación?
- Observe la figura 3.4 del libro, ¿en qué se diferencia la figura
3.4(a) de la figura 3.4(b)? Rta: en nada, son la misma, why?
- Replique la figura 3.4 del libro pero incluya una leyenda con
legend() para mejorarla.
- Incluya las ecuaciones de las rectas de la figura 3.4(b) en la misma
figura, use la siguiente ayuda de stackoverflow https://stackoverflow.com/questions/17032300/add-an-equation-into-scatter-plots-in-r.
- Complete la tabla usando los modelos ajustados.
- Ajuste el siguiente modelo y dibuje la superficie en 3d para
representar el modelo ajustado. \[kidScore_i
\sim N(\beta_0 + \beta_1 \, momAge_i + \beta_2 \, momIq_i + \beta3 \,
momAge_i \, momIq_i, \sigma^2)\]