Este taller está basado en los ejemplos del libro Data Analysis Using Regression and Multilevel/Hierarchical Models. Los autores del libro dispusieron los datos y los scripts de R en el siguiente enlace http://www.stat.columbia.edu/~gelman/arm/. Visite el enlace para descargar el material necesario.

Preguntas

  1. El usuario zorbar de Cross Validated preguntó hace algún tiempo sobre cómo simular datos para una regresión especial, en este enlace usted podrá encontrar la pregunta que zorbar hizo. Lea con detalle la pregunta de zorbar y luego responda los siguientes interrogantes.
  1. Escriba las ecuaciones del modelo matemático que usó Stéphane Laurent. Complete lo siguiente:

\[\begin{align*} y_i &\sim Bernoulli(p_i) \\ \text{logit}(p_i) &= \\ x1_{i} &\sim \\ x2_{i} &\sim \end{align*}\]

  1. En este ejercicio usted va a realizar un estudio de simulación pequeño para estudiar qué tan bien se estiman los parámetros en un modelo de regresión logístico en función del número de observaciones \(n\) disponibles. En particular, considere el modelo de Stéphane Laurent.

Lo primero que usted debe hacer es definir los valores de \(n\) a usar. No inicie con \(n=3\) porque serían muy pocas observaciones y así cualquier modelo falla. Tampoco use \(n=10000000000\) porque serían demasiadas.

Luego de definir el vector \(n\) siga los siguientes pasos.

Luego de terminar los pasos anteriores presente los resultados en forma gráfica, construya una figura similar a la mostrada a continuación.

¿A partir de que valor de \(n\) las estimaciones están cerca de los valores reales de los parámetros?