Docentes: Pablo Reeb, Valentín Tassile

Examinando el Modelo Ajustado

  • ¿Que modelos pretendo proponer?
  • ¿Como puedo verificar la adecuación del modelo propuesto?
  • Dispongo de herramientas gráficas que me ayuden en el proceso?
  • La variabilidad capturada por los efectos aleatorios puede ser explicada por covariables?
  • Quedan correlaciones entre observaciones de la variable de respuesta no contempladas en el modelo?

Examinando el Modelo Ajustado

El modelo finalmente propuesto en Brady et al (2015) puede se define en R como:

library(nlme)
model4.2.fit <- lme(mathgain ~ mathkind + sex + minority + ses,
                    random = ~1 | schoolid/classid, classroom,
                    na.action = "na.omit", 
                    method = "REML")

Con mathkind,sex,minority y ses covariables a nivel de estudiante, y EXCLUYENDO a:

  • yearstea, mathprep y mathknow covariables que se corresponden al nivel de clase
  • housepov covariable que se corresponde al nivel de colegio

PERO…

¿COMO LLEGO AL MODELO FINAL A PARTIR DEL EXAMEN DEL MODELO ACTUAL?

Examinando el Modelo Ajustado

VEAMOS………….

PREDICCIÓN DE EFECTOS ALEATORIOS

  • Recordemos que nuestro modelo mixto puede expresarse como:

\[\mathbf{y} = \mathbf{X\beta+Zu+e},\]

Con:

\[\begin{bmatrix} \mathbf{u}\\ \mathbf{e} \end{bmatrix}\sim N\left(\begin{bmatrix} \mathbf{0}\\ \mathbf{0} \end{bmatrix}, \begin{bmatrix} \mathbf{G} & \mathbf{0}\\ \mathbf{0} & \mathbf{R} \end{bmatrix}\right)\] Y \[E(\mathbf{y})=\mathbf{X\beta}, \quad Var(\mathbf{y})=\mathbf{V}=\mathbf{ZGZ^t+R} \quad \text{(dist. marginal)}\]

PREDICCIÓN DE EFECTOS ALEATORIOS

  • Las soluciones para los efectos aleatorios de las ecuaciones de modelos mixtos suelen llamarse Estimadores Bayesianos Empíricos (Empirical Bayes Estimators).

  • Para un efecto aleatorio \(b_j\) o un vector de efectos aleatorios \(u\) recordar que estamos suponiendo que: \[b_j \overset{i.i.d.}{\sim} N(0, \sigma^2_b), \quad \mathbf{u}\overset{i.d.}{\sim} N(\mathbf{0}, \mathbf{G})\]

  • Es decir, \(E(b_j)=0\), donde el interés se centra en estimar la matriz \(G\).

  • Sin embargo, en determinadas situaciones puede ser útil predecir los valores de los efectos aleatorios asociados con niveles específicos de un factor aleatorio:

  1. Caracterizar cada uno de los niveles con propósitos especificos
  2. Seleccionar covariables que expliquen variabilidad captada en los efectos aleatorios

PREDICCIÓN DE EFECTOS ALEATORIOS

  • \(E(b_j)=0\) no hace uso de los datos observados. Es posible contemplar los datos recopilados para un mismo nivel de efectos aleatorios y usar esa información para predecir los valores de los efectos aleatorios en el mismo.
  • Para hacer esto, calculamos las esperanzas condicionales de los efectos aleatorios, dados los valores de respuesta observados.
  • Para el caso de los modelos mixtos: \[\mathbf{y|u}\overset{i.d.}{\sim} N(\mathbf{X\beta+Zu}, \sigma^2 \mathbf{I}), \quad \mathbf{u}\overset{i.d.}{\sim} N(\mathbf{0}, \mathbf{G}).\]
  • La esperanza condicional para \(u\) es: \[\hat{\mathbf{u}}=\mathbf{GZ^tV^{-1}(y-X\beta)}\]

PREDICCIÓN DE EFECTOS ALEATORIOS

  • Si reemplazamos los estimadores REML dde \(G\),\(V\) y \(\beta\) obtenemos predictores de los efectos aleatorios obtenemos: \[\hat{\mathbf{u}}=E(u | Y=y)= \mathbf{\hat{G}Z^t\hat{V}^{-1}(y-X\hat{\beta})}\] Con: \[\hat{\mathbf{V}} = \mathbf{Z\hat{G}Z^t+\hat{R}}\]

  • Estos estimadores se suelen llamar EBLUPs (empirical best linear unbiased predictors), lineales porque resultan de una combinación lineal de los valores observados \(y\), insesgados porque su esperanza es igual a la esperanza del los efectos aleatorios para el conjunto de datos suministrado, mejores porque son aquellos que poseen la menor varianza de todos los posibles estimadores,predictores porque son predicciones obtenidas de los efectos aleatorios,empiricos porque están basados en estimadores de los parámetros.

  • Otro nombre que reciben es EBEs (Estimadores Bayesianos Empíricos), porque se constituyen como la esperanza de la distribución a posteriori del efecto aleatorio dado los datos.

PREDICCIÓN DE EFECTOS ALEATORIOS

  • Para el caso de un modelo de componentes de varianza los EBLUPs pueden escribirse como (*):

\[u_i= a_i \mu+(1-a_i)\mu_i \] Donde:

  • \(u_i\) es la media encogida para el nivel \(i\) del efecto aleatorio
  • \(a_i\) es un factor de ponderacions para el nivel \(i\) calculado como: \[\frac{\sigma^2_i}{\sigma^2_r+\sigma^2_i} \]
  • \(\sigma^2_i\) es la varianza del factor aleatorio al nivel \(i\) calculada como \(\sigma^2_e / n_i\)
  • \(\sigma^2_r\) es la varianza del factor aleatorio asociada al efecto aleatorio \(r\)
  • \(\mu\) es la media general para la variable de respuesta
  • \(\mu_i\) es la media de la variable de respuesta para el \(i\)ésimo nivel del factor aleatorio.

(*): http://www-personal.umich.edu/~bwest/shrinkage.doc de Brady et al (2015)

PREDICCIÓN DE EFECTOS ALEATORIOS

  • Los EBLUPs tambien suele llamarse shrinkage estimators(estimadores de encogimiento) porque tienden a acercarse a 0 a medida que la variabilidad del efecto aleatorio es menor.
  • La contracción de los EBEs con respecto al 0 siempre es mayor al valor obtenido si el efecto se hubiese considerado fijo y el valor obtenido por estimación.
  • A mayor cantidad de información disponible en cada nivel del efecto aleatorio menor es el encogimiento.

PREDICCIÓN DE EFECTOS ALEATORIOS

  • 1190 Estudiantes de Primaria
  • 312 Cursos
  • 107 Escuelas

Por lo que en promedio tenemos:

  • 11,12 Estudiantes por Escuela
  • 3,84 Estudiantes por Curso

BIBLIOGRAFIA

Brady, T and Kathlenn, B and Andrzej T 2015 LINEAR MIXED MODELS. A Practical Guide Using Statistical Software. Second Edition. CRC Press. Taylor Francis Group.London

Pinheiro J. and Bate D 2000 Mixed-Effects Models in S and S-PLUS. Springer

Di Rienzo, J. and Machiavelli, R and Casanoves, F. 2017 Modelos Lineales Mixtos-Aplicaciones en Infostat. Grupo Infostat. Cordoba. Argentina

Molenberghs, G., and G. Verbeke. 2007. “Likelihood Ratio, Score, and Wald Tests in a Constrained Parameter Space.” The American Statistician 61 (1): 567–79.

Littel,R and Milliken, G and Strup, W and Wolfinges, R. 2006 Sas System for Mixed Models. Sas Institute. Cary, NC. USA. Faraway, J 2017 Extending the Linear Model with R. Generalized Linear, Mixed Effects and Nonparametric Regression Models. CRC Press. New York

Zuur, A and Ieno, E and Walker N et al 2009 Mixed Effects Models and Extension in Ecology with R. Springer-Verlag