Se proceden a realizar descriptivas de cada variable y con su consiguiente análisis
Se puede ver que a mayor temperatura, menor AF. El gradiente de temperatura es claro en este caso
Ahora se agrega la combinación con varaibles del NSE.
Se puede ver que el gradiente desaparece conforme nos acercamos a quintiles mas grandes. Esto podría estar indicando que los quintiles más altos tienen mas posibilidades de paliar las condiciones climátias por mayor acceso a recursos e instalaciones. Esto es un indicio de interaccion que se va a poner a prueba a continuación. Se prueba el siguiente modelo:
\[ logit(P(Y ≤ AF_{alta})) = \beta_{j0} + \beta_1Quintil + \beta_2Temp + \beta_3Genero + \beta_4Edad + \beta_5Quintil*Temp \] Una vez corrido el modelo, hay que chequear el supuesto de proporcionalidad de odds . Este supuesto dice que los coeficientes que describen, por ejemplo, AF_baja vs. AF_media, son los mismos que describen AF_media vs. AF_alta. Para poder chequear esto hay que verificar que los logits predichos por el modelo sean iguales para quintil 1, 2, 3 etc. y para cada temperatura. Esta informacion se resume en el siguiente gráfico:
## Likelihood ratio test
##
## Model 1: nivel_actividad_fisica ~ temp_media * quintil_ingreso + genero +
## rango_edad
## Model 2: nivel_actividad_fisica ~ temp_media * quintil_ingreso + genero +
## rango_edad
## #Df LogLik Df Chisq Pr(>Chisq)
## 1 55686 -27715
## 2 55700 -27830 14 231.07 < 2.2e-16 ***
## ---
## Signif. codes: 0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
De nuevo, los supuestos se contradicen según el approach.
Ahora vamos a ver el modelo por dentro:
## Analysis of Deviance Table (Type II tests)
##
## Response: nivel_actividad_fisica
## Df Chisq Pr(>Chisq)
## temp_media 1 158.326 < 2.2e-16 ***
## quintil_ingreso 4 152.027 < 2.2e-16 ***
## genero 1 153.476 < 2.2e-16 ***
## rango_edad 4 990.095 < 2.2e-16 ***
## temp_media:quintil_ingreso 4 76.665 8.857e-16 ***
## ---
## Signif. codes: 0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
Lo que se puede ver al comparar varones y mujeres de 35 a 49 años es que los varones tienen una ordenada al origen mas elevada para AF media y alta sin importar el quintil y la temperatura, lo cual indica que los varones hacen más AF que las mujeres. Por otro lado, tambien se puede ver que en varones de quintiles altos, la pb de AF casi no varía según la temperatura. En mujeres se ve lo mismo con una ligera pendiente.
Ahora se repite el análisis usando Nivel de instruccion como indicador de NSE en lugar de quintil de ingresos. Comenzamos con un poco de descriptiva:
En este caso, el gradiente de temperaturas no parecería estar
modificandose mucho por lo que la interaccion probablemente no de
significativa.
El modelo a correr es el siguiente:
\[ logit(P(Y ≤ AF_{alta})) = \beta_{j0} + \beta_1Instruccion + \beta_2Temp + \beta_3Genero + \beta_4Edad + \beta_5Instruccion*Temp \]
## Likelihood ratio test
##
## Model 1: nivel_actividad_fisica ~ temp_media * nivel_instruccion + genero +
## rango_edad
## Model 2: nivel_actividad_fisica ~ temp_media * nivel_instruccion + genero +
## rango_edad
## #Df LogLik Df Chisq Pr(>Chisq)
## 1 55694 -27678
## 2 55704 -27795 10 233.4 < 2.2e-16 ***
## ---
## Signif. codes: 0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
Nuevamente, habría contradiccion en el chequeo de supuestos: uno indica que se viola mientras el otro no parecería estar mostrando problemas.
Ahora vemos dentro del modelo qué está pasando.
## Analysis of Deviance Table (Type II tests)
##
## Response: nivel_actividad_fisica
## Df Chisq Pr(>Chisq)
## temp_media 1 202.8438 <2e-16 ***
## nivel_instruccion 2 294.5852 <2e-16 ***
## genero 1 207.1618 <2e-16 ***
## rango_edad 4 566.1510 <2e-16 ***
## temp_media:nivel_instruccion 2 3.1412 0.2079
## ---
## Signif. codes: 0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
Como la interacción dió NS, pruebo el modelo aditivo:
\[ logit(P(Y ≤ AF_{alta})) = \beta_{j0} + \beta_1Instruccion + \beta_2Temp + \beta_3Genero + \beta_4Edad \]
## Likelihood ratio test
##
## Model 1: nivel_actividad_fisica ~ temp_media + nivel_instruccion + genero +
## rango_edad
## Model 2: nivel_actividad_fisica ~ temp_media + nivel_instruccion + genero +
## rango_edad
## #Df LogLik Df Chisq Pr(>Chisq)
## 1 55698 -27686
## 2 55706 -27796 8 221.66 < 2.2e-16 ***
## ---
## Signif. codes: 0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
De nuevo, los supuestos parecen bien, salvo la contradiccion con el LRT.
Ahora vemos el modelo por dentro
## Analysis of Deviance Table (Type II tests)
##
## Response: nivel_actividad_fisica
## Df Chisq Pr(>Chisq)
## temp_media 1 203.06 < 2.2e-16 ***
## nivel_instruccion 2 295.30 < 2.2e-16 ***
## genero 1 207.83 < 2.2e-16 ***
## rango_edad 4 565.58 < 2.2e-16 ***
## ---
## Signif. codes: 0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
Esto es raro, si no estoy asumiendo interacción ¿¿por qué se ve como si hubiera interaccion??
Ahora se hace lo mismo con Carencias Materiales y de Vivienda. Primero un poco de descriptiva:
En este caso, el gradiente de temperaturas si se modifica segñun se tiene o no carencias materiales y de vivienda.
Ahora corremos el modelo que es el siguiente:
\[ logit(P(Y ≤ AF_{alta})) = \beta_{j0} + \beta_1CMT + \beta_2Temp + \beta_3Genero + \beta_4Edad + \beta_5CMT*Temp \] Chequeamos los supuestos:
## Likelihood ratio test
##
## Model 1: nivel_actividad_fisica ~ temp_media * CMT + genero + rango_edad
## Model 2: nivel_actividad_fisica ~ temp_media * CMT + genero + rango_edad
## #Df LogLik Df Chisq Pr(>Chisq)
## 1 55698 -27810
## 2 55706 -27918 8 215.98 < 2.2e-16 ***
## ---
## Signif. codes: 0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
Ahora podemos ver los resultados del modelo:
## Analysis of Deviance Table (Type II tests)
##
## Response: nivel_actividad_fisica
## Df Chisq Pr(>Chisq)
## temp_media 1 203.068 < 2.2e-16 ***
## CMT 1 11.734 0.0006137 ***
## genero 1 174.655 < 2.2e-16 ***
## rango_edad 4 950.343 < 2.2e-16 ***
## temp_media:CMT 1 42.577 6.794e-11 ***
## ---
## Signif. codes: 0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
Se puede ver que la interaccion es significativa. Y además, se puede ver que afecta de manera diferencial al genero. No cambia la pendiente pero sí la ordenada al origen.
Ahora se hace lo mismo pero con las clases del analisis de clases latentes. Un poco de descriptiva:
En este caso el gradiente de temperaturas se ve claramente. Solo está
ausente en los formados lo cual era esperable. Esto es un buen indicio
de interacción entre temperatura y clase.
El modelo a correr es el siguiente:
\[ logit(P(Y ≤ AF_{alta})) = \beta_{j0} + \beta_1Clase + \beta_2Temp + \beta_3Genero + \beta_4Edad + \beta_5Clase*Temp \]
## Likelihood ratio test
##
## Model 1: nivel_actividad_fisica ~ temp_media * clase + genero + rango_edad
## Model 2: nivel_actividad_fisica ~ temp_media * clase + genero + rango_edad
## #Df LogLik Df Chisq Pr(>Chisq)
## 1 55690 -27689
## 2 55702 -27806 12 234.77 < 2.2e-16 ***
## ---
## Signif. codes: 0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
Ya probados los supuestos, se puede ver el modelo por dentro:
## Analysis of Deviance Table (Type II tests)
##
## Response: nivel_actividad_fisica
## Df Chisq Pr(>Chisq)
## temp_media 1 178.430 < 2.2e-16 ***
## clase 3 227.608 < 2.2e-16 ***
## genero 1 175.010 < 2.2e-16 ***
## rango_edad 4 456.135 < 2.2e-16 ***
## temp_media:clase 3 47.989 2.141e-10 ***
## ---
## Signif. codes: 0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
En este caso, la interaccion volvió a dar significativa, y además se puede ver que las clases más afectadas por el gradiente de temperaturas son los surgentes y vulnerados principalmente por sus pocos recursos. Por otro lado, los jubilados y los foramdos parecerían no tener problemas con paliar la temperatura.
Dado que se ha visto que el nivel de AF también cambia con el genero, se propone una triple interacción entre genero, AF, y temperatura. El modelo a correr es el siguiente:
\[ logit(P(Y ≤ AF_{alta})) = \beta_{j0} + \beta_1Ingreso + \beta_2Temp + \beta_3Edad + \beta_4Genero + \beta_5Ingreso*Temp + \beta_6Genero*Temp + \beta_7Genero*Ingreso + \beta_6Genero*Temp*Ingreso \]
Los supuestos dan de la siguiente manera:
## Likelihood ratio test
##
## Model 1: nivel_actividad_fisica ~ temp_media * quintil_ingreso * genero +
## rango_edad
## Model 2: nivel_actividad_fisica ~ temp_media * quintil_ingreso * genero +
## rango_edad
## #Df LogLik Df Chisq Pr(>Chisq)
## 1 55668 -27703
## 2 55691 -27820 23 235.09 < 2.2e-16 ***
## ---
## Signif. codes: 0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
Salvo por la contradiccion de approachs, los supuestos mostrados de manera gráfica parecerían no estar mal.
Ahora vamos a ver el modelo por dentro:
## Analysis of Deviance Table (Type II tests)
##
## Response: nivel_actividad_fisica
## Df Chisq Pr(>Chisq)
## temp_media 1 160.5400 < 2.2e-16 ***
## quintil_ingreso 4 151.7543 < 2.2e-16 ***
## genero 1 154.3126 < 2.2e-16 ***
## rango_edad 4 989.2752 < 2.2e-16 ***
## temp_media:quintil_ingreso 4 78.7933 3.138e-16 ***
## temp_media:genero 1 5.7807 0.01620 *
## quintil_ingreso:genero 4 12.3424 0.01498 *
## temp_media:quintil_ingreso:genero 4 3.1728 0.52933
## ---
## Signif. codes: 0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
La interacción triple no da significativa. Sin embargo lo que sí puede verse es que, nuevamente, el gradiente de temperaturas se estabiliza conforme nos vamos a quintiles más altos. Además de eso, el varón posee ordenada al origne mas alto que las mujeres para AF alata y media.
Algo interesante que pasa en el quintil 5 es que las mujeres tienden a aumentar AF alta mientras que los varones la disminuyen.