Se proceden a realizar descriptivas de cada variable y con su consiguiente análisis
Se puede ver que a mayor temperatura, menor es el CS. El gradiente de temperatura es claro en este caso
Ahora se agrega la combinación con varaibles del NSE.
Se puede ver que el gradiente desaparece conforme nos acercamos a quintiles mas grandes. Esto podría estar indicando que los quintiles más altos pueden combatir el calor sin salir de sus hogares. El modelo a correr es el siguiente:
\[ logit(P(Y ≤ CS_{alto})) = \beta_{j0} + \beta_1Quintil + \beta_2Temp + \beta_3Genero + \beta_4Edad + \beta_5Quintil*Temp \]
Una vez corrido el modelo, hay que chequear el supuesto de proporcionalidad de odds . Este supuesto dice que los coeficientes que describen, por ejemplo, CS_baja vs. CS_medio, son los mismos que describen CS_medio vs. CS_alto. Para poder chequear esto hay que verificar que los logits predichos por el modelo sean iguales para quintil 1, 2, 3 etc. y para cada temperatura. Esta informacion se resume en el siguiente gráfico:
## Likelihood ratio test
##
## Model 1: CS_terciles ~ temp_media * quintil_ingreso + genero + rango_edad
## Model 2: CS_terciles ~ temp_media * quintil_ingreso + genero + rango_edad
## #Df LogLik Df Chisq Pr(>Chisq)
## 1 55686 -30121
## 2 55700 -30148 14 52.319 2.483e-06 ***
## ---
## Signif. codes: 0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
Se puede ver que para cada variable explicatoria, el logit predicho se encuentra siempre dentro del mismo orden de magnitud, incluso dentro de la misma unidad (-1) lo cual indica que el supuesto de proporcionalidad de odds se cumple. De nuevo, los supuestos se contradicen según el approach.
Ahora vamos a ver el modelo por dentro:
## Analysis of Deviance Table (Type II tests)
##
## Response: CS_terciles
## Df Chisq Pr(>Chisq)
## temp_media 1 0.0115 0.9147519
## quintil_ingreso 4 677.9327 < 2.2e-16 ***
## genero 1 13.4895 0.0002399 ***
## rango_edad 4 282.0148 < 2.2e-16 ***
## temp_media:quintil_ingreso 4 4.4317 0.3507268
## ---
## Signif. codes: 0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
Como la interacción da NS, se hace el modelo aditivo:
\[ logit(P(Y ≤ CS_{alto})) = \beta_{j0} + \beta_1Quintil + \beta_2Temp + \beta_3Genero + \beta_4Edad \]
## Likelihood ratio test
##
## Model 1: CS_terciles ~ temp_media + quintil_ingreso + genero + rango_edad
## Model 2: CS_terciles ~ temp_media + quintil_ingreso + genero + rango_edad
## #Df LogLik Df Chisq Pr(>Chisq)
## 1 55694 -30129
## 2 55704 -30150 10 41.123 1.073e-05 ***
## ---
## Signif. codes: 0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
Vistos los supuestos, se observa el modelo por dentro
## Analysis of Deviance Table (Type II tests)
##
## Response: CS_terciles
## Df Chisq Pr(>Chisq)
## temp_media 1 0.0127 0.9104443
## quintil_ingreso 4 677.7762 < 2.2e-16 ***
## genero 1 13.5529 0.0002319 ***
## rango_edad 4 282.6331 < 2.2e-16 ***
## ---
## Signif. codes: 0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
Se puede ver que la temperatura no surte efecto acá porque da NS. Pero
lo que sí se ve es que cambian las ordenadas al origen dependiendo del
quintil de ingresos. A medida que el quintil sube, sube el CS alto lo
cual indica que los mas ricos son mas sedentarios.
Ahora se repite el análisis usando Nivel de instruccion como indicador de NSE en lugar de quintil de ingresos. Comenzamos con un poco de descriptiva:
En este caso, el gradiente de temperaturas no parecería estar
modificandose mucho por lo que la interaccion probablemente no de
significativa.
El modelo a correr es el siguiente:
\[ logit(P(Y ≤ CS_{alto})) = \beta_{j0} + \beta_1Instruccion + \beta_2Temp + \beta_3Genero + \beta_4Edad + \beta_5Instruccion*Temp \]
## Likelihood ratio test
##
## Model 1: CS_terciles ~ temp_media * nivel_instruccion + genero + rango_edad
## Model 2: CS_terciles ~ temp_media * nivel_instruccion + genero + rango_edad
## #Df LogLik Df Chisq Pr(>Chisq)
## 1 55694 -30054
## 2 55704 -30075 10 41.781 8.203e-06 ***
## ---
## Signif. codes: 0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
Nuevamente, habría contradiccion en el chequeo de supuestos: uno indica que se viola mientras el otro no parecería estar mostrando problemas.
Ahora vemos dentro del modelo qué está pasando.
## Analysis of Deviance Table (Type II tests)
##
## Response: CS_terciles
## Df Chisq Pr(>Chisq)
## temp_media 1 14.3119 0.0001549 ***
## nivel_instruccion 2 812.1651 < 2.2e-16 ***
## genero 1 58.1300 2.454e-14 ***
## rango_edad 4 194.6900 < 2.2e-16 ***
## temp_media:nivel_instruccion 2 5.8169 0.0545604 .
## ---
## Signif. codes: 0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
La interacción da CASI significativa. Si la consideramos de esa manera,
se puede ver que a medida que vamos a niveles mas altos de instruccion
el gradiente de temperaturas desaparece y además a mayor nivel de
instruccion mayor CS.
Sin embargo, como la interacción dió NS, pruebo el modelo aditivo:
\[ logit(P(Y ≤ CS_{alto})) = \beta_{j0} + \beta_1Instruccion + \beta_2Temp + \beta_3Genero + \beta_4Edad \]
## Likelihood ratio test
##
## Model 1: CS_terciles ~ temp_media + nivel_instruccion + genero + rango_edad
## Model 2: CS_terciles ~ temp_media + nivel_instruccion + genero + rango_edad
## #Df LogLik Df Chisq Pr(>Chisq)
## 1 55698 -30060
## 2 55706 -30078 8 37.129 1.09e-05 ***
## ---
## Signif. codes: 0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
De nuevo, los supuestos parecen bien, salvo la contradiccion con el LRT.
Ahora vemos el modelo por dentro
## Analysis of Deviance Table (Type II tests)
##
## Response: CS_terciles
## Df Chisq Pr(>Chisq)
## temp_media 1 14.45 0.0001439 ***
## nivel_instruccion 2 813.39 < 2.2e-16 ***
## genero 1 58.63 1.903e-14 ***
## rango_edad 4 195.63 < 2.2e-16 ***
## ---
## Signif. codes: 0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
Esto es raro, si no estoy asumiendo interacción ¿¿por qué se ve como si hubiera interaccion??
Ahora se hace lo mismo con Carencias Materiales y de Vivienda. Primero un poco de descriptiva:
En este caso, el gradiente de temperaturas parece que no se modifica segñun se tiene o no carencias materiales y de vivienda. Indicio de una interacción NS.
Ahora corremos el modelo que es el siguiente:
\[ logit(P(Y ≤ CS_{alto})) = \beta_{j0} + \beta_1CMT + \beta_2Temp + \beta_3Genero + \beta_4Edad + \beta_5CMT*Temp \] Chequeamos los supuestos:
## Likelihood ratio test
##
## Model 1: CS_terciles ~ temp_media * CMT + genero + rango_edad
## Model 2: CS_terciles ~ temp_media * CMT + genero + rango_edad
## #Df LogLik Df Chisq Pr(>Chisq)
## 1 55698 -30314
## 2 55706 -30331 8 35.731 1.967e-05 ***
## ---
## Signif. codes: 0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
Ahora podemos ver los resultados del modelo:
## Analysis of Deviance Table (Type II tests)
##
## Response: CS_terciles
## Df Chisq Pr(>Chisq)
## temp_media 1 10.6665 0.001091 **
## CMT 1 318.0218 < 2.2e-16 ***
## genero 1 30.2581 3.782e-08 ***
## rango_edad 4 209.9219 < 2.2e-16 ***
## temp_media:CMT 1 0.6645 0.414991
## ---
## Signif. codes: 0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
Se puede ver que la interaccion es no significativa, por lo tanto se prueba el modelo aditivo:
\[ logit(P(Y ≤ CS_{alto})) = \beta_{j0} + \beta_1CMT + \beta_2Temp + \beta_3Genero + \beta_4Edad \]
## Likelihood ratio test
##
## Model 1: CS_terciles ~ temp_media + CMT + genero + rango_edad
## Model 2: CS_terciles ~ temp_media + CMT + genero + rango_edad
## #Df LogLik Df Chisq Pr(>Chisq)
## 1 55700 -30315
## 2 55707 -30332 7 34.551 1.358e-05 ***
## ---
## Signif. codes: 0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
Chequeados los supuestos se observa el modelo por dentro:
## Analysis of Deviance Table (Type II tests)
##
## Response: CS_terciles
## Df Chisq Pr(>Chisq)
## temp_media 1 10.670 0.001089 **
## CMT 1 318.276 < 2.2e-16 ***
## genero 1 30.203 3.891e-08 ***
## rango_edad 4 209.789 < 2.2e-16 ***
## ---
## Signif. codes: 0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
Si la interaccion da NS, de nuevo ¿por qué parece que sí hay
interaccion en estos gráficos?. Se puede ver que Si tener CMV
da más probabilidades de tener bajo CS. Consistente con los otros
indicadores de NSE que veníamos viendo.
Ahora se hace lo mismo pero con las clases del analisis de clases latentes. Un poco de descriptiva:
En este caso el gradiente de temperaturas se ve claramente. Solo está
ausente en los formados lo cual era esperable. Esto es un buen indicio
de interacción entre temperatura y clase.
El modelo a correr es el siguiente:
\[ logit(P(Y ≤ CS_{alto})) = \beta_{j0} + \beta_1Clase + \beta_2Temp + \beta_3Genero + \beta_4Edad + \beta_5Clase*Temp \]
## Likelihood ratio test
##
## Model 1: CS_terciles ~ temp_media * clase + genero + rango_edad
## Model 2: CS_terciles ~ temp_media * clase + genero + rango_edad
## #Df LogLik Df Chisq Pr(>Chisq)
## 1 55690 -30093
## 2 55702 -30113 12 40.014 7.154e-05 ***
## ---
## Signif. codes: 0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
Ya probados los supuestos, se puede ver el modelo por dentro:
## Analysis of Deviance Table (Type II tests)
##
## Response: CS_terciles
## Df Chisq Pr(>Chisq)
## temp_media 1 1.5218 0.2174
## clase 3 744.2419 < 2.2e-16 ***
## genero 1 25.5235 4.37e-07 ***
## rango_edad 4 304.4795 < 2.2e-16 ***
## temp_media:clase 3 1.5076 0.6805
## ---
## Signif. codes: 0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
En este caso, la interaccion volvió a dar NS, por lo tanto se prueba el modelo aditivo:
\[ logit(P(Y ≤ CS_{alto})) = \beta_{j0} + \beta_1Clase + \beta_2Temp + \beta_3Genero + \beta_4Edad \]
## Likelihood ratio test
##
## Model 1: CS_terciles ~ temp_media + clase + genero + rango_edad
## Model 2: CS_terciles ~ temp_media + clase + genero + rango_edad
## #Df LogLik Df Chisq Pr(>Chisq)
## 1 55696 -30095
## 2 55705 -30114 9 37.826 1.873e-05 ***
## ---
## Signif. codes: 0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
Ya probados los supuestos, se puede ver el modelo por dentro:
## Analysis of Deviance Table (Type II tests)
##
## Response: CS_terciles
## Df Chisq Pr(>Chisq)
## temp_media 1 1.5342 0.2155
## clase 3 744.3310 < 2.2e-16 ***
## genero 1 25.6211 4.155e-07 ***
## rango_edad 4 304.5397 < 2.2e-16 ***
## ---
## Signif. codes: 0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
En este caso, parecería que los formados son los que tienen mayor CS,
mientras que los vulnerados son los de mayor bajo CS. Quizas esto se
relaciona con que están mucho tiempo fuera de casa. CM inactiva tiene
todos los grupos mas bien juntos indicando que están son igualmente
Bajos Medios y Altos en CS. y los surgentes son mas bien de bajo CS
porque son bien jovenes.
Dado que se ha visto que el nivel de CS también cambia con el genero, se propone una triple interacción entre genero, CS, y temperatura. El modelo a correr es el siguiente:
\[ logit(P(Y ≤ CS_{alto})) = \beta_{j0} + \beta_1Ingreso + \beta_2Temp + \beta_3Edad + \beta_4Genero + \beta_5Ingreso*Temp + \beta_6Genero*Temp + \beta_7Genero*Ingreso + \beta_6Genero*Temp*Ingreso \]
Los supuestos dan de la siguiente manera:
## Likelihood ratio test
##
## Model 1: CS_terciles ~ temp_media * quintil_ingreso * genero + rango_edad
## Model 2: CS_terciles ~ temp_media * quintil_ingreso * genero + rango_edad
## #Df LogLik Df Chisq Pr(>Chisq)
## 1 55668 -30113
## 2 55691 -30143 23 59.907 3.94e-05 ***
## ---
## Signif. codes: 0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
Salvo por la contradiccion de approachs, los supuestos mostrados de manera gráfica parecerían no estar mal.
Ahora vamos a ver el modelo por dentro:
## Analysis of Deviance Table (Type II tests)
##
## Response: CS_terciles
## Df Chisq Pr(>Chisq)
## temp_media 1 0.0087 0.9257080
## quintil_ingreso 4 678.0710 < 2.2e-16 ***
## genero 1 13.4326 0.0002473 ***
## rango_edad 4 281.5326 < 2.2e-16 ***
## temp_media:quintil_ingreso 4 4.4810 0.3448094
## temp_media:genero 1 1.0156 0.3135707
## quintil_ingreso:genero 4 1.6422 0.8011863
## temp_media:quintil_ingreso:genero 4 7.2470 0.1233982
## ---
## Signif. codes: 0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
La interacción triple no da significativa, y el resto de interacciones tampoco. El comportamiento sedentario se manifiesta de manera extraña. Los quintiles bajos tienden a tener bajo CS que baja en varones y sube en mujeres conforme aumenta la temperatura. Mietas que en el quintil 5 pasa exactamente lo contrario.