Se proceden a realizar descriptivas de cada variable y con su consiguiente análisis
Se puede ver que a mayor Precipitaciones, menor CS. El gradiente de Precipitaciones no es tan claro en este caso
Ahora se agrega la combinación con varaibles del NSE.
Se puede ver que el gradiente desaparece conforme nos acercamos a quintiles mas grandes. Esto podría estar indicando que los quintiles más altos tienen mas posibilidades de paliar las condiciones climátias por mayor acceso a recursos e instalaciones. Esto es un indicio de interaccion que se va a poner a prueba a continuación. Se prueba el siguiente modelo:
\[ logit(P(Y ≤ CS_{alta})) = \beta_{j0} + \beta_1Quintil + \beta_2Prec + \beta_3Genero + \beta_4Edad + \beta_5Quintil*Prec \]
Una vez corrido el modelo, hay que chequear el supuesto de proporcionalidad de odds . Este supuesto dice que los coeficientes que describen, por ejemplo, CS_baja vs. CS_media, son los mismos que describen CS_media vs. CS_alta. Para poder chequear esto hay que verificar que los logits predichos por el modelo sean iguales para quintil 1, 2, 3 etc. y para cada Precipitaciones. Esta informacion se resume en el siguiente gráfico:
## Likelihood ratio test
##
## Model 1: CS_terciles ~ prec_media * quintil_ingreso + genero + rango_edad
## Model 2: CS_terciles ~ prec_media * quintil_ingreso + genero + rango_edad
## #Df LogLik Df Chisq Pr(>Chisq)
## 1 55686 -30121
## 2 55700 -30139 14 36.942 0.0007528 ***
## ---
## Signif. codes: 0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
De nuevo, los supuestos se contradicen según el approach.
Ahora vamos a ver el modelo por dentro:
## Analysis of Deviance Table (Type II tests)
##
## Response: CS_terciles
## Df Chisq Pr(>Chisq)
## prec_media 1 7.2808 0.0069696 **
## quintil_ingreso 4 680.9416 < 2.2e-16 ***
## genero 1 13.7104 0.0002133 ***
## rango_edad 4 282.8060 < 2.2e-16 ***
## prec_media:quintil_ingreso 4 13.8812 0.0076840 **
## ---
## Signif. codes: 0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
Se puede ver nuevamente como las relaciones se invierten. Esto es algo que sucede claramente para ambos sexos, y de la misma manera.
Ahora se repite el análisis usando Nivel de instruccion como indicador de NSE en lugar de quintil de ingresos. Comenzamos con un poco de descriptiva:
En este caso, el gradiente de Precipitacioness no parecería estar
modificandose mucho por lo que la interaccion probablemente no de
significativa.
El modelo a correr es el siguiente:
\[ logit(P(Y ≤ CS_{alta})) = \beta_{j0} + \beta_1Instruccion + \beta_2Prec + \beta_3Genero + \beta_4Edad + \beta_5Instruccion*Prec \]
## Likelihood ratio test
##
## Model 1: CS_terciles ~ prec_media * nivel_instruccion + genero + rango_edad
## Model 2: CS_terciles ~ prec_media * nivel_instruccion + genero + rango_edad
## #Df LogLik Df Chisq Pr(>Chisq)
## 1 55694 -30057
## 2 55704 -30066 10 19.05 0.03963 *
## ---
## Signif. codes: 0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
Nuevamente, habría contradiccion en el chequeo de supuestos: uno indica que se viola mientras el otro no parecería estar mostrando problemas.
Ahora vemos dentro del modelo qué está pasando.
## Analysis of Deviance Table (Type II tests)
##
## Response: CS_terciles
## Df Chisq Pr(>Chisq)
## prec_media 1 27.177 1.856e-07 ***
## nivel_instruccion 2 821.070 < 2.2e-16 ***
## genero 1 58.300 2.251e-14 ***
## rango_edad 4 196.245 < 2.2e-16 ***
## prec_media:nivel_instruccion 2 11.109 0.00387 **
## ---
## Signif. codes: 0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
Esta vez la interacción dio significativa (con nivel de instruccion y precipitaciones). Se puede ver cómo los niveles más instruidos tienen CS mas alto en general y una pendiente de caida menor. Tambien tienen una pendiente mas chica para la suba de CS. Se puede ver la inversion de los niveles y la perdida del gradiente de precipitaciones.
Ahora se hace lo mismo con Carencias Materiales y de Vivienda. Primero un poco de descriptiva:
En este caso, el gradiente de Precipitacioness sí se modifica según se tiene o no carencias materiales y de vivienda. Cuando hay carencias, hay poco CS. Esto puede indicarse con que estos individuos están poco tiempo en sus hogares.
Ahora corremos el modelo que es el siguiente:
\[ logit(P(Y ≤ CS_{alta})) = \beta_{j0} + \beta_1CMT + \beta_2Prec + \beta_3Genero + \beta_4Edad + \beta_5CMT*Prec \] Chequeamos los supuestos:
## Likelihood ratio test
##
## Model 1: CS_terciles ~ prec_media * CMT + genero + rango_edad
## Model 2: CS_terciles ~ prec_media * CMT + genero + rango_edad
## #Df LogLik Df Chisq Pr(>Chisq)
## 1 55698 -30319
## 2 55706 -30327 8 15.245 0.05456 .
## ---
## Signif. codes: 0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
Ahora podemos ver los resultados del modelo:
## Analysis of Deviance Table (Type II tests)
##
## Response: CS_terciles
## Df Chisq Pr(>Chisq)
## prec_media 1 18.5922 1.619e-05 ***
## CMT 1 321.5277 < 2.2e-16 ***
## genero 1 30.4580 3.412e-08 ***
## rango_edad 4 209.6377 < 2.2e-16 ***
## prec_media:CMT 1 2.2563 0.1331
## ---
## Signif. codes: 0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
Se puede ver que la interaccion es NO significativa, por lo tanto se corre el modelo aditivo. Este es el siguiente:
\[ logit(P(Y ≤ CS_{alta})) = \beta_{j0} + \beta_1CMT + \beta_2Prec + \beta_3Genero + \beta_4Edad \] Chequeamos los supuestos:
## Likelihood ratio test
##
## Model 1: CS_terciles ~ prec_media + CMT + genero + rango_edad
## Model 2: CS_terciles ~ prec_media + CMT + genero + rango_edad
## #Df LogLik Df Chisq Pr(>Chisq)
## 1 55700 -30320
## 2 55707 -30328 7 15.434 0.03083 *
## ---
## Signif. codes: 0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
Ahora podemos ver los resultados del modelo:
## Analysis of Deviance Table (Type II tests)
##
## Response: CS_terciles
## Df Chisq Pr(>Chisq)
## prec_media 1 18.556 1.650e-05 ***
## CMT 1 321.555 < 2.2e-16 ***
## genero 1 30.487 3.361e-08 ***
## rango_edad 4 209.610 < 2.2e-16 ***
## ---
## Signif. codes: 0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
Se puede ver que tener CMV te hace menos sedentario mientras que no
tener CMV te hace más sedentario. El bajo CS aumenta con precipitaciones
y es similar entre varones y mujeres.
Ahora se hace lo mismo pero con las clases del analisis de clases latentes. Un poco de descriptiva:
En este caso el gradiente de Precipitacioness se ve claramente. Los que
parecen sufrir menos las precipitaciones son los surgentes. Pero esto
puede deberse a que ellos deben cumplir obligaciones sin importar el
clima.
El modelo a correr es el siguiente:
\[ logit(P(Y ≤ CS_{alta})) = \beta_{j0} + \beta_1Clase + \beta_2Prec + \beta_3Genero + \beta_4Edad + \beta_5Clase*Prec \]
## Likelihood ratio test
##
## Model 1: CS_terciles ~ prec_media * clase + genero + rango_edad
## Model 2: CS_terciles ~ prec_media * clase + genero + rango_edad
## #Df LogLik Df Chisq Pr(>Chisq)
## 1 55690 -30095
## 2 55702 -30105 12 20.62 0.05622 .
## ---
## Signif. codes: 0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
Ya probados los supuestos, se puede ver el modelo por dentro:
## Analysis of Deviance Table (Type II tests)
##
## Response: CS_terciles
## Df Chisq Pr(>Chisq)
## prec_media 1 11.7550 0.0006068 ***
## clase 3 749.6047 < 2.2e-16 ***
## genero 1 25.6080 4.183e-07 ***
## rango_edad 4 305.9706 < 2.2e-16 ***
## prec_media:clase 3 5.9148 0.1158321
## ---
## Signif. codes: 0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
En este caso, la interaccion volvió a dar NO significativa, por lo que se prueba el modelo aditivo:
\[ logit(P(Y ≤ CS_{alta})) = \beta_{j0} + \beta_1Clase + \beta_2Prec + \beta_3Genero + \beta_4Edad\]
## Likelihood ratio test
##
## Model 1: CS_terciles ~ prec_media + clase + genero + rango_edad
## Model 2: CS_terciles ~ prec_media + clase + genero + rango_edad
## #Df LogLik Df Chisq Pr(>Chisq)
## 1 55696 -30098
## 2 55705 -30108 9 19.833 0.01897 *
## ---
## Signif. codes: 0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
Ya probados los supuestos, se puede ver el modelo por dentro:
## Analysis of Deviance Table (Type II tests)
##
## Response: CS_terciles
## Df Chisq Pr(>Chisq)
## prec_media 1 11.773 0.0006009 ***
## clase 3 749.668 < 2.2e-16 ***
## genero 1 25.792 3.802e-07 ***
## rango_edad 4 305.235 < 2.2e-16 ***
## ---
## Signif. codes: 0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
Lo que puede verse es que los formados son los unicos que tienen un
mayor CS que baja con las precipitaciones. Los vulnerados son los que
tienen menor CS.
Dado que se ha visto que el nivel de CS también cambia con el genero, se propone una triple interacción entre genero, CS, y precipitaciones. El modelo a correr es el siguiente:
\[ logit(P(Y ≤ CS_{alta})) = \beta_{j0} + \beta_1Ingreso + \beta_2Prec + \beta_3Edad + \beta_4Genero + \beta_5Ingreso*Prec + \beta_6Genero*Prec + \beta_7Genero*Ingreso + \beta_6Genero*Prec*Ingreso \]
Los supuestos dan de la siguiente manera:
## Likelihood ratio test
##
## Model 1: CS_terciles ~ prec_media * quintil_ingreso * genero + rango_edad
## Model 2: CS_terciles ~ prec_media * quintil_ingreso * genero + rango_edad
## #Df LogLik Df Chisq Pr(>Chisq)
## 1 55668 -30109
## 2 55691 -30131 23 45.456 0.003494 **
## ---
## Signif. codes: 0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
Salvo por la contradiccion de approachs, los supuestos mostrados de manera gráfica parecerían no estar mal.
Ahora vamos a ver el modelo por dentro:
## Analysis of Deviance Table (Type II tests)
##
## Response: CS_terciles
## Df Chisq Pr(>Chisq)
## prec_media 1 7.2841 0.006957 **
## quintil_ingreso 4 680.9615 < 2.2e-16 ***
## genero 1 13.6955 0.000215 ***
## rango_edad 4 283.6033 < 2.2e-16 ***
## prec_media:quintil_ingreso 4 14.5135 0.005824 **
## prec_media:genero 1 9.8038 0.001742 **
## quintil_ingreso:genero 4 2.0863 0.719883
## prec_media:quintil_ingreso:genero 4 4.4431 0.349343
## ---
## Signif. codes: 0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
La interacción triple no da significativa. Sin embargo lo que sí puede verse es que, nuevamente, la relacion de CS se invierte conforme vamos a quintiles mas altos en donde el alto CS comienza a hacerse preponderante.