Descriptiva y Analísis

Se proceden a realizar descriptivas de cada variable y con su consiguiente análisis

Se puede ver que a mayor Precipitaciones, menor AF. El gradiente de Precipitaciones no es tan claro en este caso

Ahora se agrega la combinación con varaibles del NSE.

Se puede ver que el gradiente desaparece conforme nos acercamos a quintiles mas grandes. Esto podría estar indicando que los quintiles más altos tienen mas posibilidades de paliar las condiciones climátias por mayor acceso a recursos e instalaciones. Esto es un indicio de interaccion que se va a poner a prueba a continuación. Se prueba el siguiente modelo:

\[ logit(P(Y ≤ AF_{alta})) = \beta_{j0} + \beta_1Quintil + \beta_2Prec + \beta_3Genero + \beta_4Edad + \beta_5Quintil*Prec \] Una vez corrido el modelo, hay que chequear el supuesto de proporcionalidad de odds . Este supuesto dice que los coeficientes que describen, por ejemplo, AF_baja vs. AF_media, son los mismos que describen AF_media vs. AF_alta. Para poder chequear esto hay que verificar que los logits predichos por el modelo sean iguales para quintil 1, 2, 3 etc. y para cada Precipitaciones. Esta informacion se resume en el siguiente gráfico:

## Likelihood ratio test
## 
## Model 1: nivel_actividad_fisica ~ prec_media * quintil_ingreso + genero + 
##     rango_edad
## Model 2: nivel_actividad_fisica ~ prec_media * quintil_ingreso + genero + 
##     rango_edad
##     #Df LogLik Df  Chisq Pr(>Chisq)    
## 1 55686 -27769                         
## 2 55700 -27902 14 267.85  < 2.2e-16 ***
## ---
## Signif. codes:  0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1

Se puede ver que para cada variable explicatoria, el logit predicho se encuentra siempre dentro del mismo orden de magnitud, incluso dentro de la misma unidad (-1) lo cual indica que el supuesto de proporcionalidad de odds se cumple. De nuevo, los supuestos se contradicen según el approach.

Ahora vamos a ver el modelo por dentro:

## Analysis of Deviance Table (Type II tests)
## 
## Response: nivel_actividad_fisica
##                            Df   Chisq Pr(>Chisq)    
## prec_media                  1  43.712  3.804e-11 ***
## quintil_ingreso             4 189.089  < 2.2e-16 ***
## genero                      1 149.369  < 2.2e-16 ***
## rango_edad                  4 983.920  < 2.2e-16 ***
## prec_media:quintil_ingreso  4  47.414  1.250e-09 ***
## ---
## Signif. codes:  0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1

Lo que se puede ver al comparar varones y mujeres de 35 a 49 años es que los varones tienen una ordenada al origen mas elevada para AF media y alta sin importar el quintil y la Precipitaciones, lo cual indica que los varones hacen más AF que las mujeres. Por otro lado, tambien se puede ver que en varones de quintiles altos, la pb de AF casi no varía según la Precipitaciones. En mujeres se ve lo mismo con una ligera pendiente.

Ahora se repite el análisis usando Nivel de instruccion como indicador de NSE en lugar de quintil de ingresos. Comenzamos con un poco de descriptiva:

En este caso, el gradiente de Precipitacioness no parecería estar modificandose mucho por lo que la interaccion probablemente no de significativa.

El modelo a correr es el siguiente:

\[ logit(P(Y ≤ AF_{alta})) = \beta_{j0} + \beta_1Instruccion + \beta_2Prec + \beta_3Genero + \beta_4Edad + \beta_5Instruccion*Prec \]

## Likelihood ratio test
## 
## Model 1: nivel_actividad_fisica ~ prec_media * nivel_instruccion + genero + 
##     rango_edad
## Model 2: nivel_actividad_fisica ~ prec_media * nivel_instruccion + genero + 
##     rango_edad
##     #Df LogLik Df  Chisq Pr(>Chisq)    
## 1 55694 -27727                         
## 2 55704 -27863 10 272.25  < 2.2e-16 ***
## ---
## Signif. codes:  0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1

Nuevamente, habría contradiccion en el chequeo de supuestos: uno indica que se viola mientras el otro no parecería estar mostrando problemas.

Ahora vemos dentro del modelo qué está pasando.

## Analysis of Deviance Table (Type II tests)
## 
## Response: nivel_actividad_fisica
##                              Df    Chisq Pr(>Chisq)    
## prec_media                    1  59.0990  1.499e-14 ***
## nivel_instruccion             2 304.8681  < 2.2e-16 ***
## genero                        1 205.7451  < 2.2e-16 ***
## rango_edad                    4 552.6322  < 2.2e-16 ***
## prec_media:nivel_instruccion  2   7.8907    0.01934 *  
## ---
## Signif. codes:  0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1

Esta vez la interacción dio significativa (con nivel de instruccion y precipitaciones). Se puede ver cómo los niveles más instruidos tienen AF mas alta en general y una pendiente de caida menor AF alta. Y una pendiente mas chica para la suba de AF baja conforme aumentan las precipitaciones.

Ahora se hace lo mismo con Carencias Materiales y de Vivienda. Primero un poco de descriptiva:

En este caso, el gradiente de Precipitacioness sí se modifica según se tiene o no carencias materiales y de vivienda.

Ahora corremos el modelo que es el siguiente:

\[ logit(P(Y ≤ AF_{alta})) = \beta_{j0} + \beta_1CMT + \beta_2Prec + \beta_3Genero + \beta_4Edad + \beta_5CMT*Prec \] Chequeamos los supuestos:

## Likelihood ratio test
## 
## Model 1: nivel_actividad_fisica ~ prec_media * CMT + genero + rango_edad
## Model 2: nivel_actividad_fisica ~ prec_media * CMT + genero + rango_edad
##     #Df LogLik Df  Chisq Pr(>Chisq)    
## 1 55698 -27867                         
## 2 55706 -27992  8 250.62  < 2.2e-16 ***
## ---
## Signif. codes:  0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1

Ahora podemos ver los resultados del modelo:

## Analysis of Deviance Table (Type II tests)
## 
## Response: nivel_actividad_fisica
##                Df   Chisq Pr(>Chisq)    
## prec_media      1  54.443  1.601e-13 ***
## CMT             1  15.560  7.992e-05 ***
## genero          1 172.015  < 2.2e-16 ***
## rango_edad      4 942.251  < 2.2e-16 ***
## prec_media:CMT  1  43.189  4.970e-11 ***
## ---
## Signif. codes:  0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1

Se puede ver que la interaccion es significativa. Y además, se puede ver claramente que afecta de manera diferencial al genero. No cambia la pendiente pero sí la ordenada al origen. Poseer carencias materiaes y de vivienda aumenta mucho la AF baja, y disminuye la AF media y alta.

Ahora se hace lo mismo pero con las clases del analisis de clases latentes. Un poco de descriptiva:

En este caso el gradiente de Precipitacioness se ve claramente. Solo está ausente en los formados lo cual era esperable. Esto es un buen indicio de interacción entre Precipitaciones y clase.

El modelo a correr es el siguiente:

\[ logit(P(Y ≤ AF_{alta})) = \beta_{j0} + \beta_1Clase + \beta_2Prec + \beta_3Genero + \beta_4Edad + \beta_5Clase*Prec \]

## Likelihood ratio test
## 
## Model 1: nivel_actividad_fisica ~ prec_media * clase + genero + rango_edad
## Model 2: nivel_actividad_fisica ~ prec_media * clase + genero + rango_edad
##     #Df LogLik Df  Chisq Pr(>Chisq)    
## 1 55690 -27736                         
## 2 55702 -27871 12 270.98  < 2.2e-16 ***
## ---
## Signif. codes:  0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1

Ya probados los supuestos, se puede ver el modelo por dentro:

## Analysis of Deviance Table (Type II tests)
## 
## Response: nivel_actividad_fisica
##                  Df   Chisq Pr(>Chisq)    
## prec_media        1  50.327  1.301e-12 ***
## clase             3 252.020  < 2.2e-16 ***
## genero            1 172.617  < 2.2e-16 ***
## rango_edad        4 462.661  < 2.2e-16 ***
## prec_media:clase  3  46.096  5.410e-10 ***
## ---
## Signif. codes:  0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1

En este caso, la interaccion volvió a dar significativa, y además se puede ver que las clases más afectadas por el gradiente de Precipitacioness son los surgentes y vulnerados principalmente por sus pocos recursos. Por otro lado, los jubilados y los foramdos parecerían no tener problemas con paliar la Precipitaciones.

Probando triple interacción

Dado que se ha visto que el nivel de AF también cambia con el genero, se propone una triple interacción entre genero, AF, y precipitaciones. El modelo a correr es el siguiente:

\[ logit(P(Y ≤ AF_{alta})) = \beta_{j0} + \beta_1Ingreso + \beta_2Prec + \beta_3Edad + \beta_4Genero + \beta_5Ingreso*Prec + \beta_6Genero*Prec + \beta_7Genero*Ingreso + \beta_6Genero*Prec*Ingreso \]

Los supuestos dan de la siguiente manera:

## Likelihood ratio test
## 
## Model 1: nivel_actividad_fisica ~ prec_media * quintil_ingreso * genero + 
##     rango_edad
## Model 2: nivel_actividad_fisica ~ prec_media * quintil_ingreso * genero + 
##     rango_edad
##     #Df LogLik Df  Chisq Pr(>Chisq)    
## 1 55668 -27756                         
## 2 55691 -27890 23 267.94  < 2.2e-16 ***
## ---
## Signif. codes:  0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1

Salvo por la contradiccion de approachs, los supuestos mostrados de manera gráfica parecerían no estar mal.

Ahora vamos a ver el modelo por dentro:

## Analysis of Deviance Table (Type II tests)
## 
## Response: nivel_actividad_fisica
##                                   Df    Chisq Pr(>Chisq)    
## prec_media                         1  44.8854  2.089e-11 ***
## quintil_ingreso                    4 189.2721  < 2.2e-16 ***
## genero                             1 150.7390  < 2.2e-16 ***
## rango_edad                         4 982.4386  < 2.2e-16 ***
## prec_media:quintil_ingreso         4  49.7700  4.033e-10 ***
## prec_media:genero                  1  10.7080   0.001067 ** 
## quintil_ingreso:genero             4  11.7832   0.019038 *  
## prec_media:quintil_ingreso:genero  4   3.2395   0.518580    
## ---
## Signif. codes:  0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1

La interacción triple no da significativa. Sin embargo lo que sí puede verse es que, nuevamente, el gradiente de precipitaciones se estabiliza conforme nos vamos a quintiles más altos. Además de eso, el varón posee ordenada al origne mas alto que las mujeres para AF alata y media.

Algo interesante que pasa en el quintil 5 es que las mujeres tienden a aumentar AF alta mientras que los varones la disminuyen.