Primero un poco de descriptiva con temperatura media:
Se puede ver claramente el gradiente de temperatura, sobre todo para quintiles bajos.
El primero modelo a correr es el siguiente:
\[ logit(\pi(AF_{Baja})) = \beta_{j0} +
\beta_1Quintil + \beta_2T_{media} + \beta_3Genero + \beta_4Edad +
\beta_5Quintil*T_{media} \]
Como el test de RES vs PRED no tiene sentido en bernoulli, y el resto de los supuestos parecen estar OK, podemos ver el modelo ahora.
## Analysis of Deviance Table (Type II Wald chisquare tests)
##
## Response: nivel_actividad_fisica
## Chisq Df Pr(>Chisq)
## quintil_ingreso 122.930 4 < 2.2e-16 ***
## temp_media 79.990 1 < 2.2e-16 ***
## rango_edad 735.078 4 < 2.2e-16 ***
## genero 53.661 1 2.383e-13 ***
## quintil_ingreso:temp_media 85.235 4 < 2.2e-16 ***
## ---
## Signif. codes: 0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
La interacción da S y los patrones son los mismos que vimos antes.
Ahora la triple interacción. El modelo es el siguiente:
\[ logit(\pi(AF_{Baja})) = \beta_{j0} + \beta_1Ingreso + \beta_2T_{media} + \beta_3Edad + \beta_4Genero + \beta_5Ingreso*T_{media} + \beta_6Genero*T_{media} + \beta_7Genero*Ingreso + \beta_6Genero*T_{media}*Ingreso \]
Los supuestos dan OK por lo tanto podemos ver el modelo:
## Analysis of Deviance Table (Type II Wald chisquare tests)
##
## Response: nivel_actividad_fisica
## Chisq Df Pr(>Chisq)
## quintil_ingreso 122.8675 4 < 2.2e-16 ***
## temp_media 80.4368 1 < 2.2e-16 ***
## genero 53.5558 1 2.513e-13 ***
## rango_edad 734.6328 4 < 2.2e-16 ***
## quintil_ingreso:temp_media 86.0394 4 < 2.2e-16 ***
## quintil_ingreso:genero 8.3393 4 0.07991 .
## temp_media:genero 0.5335 1 0.46514
## quintil_ingreso:temp_media:genero 1.7661 4 0.77868
## ---
## Signif. codes: 0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
En este caso la triple interacción da NS con dos interacciones dobles también NS. Esto se diferencia del analisis anterior en donde las dobles daban S. Esto es pérdida de información. (En el código está comentado el ggpredict)
Ahora se hace lo mismo con la temperatura mínima. No espero encontrar diferencias. El modelo a correr es el siguiente:
\[ logit(\pi(AF_{Baja})) = \beta_{j0} + \beta_1Quintil + \beta_2T_{min} + \beta_3Genero + \beta_4Edad + \beta_5Quintil*T_{min} \]
Chequeados los supuestos podemos ver el modelo:
## Analysis of Deviance Table (Type II Wald chisquare tests)
##
## Response: nivel_actividad_fisica
## Chisq Df Pr(>Chisq)
## quintil_ingreso 127.725 4 < 2.2e-16 ***
## temp_min 73.188 1 < 2.2e-16 ***
## genero 53.498 1 2.589e-13 ***
## rango_edad 735.305 4 < 2.2e-16 ***
## quintil_ingreso:temp_min 84.215 4 < 2.2e-16 ***
## ---
## Signif. codes: 0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
Los patrones son iguales tal y cómo lo esperaba. Ahora la interacción triple:
\[ logit(\pi(AF_{Baja})) = \beta_{j0} + \beta_1Ingreso + \beta_2T_{min} + \beta_3Edad + \beta_4Genero + \beta_5Ingreso*T_{min} + \beta_6Genero*T_{min} + \beta_7Genero*Ingreso + \beta_6Genero*T_{min}*Ingreso \]
Los supuestos dan OK por lo tanto podemos ver el modelo:
## Analysis of Deviance Table (Type II Wald chisquare tests)
##
## Response: nivel_actividad_fisica
## Chisq Df Pr(>Chisq)
## quintil_ingreso 127.6659 4 < 2.2e-16 ***
## temp_min 73.5994 1 < 2.2e-16 ***
## genero 53.3915 1 2.733e-13 ***
## rango_edad 734.9143 4 < 2.2e-16 ***
## quintil_ingreso:temp_min 85.0494 4 < 2.2e-16 ***
## quintil_ingreso:genero 8.3589 4 0.07928 .
## temp_min:genero 0.5414 1 0.46187
## quintil_ingreso:temp_min:genero 2.0429 4 0.72787
## ---
## Signif. codes: 0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
Igual que antes, las dobles dan NS.
Ahora se hace lo mismo con la temperatura máxima No espero encontrar diferencias. El modelo a correr es el siguiente:
\[ logit(\pi(AF_{Baja})) = \beta_{j0} + \beta_1Quintil + \beta_2T_{max} + \beta_3Genero + \beta_4Edad + \beta_5Quintil*T_{max} \]
Chequeados los supuestos podemos ver el modelo:
## Analysis of Deviance Table (Type II Wald chisquare tests)
##
## Response: nivel_actividad_fisica
## Chisq Df Pr(>Chisq)
## quintil_ingreso 116.062 4 < 2.2e-16 ***
## temp_max 101.515 1 < 2.2e-16 ***
## genero 53.598 1 2.46e-13 ***
## rango_edad 734.295 4 < 2.2e-16 ***
## quintil_ingreso:temp_max 80.270 4 < 2.2e-16 ***
## ---
## Signif. codes: 0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
Los patrones son iguales tal y cómo lo esperaba. Ahora la interacción triple:
\[ logit(\pi(AF_{Baja})) = \beta_{j0} + \beta_1Ingreso + \beta_2T_{max} + \beta_3Edad + \beta_4Genero + \beta_5Ingreso*T_{max} + \beta_6Genero*T_{max} + \beta_7Genero*Ingreso + \beta_6Genero*T_{max}*Ingreso \]
Los supuestos dan OK por lo tanto podemos ver el modelo:
## Analysis of Deviance Table (Type II Wald chisquare tests)
##
## Response: nivel_actividad_fisica
## Chisq Df Pr(>Chisq)
## quintil_ingreso 115.9717 4 < 2.2e-16 ***
## temp_max 102.0585 1 < 2.2e-16 ***
## genero 53.4914 1 2.597e-13 ***
## rango_edad 733.7845 4 < 2.2e-16 ***
## quintil_ingreso:temp_max 80.8949 4 < 2.2e-16 ***
## quintil_ingreso:genero 8.3834 4 0.0785 .
## temp_max:genero 0.3602 1 0.5484
## quintil_ingreso:temp_max:genero 2.2803 4 0.6844
## ---
## Signif. codes: 0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
Igual que antes, las dobles dan NS.
Primero un poco de descriptiva con precipitaciones media:
Nuevamente se evidencia el gradiente de precipitaciones. Los quintiles altos lo pueden soportar.
El primero modelo a correr es el siguiente:
\[ logit(\pi(AF_{Baja})) = \beta_{j0} +
\beta_1Quintil + \beta_2Prec + \beta_3Genero + \beta_4Edad +
\beta_5Quintil*Prec \]
Como el test de RES vs PRED no tiene sentido en bernoulli, y el resto de los supuestos parecen estar OK, podemos ver el modelo ahora.
## Analysis of Deviance Table (Type II Wald chisquare tests)
##
## Response: nivel_actividad_fisica
## Chisq Df Pr(>Chisq)
## quintil_ingreso 150.5267 4 < 2.2e-16 ***
## prec_media 9.6744 1 0.001869 **
## rango_edad 730.1273 4 < 2.2e-16 ***
## genero 52.0450 1 5.424e-13 ***
## quintil_ingreso:prec_media 50.6283 4 2.669e-10 ***
## ---
## Signif. codes: 0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
La interacción da S y los patrones son los mismos que vimos antes.
Ahora la triple interacción. El modelo es el siguiente:
\[ logit(\pi(AF_{Baja})) = \beta_{j0} + \beta_1Ingreso + \beta_2Prec + \beta_3Edad + \beta_4Genero + \beta_5Ingreso*Prec + \beta_6Genero*Prec + \beta_7Genero*Ingreso + \beta_6Genero*Prec*Ingreso \]
Los supuestos dan OK por lo tanto podemos ver el modelo:
## Analysis of Deviance Table (Type II Wald chisquare tests)
##
## Response: nivel_actividad_fisica
## Chisq Df Pr(>Chisq)
## quintil_ingreso 150.4324 4 < 2.2e-16 ***
## prec_media 9.8343 1 0.001713 **
## genero 51.9410 1 5.719e-13 ***
## rango_edad 729.3186 4 < 2.2e-16 ***
## quintil_ingreso:prec_media 51.9017 4 1.446e-10 ***
## quintil_ingreso:genero 8.0973 4 0.088079 .
## prec_media:genero 3.3615 1 0.066737 .
## quintil_ingreso:prec_media:genero 1.7425 4 0.782977
## ---
## Signif. codes: 0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
En este caso la triple interacción da NS con dos interacciones dobles también NS.
Ahora se realizan los mismos analisis pero utilizando diferentes indicadores de NSE a saber: nivel de instruccion, CMT y Clases generadas por el análisis de clases latentes.
El modelo a correr es el siguiente:
\[ logit(\pi(AF_{Baja})) = \beta_{j0} + \beta_1Instruccion + \beta_2T_{media} + \beta_3Genero + \beta_4Edad + \beta_5Instruccion*T_{media} \]
Ahora se pueden ver los resultados
## Analysis of Deviance Table (Type II Wald chisquare tests)
##
## Response: nivel_actividad_fisica
## Chisq Df Pr(>Chisq)
## nivel_instruccion 263.3689 2 <2e-16 ***
## temp_media 108.7660 1 <2e-16 ***
## genero 84.8989 1 <2e-16 ***
## rango_edad 402.1989 4 <2e-16 ***
## nivel_instruccion:temp_media 7.3695 2 0.0251 *
## ---
## Signif. codes: 0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
La interaccón con temperatura media es a penas significativa pero existe. En cuanto al gráfico de perfiles puede verse que se modifican tanto las ordenadas al origen como las pendientes conforme avanzamos en el nivel de instrucción. Esto es que la probabilidad de AF no solo se hace mas baja nominalmente sinoque tambien disminuye el efecto de la temperatura pues tambien disminuye la pendiente.
El modelo a correr es el siguiente:
\[ logit(\pi(AF_{Baja})) = \beta_{j0} + \beta_1Instruccion + \beta_2T_{min} + \beta_3Genero + \beta_4Edad + \beta_5Instruccion*T_{min} \]
Probados los supuestos se ven los resultados:
## Analysis of Deviance Table (Type II Wald chisquare tests)
##
## Response: nivel_actividad_fisica
## Chisq Df Pr(>Chisq)
## nivel_instruccion 266.1266 2 < 2.2e-16 ***
## temp_min 99.5331 1 < 2.2e-16 ***
## genero 84.9598 1 < 2.2e-16 ***
## rango_edad 401.8372 4 < 2.2e-16 ***
## nivel_instruccion:temp_min 9.2934 2 0.009593 **
## ---
## Signif. codes: 0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
Se ven los mismos patrones que con temperatura media.
El modelo a correr es el siguiente:
\[ logit(\pi(AF_{Baja})) = \beta_{j0} + \beta_1Instruccion + \beta_2T_{max} + \beta_3Genero + \beta_4Edad + \beta_5Instruccion*T_{max} \]
Probados los supuestos se ven los resultados:
## Analysis of Deviance Table (Type II Wald chisquare tests)
##
## Response: nivel_actividad_fisica
## Chisq Df Pr(>Chisq)
## nivel_instruccion 256.817 2 <2e-16 ***
## temp_max 131.741 1 <2e-16 ***
## genero 84.419 1 <2e-16 ***
## rango_edad 402.789 4 <2e-16 ***
## nivel_instruccion:temp_max 3.766 2 0.1521
## ---
## Signif. codes: 0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
En este caso la temperatura maxima no tiene interaccion significativa. No sé cómo interpretar esto. Puede ser que las interacciones desaparezcan en temperaturas altas. Pero esto nos arruina la hipótesis.
El modelo a correr es el siguiente:
\[ logit(\pi(AF_{Baja})) = \beta_{j0} + \beta_1Instruccion + \beta_2Prec + \beta_3Genero + \beta_4Edad + \beta_5Instruccion*Prec \]
Probados los supuestos se ven los resultados:
## Analysis of Deviance Table (Type II Wald chisquare tests)
##
## Response: nivel_actividad_fisica
## Chisq Df Pr(>Chisq)
## nivel_instruccion 270.055 2 < 2.2e-16 ***
## prec_media 16.574 1 4.678e-05 ***
## genero 84.552 1 < 2.2e-16 ***
## rango_edad 394.313 4 < 2.2e-16 ***
## nivel_instruccion:prec_media 12.401 2 0.002029 **
## ---
## Signif. codes: 0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
En este caso las precipitaciones sí tiene interaccion significativa, y el cambio de pendiente asi como tambien el de ordenada al origen son muy claros.
El modelo a correr es el siguiente:
\[ logit(\pi(AF_{Baja})) = \beta_{j0} + \beta_1CMT + \beta_2T_{media} + \beta_3Genero + \beta_4Edad + \beta_5CMT*T_{media} \]
Ahora se pueden ver los resultados
## Analysis of Deviance Table (Type II Wald chisquare tests)
##
## Response: nivel_actividad_fisica
## Chisq Df Pr(>Chisq)
## CMT 9.3446 1 0.002236 **
## temp_media 108.8166 1 < 2.2e-16 ***
## genero 65.1967 1 6.778e-16 ***
## rango_edad 710.2503 4 < 2.2e-16 ***
## CMT:temp_media 48.7969 1 2.839e-12 ***
## ---
## Signif. codes: 0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
La interaccón con temperatura media da S. En cuanto al gráfico de perfiles puede verse que se modifican tanto las ordenadas al origen como las pendientes. La probabilidad de AF baja sube mucho cuando hay CMT.
El modelo a correr es el siguiente:
\[ logit(\pi(AF_{Baja})) = \beta_{j0} + \beta_1CMT + \beta_2T_{min} + \beta_3Genero + \beta_4Edad + \beta_5CMT*T_{min} \]
Probados los supuestos se ven los resultados:
## Analysis of Deviance Table (Type II Wald chisquare tests)
##
## Response: nivel_actividad_fisica
## Chisq Df Pr(>Chisq)
## CMT 10.030 1 0.00154 **
## temp_min 97.646 1 < 2.2e-16 ***
## genero 65.241 1 6.627e-16 ***
## rango_edad 711.118 4 < 2.2e-16 ***
## CMT:temp_min 50.548 1 1.163e-12 ***
## ---
## Signif. codes: 0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
Se ven los mismos patrones que con temperatura media.
El modelo a correr es el siguiente:
\[ logit(\pi(AF_{Baja})) = \beta_{j0} + \beta_1CMT + \beta_2T_{max} + \beta_3Genero + \beta_4Edad + \beta_5ICMT*T_{max} \]
Probados los supuestos se ven los resultados:
## Analysis of Deviance Table (Type II Wald chisquare tests)
##
## Response: nivel_actividad_fisica
## Chisq Df Pr(>Chisq)
## CMT 9.848 1 0.0017 **
## temp_max 138.864 1 < 2.2e-16 ***
## genero 64.951 1 7.677e-16 ***
## rango_edad 707.346 4 < 2.2e-16 ***
## CMT:temp_max 34.797 1 3.659e-09 ***
## ---
## Signif. codes: 0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
Mismos patrones quizas con un leve cambio en la pendiente.
El modelo a correr es el siguiente:
\[ logit(\pi(AF_{Baja})) = \beta_{j0} + \beta_1CMT + \beta_2Prec + \beta_3Genero + \beta_4Edad + \beta_5CMT*Prec \]
Probados los supuestos se ven los resultados:
## Analysis of Deviance Table (Type II Wald chisquare tests)
##
## Response: nivel_actividad_fisica
## Chisq Df Pr(>Chisq)
## CMT 13.119 1 0.0002923 ***
## prec_media 14.590 1 0.0001336 ***
## genero 64.355 1 1.039e-15 ***
## rango_edad 703.648 4 < 2.2e-16 ***
## CMT:prec_media 35.788 1 2.200e-09 ***
## ---
## Signif. codes: 0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
Las precipitaciones sí tienen interaccion significativa, y el cambio de pendiente es demasiado claro. En este caso, no tener CMT te hace casi invulnerable al efecto de las precipitaciones.
El modelo a correr es el siguiente:
\[ logit(\pi(AF_{Baja})) = \beta_{j0} + \beta_1Clase + \beta_2T_{media} + \beta_3Genero + \beta_4Edad + \beta_5Clase*T_{media} \]
Ahora se pueden ver los resultados
## Analysis of Deviance Table (Type II Wald chisquare tests)
##
## Response: nivel_actividad_fisica
## Chisq Df Pr(>Chisq)
## clase 182.808 3 < 2.2e-16 ***
## temp_media 93.596 1 < 2.2e-16 ***
## genero 65.765 1 5.081e-16 ***
## rango_edad 316.008 4 < 2.2e-16 ***
## clase:temp_media 57.800 3 1.734e-12 ***
## ---
## Signif. codes: 0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
La interaccón con temperatura media da S. Se puede ver que los menos afectados son CM inactiva y Formados, porque son los más acomodados.
El modelo a correr es el siguiente:
\[ logit(\pi(AF_{Baja})) = \beta_{j0} + \beta_1Clase + \beta_2T_{min} + \beta_3Genero + \beta_4Edad + \beta_5Clase*T_{min} \]
Probados los supuestos se ven los resultados:
## Analysis of Deviance Table (Type II Wald chisquare tests)
##
## Response: nivel_actividad_fisica
## Chisq Df Pr(>Chisq)
## clase 186.701 3 < 2.2e-16 ***
## temp_min 85.695 1 < 2.2e-16 ***
## genero 65.725 1 5.183e-16 ***
## rango_edad 317.360 4 < 2.2e-16 ***
## clase:temp_min 60.103 3 5.587e-13 ***
## ---
## Signif. codes: 0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
Se ven los mismos patrones que con temperatura media, interacción S. Se aprecia que Cm inactiva tiene una pendiente un poco más grande que los formados indicando que son má suceptibles a la temperatura mínima
El modelo a correr es el siguiente:
\[ logit(\pi(AF_{Baja})) = \beta_{j0} + \beta_1Clase + \beta_2T_{max} + \beta_3Genero + \beta_4Edad + \beta_5IClase*T_{max} \]
Probados los supuestos se ven los resultados:
## Analysis of Deviance Table (Type II Wald chisquare tests)
##
## Response: nivel_actividad_fisica
## Chisq Df Pr(>Chisq)
## clase 176.513 3 < 2.2e-16 ***
## temp_max 116.617 1 < 2.2e-16 ***
## genero 65.547 1 5.673e-16 ***
## rango_edad 315.071 4 < 2.2e-16 ***
## clase:temp_max 45.844 3 6.121e-10 ***
## ---
## Signif. codes: 0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
Mismos patrones que antes.
El modelo a correr es el siguiente:
\[ logit(\pi(AF_{Baja})) = \beta_{j0} + \beta_1clase + \beta_2Prec + \beta_3Genero + \beta_4Edad + \beta_5clase*Prec \]
Probados los supuestos se ven los resultados:
## Analysis of Deviance Table (Type II Wald chisquare tests)
##
## Response: nivel_actividad_fisica
## Chisq Df Pr(>Chisq)
## clase 199.619 3 < 2.2e-16 ***
## prec_media 12.838 1 0.0003396 ***
## genero 64.991 1 7.525e-16 ***
## rango_edad 321.026 4 < 2.2e-16 ***
## clase:prec_media 46.491 3 4.460e-10 ***
## ---
## Signif. codes: 0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
Las precipitaciones sí tienen interaccion significativa, y el cambio de pendiente es demasiado claro. En este caso, los formados incluso disminuyen su prob de AF baja conforme aumentan las precipitaciones. Sin embargo, ese resultado puede ser espurio. Lo importante es que se ve la brecha del NSE.
Ahora se procede a agregar la variable de estacionalidad que habla de qué tanto varían las variables climáticas a lo largo del año. Esto es algo que se espera que aumente conforme avanza el cambio climático.
Se procede a probar estas variables de manera aditiva con AF baja como variable respuesta y quintil de ingresos como indicador de NSE. Un modelo para temperatura media y otro para precipitaciones. El primer modelo es el de temperatura:
\[ logit(\pi(AF_{Baja})) = \beta_{j0} + \beta_1Quintil + \beta_2T_{media} + \beta_3Genero + \beta_4Edad + \beta_5Estacionalidad_{T_{media}} + \beta_6Quintil*T_{media} \]
ya que los supuestos dan bien, vemos el modelo por dentro:
## Analysis of Deviance Table (Type II Wald chisquare tests)
##
## Response: nivel_actividad_fisica
## Chisq Df Pr(>Chisq)
## quintil_ingreso 119.3440 4 < 2.2e-16 ***
## temp_media 74.3513 1 < 2.2e-16 ***
## rango_edad 733.7886 4 < 2.2e-16 ***
## genero 53.6599 1 2.384e-13 ***
## est_temp 0.0003 1 0.9871
## quintil_ingreso:temp_media 84.4570 4 < 2.2e-16 ***
## ---
## Signif. codes: 0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
## GVIF Df GVIF^(1/(2*Df))
## quintil_ingreso 1.581952e+05 4 4.465799
## temp_media 5.251141e+00 1 2.291537
## rango_edad 1.046169e+00 4 1.005658
## genero 1.004524e+00 1 1.002259
## est_temp 1.088042e+00 1 1.043093
## quintil_ingreso:temp_media 1.701618e+05 4 4.506691
Se puede ver que la escionalidad da muy NS. Yo creo que hay colinealidad con temperatura media.
Ahora con precipitaciones. El modelo es el siguiente:
\[ logit(\pi(AF_{Baja})) = \beta_{j0} + \beta_1Quintil + \beta_2Prec + \beta_3Genero + \beta_4Edad + \beta_5Estacionalidad_{Prec} + \beta_6Quintil*Prec} \]
ya que los supuestos dan bien, vemos el modelo por dentro:
## Analysis of Deviance Table (Type II Wald chisquare tests)
##
## Response: nivel_actividad_fisica
## Chisq Df Pr(>Chisq)
## quintil_ingreso 130.948 4 < 2.2e-16 ***
## prec_media 15.207 1 9.635e-05 ***
## rango_edad 733.998 4 < 2.2e-16 ***
## genero 52.874 1 3.557e-13 ***
## est_prec 13.176 1 0.0002836 ***
## quintil_ingreso:prec_media 57.166 4 1.142e-11 ***
## ---
## Signif. codes: 0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
## GVIF Df GVIF^(1/(2*Df))
## quintil_ingreso 447.876245 4 2.144839
## prec_media 5.561334 1 2.358248
## rango_edad 1.043915 4 1.005387
## genero 1.004492 1 1.002243
## est_prec 1.297849 1 1.139232
## quintil_ingreso:prec_media 715.919430 4 2.274354
En este caso la estacionalidad de precipitaciones sí da significativa y el VIF de quintil de ingresos se fue a la bosta. En cuanto a los resultados, todo parece estar como antes.
Se prueba un modelo que tenga ambas varaibles en simultáneo. El modelo a probar es el siguiente:
\[ logit(\pi(AF_{Baja})) = \beta_{j0} + \beta_1Quintil + \beta_2Temp + \beta_3Prec + \beta_4Genero + \beta_5Edad \]
ya que los supuestos dan bien, vemos el modelo por dentro:
## Analysis of Deviance Table (Type II Wald chisquare tests)
##
## Response: nivel_actividad_fisica
## Chisq Df Pr(>Chisq)
## quintil_ingreso 106.127 4 < 2.2e-16 ***
## temp_media 136.885 1 < 2.2e-16 ***
## prec_media 65.162 1 6.899e-16 ***
## rango_edad 733.924 4 < 2.2e-16 ***
## genero 53.371 1 2.762e-13 ***
## ---
## Signif. codes: 0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
## GVIF Df GVIF^(1/(2*Df))
## quintil_ingreso 1.078542 4 1.009496
## temp_media 3.388022 1 1.840658
## prec_media 3.334331 1 1.826015
## rango_edad 1.043231 4 1.005304
## genero 1.004180 1 1.002088
Todas las variables dan significativas pero el VIF me indica que puede haber un poco de colinealidad entre temperatura y preciptaciones. No hay gráfico porque no sé cómo graficar esto.
La interacción será entre las variables climáticas y un indicador de NSE, en este caso, quintil de ingresos. El modelo es el siguiente:
\[ logit(\pi(AF_{Baja})) = \beta_{j0} + \beta_1Ingreso + \beta_2T_{media} + \beta_3Edad + \beta_4Genero + \beta_5Prec + \beta_6Ingreso*T_{media} + \beta_7Prec*T_{media} + \beta_8Prec*Ingreso + \beta_9Prec*T_{media}*Ingreso \]
ya que los supuestos dan bien, vemos el modelo por dentro:
## Analysis of Deviance Table (Type II Wald chisquare tests)
##
## Response: nivel_actividad_fisica
## Chisq Df Pr(>Chisq)
## quintil_ingreso 100.9053 4 < 2.2e-16 ***
## temp_media 143.7766 1 < 2.2e-16 ***
## prec_media 62.4586 1 2.721e-15 ***
## rango_edad 743.3380 4 < 2.2e-16 ***
## genero 53.3965 1 2.726e-13 ***
## quintil_ingreso:temp_media 24.4658 4 6.441e-05 ***
## quintil_ingreso:prec_media 1.5063 4 0.8255
## temp_media:prec_media 1.3211 1 0.2504
## quintil_ingreso:temp_media:prec_media 1.4134 4 0.8419
## ---
## Signif. codes: 0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
La interacción triple da NS. y dos dobles tambien.
Como la triple da NS y las preguntas especificas son para la interaccion clima y NSE, se hace un modelo de interacciones dobles entre temp y NSE, y prec y NSE. El modelo es el siguiente:
\[ logit(\pi(AF_{Baja})) = \beta_{j0} +
\beta_1Ingreso + \beta_2T_{media} + \beta_3Edad + \beta_4Genero +
\beta_5Prec + \beta_6Ingreso*T_{media} + \beta_7Ingreso*Prec \]
## Analysis of Deviance Table (Type II Wald chisquare tests)
##
## Response: nivel_actividad_fisica
## Chisq Df Pr(>Chisq)
## quintil_ingreso 104.6779 4 < 2.2e-16 ***
## temp_media 143.7079 1 < 2.2e-16 ***
## prec_media 62.2690 1 2.996e-15 ***
## rango_edad 743.2912 4 < 2.2e-16 ***
## genero 53.5871 1 2.474e-13 ***
## quintil_ingreso:temp_media 25.3148 4 4.348e-05 ***
## quintil_ingreso:prec_media 1.5725 4 0.8137
## ---
## Signif. codes: 0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
Nuevamente la interaccion de precipitaciones con NSE dio NS. Esto significa que el modelo más simple es el siguiente:
\[ logit(\pi(AF_{Baja})) = \beta_{j0} + \beta_1Ingreso + \beta_2T_{media} + \beta_3Edad + \beta_4Genero + \beta_5Prec + \beta_6Ingreso*T_{media} \]
## Analysis of Deviance Table (Type II Wald chisquare tests)
##
## Response: nivel_actividad_fisica
## Chisq Df Pr(>Chisq)
## quintil_ingreso 104.653 4 < 2.2e-16 ***
## temp_media 134.645 1 < 2.2e-16 ***
## prec_media 62.300 1 2.950e-15 ***
## rango_edad 742.898 4 < 2.2e-16 ***
## genero 53.641 1 2.406e-13 ***
## quintil_ingreso:temp_media 82.404 4 < 2.2e-16 ***
## ---
## Signif. codes: 0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
Primero para temperatura media
Esperamos ver una simgmoidea y a decir verdad se ve. No claramente, pero está.
Ahora con precipitaciones:
En este caso, la sigmoidea se pierde bastante.
Para ver el efecto de la estacionalidad interaccionando con el NSE se corre el siguiente modelo:
\[ logit(\pi(AF_{Baja})) = \beta_{j0} +
\beta_1Quintil + \beta_2Est_{Temp} + \beta_3Prec + \beta_4Genero +
\beta_5Edad + \beta_6Quintil*Est_{Temp} \]
## Analysis of Deviance Table (Type II Wald chisquare tests)
##
## Response: nivel_actividad_fisica
## Chisq Df Pr(>Chisq)
## quintil_ingreso 146.8779 4 < 2.2e-16 ***
## est_temp 5.9749 1 0.01451 *
## rango_edad 734.3418 4 < 2.2e-16 ***
## genero 52.0847 1 5.316e-13 ***
## quintil_ingreso:est_temp 6.0711 4 0.19390
## ---
## Signif. codes: 0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
El patron no es claro y además también es dificil de interpretar dado que el concepto de estacionalidad es amplio.
Para ver la colinealidad entre varaibles se corre un modelo aditivo con absolutamente todas las variables tanto ambientales como del NSE. El modelo a correr es el siguiente:
\[ logit(\pi(AF_{Baja})) = \beta_{j0} + \beta_1Quintil + \beta_2Instruccion + \beta_3CMT + \beta_4Edad + \beta_5Genero + \beta_6Temp_{media} + \beta_7Temp_{min} + \beta_8Temp_{max} + \beta_9Est_{temp} + \beta_{10}Prec + \beta_{11}Est_{prec} \]
## GVIF Df GVIF^(1/(2*Df))
## as.numeric(quintil_ingreso) 2.512837 1 1.585193
## as.numeric(nivel_instruccion) 3.288181 1 1.813334
## as.numeric(CMT) 1.340778 1 1.157920
## clase 11.962571 3 1.512298
## as.numeric(rango_edad) 1.795538 1 1.339977
## as.numeric(genero) 1.018034 1 1.008977
## temp_media 515.809807 1 22.711447
## temp_max 60.444432 1 7.774602
## temp_min 229.094904 1 15.135881
## prec_media 16.393020 1 4.048829
## est_temp 4.229851 1 2.056660
## est_prec 5.277679 1 2.297320
Era obvio que lsa temperaturas dieran colineales al igual que las clases porque es un resumen del resto de varaibles del NSE. También, la estacionalidad de precipitaciones dio colinealidad lo cual es logico.
Se prueba la función ggpairs para obtener la matriz de correlacion entre las variables
Las correlaciones más claras pueden verse en las temperaturas. Un poco tambien hay entre las precipitaciones y las temperaturas.
Se calculan los porcentajes de AF baja para cada provincia y se grafican en función de la temperatura
##
## Call:
## lm(formula = logit_AF ~ t_mean, data = df_prov)
##
## Residuals:
## Min 1Q Median 3Q Max
## -0.87211 -0.28846 0.04931 0.22801 0.55430
##
## Coefficients:
## Estimate Std. Error t value Pr(>|t|)
## (Intercept) -0.77471 0.28519 -2.716 0.0126 *
## t_mean 0.04088 0.01797 2.275 0.0330 *
## ---
## Signif. codes: 0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
##
## Residual standard error: 0.4052 on 22 degrees of freedom
## Multiple R-squared: 0.1905, Adjusted R-squared: 0.1537
## F-statistic: 5.176 on 1 and 22 DF, p-value: 0.03299
Si corremos un modelo lineal, si bien la temperatura da significativa, el R^2 de bondad de ajuste da 0.1537 lo cual es BAJÍSMO.
En un modelo lineal, al parecer no habría linealidad entre el logit de AF baja y temperatura. Sin embargo, no entiendo cómo esto nos ayuda a probar el supuesto de linealidad porque estamos sacando la prevalencia por provincia y nosotros nunca tuvimos a provincia en el modelo. Esto no me parece demostrativo de la linealidad.
No se detectan patrones fuertes lo cual es algo bueno. Estaría indicando que la linealidad existe, o por lo menos, que no puede ser descartada.
Se va a partir la base de datos en los más jovenes y los más viejos para correr los mismos análisis. La idea es versi hay patrones que cambian dependiendo del rango etario (como una interacción).
El modelo a correr es el mismo en los dos casos, y es el siguiente:
\[ logit(\pi(AF_{Baja})) = \beta_{j0} + \beta_1Quintil + \beta_2Temp + \beta_3Genero + \beta_4Temp*Quintil \]
Notar que ya no está más la variable Edad porque la estamos controlando con la estratificación
Ya verificados los supuestos, podemos ver los resultados
## Analysis of Deviance Table (Type II Wald chisquare tests)
##
## Response: nivel_actividad_fisica
## Chisq Df Pr(>Chisq)
## quintiles 3.5051 4 0.4771
## temp_media 17.4647 1 2.927e-05 ***
## genero 59.7487 1 1.078e-14 ***
## quintiles:temp_media 12.7430 4 0.0126 *
## ---
## Signif. codes: 0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
Notar cómo ocurre un cambio de pendiente en el quintil 5. Es como si el factor de riesgo volviera a aumentar con la tempertarua de manera similar al quintil 2. <– esto era antes, ahora se corrigió al hacer los quintiles DENTRO de los pibes de 18 a 24 años.
Probando ahora con los adultos
Y ahora vemos los resultados
## Analysis of Deviance Table (Type II Wald chisquare tests)
##
## Response: nivel_actividad_fisica
## Chisq Df Pr(>Chisq)
## quintiles 15.7132 4 0.003429 **
## temp_media 38.2764 1 6.140e-10 ***
## genero 1.3954 1 0.237492
## quintiles:temp_media 24.0517 4 7.799e-05 ***
## ---
## Signif. codes: 0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
Interesante notar como el genero casi no presenta diferencias en este rango etario en cuanto a la AF según quintiles. Sin embargo, el patron general y la interaccion clima-NSE sigue estando bien presente.
Ahora se hace lo mismo pero con este rango etario
## Analysis of Deviance Table (Type II Wald chisquare tests)
##
## Response: nivel_actividad_fisica
## Chisq Df Pr(>Chisq)
## quintiles 26.635 4 2.356e-05 ***
## temp_media 7.844 1 0.005099 **
## genero 28.798 1 8.033e-08 ***
## quintiles:temp_media 11.897 4 0.018133 *
## ---
## Signif. codes: 0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
Lo que se puede observar es que el patrón es esencialmente el mismo para los rangos etarios más extremos. Sin embargo, algo curioso sucee entre los quintiles 4 y 5 de los más jovenes porque puee verse que la relacion se invierte.