Caso de estudio de análisis del efecto de la movilidad de personas en la contaminación atmosférica y la incidencia de casos de contagio de COVID-19
Paquetes
library(pacman)
p_load("rmdformats","readr","readxl","ggplot2","plotly","DT","xfun","gridExtra","leaflet", "base64enc", "htmltools", "mime", "xfun", "prettydoc","readr", "knitr","DT","dplyr", "gganimate","gifski","scales")
library(DT)
library(readxl)
library(pacman)
p_load(rmdformats,readr,readxl,ggplot2,plotly,DT,xfun,gridExtra,leaflet,TSstudio)
## also installing the dependencies 'TTR', 'SparseM', 'RcppEigen', 'quadprog', 'quantmod', 'hts', 'iterators', 'BH', 'fracdiff', 'lmtest', 'tseries', 'urca', 'RcppArmadillo', 'thief', 'doParallel', 'foreach', 'globals', 'listenv', 'parallelly', 'anytime', 'forecast', 'forecastHybrid', 'future', 'future.apply', 'lubridate', 'reshape2', 'tsibble', 'xts', 'zoo'
## Warning: unable to access index for repository http://www.stats.ox.ac.uk/pub/RWin/bin/windows/contrib/4.1:
## cannot open URL 'http://www.stats.ox.ac.uk/pub/RWin/bin/windows/contrib/4.1/PACKAGES'
## package 'TTR' successfully unpacked and MD5 sums checked
## package 'SparseM' successfully unpacked and MD5 sums checked
## package 'RcppEigen' successfully unpacked and MD5 sums checked
## package 'quadprog' successfully unpacked and MD5 sums checked
## package 'quantmod' successfully unpacked and MD5 sums checked
## package 'hts' successfully unpacked and MD5 sums checked
## package 'iterators' successfully unpacked and MD5 sums checked
## package 'BH' successfully unpacked and MD5 sums checked
## package 'fracdiff' successfully unpacked and MD5 sums checked
## package 'lmtest' successfully unpacked and MD5 sums checked
## package 'tseries' successfully unpacked and MD5 sums checked
## package 'urca' successfully unpacked and MD5 sums checked
## package 'RcppArmadillo' successfully unpacked and MD5 sums checked
## package 'thief' successfully unpacked and MD5 sums checked
## package 'doParallel' successfully unpacked and MD5 sums checked
## package 'foreach' successfully unpacked and MD5 sums checked
## package 'globals' successfully unpacked and MD5 sums checked
## package 'listenv' successfully unpacked and MD5 sums checked
## package 'parallelly' successfully unpacked and MD5 sums checked
## package 'anytime' successfully unpacked and MD5 sums checked
## package 'forecast' successfully unpacked and MD5 sums checked
## package 'forecastHybrid' successfully unpacked and MD5 sums checked
## package 'future' successfully unpacked and MD5 sums checked
## package 'future.apply' successfully unpacked and MD5 sums checked
## package 'lubridate' successfully unpacked and MD5 sums checked
## package 'reshape2' successfully unpacked and MD5 sums checked
## package 'tsibble' successfully unpacked and MD5 sums checked
## package 'xts' successfully unpacked and MD5 sums checked
## package 'zoo' successfully unpacked and MD5 sums checked
## package 'TSstudio' successfully unpacked and MD5 sums checked
##
## The downloaded binary packages are in
## C:\Users\Josue\AppData\Local\Temp\RtmpQ5WqJG\downloaded_packages
##
## TSstudio installed
Importar datos
setwd("~/R/ESTADISTICA")
CM <- read_excel("Concentracion_Mov.xlsx")
datatable(CM)
Caso de estudio
La gestión de la contaminación del aire se ha vuelto importante en el último periodo debido a las siguientes afirmaciones: “A causa del desarrollo industrial y avance tecnológico se estima aproximadamente 1200 millones de personas están expuestas a niveles de dióxido de azufre (SO2), muy por encima de por directrices de la Organización Mundial de la Salud (OMS) y aproximadamente 1400 millones de personas están expuestas a niveles excesivos de humo y material articulado (PM)” (Rico, 2018).
La importancia de respirar aire limpio sin contaminantes es crucial para todo ser viviente. Por lo cual es importante que este sea aire limpio, pero ¿Cómo detectar si el aire que respiramos no tiene contaminantes? ¿Cómo nos afecta a nosotros?. La calidad del aire está directamente relacionada con la movilidad de carros, autobuses y hasta la propia movilidad de la ciudad, donde las personas realizan sus actividades diarias, por lo tanto, entre más movilidad haya en la ciudad, aumentan los contaminantes en el aire.
Los principales contaminantes en el aire han sido creados principalmente por la actividad económica humana, la concentración de estas sustancias es altamente nociva para la salud del ser humano. Este estudio tuvo en cuenta los siguientes contaminantes:
- Material particulado \((PM10)\)
- Ozono \((O_3)\)
- Dióxido de nitrógeno \((NO_2)\)
- Dióxido de azufre \((SO_2)\)
Fuente de de los datos
Los datos de contaminantes atmosfericos provienen de la estacion de calidad del aire de la ERNO del instituto de geologia de la unam ubicado en Hermosillo. Podemos visitar el origen de los datos aqui: http://www.erno.geologia.unam.mx
La estación de calidade del aire se encuentra ubicada en el siguiente mapa interactivo:
Ubicación de donde se obtuvieron los datos
content <- paste(sep = "<br/>",
"<b><a href='https://www.ruoa.unam.mx/index.php?page=estaciones&id=6#datos'>ERNO</a></b>","Lng: -110.9706, Lat: 29.0814")
m <- leaflet() %>%
addTiles() %>%
addMarkers(lng=-110.9706, lat= 29.0814, popup= content)
m
- La contaminación del aire es el principal riesgo ambiental para la salud pública en las Américas.
- En todo el mundo, cerca de 7 millones de muertes prematuras fueron atribuibles a la contaminación del aire ambiental en 2016. Alrededor del 88% de estas muertes ocurren en países de ingresos bajos y medios.
- Más de 150 millones de personas en América Latina viven en ciudades que exceden las Guías de Calidad del Aire de la OMS.
- La exposición a altos niveles de contaminación del aire puede causar una variedad de resultados adversos para la salud: aumenta el riesgo de infecciones respiratorias, enfermedades cardiacas, derrames cerebrales y cáncer de pulmón, las cuales afectan en mayor proporción a población vulnerable, niños, adultos mayores y mujeres.
- La contaminación del aire en el hogar se asocia al uso de combustibles y prácticas de cocina ineficiente
Regresión Lineal Múltiple
La regresión lineal múltiple permite generar un modelo lineal en el que el valor de la variable dependiente o respuesta (Y) se determina a partir de un conjunto de variables independientes llamadas predictores \((X_1, X_2, X_3…)\). Los modelos de regresión múltiple pueden emplearse para predecir el valor de la variable dependiente o para evaluar la influencia que tienen los predictores sobre ella (esto último se debe que analizar con cautela para no malinterpretar causa-efecto). (Rodrigo, 2016)
Los modelos lineales múltiples siguen la siguiente ecuación:
\[ Y_{i}=(\beta_{0}+\beta_{1}X_{1i}+\beta_{2}X_{2i}+\cdots+\beta_{n}X_{ni})+e_{i} \]
Contagios de COVID-19 diarios en México
Fecha <- seq(from = as.Date("2020-02-15"), to = as.Date("2021-05-06"), by = "day" )
gcov <- ggplot(data = CM) +
geom_line(aes(Fecha, CM$covid, colour="Confirmados")) +
xlab("Fecha") +
ylab("COVID-19 en México") +
labs(colour="casos")+
ggtitle("Casos de COVID-19 en México") +
scale_y_continuous(labels = comma)
ggplotly(gcov)
## Warning: Use of `CM$covid` is discouraged. Use `covid` instead.
En esta gráfica podemos notar como han ido aumentando los casos de covid diarios en el periodo Febrero 2020-Mayo 2021 y ver los picos de contagio claramente, estos se encuentran en las fechas de vacaciones de verano asi como a principios de año, estos se debe a que las personas tienden a juntarse en esas fechas.
Movilidad de personas en Sonora
Para esto estamos usando datos de google mobility report, que pueden ser encontrados con su documentacion aqui: https://www.google.com/covid19/mobility/
movilidad <- ggplot(CM) +
geom_line(aes(x=Fecha,y=Reactivacion_Comercial,colour="Recreación y comercio"))+
geom_line(aes(x=Fecha,y=Supermercado_Farmacia,colour="Supermercados y farmacias"))+
geom_line(aes(x=Fecha,y=Parques_Centros,colour="Parques"))+
geom_line(aes(x=Fecha,y=Estaciones_Transito,colour="Estaciones de tránsito"))+
geom_line(aes(x=Fecha,y=Lugares_Trabajo,colour="Lugares de trabajo"))+
geom_line(aes(x=Fecha,y=Residencia,colour="Lugares residenciales"))+
labs(title="Reporte de movilidad",x="Fecha",y="Procentaje de cambio de movilidad")
ggplotly(movilidad)
Podemos ver como al principio la movilidad es bastante normal ya que no hay una gran varianza entre los dias, sin embargo, a partir de mediados de marzo esto cambia, ya que se puede ver un gran aumento en supermercados, farmacias y estaciones de tránsito, esto se debe a que en esas fechas comenzaron a aumentar los casos de covid en México, por lo que es normal que las peronas quisieran comprar alimentos ya que habia miedo de salir de casa y las estaciones de tránsito ya que las personas que estaban fuera de su ciudad querian regresar rápido, sin embargo la movilidad en estaciones de tránsito duro poco, ya que esta disminuyo rápidamente. También por estas fechas es cuando disminuyo la movilidad en parques, lugares de trabajo, recreativos y comercio, esto debido igualmente a el comienzo de los contagios de covid en México. Además podemos notar que las personas comenzaron a quedarse en casa mas tiempo.
Después de los picos iniciales todo se estabilizo, sin embargo se puede notar como las personas comenzaban a salir mas cada vez, esto se puede ver ya que a la vez que la movilidad en las casas baja, las otras variables aumentan, una cosa muy interesante es que las variables de los lugares residenciales y lugares de trabajo estan mur relacionadas, ya que cuando la variable de los lugares residenciales baja, la de lugares de trabajo sube, esto obviamente es debido a que cuando las personas van a trabajar tienen que salir de su hogar.
Algo que esta muy claro es que los contagios de covid hacen que las personas cambien su manera de moverse, sin embargo esto a veces no es suficiente para evitar que las personas salgan, ya que podemos ver que en fechas navideñas las personas no les importo que hubiera pandemia y se juntaron una gran cantidad de personas en estaciones de tránsito, esto con el objetivo de ir con familiares por las fechas que eran. Y unos dias despues de que esto pasara, podemos ver como se dispara la movilidad en farmacias, ya que hubo muchos contagios debido a estas fechas navideñas.
También podemos ver como en el pico de contagios mas grande la personas evitaron ir a parques y estaciones de tránsito, aunque esto nuevamente no dura mucho ya que las personas nuevamente comienzan a ir a estos lugares poco a poco, este comportamiento se repite bastante ya que las personas no quieren aprender la lección.
Contaminantes atmosféricos
plot_ly(CM,colors = rainbow(3)) %>%
add_lines(x = ~Fecha, y = ~O3,mode="lines",name = "O3") %>%
add_lines(x = ~Fecha, y = ~SO2,mode="lines", name = "SO2") %>%
add_lines(x = ~Fecha, y = ~PM10,mode="lines", name ="PM10") %>%
rangeslider() %>%
layout(title = 'Contaminantes atmosféricos (concentraciones)',
xaxis = list(title = 'Fecha'),
yaxis = list(title = 'Concentración (ppb para O3 y SO2, ug/m3 para PM10)'))
Podemos ver como los contaminantes atmosféricos eran bastante altos, pero con la llegada del covid a México y ya que las personas dejaron de salir tanto a las calles, estos bajaron drasticamente, esto nos deja bien en claro que la principal razón de los contaminantes atmosféricos son los humanos, esto se nos demuestra una vez más ya que cada vez que la movilidad en lugares recreativos y de comercio aumentan tambien lo hacen los contaminantes atmosféricos y cuando disminuyen también.
Entender la relacion entre la dispersion cruzada de los datos
Matriz de diagramas de dispersion
pairs(CM)
Aqui hacemos un diagrama de dispersión de los todas las variables en el que podemos ver como las variables que estan mas correlacionadas tienen una forma de diagonal que aumenta en el eje x y en el eje y en la misma medida.