Caso de estudio de análisis del efecto de la movilidad de personas en la contaminación atmosférica y la incidencia de casos de contagio de COVID-19
Paquetes
library(pacman)
p_load(rmdformats,readr,readxl,ggplot2,plotly,DT,xfun,gridExtra,leaflet,TSstudio)
Importar datos
setwd("~/ESTADISTICA")
CM <- read_excel("Concentracion_Mov_.xlsx")
datatable(CM)
Caso de estudio
La gestión de la contaminación del aire se ha vuelto importante en el último periodo debido a las siguientes afirmaciones: “A causa del desarrollo industrial y avance tecnológico se estima aproximadamente 1200 millones de personas están expuestas a niveles de dióxido de azufre (SO2), muy por encima de por directrices de la Organización Mundial de la Salud (OMS) y aproximadamente 1400 millones de personas están expuestas a niveles excesivos de humo y material articulado (PM)” (Rico, 2018).
La importancia de respirar aire limpio sin contaminantes es crucial para todo ser viviente. Por lo cual es importante que este sea aire limpio, pero ¿Cómo detectar si el aire que respiramos no tiene contaminantes? ¿Cómo nos afecta a nosotros?. La calidad del aire está directamente relacionada con la movilidad de carros, autobuses y hasta la propia movilidad de la ciudad, donde las personas realizan sus actividades diarias, por lo tanto, entre más movilidad haya en la ciudad, aumentan los contaminantes en el aire.
Los principales contaminantes en el aire han sido creados principalmente por la actividad económica humana, la concentración de estas sustancias es altamente nociva para la salud del ser humano. Este estudio tuvo en cuenta los siguientes contaminantes:
- Material particulado \((PM10)\)
- Ozono \((O_3)\)
- Dióxido de nitrógeno \((NO_2)\)
- Dióxido de azufre \((SO_2)\)
Fuente de de los datos
Los datos de contaminantes atmosfericos provienen de la estacion de calidad del aire de la ERNO del instituto de geologia de la unam ubicado en Hermosillo. Podemos visitar el origen de los datos aqui: http://www.erno.geologia.unam.mx
La estación de calidade del aire se encuentra ubicada en el siguiente mapa interactivo:
Ubicación de donde se obtuvieron los datos
content <- paste(sep = "<br/>",
"<b><a href='https://www.ruoa.unam.mx/index.php?page=estaciones&id=6#datos'>ERNO</a></b>","Lng: -110.9706, Lat: 29.0814")
m <- leaflet() %>%
addTiles() %>%
addMarkers(lng=-110.9706, lat= 29.0814, popup= content)
m
- La contaminación del aire es el principal riesgo ambiental para la salud pública en las Américas.
- En todo el mundo, cerca de 7 millones de muertes prematuras fueron atribuibles a la contaminación del aire ambiental en 2016. Alrededor del 88% de estas muertes ocurren en países de ingresos bajos y medios.
- Más de 150 millones de personas en América Latina viven en ciudades que exceden las Guías de Calidad del Aire de la OMS.
- La exposición a altos niveles de contaminación del aire puede causar una variedad de resultados adversos para la salud: aumenta el riesgo de infecciones respiratorias, enfermedades cardiacas, derrames cerebrales y cáncer de pulmón, las cuales afectan en mayor proporción a población vulnerable, niños, adultos mayores y mujeres.
- La contaminación del aire en el hogar se asocia al uso de combustibles y prácticas de cocina ineficiente
Regresión Lineal Múltiple
La regresión lineal múltiple permite generar un modelo lineal en el que el valor de la variable dependiente o respuesta (Y) se determina a partir de un conjunto de variables independientes llamadas predictores \((X_1, X_2, X_3…)\). Los modelos de regresión múltiple pueden emplearse para predecir el valor de la variable dependiente o para evaluar la influencia que tienen los predictores sobre ella (esto último se debe que analizar con cautela para no malinterpretar causa-efecto). (Rodrigo, 2016)
Los modelos lineales múltiples siguen la siguiente ecuación:
\[ Y_{i}=(\beta_{0}+\beta_{1}X_{1i}+\beta_{2}X_{2i}+\cdots+\beta_{n}X_{ni})+e_{i} \] ## Movilidad de personas en Sonora
Para esto estamos usando datos de google mobility report, que pueden ser encontrados con su documentacion aqui: https://www.google.com/covid19/mobility/
movilidad <- ggplot(CM) +
geom_line(aes(x=Fecha,y=Reactivacion_Comercial,colour="Recreación y comercio"))+
geom_line(aes(x=Fecha,y=Supermercado_Farmacia,colour="Supermercados y farmacias"))+
geom_line(aes(x=Fecha,y=Parques_Centros,colour="Parques"))+
geom_line(aes(x=Fecha,y=Estaciones_Transito,colour="Estaciones de tránsito"))+
geom_line(aes(x=Fecha,y=Lugares_Trabajo,colour="Lugares de trabajo"))+
geom_line(aes(x=Fecha,y=Residencia,colour="Lugares residenciales"))+
labs(title="Reporte de movilidad",x="Fecha",y="Procentaje de cambio de movilidad")
ggplotly(movilidad)
A finales del mes de marzo hay un gran cambio en la movilidad aumentando el porcentaje de movilidad en residencia, esto sucedió, ya que fue cuando empezó a haber demasiados casos de covid confirmados al igual que las defunciones por covid se hacían más notorias por lo cual este género miedo en todas las personas y como consecuencia las personas optaron por mantenerse en sus casas, por otra parte los lugares de trabajo, parques y la variable de reactivación comercial bajaron, ya que parques y reactivación comercial no es una necesidad como tal, y la movilidad de trabajo bajo demasiado porque se optó por el trabajo de manera remota en los que fue posible hacerlo de esa manera claro esta, pero no sucede lo mismo con la movilidad de supermercados y farmacias, por la razón que son 2 cosas que realmente necesitamos para vivir básicamente.
Pero a partir del mes de junio la movilidad de las variables de movilidad como lo son parques, reactivación comercial, lugares de trabajo, supermercado-farmacia toman una tendencia ascendente esto provocado porque a partir del 1 de junio de 2020 se inició una etapa de reapertura socioeconómica lo que conlleva también regreso a centros de trabajo bajo protocolos de seguridad sanitaria si la empresa consideraba necesario el regreso presencial de algunos de sus elementos, mientras que la movilidad de residencia toma una tendencia descendente en relación con lo antes mencionado, de la reactivación socioeconómica y que más personas salían más frecuentemente de sus residencias para acudir a trabajar.
Entender la relacion entre la dispersion cruzada de los datos
Matriz de diagramas de dispersion
pairs(CM)