AE5UC2_13

Equipo 5: Christian Acedo, Paulina Cortez, Jaime Valenzuela, Dianey Velasquez

10/28/2021

Caso de estudio de análisis del efecto de la movilidad de personas en la contaminación atmosférica y la incidencia de casos de contagio de COVID-19.

Paquetes

library(pacman)
p_load(rmdformats,readr,readxl,ggplot2,plotly,DT,xfun,gridExtra,leaflet,TSstudio)

Importar datos

CM <- read_excel("Concentracion_MovEx.xlsx")
datatable(CM)

Caso de estudio

La gestión de la contaminación del aire se ha vuelto importante en el último periodo debido a las siguientes afirmaciones: “A causa del desarrollo industrial y avance tecnológico se estima aproximadamente 1200 millones de personas están expuestas a niveles de dióxido de azufre (SO2), muy por encima de por directrices de la Organización Mundial de la Salud (OMS) y aproximadamente 1400 millones de personas están expuestas a niveles excesivos de humo y material articulado (PM)” (Rico, 2018).

La importancia de respirar aire limpio sin contaminantes es crucial para todo ser viviente. Por lo cual es importante que este sea aire limpio, pero ¿Cómo detectar si el aire que respiramos no tiene contaminantes? ¿Cómo nos afecta a nosotros?. La calidad del aire está directamente relacionada con la movilidad de carros, autobuses y hasta la propia movilidad de la ciudad, donde las personas realizan sus actividades diarias, por lo tanto, entre más movilidad haya en la ciudad, aumentan los contaminantes en el aire.

Los principales contaminantes en el aire han sido creados principalmente por la actividad económica humana, la concentración de estas sustancias es altamente nociva para la salud del ser humano. Este estudio tuvo en cuenta los siguientes contaminantes:

  • Material particulado \((PM10)\)
  • Ozono \((O3)\)
  • Dióxido de nitrógeno \((NO2)\)
  • Dióxido de azufre \((SO2)\)

Fuente de de los datos

Los datos de contaminantes atmosfericos provienen de la estacion de calidad del aire de la ERNO del instituto de geologia de la unam ubicado en Hermosillo. Podemos visitar el origen de los datos aqui: http://www.erno.geologia.unam.mx

La estación de calidade del aire se encuentra ubicada en el siguiente mapa interactivo:

Ubicación de donde se obtuvieron los datos

content <- paste(sep = "<br/>",
  "<b><a href='https://www.ruoa.unam.mx/index.php?page=estaciones&id=6#datos'>ERNO</a></b>","Lng: -110.9706, Lat: 29.0814")


m <- leaflet() %>%
  addTiles() %>%  
  addMarkers(lng=-110.9706, lat= 29.0814, popup= content)

m
  • La contaminación del aire es el principal riesgo ambiental para la salud pública en las Américas.
  • En todo el mundo, cerca de 7 millones de muertes prematuras fueron atribuibles a la contaminación del aire ambiental en 2016. Alrededor del 88% de estas muertes ocurren en países de ingresos bajos y medios.
  • Más de 150 millones de personas en América Latina viven en ciudades que exceden las Guías de Calidad del Aire de la OMS.
  • La exposición a altos niveles de contaminación del aire puede causar una variedad de resultados adversos para la salud: aumenta el riesgo de infecciones respiratorias, enfermedades cardiacas, derrames cerebrales y cáncer de pulmón, las cuales afectan en mayor proporción a población vulnerable, niños, adultos mayores y mujeres.
  • La contaminación del aire en el hogar se asocia al uso de combustibles y prácticas de cocina ineficiente.

Regresión lineal multiple

La regresión lineal múltiple permite generar un modelo lineal en el que el valor de la variable dependiente o respuesta (Y) se determina a partir de un conjunto de variables independientes llamadas predictores \((X1,X2,X3…)\). Los modelos de regresión múltiple pueden emplearse para predecir el valor de la variable dependiente o para evaluar la influencia que tienen los predictores sobre ella (esto último se debe que analizar con cautela para no malinterpretar causa-efecto). (Rodrigo, 2016)

Los modelos lineales múltiples siguen la siguiente ecuación:

\[Yi=(β0+β1X1i+β2X2i+⋯+βnXni)+ei\]

Movilidad de personas en sonora:

Para esto estamos usando datos de google mobility report, que pueden ser encontrados con su documentacion aqui: https://www.google.com/covid19/mobility/

movilidad <- ggplot(CM) +
  geom_line(aes(x=Fecha,y=Reactivacion_Comercial,colour="Recreación y comercio"))+
    geom_line(aes(x=Fecha,y=Supermercado_Farmacia,colour="Supermercados y farmacias"))+
    geom_line(aes(x=Fecha,y=Parques_Centros,colour="Parques"))+
    geom_line(aes(x=Fecha,y=Estaciones_Transito,colour="Estaciones de tránsito"))+
    geom_line(aes(x=Fecha,y=Lugares_Trabajo,colour="Lugares de trabajo"))+
    geom_line(aes(x=Fecha,y=Residencia,colour="Lugares residenciales"))+
    labs(title="Reporte de movilidad",x="Fecha",y="Porcentaje de cambio de movilidad")
ggplotly(movilidad)

Entender la relacion entre la dispersion cruzada de los datos

Matriz de diagramas de dispersion

pairs(CM)

La matriz de correlación es una tabla que nos permite conocer los coeficientes de conexión entre los factores, los cuales miden el grado de relación lineal entre cada par de elementos. En la anterior matriz de correlación se observa que la variable correspondiente al covid-19 está mayormente relacionada con el SO2, es decir con el dióxido de azufre. La correlación entre este contaminante y el covid-19 se debe a que existe una gran propabilidad de contagio y hospitalización cuando existe una mayor cantidad de dioxido de azufre en el ambiente. Por otro lado, la variables correspondientes a residencia y lugares de trabajo están más relacionadas al covid que variables como supermercados o parques, esto debido a que en estos lugares es más difícil de conservar las medidas de preveención. El gráfico de correlación de múltiples variables, realizado con la función pairs, corresponde a la representación gráfica de la matriz de correlación, por lo tanto, nos permite conocer el grado de relación que existe ente las variables.

Análisis y conclusiones

A inicios del mes de abril se muestra el mayor porcentaje de cambio de movilidad en lugares residenciales, esto se debe a que empezaron a notarse los brotes de este virus y en consecuencia las defunciones que este ocasionó, aun cuando apenas se llevaba un mes de pandemia. También se puede observar que la movilidad tanto en los parques como en lugares de recreación y comercio disminuyó demasiado en esos días. Sin embargo, la movilidad en supermercados y farmacias se mantuvieron estables puesto que las visitas a estos lugares eran indispensables para la supervivencia. Igualmente se observa cómo bajó la movilidad en los lugares de trabajo y esto se debió a que los trabajos se empezaron a realizar desde los hogares.

En el mes de julio no se notó una variación importante al los meses anteriores, pero podemos observar que cada una de estas tiene una ligera tendencia ascendente, en específico podemos observar que los lugares de trabajo se estaban incrementando poco a poco debido a la gradual reactivación económica. Por el contrario la gente empezó a confiarse de este problema y se ve una ligera disminución en la movilidad de las zonas residenciales.

Posterior a estos meses entró la época decembrinas, y como era de esperarse hubo una varianza considerable en la movilidad de todos los factores, la movilidad en los lugares residenciales disminuyó evidenciando así, como se esperaba un aumento en la movilidad de las personas, como puede ser en los supermercados, lugares de recreación, comercio y las estaciones de tránsito como por ejemplo centrales de autobuses y aeropuertos, esto puede ser debido a que las personas viajen a ver a sus familias o fiestas de fin de año y buscan un pasatiempo. También podemos observar que hubo cuatro picos significativos en la movilidad de los lugares de trabajo, debido a puentes o días de asueto, remarcando el día de la independencia, navidad y año nuevo.

A finales del mes de enero, se puede notar que el movimiento en los parques, estaciones de tránsito, supermercados y farmacias tienen un comportamiento similar, ya que todos estos muestran una disminución en la movilidad, esto es debido a que por estas fecha hubo otro brote del COVID-19, ocasionando por los contagios ocurridos en el mes de diciembre debido al incumplimiento de las normas sanitarias en las personas.

Desde principios del mes de febrero en adelante podemos observar un aumento síncrono en la movilización de las personas, esto debido a que poco a poco más gente se fue vacunando, haciendo que la movilización aumente y por ende la reactivación económica se estaba viendo cada vez más presente. Se ve un pico en la movilización de los supermercados y farmacias ya que la gente estaba empezando a salir más de sus hogares y la normalidad se sentía cada vez más cerca. En cambio la variable de lugares de trabajo disminuyó dramáticamente en abril, esto debido al aumento de desempleados, ya que las empresas se vieron en la necesidad de reducir costos a raíz de la pandemia.

Descargar el código

xfun::embed_file("multiple.Rmd")

Download multiple.Rmd

Descargar los datos

xfun::embed_file("Concentracion_MovEx.xlsx")

Download Concentracion_MovEx.xlsx