Análisis de datos de COVID-19 en México, impacto de la movilidad de las personas sobre los contagios, impacto sobre la movilidad urbana sobre la calidad del aire
Paquetes a utilizar
library(pacman)
p_load(rmdformats,readr,readxl,ggplot2,plotly,DT,xfun,gridExtra,leaflet)
Importar datos
setwd("~/Documents/APLICADA")
CM <- read_excel("Concentracion_Mov.xlsx")
datatable(CM)
Origen de los datos
content <- paste(sep = "<br/>",
"<b><a href='https://www.ruoa.unam.mx/index.php?page=estaciones&id=6#datos'>ERNO</a></b>","Lng: -110.9706, Lat: 29.0814")
m <- leaflet() %>%
addTiles() %>%
addMarkers(lng=-110.9706, lat= 29.0814, popup= content)
m
Analisis explratorio de datos
Empezamos este análisis utulizando una matriz de diagramas de dispersión
Cual de las variables de movilidad afectan mas a la incidencia de contaminantes atmosféricos?
Nuestra hipótesis es que a medida que las personas aumemtan su estadÃa en sus casas (y por consecuente no usan su automovil o el transporte público) los contaminantes atmosféricos bajan su concentración
pairs(CM)
Serie de tiempo de los datos
Para entender como serie de tiempo la movilidad de google VS los contaminantes de la estacion ERNO, haremos un grafico interactivo con GGPPLOT2
movilidad <- ggplot(CM) +
geom_line(aes(x=Fecha,y=Reactivacion_Comercial,colour="Recreación y comercio")) +
geom_line(aes(x=Fecha,y=Supermercado_Farmacia,colour="Abarrotes y farmacias")) +
geom_line(aes(x=Fecha,y=Parques_Centros,colour="Parques")) +
geom_line(aes(x=Fecha,y=Estaciones_Transito,colour="Estaciones de tránsito")) +
geom_line(aes(x=Fecha,y=Lugares_Trabajo,colour="Lugares de trabajo"))+
geom_line(aes(x=Fecha,y=Residencia,colour="Lugares residenciales")) +
labs(title="Reporte de movilidad",x="Fecha",y="Procentaje de cambio de movilidad")
ggplotly(movilidad)
Descarga de los datos
- Datos de concentracion de contaminantes y de movilidad
xfun::embed_file("Concentracion_Mov.xlsx")