AE4UC2_12

Equipo 5: Christian Acedo, Paulina Cortez, Jaime Valenzuela, Dianey Velasquez

10/22/2021

## Se importan paquetes y librerias.
setwd("~/ESTADISTICA") #Directorio de trabajo
library(pacman) #para importar la biblioteca "pacman"
p_load(markdown,knitr,dplyr,tidyr,tidyverse,hashmap,lubridate,summarytools,ggpubr,kableExtra,reshape2,gridExtra,
       sf,tmap,readr,devtools,ploty,Rcpp,gganimate,gifski,Hmisc)
## Installing package into 'C:/Users/dany3/OneDrive/Documentos/R/win-library/4.1'
## (as 'lib' is unspecified)
## Warning: package 'hashmap' is not available for this version of R
## 
## A version of this package for your version of R might be available elsewhere,
## see the ideas at
## https://cran.r-project.org/doc/manuals/r-patched/R-admin.html#Installing-packages
## Warning: unable to access index for repository http://www.stats.ox.ac.uk/pub/RWin/bin/windows/contrib/4.1:
##   no fue posible abrir la URL 'http://www.stats.ox.ac.uk/pub/RWin/bin/windows/contrib/4.1/PACKAGES'
## Warning: 'BiocManager' not available.  Could not check Bioconductor.
## 
## Please use `install.packages('BiocManager')` and then retry.
## Warning in p_install(package, character.only = TRUE, ...):
## Warning in library(package, lib.loc = lib.loc, character.only = TRUE,
## logical.return = TRUE, : there is no package called 'hashmap'
## Installing package into 'C:/Users/dany3/OneDrive/Documentos/R/win-library/4.1'
## (as 'lib' is unspecified)
## Warning: package 'ploty' is not available for this version of R
## 
## A version of this package for your version of R might be available elsewhere,
## see the ideas at
## https://cran.r-project.org/doc/manuals/r-patched/R-admin.html#Installing-packages
## Warning: unable to access index for repository http://www.stats.ox.ac.uk/pub/RWin/bin/windows/contrib/4.1:
##   no fue posible abrir la URL 'http://www.stats.ox.ac.uk/pub/RWin/bin/windows/contrib/4.1/PACKAGES'
## Warning: 'BiocManager' not available.  Could not check Bioconductor.
## 
## Please use `install.packages('BiocManager')` and then retry.
## Warning in p_install(package, character.only = TRUE, ...):
## Warning in library(package, lib.loc = lib.loc, character.only = TRUE,
## logical.return = TRUE, : there is no package called 'ploty'
## Warning in p_load(markdown, knitr, dplyr, tidyr, tidyverse, hashmap, lubridate, : Failed to install/load:
## hashmap, ploty
datos <- read.csv("Concentracion_Mov.csv")
#03 datos
O3 <- t(datos$O3)
O3 <- as.vector(O3)
O3 <- O3[1:447]
O3 <- as.numeric(O3)
O3 <- as.vector(O3)
# SO2 datos
SO2 <- t(datos$SO2)
SO2 <- as.vector(SO2)
SO2 <- SO2[1:447]
SO2 <- as.numeric(SO2)
SO2 <- as.vector(SO2)
#PM10 datos
PM10 <- t(datos$PM10)
PM10 <- as.vector(PM10)
PM10 <- PM10[1:447]
PM10 <- as.numeric(PM10)
PM10 <- as.vector(PM10)
# Reactivacion comercial datos
RC <- t(datos$Reactivacion_Comercial)
RC <- as.vector(RC)
RC <- RC[1:447]
RC <- as.numeric(RC)
RC <- as.vector(RC)
# Supermercado-farmacia datos
SF <- t(datos$Supermercado_Farmacia)
SF <- as.vector(SF)
SF <- SF[1:447]
SF <- as.numeric(SF)
SF <- as.vector(SF)
# Parques-centros datos
PC <- t(datos$Parques_Centros)
PC <- as.vector(PC)
PC <- PC[1:447]
PC <- as.numeric(PC)
PC <- as.vector(PC)
# Estaciones transito datos
ET <- t(datos$Estaciones_Transito)
ET <- as.vector(ET)
ET <- ET[1:447]
ET <- as.numeric(ET)
ET <- as.vector(ET)
# Lugares de trabajo datos
LT <- t(datos$Lugares_Trabajo)
LT <- as.vector(LT)
LT <- LT[1:447]
LT <- as.numeric(LT)
LT <- as.vector(LT)
# Residencia datos
R <- t(datos$Residencia)
R <- as.vector(R)
R <- R[1:447]
R <- as.numeric(R)
R <- as.vector(R)
# Covid datos
C <- t(datos$covid)
C <- as.vector(C)
C <- C[1:447]
C <- as.numeric(C)
C <- as.vector(C)

# Fecha 

Fecha = seq(from = as.Date("2020-02-15"), to = as.Date("2021-05-06"),by = 'day')
datos1 <- data.frame(O3,SO2,PM10,RC,SF,PC,ET,LT,R,C)

Matriz de correlación

round(cor(x = datos1, method = "pearson"),3)
##          O3    SO2   PM10     RC     SF     PC     ET     LT      R      C
## O3    1.000 -0.220 -0.229 -0.193 -0.047 -0.182 -0.174 -0.119  0.130 -0.390
## SO2  -0.220  1.000  0.612  0.404  0.443  0.019  0.399  0.138 -0.371  0.482
## PM10 -0.229  0.612  1.000  0.281  0.280  0.065  0.270  0.100 -0.238  0.310
## RC   -0.193  0.404  0.281  1.000  0.875  0.814  0.944  0.581 -0.842  0.018
## SF   -0.047  0.443  0.280  0.875  1.000  0.655  0.872  0.492 -0.729 -0.006
## PC   -0.182  0.019  0.065  0.814  0.655  1.000  0.770  0.371 -0.617 -0.209
## ET   -0.174  0.399  0.270  0.944  0.872  0.770  1.000  0.474 -0.758  0.078
## LT   -0.119  0.138  0.100  0.581  0.492  0.371  0.474  1.000 -0.853 -0.274
## R     0.130 -0.371 -0.238 -0.842 -0.729 -0.617 -0.758 -0.853  1.000  0.183
## C    -0.390  0.482  0.310  0.018 -0.006 -0.209  0.078 -0.274  0.183  1.000

La matriz de correlación es una tabla que nos permite conocer los coeficientes de conexión entre los factores, los cuales miden el grado de relación lineal entre cada par de elementos. En la anterior matriz de correlación se observa que la variable correspondiente al covid-19 está mayormente relacionada con el SO2, es decir con el dióxido de azufre. La correlación entre este contaminante y el covid-19 se debe a que existe una gran propabilidad de contagio y hospitalización cuando existe una mayor cantidad de dioxido de azufre en el ambiente. Por otro lado, la variables correspondientes a residencia y lugares de trabajo están más relacionadas al covid que variables como supermercados o parques, esto debido a que en estos lugares es más difícil de conservar las medidas de preveención.

Diagrama de matriz de correlacion

pairs (datos1)

El gráfico de correlación de múltiples variables, realizado con la función pairs, corresponde a la representación gráfica de la matriz de correlación, por lo tanto, nos permite conocer el grado de relación que existe ente las variables.

Gráficas de series de tiempo

datos2 <- data.frame(O3,SO2,PM10,RC,SF,PC,ET,LT,R,C)
datos2.ts <- ts(datos2,start = c(2020,02,15), end = c(2021,05,06), frequency = 365)
plot(datos2.ts, main="Series de tiempo")

La gráfica de series de tiempo permiten visualizar tendencias de valores númericos o recuentos a lo largo del tiempo. Esta gráfica a su vez nos ayuda a reconocer tendencias, valores atípicos o patrones. En la gráfica correspondiente al ozono (O3) se puede observar como no existe ningún tipo de patrón, sin embargo se presentó una disminución a medidados del año 2020. Por otro lado el SO2 (Dioxido de azufre) tiene una tendencia a aumentar a partir de los primeros meses de 2020. Tomando en cuenta los datos de movilidad correspondientes a la reactivación económica y a supermecados-farmacias, podemos observar como están altamente relacionas, además de como dichas variables disminuyeron a principios de 2020, y como han ido aumentando poco a poco, teniendo ambas, valores atípicos en los últimos meses de 2020. Por el contrario la variable correspondiente a residencia, la cual tuvo un aumento significativo a principios de 2020, esto debido a la cuarentena que se originó por la pandemia, sin embargo, esta empezó a disminuir poco a poco, debido a la reactivación de actividades. La última gráfica corresponde a la variable Covid, esta variable tuvo un aumento a principios del año 2020, debido a la llegada del virus en México, en la gráfica se presentan dos aumentos notables, correspondientes a olas de contagio.

Conclusiones

  • ¿Qué variable de movilidad urbana aumenta más los casos de covid? De acuerdo con nuestra matriz de correlación, residencia (R) es la variable con la relación más fuerte con los casos de COVID, con una relación positiva de .183. Esto puede deberse a que cuando estamos en casa tenemos la idea errónea de que es poco probable que nos contagiemos ahí, nos confiamos y casi no tomamos medidas preventivas. Por cada persona que vive en la misma casa aumenta el riesgo de contagio, pues si salen hay más posibilidad de que alguien se contagie y contagie al resto de los habitantes de la casa.

  • ¿Qué variable de movilidad urbana aumenta o disminuye más los contaminantes? Analizando nuestra matriz de correlación, observamos que la variable de movilidad que aumenta al ozono sería la residencia y la que lo disminuye seria la reactivación comercial, en el caso del el dióxido de azufre la variable supermercado farmacia hace que este aumente, mientras que disminuye con la residencia, en el caso de las partículas gruesas, podemos observar que esta aumenta con la activación comercial al mismo tiempo que disminuye con la residencia de igual forma, analizando esta información podemos ver la relación que existe entre estas variables de movilidad con los contaminantes, ya que, diferentes acciones realizadas por la población, pueden llevar a resultados variables que hacen disminuir o aumentar estos.

library(pacman)
p_load(rmdformats,readr,readxl,ggplot2,plotly,DT,xfun,gridExtra,leaflet)