library(pacman)
p_load("rmdformats","readxl","plotly","xfun","gridExtra","leaflet","base64enc", "htmltools", "mime", "prettydoc","readr", "knitr","DT","dplyr", "ggplot2","plotly", "gganimate","gifski","scales","psych","GGally","fdth","modeest")
I. INTRODUCCIÓN
A comienzos de pandemia por el virus SARS-CoV-2 se han dado olas de contagios en todo el mundo, México ya ha presenciado hasta su tercera ola significativa a lo largo de estos 2 años debido a negligencias o por la necesidad de la población en conseguir sus bienes y aun bajo todas las medidas de seguridad e higiene impuestas por México se intenta controlar los daños por el covid-19 en toda la república.
En el trabajo a continuación se plantera la correlación en cuestión de la movilidad de Sonora y deducir si hay una relación entre la satisfacción de necesidades básicas como ir a la farmacia o centros comerciales en cuestión de los contagios por Covid-19.
Tabla de datos de concentraciones que afectan la calidad del aire y movilidad local
En la siguiente tabla se ve los datos de porcentaje encontrado de contagios vs los contagios registrados en Sonora.
library(TSstudio)
library(DT)
library(readxl)
CM <- read_excel("Concentracion_Mov.xlsx")
Csf <- read_excel("Concentracion_MovSF.xlsx")
datos <- as.data.frame(Csf)
datatable(CM)
Reporte de movilidad en Sonora.
A continuación, se presenta los datos de movilidad en Sonora representados de manera grafica a lo largo de 2020, en ella se ve los datos de tanto recreación y comercio hasta necesidades como residencia, trabajo y farmacia.
Se puede observar que los datos según la gráfica, los lugares de mayor contagio producido con mayor diferencia a las demás es los lugares residenciales, ósea los hogares seguido de lugares de trabajo como en farmacias, podemos ver que a partir del 16 de marzo hasta el 16 de abril lugares como estaciones de tránsito, parques, lugares de trabajo y lugares de comercio baja estrepitosamente a comparación de las zonas residenciales donde aumentan, que es la fecha en donde la primera ola de covid-19 empezó, esto se puede interpretar que la gente por miedo prefirió quedarse en casa a salir lo cual también se puede decir que resulto en una menor emisión de gases, sin embargo, existen picos que son llenados por estaciones de tránsito y de farmacias e supermercados, que es entendible su alta visualización en la tabla ya que conforma las necesidades básicas de la población, los repuntes de contagio vuelven a empezar hasta a finales de diciembre, donde se tomó medidas por la alta en contagios.
movilidad <- ggplot(CM)+
geom_line(aes(x=Fecha,y=Reactivacion_Comercial,colour="Recreación y comercio"))+
geom_line(aes(x=Fecha,y=Supermercado_Farmacia,colour="Supermercados y farmacias"))+
geom_line(aes(x=Fecha,y=Parques_Centros,colour="Parques"))+
geom_line(aes(x=Fecha,y=Estaciones_Transito,colour="Estaciones de tránsito"))+
geom_line(aes(x=Fecha,y=Lugares_Trabajo,colour="Lugares de trabajo"))+
geom_line(aes(x=Fecha,y=Residencia,colour="Lugares residenciales"))+
labs(title="Reporte de movilidad",x="Fecha",y="Procentaje de cambio de movilidad")
ggplotly(movilidad)
Medidas de tendencia central
Moda
mlv(datos$Contagios)
## Warning: argument 'method' is missing. Data are supposed to be continuous.
## Default method 'shorth' is used
## [1] 56.36161
Media
mean(datos$Contagios)
## [1] 165.8591
Mediana
median(datos$Contagios)
## [1] 137
Varianza
var(datos$Contagios)
## [1] 18922.97
Desviación Estandar
sd(datos$Contagios)
## [1] 137.5608
Analisis a travez del tiempo
En la siguiente grafica podemos observar los contagios en Sonora a través de 2020, en ella podemos observar cómo se produjeron las 2 primeras olas de covid-19 en Sonora, estas sucedieron en mediados de Julio. En ellas se puede ver cierto patrón ciclo en según las fechas festivas y eventos en Sonara y el resto del país.
time.ts <- ts(data=datos$Contagios,start=c(2020,2), end = c(2021,5),frequency = 447)
plot(time.ts)
Estacionalidad de la varianza
Si miramos la estacionalidad de la varianza de Sonora podemos notar que los datos se mantiene a cierto “ritmo” de casos registrados en menor proporción a los anterior picos de contagios, se puede observar cómo en esta ocasión hasta la fecha registrada va a la baja.
plot(log(time.ts))
Eliminación de tendencia
Si eliminamos la tendencia podemos notar que los datos de Sonora se dispersan horizontalmente refiriéndose a que los casos de contagio siguieron bajando y subiendo a un ritmo semejante.
x=log(time.ts)
difi.x=diff(x)
plot(difi.x)
Eliminación de estacionalidad
Si eliminamos la estacionalidad no se ve mucha varianción respecto a la anterior tabla.
dif12.dif1.x=diff(difi.x,log=12)
plot(dif12.dif1.x)
Regresion Lineal
En la siguiente tabla de podemos ver la relación entre los lugares de movilidad y los contagios usando la correlación de Pearson siendo los datos en negativo don se produjeron los contagios en relación a su procedencia, en ella podemos interpretar como que los lugares donde se produjeron el mayor número de infectados en Sonora fueron en la zonas residenciales y de trabajo, que son las zonas donde mayormente pasa el tiempo la población.
round(cor(x = datos, method = "pearson"), 3)
## Reactivacion_Comercial Supermercado_Farmacia
## Reactivacion_Comercial 1.000 0.875
## Supermercado_Farmacia 0.875 1.000
## Parques_Centros 0.814 0.655
## Estaciones_Transito 0.944 0.872
## Lugares_Trabajo 0.581 0.492
## Residencia -0.842 -0.729
## Contagios -0.145 -0.088
## Parques_Centros Estaciones_Transito Lugares_Trabajo
## Reactivacion_Comercial 0.814 0.944 0.581
## Supermercado_Farmacia 0.655 0.872 0.492
## Parques_Centros 1.000 0.770 0.371
## Estaciones_Transito 0.770 1.000 0.474
## Lugares_Trabajo 0.371 0.474 1.000
## Residencia -0.617 -0.758 -0.853
## Contagios -0.190 -0.054 -0.323
## Residencia Contagios
## Reactivacion_Comercial -0.842 -0.145
## Supermercado_Farmacia -0.729 -0.088
## Parques_Centros -0.617 -0.190
## Estaciones_Transito -0.758 -0.054
## Lugares_Trabajo -0.853 -0.323
## Residencia 1.000 0.354
## Contagios 0.354 1.000
Gráficos de disperción de variables
Si miramos la dispersión entre los contagios en relación a la movilidad, podemos ver que los que presentan mayor relación lineal en Sonora son las Zonas residenciales con -0.842, lugares de trabajo con -0.853, donde se menciona de nuevo que es debido por el tiempo empledado por la población.
library(GGally)
ggpairs(datos, lower = list(continuous = "smooth"),
diag = list(continuous = "barDiag"), axisLabels = "none")
## `stat_bin()` using `bins = 30`. Pick better value with `binwidth`.
## `stat_bin()` using `bins = 30`. Pick better value with `binwidth`.
## `stat_bin()` using `bins = 30`. Pick better value with `binwidth`.
## `stat_bin()` using `bins = 30`. Pick better value with `binwidth`.
## `stat_bin()` using `bins = 30`. Pick better value with `binwidth`.
## `stat_bin()` using `bins = 30`. Pick better value with `binwidth`.
## `stat_bin()` using `bins = 30`. Pick better value with `binwidth`.
Aquí podemos observar de forma más contemplativa las dispersiones de las variables, podemos ver lugares como en residencia, farmacias y transito donde la dispersión es más lineal, lo cual puede decirse que la relación de contagios y esas zonas tiene más relación entre sí.
pairs(Csf)
Validación de condiciones para la regresión lineal
library(ggplot2)
library(gridExtra)
plot1 <- ggplot(data = datos, aes(Contagios, datos$Contagios)) +
geom_point() + geom_smooth(color = "firebrick") + geom_hline(yintercept = 0) +
theme_bw()
plot2 <- ggplot(data = datos, aes(Contagios, datos$Residencia)) +
geom_point() + geom_smooth(color = "firebrick") + geom_hline(yintercept = 0) +
theme_bw()
plot3 <- ggplot(data = datos, aes(Contagios, datos$Lugares_Trabajo)) +
geom_point() + geom_smooth(color = "firebrick") + geom_hline(yintercept = 0) +
theme_bw()
plot4 <- ggplot(data = datos, aes(Contagios, datos$Estaciones_Transito)) +
geom_point() + geom_smooth(color = "firebrick") + geom_hline(yintercept = 0) +
theme_bw()
plot5 <- ggplot(data = datos, aes(Contagios, datos$Parques_Centros)) +
geom_point() + geom_smooth(color = "firebrick") + geom_hline(yintercept = 0) +
theme_bw()
plot6 <- ggplot(data = datos, aes(Contagios, datos$Supermercado_Farmacia)) +
geom_point() + geom_smooth(color = "firebrick") + geom_hline(yintercept = 0) +
theme_bw()
plot7 <- ggplot(data = datos, aes(Contagios, datos$Reactivacion_Comercial)) +
geom_point() + geom_smooth(color = "firebrick") + geom_hline(yintercept = 0) +
theme_bw()
grid.arrange(plot1, plot2, plot3, plot4, plot5, plot6, plot7)
## Warning: Use of `datos$Contagios` is discouraged. Use `Contagios` instead.
## Warning: Use of `datos$Contagios` is discouraged. Use `Contagios` instead.
## `geom_smooth()` using method = 'loess' and formula 'y ~ x'
## Warning: Use of `datos$Residencia` is discouraged. Use `Residencia` instead.
## Warning: Use of `datos$Residencia` is discouraged. Use `Residencia` instead.
## `geom_smooth()` using method = 'loess' and formula 'y ~ x'
## Warning: Use of `datos$Lugares_Trabajo` is discouraged. Use `Lugares_Trabajo`
## instead.
## Warning: Use of `datos$Lugares_Trabajo` is discouraged. Use `Lugares_Trabajo`
## instead.
## `geom_smooth()` using method = 'loess' and formula 'y ~ x'
## Warning: Use of `datos$Estaciones_Transito` is discouraged. Use
## `Estaciones_Transito` instead.
## Warning: Use of `datos$Estaciones_Transito` is discouraged. Use
## `Estaciones_Transito` instead.
## `geom_smooth()` using method = 'loess' and formula 'y ~ x'
## Warning: Use of `datos$Parques_Centros` is discouraged. Use `Parques_Centros`
## instead.
## Warning: Use of `datos$Parques_Centros` is discouraged. Use `Parques_Centros`
## instead.
## `geom_smooth()` using method = 'loess' and formula 'y ~ x'
## Warning: Use of `datos$Supermercado_Farmacia` is discouraged. Use
## `Supermercado_Farmacia` instead.
## Warning: Use of `datos$Supermercado_Farmacia` is discouraged. Use
## `Supermercado_Farmacia` instead.
## `geom_smooth()` using method = 'loess' and formula 'y ~ x'
## Warning: Use of `datos$Reactivacion_Comercial` is discouraged. Use
## `Reactivacion_Comercial` instead.
## Warning: Use of `datos$Reactivacion_Comercial` is discouraged. Use
## `Reactivacion_Comercial` instead.
## `geom_smooth()` using method = 'loess' and formula 'y ~ x'
Si bien los datos anteriores dieron como resultado que los lugres residenciales y de trabajo es donde mayor población se contagia, para confirmar la validación de estos resultados es necesario verificar la linealidad de los datos, para ello se requiere una verificación de ellos a través de del grafico anterior, en ella podemos observar que hay casos como en los lugares residenciales y de trabajo pueden dar valores altos en la correlación de Pearson se puede llegar a observar que la linealidad en la dispersión de datos se ve n irregularidades en comparación a otras comparaciones como puede ser el parque y estaciones de tránsito, se puede interpretar como si bien no presentaron los valores más altos se pueden considerar más exactos en respeto a linealidad.
Conclusión
En Sonora se han producido gran cantidad de casos de contagios a lo largo de 2020, en ella se puede apreciar a través de los análisis en los casos de infecciones, mayormente se han producido en zonas de mayor consumo de tiempo como lo son las zonas residenciales y de trabajo, con ella podemos ver que si bien las medidas impuestas por la pandemia han resultado con ciertos logros para las zonas públicas, sin embargo, en las zonas privadas han sido donde la mayor proporción de casos diarios a traído, ya sea por negligencia o por el tiempo en que pasa la gente en ellos, esto se puede relacionar a que el virus SARS-CoV-2 es más contagioso en lugares cerrados y con menos ventilación que en lugares abierto y con mayor flujo de aire.
Conclusión Valeria Acosta: De acuerdo al análisis de COVID en el año 2020, vemos que acertadamente se dieron olas de mayor contagio en el estado de sonora durante el mes de julio probablemente a la fecha y eventos ya que seguían las vacaciones de Semana Santa y las personas salen a playas, centros comerciales etcétera. Analizando en la correlación de Pearson se pudo interpretar que los lugares que se produjo el mayor número de infectados dependen de la zona, por ejemplo; para este caso de estudio las residénciales y el trabajo fueron los lugares en los que las personas pasan mayor tiempo interactuando, por lo que hay mayor número de contagios (aproximadamente 56 casos diarios confirmados del virus contagiado).
Conclusión Eduardo Cuevas: Gracias al estudio pudimos saber la correlación de los casos de covid-19 con la de los lugares de contagio, supimos que los lugares donde mayor pasa la gente de Sonora es donde mayor infección hubo y pues si bien en la pandemia se tomó medidas para evitar una mayor proporción de infectados, no surgió mucho efecto en lugares con menor supervisión como en lugares privados.