library(pacman) #para importar la biblioteca "pacman"
p_load("base64enc", "htmltools", "mime", "xfun", "prettydoc","readr", "knitr","DT","dplyr", "ggplot2","plotly", "gganimate","gifski","scales","psych","GGally","fdth","modeest")

setwd("~/APLICADA")
xfun::embed_file("movilidad.csv")

Download movilidad.csv

library(readr)

movilidad <- read_csv("movilidad.csv")
## Rows: 292 Columns: 10
## -- Column specification --------------------------------------------------------
## Delimiter: ","
## chr (1): date
## dbl (9): Comercio_Recreacion, Mercado_Farmacias, Parques, Transito, Lugares_...
## 
## i Use `spec()` to retrieve the full column specification for this data.
## i Specify the column types or set `show_col_types = FALSE` to quiet this message.
View(movilidad)
xfun::embed_file("movilidad sin fechas.csv")

Download movilidad sin fechas.csv

library(readr)
movilidad_sin_fechas <- read_csv("movilidad sin fechas.csv")
## Rows: 292 Columns: 9
## -- Column specification --------------------------------------------------------
## Delimiter: ","
## dbl (9): Comercio_Recreacion, Mercado_Farmacias, Parques, Transito, Lugares_...
## 
## i Use `spec()` to retrieve the full column specification for this data.
## i Specify the column types or set `show_col_types = FALSE` to quiet this message.
View(movilidad_sin_fechas)
datos=read.csv("movilidad.csv")

conf_mex <- t(datos$Contagio_diarios)
dec_mex  <- t(datos$Muertes_diarias)
rec_mex  <- t(datos$Recuperados_diarios)

INTRODUCCIÓN

Desde el comienzo de la pandemia de COVID-19, hemos visto como los casos suben y bajan creando olas de contagios, muchas personas pueden llegar a pensar que esto sucede por algún mal manejo de la pandemia por parte del gobierno, tal vez por desobediencia de los ciudadanos a la cuarentena impuesta por el gobierno, o simplemente por el hartazgo de llevar cuidados estrictos como el aislamiento social.

En este trabajo, el equipo plantea que la verdadera causa de los picos a la alta en casos de COVID-19 sea por la movilidad, pues a mayor movilidad, podemos suponer un mayor riesgo para las personas.

Fecha <- seq(from = as.Date("2021-01-1"), to = as.Date("2021-10-19"), by = "day"   )

#casos confirmados 
vec1 <- as.vector(conf_mex)
num1 <- as.numeric(vec1)
Confirmados <- as.vector(num1)

#decesos 
vec1 <- as.vector(dec_mex)
num1 <- as.numeric(vec1)
Decesos <- as.vector(num1)

#recuperados
vec1 <- as.vector(rec_mex)
num1 <- as.numeric(vec1)
Recuperados <- as.vector(num1)

#generación de un marco de datos (data frame)

datos1 <- data.frame(Fecha, Confirmados, Decesos, Recuperados)
gcov <- ggplot(data = datos1) +
  geom_line(aes(Fecha, Confirmados, colour="Confirmados")) +
  geom_line(aes(Fecha, Decesos, colour="Decesos")) +
  geom_line(aes(Fecha, Recuperados, colour="Recuperados")) +
  xlab("Fecha") +
  ylab("COVID-19 en México") +
  labs(colour="casos")+
  ggtitle("Estado de COVID-19 en México 2021") +
  scale_y_continuous(labels = comma)
ggplotly(gcov)
hist(datos$Contagio_diarios,xlab = "Casos por COVID-19",ylab = "Concurrencia de los datos",main = "Casos de COVID-19 a nivel nacional en mexico")

Medidas de tendencia central

con estas medidas observamos como fue el promedio o casos usuales por dia, en la propagacion del COVID-19 2021

Media

mean(datos$Contagio_diarios)
## [1] 2553577

Mediana

median(datos$Contagio_diarios)
## [1] 2404247

Moda

mlv(datos$Contagio_diarios)
##  [1] 1886245 2471741 2709739 3091971 3479999 3552983 3619115 3678980 3684242
## [10] 3714392

Varianza

var(datos$Contagio_diarios)
## [1] 376582196965

Desviación estandar

sd(datos$Contagio_diarios)
## [1] 613662.9

Grafico de caja y bigote

summary(datos$Contagio_diarios)
##    Min. 1st Qu.  Median    Mean 3rd Qu.    Max. 
## 1437185 2167369 2404247 2553577 2966137 3762689
boxplot(datos$Contagio_diarios,main="Casos de COVID-19 a nivel nacional en México")

Análisis de series de tiempo

revolucion.ts=ts(data=datos$Contagio_diarios,start=c(2021,1),frequency = 320)
plot(revolucion.ts)

Estacionalidad de la varianza

plot(log(revolucion.ts))

Eliminacion de tendencia

x=log(revolucion.ts)
difi.x=diff(x)
plot(difi.x)

Eliminacion de estacionalidad

dif12.dif1.x=diff(difi.x,log=12)
plot(dif12.dif1.x)

comercio_recreacion=t(datos$Comercio_Recreacion)
mercado_farmacias=t(datos$Mercado_Farmacias)
parques=t(datos$Parques)
transito=t(datos$Transito)
lugar_trabajo=t(datos$Lugares_Trabajo)
recidencia_casa=t(datos$Recidencia_Casa)

vec1 <- as.vector(comercio_recreacion)
num1 <- as.numeric(vec1)
Comercio_recreacion <- as.vector(num1)

vec1 <- as.vector(mercado_farmacias)
num1 <- as.numeric(vec1)
Mercado_farmacias <- as.vector(num1)

vec1 <- as.vector(parques)
num1 <- as.numeric(vec1)
Parques <- as.vector(num1)

vec1 <- as.vector(lugar_trabajo)
num1 <- as.numeric(vec1)
Lugar_trabajo <- as.vector(num1)

vec1 <- as.vector(recidencia_casa)
num1 <- as.numeric(vec1)
Recidencia_casa <- as.vector(num1)

datos2 <- data.frame(Fecha, Comercio_recreacion,  Mercado_farmacias, Parques, Lugar_trabajo, Recidencia_casa)
gcov <- ggplot(data = datos1) +
  geom_line(aes(Fecha, Comercio_recreacion, colour="Comercio y Recreacion")) +
  geom_line(aes(Fecha, Mercado_farmacias, colour="Mercado y Farmacias")) +
  geom_line(aes(Fecha, Parques, colour="Parques")) +
  geom_line(aes(Fecha, Lugar_trabajo, colour="Lugares de trabajo")) +
  geom_line(aes(Fecha, Recidencia_casa, colour="Recidencia en casa")) +
  xlab("Fecha") +
  ylab("Metodos de propagacion de COVID-19 en México 2021") +
  labs(colour="casos")+
  ggtitle("Movilidad de COVID-19 en México 2021") +
  scale_y_continuous(labels = comma)
ggplotly(gcov)
datosSinFechas=read.csv("movilidad sin fechas.csv")

Analisis de la relación entre variables

datossf <- as.data.frame(datosSinFechas)
round(cor(x = datossf, method = "pearson"), 3)
##                     Comercio_Recreacion Mercado_Farmacias Parques Transito
## Comercio_Recreacion               1.000             0.981   0.938    0.898
## Mercado_Farmacias                 0.981             1.000   0.926    0.880
## Parques                           0.938             0.926   1.000    0.896
## Transito                          0.898             0.880   0.896    1.000
## Lugares_Trabajo                   0.491             0.469   0.528    0.800
## Recidencia_Casa                  -0.578            -0.548  -0.624   -0.820
## Contagio_diarios                  0.798             0.784   0.712    0.742
## Muertes_diarias                   0.905             0.886   0.841    0.839
## Recuperados_diarios              -0.244            -0.252  -0.144   -0.233
##                     Lugares_Trabajo Recidencia_Casa Contagio_diarios
## Comercio_Recreacion           0.491          -0.578            0.798
## Mercado_Farmacias             0.469          -0.548            0.784
## Parques                       0.528          -0.624            0.712
## Transito                      0.800          -0.820            0.742
## Lugares_Trabajo               1.000          -0.917            0.428
## Recidencia_Casa              -0.917           1.000           -0.424
## Contagio_diarios              0.428          -0.424            1.000
## Muertes_diarias               0.476          -0.531            0.953
## Recuperados_diarios          -0.160           0.010           -0.684
##                     Muertes_diarias Recuperados_diarios
## Comercio_Recreacion           0.905              -0.244
## Mercado_Farmacias             0.886              -0.252
## Parques                       0.841              -0.144
## Transito                      0.839              -0.233
## Lugares_Trabajo               0.476              -0.160
## Recidencia_Casa              -0.531               0.010
## Contagio_diarios              0.953              -0.684
## Muertes_diarias               1.000              -0.463
## Recuperados_diarios          -0.463               1.000

Dispersion de variables

ggpairs(datosSinFechas, lower = list(continuous = "smooth"),
        diag = list(continuous = "barDiag"), axisLabels = "none")
## `stat_bin()` using `bins = 30`. Pick better value with `binwidth`.
## `stat_bin()` using `bins = 30`. Pick better value with `binwidth`.
## `stat_bin()` using `bins = 30`. Pick better value with `binwidth`.
## `stat_bin()` using `bins = 30`. Pick better value with `binwidth`.
## `stat_bin()` using `bins = 30`. Pick better value with `binwidth`.
## `stat_bin()` using `bins = 30`. Pick better value with `binwidth`.
## `stat_bin()` using `bins = 30`. Pick better value with `binwidth`.
## `stat_bin()` using `bins = 30`. Pick better value with `binwidth`.
## `stat_bin()` using `bins = 30`. Pick better value with `binwidth`.

¿Porque se ha propagado tanto el virus?

De acuerdo a los datos y graficos obtenidos podemos concluir que el aumento de contagios se debio a que a principios del año 2021 surgio la pandemia mundial y muchas personas no acataron los lineamientos de seguridad de permanecer en cuarentena durante el tiempo de transmisiones y aun así sin ninguna cura para el covid-19. Entonces se puede decir que los picos en los graficos donde hay mayor propagación del virus se debe a que las personas estuvieron en constante movilidad. Por consiguiente despues de las fechas de vacunacion se logra apreciar una disminucion de contagio lo que nos lleva a concluir que las vacunas lograron ser efectivas y las personas aprendieron a vivir con la pandemia protegiendose.