I. Introducción
En los últimos 2 años el mundo se ha visto envuelto en una carrera para disminuir los contagios de COVID-19, un virus responsable de la muerte de millones de personas. En México se han presentado al menos 3.74 millones de personas contagiadas, y las muertes han alcanzado una cifra mayor a 280 mil personas, sin mencionar a quienes no fueron diagnosticados.
De ahí la importancia de conocer la situación, ¿Como es que las personas se contagian?, ¿Existe alguna razón para los repentinos picos de contagio?, ¿Hay algún tipo de patrón o ciclo? Nuestra intención es contestar esta y más incógnitas. Para ello en este documento se desarrollará una investigación y análisis sobre los casos de COVID-19 en México. Se establecerá una secuencia de tiempo mediante la cual se analizará la ciclicidad de los datos, la tendencia, estacionalidad, y otras variables con el propósito de entender el comportamiento de los datos, y así arrojar algo de luz sobre la situación actual.
II. Antecedentes
El virus COVID-19 fue reportado por primera vez el martes 7 de enero de 2020, por CDC de China (Centro para el Control y la Prevención de Enfermedades), luego de que el 31 de diciembre de 2019 la Organización Mundial de la Salud (OMS) recibiera reportes de 27 casos de un tipo de neumonía, de origen desconocido, siente de los cuales eran severos, en la ciudad de Wuhan, en China.
El vínculo común de todos estos casos, es que se trataba de personas con algpun tipo de relación con el Mercado de Huanan en Wuhan, en el cual se vende al mayoreo pescados, mariscos y animales vivos. La autoridades sanitarias del luegar, tomaron muestras en el mencionado mercado y el 1 de enero fue cerrado al público, ya que las mismas dieron positivas para el nuevo virus.
En México, el primer caso de COVID-19 se detectó el 27 de febrero de 2020. El 30 de abril, 64 días después de este primer diagnóstico, el número de pacientes aumentó exponencialmente, alcanzando un total de 19,224 casos confirmados y 1,859 fallecidos.
La mayoría de casos, se ubicaron en la Ciudad de México, donde la edad promedio fue de 46 años.
III. Objetivo
- Determinar como afectó el COVID-19 a México.
- Determinar la variabilidad de los casos de COVID-19 en México.
- Determinar si existe un ciclo en los casos de COVID-19 en México.
IV. Teoría
Todos conocemos este virus que nos ha hecho ser parte de esta pandemia pero no muchos conocen como este se propaga, el contacto cercano con personas que tengan este virus es la mayor causa, ya que a través de las gotitas respiratorias (llamadas aerosoles) producidas cuando una persona infectada tose, estornuda, respira, canta o habla la gente se infecta. Estas gotitas provocan infecciones cuando son inhaladas o se depositan en las membranas mucosas, como las que revisten la parte interna de la nariz y la boca.
En ciertas circunstancias (por ejemplo, cuando las personas están en espacios cerrados con poca ventilación), el COVID 19 puede propagarse mediante la transmisión por aire.
Y además, el COVID 19 se propaga con menor frecuencia a través del contacto con superficies contaminadas.
¿Cómo prevenir preveenir la enfermedad?
- Lavarse las manos frecuentemente por al menos 40 segundos, especialmente:
- Antes de comer o preparar la comida.
- Antes de tocarse la cara.
- Después de ir al baño.
- Después de salir de lugares públicos.
- Después de sonarse la nariz, toser o estornudar.
- Después de manipular su mascarilla.
- Después de cambiar pañales.
- Después de cuidar a una persona enferma.
- Después de tocar animales o mascotas.
- Mantenerse a 2 metros de distancia de una persona que se encuentre enferma.
- Cubrir tu boca con el interior de tu codo o con un pañuelo desechable al toser o estornudar.
- Evitar tocarse los ojos, la nariz y la boca sin haberte lavado las manos.
- Si no dispones de agua y jabón, usa un desinfectante de manos que contenga al menos un 70% de alcohol. Cubre toda la superficie de las manos y frótalas hasta que las sientas secas.
- Quedarse en casa y no acudir a lugares cerrados o poco ventilados muy concurridos.
- Utilizar cubrebocas.
V. Metodología
Para el análisis de estos datos se utilizarán las siguientes herramientas:
Series de tiempo
Por serie de tiempo nos referimos a datos estadísticos que se recopilan, observan o registran en intervalos de tiempo regulares (diario, semanal, semestral, anual, entre otros). El término serie de tiempo se aplica por ejemplo a datos registrados en forma periódica que muestran, por ejemplo, las ventas anuales totales de almacenes, el valor trimestral total de contratos de construcción otorgados, el valor trimestral del PIB.
Ciclos
Se denomina ciclo al período de tiempo en el cual se desarrollan o suceden un conjunto de acontecimientos, etapas o fenómenos que, una vez finalizados se vuelven a repetir en el mismo orden de principio a fin.
VI. Resultados y discusión
Importar paquetes/librerias
## Se importan paquetes y librerias.
library(pacman) #para importar la biblioteca "pacman"
p_load(markdown,knitr,dplyr,tidyr,tidyverse,hashmap,lubridate,summarytools,ggpubr,kableExtra,reshape2,gridExtra,
sf,tmap,readr,devtools,ploty,Rcpp,gganimate,gifski,Hmisc)
## Installing package into 'C:/Users/dany3/OneDrive/Documentos/R/win-library/4.1'
## (as 'lib' is unspecified)
## Warning: package 'hashmap' is not available for this version of R
##
## A version of this package for your version of R might be available elsewhere,
## see the ideas at
## https://cran.r-project.org/doc/manuals/r-patched/R-admin.html#Installing-packages
## Warning: unable to access index for repository http://www.stats.ox.ac.uk/pub/RWin/bin/windows/contrib/4.1:
## no fue posible abrir la URL 'http://www.stats.ox.ac.uk/pub/RWin/bin/windows/contrib/4.1/PACKAGES'
## Warning: 'BiocManager' not available. Could not check Bioconductor.
##
## Please use `install.packages('BiocManager')` and then retry.
## Warning in p_install(package, character.only = TRUE, ...):
## Warning in library(package, lib.loc = lib.loc, character.only = TRUE,
## logical.return = TRUE, : there is no package called 'hashmap'
## Installing package into 'C:/Users/dany3/OneDrive/Documentos/R/win-library/4.1'
## (as 'lib' is unspecified)
## Warning: package 'ploty' is not available for this version of R
##
## A version of this package for your version of R might be available elsewhere,
## see the ideas at
## https://cran.r-project.org/doc/manuals/r-patched/R-admin.html#Installing-packages
## Warning: unable to access index for repository http://www.stats.ox.ac.uk/pub/RWin/bin/windows/contrib/4.1:
## no fue posible abrir la URL 'http://www.stats.ox.ac.uk/pub/RWin/bin/windows/contrib/4.1/PACKAGES'
## Warning: 'BiocManager' not available. Could not check Bioconductor.
##
## Please use `install.packages('BiocManager')` and then retry.
## Warning in p_install(package, character.only = TRUE, ...):
## Warning in library(package, lib.loc = lib.loc, character.only = TRUE,
## logical.return = TRUE, : there is no package called 'ploty'
## Warning in p_load(markdown, knitr, dplyr, tidyr, tidyverse, hashmap, lubridate, : Failed to install/load:
## hashmap, ploty
Datos
url_conf <- "https://raw.githubusercontent.com/CSSEGISandData/COVID-19/master/csse_covid_19_data/csse_covid_19_time_series/time_series_covid19_confirmed_global.csv"
url_decesos <- "https://raw.githubusercontent.com/CSSEGISandData/COVID-19/master/csse_covid_19_data/csse_covid_19_time_series/time_series_covid19_deaths_global.csv"
url_recuperados <- "https://raw.githubusercontent.com/CSSEGISandData/COVID-19/master/csse_covid_19_data/csse_covid_19_time_series/time_series_covid19_recovered_global.csv"
#Leer los archivos .csv de las url
datos_conf <- read.csv(url_conf)
datos_decesos <- read.csv(url_decesos)
datos_recuperados <- read.csv(url_recuperados)
#definir variables
conf_mex <- t(datos_conf[datos_conf$Country.Region=="Mexico" ,])
dec_mex <- t(datos_decesos[datos_decesos$Country.Region=="Mexico" ,])
rec_mex <- t(datos_recuperados[datos_recuperados$Country.Region=="Mexico" ,])
#Importar datos diarios
datos= read.csv("Casos_Diarios_Estado_Nacional_Confirmados.csv")
Nacional<- t(datos[datos$nombre=="Nacional" ,])
Nacional <- as.vector(Nacional)
Nacional <-Nacional[4:602]
Nacional <- as.numeric(Nacional)
Nacional <- as.vector(Nacional)
Fecha1 = seq(from = as.Date("2020-02-18"), to = as.Date("2021-10-14"), by = 'day')
datosd= read.csv("Casos_Diarios_Estado_Nacional_Defunciones.csv")
N_def <- t(datosd[datosd$nombre=="Nacional",])
N_def <- as.vector(N_def)
N_def <- N_def[4:577]
N_def <- as.numeric(N_def)
N_def <- as.vector(N_def)
Fecha2=seq(from = as.Date("2020-03-17"),to = as.Date("2021-10-14"),by = "day")
- Eliminar campos no utilizables
- Formatear las fechas
- Crear un marco de datos (data frame)
Fecha = seq(from=as.Date("2020-01-27"),to =as.Date("2021-10-15"),by ='day')
#casos confirmados
vec1 <- as.vector(conf_mex)
vec2 <- vec1[5:632]
num1 <- as.double(vec2)
Confirmados <- as.vector(num1)
#decesos
vec1 <- as.vector(dec_mex)
vec2 <- vec1[5:632]
num1 <- as.numeric(vec2)
Decesos <- as.vector(num1)
#recuperados
vec1 <- as.vector(rec_mex)
vec2 <- vec1[5:632]
num1 <- as.numeric(vec2)
Recuperados <- as.vector(num1)
#generación de un marco de datos (data frame)
datos1 <- data.frame(Fecha, Confirmados, Decesos, Recuperados)
Se grafican los datos
A continuación se presentan los datos de casos confirmados, decesos y recuperados en una gráfica
- Gráfica estática
gcov <- ggplot(data = datos1) +
geom_line(aes(Fecha, Confirmados, colour="Confirmados")) +
geom_line(aes(Fecha, Decesos, colour="Decesos")) +
geom_line(aes(Fecha, Recuperados, colour="Recuperados")) +
xlab("Fecha") +
ylab("COVID-19 en México") +
labs(colour="casos")+
ggtitle("Casos de COVID-19 en México (Fuente: JHU CSSE)")
gcov
En este gráfico se muestran las tendencias de crecimiento de los casos de COVID-19 confirmados, igualmente los decesos que sucedieron por este virus y los casos de recuperación de la enfermedad.
- Gráfica animada
ggplot(data = datos1) +
geom_line(aes(Fecha, Confirmados, colour="Confirmados")) +
geom_line(aes(Fecha, Decesos, colour="Decesos")) +
geom_line(aes(Fecha, Recuperados, colour="Recuperados")) +
xlab("Fecha") +
ylab("COVID-19 en México") +
labs(colour="casos")+
ggtitle("Casos de COVID-19 en México (Fuente: JHU CSSE)") +
transition_reveal(Fecha)
En este gráfico se muestran poco a poco las tendencias de crecimiento de los casos de COVID-19 confirmados, igualmente los decesos que sucedieron por este virus y los casos de recuperación de la enfermedad.
#Confirmados
conf_mex.ts=ts(data=Nacional,start=c(2020,2),frequency = 365)
plot(conf_mex.ts, xlab="FECHA",ylab="CASOS")
title(main = "Casos confirmados")
En esta gráfica se representan los ciclos de crecimiento de los casos confirmados de COVID-19. Si ponemos atención podremos observar 3 picos significativos, que son indicadores de tres olas de contagios, encontrándose el pico más grande en 2021, aproximadamente en el mes de junio. Esto podría haber sido causado por la llegada de las vacaciones de verano, momento perfecto para que la gente saliera en masa ignorando las regulaciones de salud.
ConfirmadosMensuales = c(0, 13,3128, 29647, 92458, 158839, 212221, 170752, 147373, 172075, 205905, 329772, 421469, 194790, 141536, 91714, 64634, 106191,376185, 514898, 259637, 56623, 0, 0)
confirmados.ts <- ts(ConfirmadosMensuales, start = c(2020,1), end = c (2021, 12), frequency = 12)
boxplot(confirmados.ts ~cycle(confirmados.ts), xlab = "MESES",ylab = "CASOS")
title(main = "CASOS DIARIOS CONFIRMADOS")
En esta gráfica se representan los casos confirmados de COVID-19 cada mes. Estas gráficas son de caja y bigote, por lo que mientras más grande sea la caja más varían los datos. Se puede apreciar que, debido a la altitud de la caja en el mes de agosto, este sería el mes con más casos confirmados.
#Decesos
def_mex.ts=ts(data=N_def,start=c(2020,3),frequency = 365)
plot(def_mex.ts, xlab="FECHA",ylab="MUERTES")
title(main = "Decesos")
En esta gráfica se representan los ciclos de crecimiento de los decesos por COVID-19. Si ponemos atención podremos observar 3 picos significativos, que son indicadores de tres olas de decesos, encontrándose el pico más grande aproximadamente al final del 2020 e inicio del 2021. Esto podría haber sido causado por la una ola de contagios combinada con la falta de vacunas, y otros factores.
DecesosMensuales <- c(0, 0, 93, 4626, 16153, 20580, 23714, 18927, 12813, 12784, 16114, 23548, 38572, 22984, 12695, 7297, 3790, 2932, 8086, 20753, 14365, 3182, 0, 0)
decesos.ts <- ts(DecesosMensuales, start = c(2020,1), end = c (2021, 12), frequency = 12)
boxplot(decesos.ts ~cycle(decesos.ts), xlab = "MESES",ylab = "MUERTES")
title(main = "Decesos diarios")
En esta gráfica se representan los decesos por COVID-19 cada mes. Estas gráficas son de caja y bigote, por lo que mientras más grande sea la caja más varían los datos. Se puede apreciar que, debido a la altitud de la caja en el mes de enero, este sería el mes con más decesos.
Descomposición de una serie de tiempo.
ConfirmadosMensuales = c(0, 13,3128, 29647, 92458, 158839, 212221, 170752, 147373, 172075, 205905, 329772, 421469, 19479, 141536, 91714, 64634, 106191,376185, 514898, 259637, 56623, 0, 0)
confirmados.ts <- ts(ConfirmadosMensuales, start = c(2020,1), end = c (2021, 12), frequency = 12)
boxplot(confirmados.ts ~cycle(confirmados.ts), xlab = "MESES",ylab = "CASOS")
Aqui se presentan ciclicamente los casos confirmados por mes.
Casos confirmados.
confirmados.ts.des <- decompose(confirmados.ts)
plot(confirmados.ts.des, xlab= "Year")
> La gráfica representa la descomposición de la serie de tiempo. Primero se nos muestra lo que es la serie observada, es decir, nuestra serie de tiempo de los casos confirmados de COVID-19. La cual nos muestra un poco el comportamiento de los datos, parece aumentar hasta llegar a un punto para bajar y luego volver a subir algunas veces, creando 4 picos notables, retratando así los 4 aumentos repentinos en el número de casos de COVID, aunque uno de estos 4 picos no parece ser muy importante en las primeras gráficas. Luego se nos muestra un recuadro que contiene la tendencia, la cual parece estabilizarse en algunos pequeños tramos de la gráfica, que como pueden observar parece formarse por dos curvas unidas.. Esto nos cuenta cómo aumentaron muchísimo y de forma constante los casos hasta llegar a un punto en el que bajaron de forma parecida a como subieron, esto posiblemente fue causado por la mejora de las medidas tomadas para evitar el contagio, y la llegada de las vacunas. Posteriormente, se muestra la estacionalidad, que nos habla de las fluctuaciones periódicas de la serie de tiempo, en la cual podemos observar una variación constante, y aparentemente impredecible. Esto nos habla de una fluctuación constante de datos, pero poniendo un poco de atención se pueden identificar los picos de contagio que se observaron en la serie de tiempo antes, por lo que esto puede deberse a que los datos resultan anormales en un principio, pero luego se normalizan. Finalmente, en el cuarto y último recuadro podemos observar las variaciones a corto plazo, que son normalmente impredecibles. Podemos ver una recta horizontal, aparentemente sin ningún tipo de pendiente, indicando que la variación a corto plazo no cambia, se mantiene tal como inicio.
- Transformaciones básicas de una serie de tiempo.
Antes de hacer la estabilización de la varianza, transformaremos nuestra serie a una logarítmica. Esto, con la intención de hacer una comparación entendible y real entre los datos, pasaremos nuestros datos a graficas logarítmicas, mediante el uso de una serie de tiempo.
plot (log(conf_mex.ts))
> Se puede observar que al inicio de esta gráfica, se observa un pico que aparece en el inicio del 2020, aquí fue cuando los números crecieron alarmadamente convirtiéndose así en la pandemia COVID-19, después podemos observar cómo a inicios de 2021 los casos fueron disminuyendo, hasta que llegó la mitad de 2021 en donde se puede notar una segunda ola de contagios, y hasta ahora por tanta gente que se ha vacunado, poco a poco estamos haciendo que la curva este más pareja.
- Eliminación de la tendencia
x <- log (conf_mex.ts)
dif1.x <- diff(x)
plot(dif1.x)
Gráfica con la tendencia eliminada, la cual nos indica una posible estabilidad en los casos futuros de COVID si las cosas se quedan de la misma manera, y si la gente sigue protegiéndose como lo ha estado haciendo.
- Eliminación de la estacionalidad.
dif12.dif1.x <- diff(dif1.x, log=12)
plot (dif12.dif1.x)
En esta gráfica se elimina la estacionalidad, y al analizarla podemos ver como al comienzo de la pandemia, los contagios eran muy variables y alarmantes, pero con el paso del tiempo estos se terminan estabilizando.
Defunciones.
decesos.ts.des <- decompose(decesos.ts)
plot(decesos.ts.des, xlab= "Year")
La gráfica representa la descomposición de la serie de tiempo. Primero se nos muestra lo que es la serie observada, es decir, nuestra serie de tiempo de los decesos por COVID-19. La cual nos muestra un poco el comportamiento de los datos, parece aumentar hasta llegar a un punto para bajar, volver a subir y luego bajar un par de veces, creando 3 picos notables, lo que indica 3 aumentos repentinos en el número de decesos por COVID. Luego se nos muestra un recuadro que contiene la tendencia, la cual parece ser resultado de dos curvas unidas, como si los decesos aumentaron hasta llegar a un punto donde bajan, para luego repetir el ciclo anterior, pero en menor magnitud. Esto puede deberse a la mejora de las medidas tomadas para evitar el contagio, y la llegada de las vacunas. Posteriormente, se muestra la estacionalidad, que nos habla de las fluctuaciones periódicas de la serie de tiempo, en la cual podemos observar una variación constante, y aparentemente impredecible. Esto nos habla de una fluctuación constante de datos, pero poniendo un poco de atención se pueden identificar los picos por el aumento de decesos que se observaron en la serie de tiempo antes, por lo que esto puede deberse a que los datos resultan anormales en un principio, pero luego se normalizan. Finalmente, en el cuarto y último recuadro podemos observar las variaciones a corto plazo, que son normalmente impredecibles. Podemos ver una recta horizontal, aparentemente sin ningún tipo de pendiente, indicando que la variación a corto plazo no cambia, se mantiene tal como inicio.
- Transformaciones básicas de una serie de tiempo.
Antes de hacer la estabilización de la varianza, transformaremos nuestra serie a una logaritmica.
plot (log(def_mex.ts))
Esta gráfica es muy parecida a nuestra gráfica anteriormente mostrado de casos de COVID, esto confirma que estas dos se encuentran directamente correlacionadas, al igual que la otra se puede observar que al inicio se observa un pico que aparece en el inicio del 2020, aquí fue cuando los números crecieron y por ende también las defunciones se dispararon, después podemos observar cómo a inicios de 2021 los casos fueron disminuyendo, hasta que llegó la mitad de 2021 en donde se puede notar una segunda ola de contagios haciendo así una segunda ola de defunciones, estando el mundo así en una emergencia global
- Eliminación de la tendencia.
x <- log (def_mex.ts)
dif1.x <- diff(x)
plot(dif1.x)
Gráfica con la tendencia eliminada, la cual nos indica una posible estabilidad en las defunciones si las cosas se quedan de la misma manera,o un posible nuevo pico si la gente no respeta las medidas de sanitización
- Eliminación de la estacionalidad.
dif12.dif1.x <- diff(dif1.x, log=12)
plot (dif12.dif1.x)
En esta gráfica se elimina la estacionalidad, y al analizarla podemos observar que al igual que al comienzo de la pandemia, los contagios eran muy variables y por ende las defunciones también estaban siendo alarmantes para todo el mundo, pero con el paso del tiempo estos se terminan estabilizando, poco a poco esperando a que la gente se cuide y haga caso a la sana distancia.
VII. Conclusiones
Conclusión en equipo
Es necesario recalcar que la serie de tiempo de casos confirmados y la serie de tiempo de defunciones son muy similares, en ambos han habido 3 picos muy marcados de casos, esto fue mencionado en el análisis de las gráficas, dichos brotes pueden deberse a diferentes factores como la reapertura de restaurantes, bares u otros establecimientos, así como la llegada de fechas especiales y festivas como el dia de las madres o el dia de la independencia.
De igual forma, como ha habido más gente que se ha ido a vacunar en las últimas semanas, pudo ser que la gente se terminó confiando de que estaba vacunada sin saber que tenía el virus, y así aumentó el número de contagios.
Además, la disminución de casos en ambas series puede deberse a la llegada de las vacunas y la mejora de las medidas tomadas para evitar el contagio. Estas dos series tienen un comportamiento cíclico ligeramente marcado, pues hablamos de 3 picos de contagio, el cual es suficiente para determinar una ciclicidad. Es variable en algunos momentos, pues los casos pueden aumentar, disminuir o mantenerse en un número parecido sin gran variación ya que realmente nadie tiene control de este problema, solo los gobiernos que pueden poner restricciones.
Conclusión individual
Al haber analizado todos estos datos podemos notar la estrecha relación que tienen los casos de covid y las defunciones, ya que como se muestra en las gráficas estas están ligadas, en cuanto más número de infectados haya, mayores serán el número de defunciones, aunque estos datos pueden variar en un futuro ya que todos nos encontremos vacunados, y sigamos todas las reglas de sanitización en nuestra area.
VIII. Bibliografía
https://www.significados.com/ciclo/#:~:text=Qu%C3%A9%20es%20Ciclo%3A%20Se%20denomina%20ciclo%20al%20per%C3%ADodo,en%20el%20mismo%20orden%20de%20principio%20a%20fin.
http://www.estadistica.mat.uson.mx/Material/seriesdetiempo.pdf
Gobierno de México. (2020, 4 julio). COVID-19 Tablero México. COVID - 19. Recuperado 4 de julio de 2021, de https://datos.covid-19.conacyt.mx/#COMNac
Morgan, S. (2017, 28 diciembre). Significado de Ciclo. Significados. Recuperado 24 de enero de 2018, de https://www.significados.com/ciclo/#:%7E:text=Qu%C3%A9%20es%20Ciclo%3A%20Se%20denomina%20ciclo%20al%20per%C3%ADodo,en%20el%20mismo%20orden%20de%20principio%20a%20fin.
Foster, F. (2020, 1 noviembre). Epidemiología de COVID-19 en México: del 27 de febrero al 30 de abril de 2020. PubMed Central (PMC). Recuperado 17 de octubre de 2021, de https://www.ncbi.nlm.nih.gov/pmc/articles/PMC7250750/
Porto, P. (s. f.). ¿Quieres saber sobre COVID 19? MedicaSur. Recuperado 17 de octubre de 2021, de https://www.medicasur.com.mx/es_mx/ms/faseI_Como_se_transmite_la_enfermedad_COVID_19
Sedgwick, E. K. (2017). Series de tiempo. Recuperado de: http://www.bu.edu/honoringeve/files/2009/09/paranoid-reading-and-reparative-reading.pdf
IX Descarga de datos
- Para descargar los datos de los casos de covid por mes
xfun::embed_file("Confirmados_mensuales_covid19.csv")
Download Confirmados_mensuales_covid19.csv
xfun::embed_file("Defunciones_mensuales_covid19.csv")
Download Defunciones_mensuales_covid19.csv
- Para descarga el código de este proyecto
xfun::embed_file("AE3UC1_11.Rmd")