AE3UC1_11

Soto López Nadia Alejandra, Garcia Soqui Rafael, Valenzuela Arredondo Julio Emmanuel, Luna Ruelas Arturo

15/10/2021

I. INTRODUCCIÓN

En el siguiente trabajo analizaremos los datos de contagios de la pandemia del COVID-19, teniendo en cuenta mayormente 3 grupos de datos que serían casos confirmados, decesos y recuperaciones durante el periodo del 2020-01-22 al 2020-12-18, en el cual mediante el uso de las herramientas y técnicas proporcionadas a lo largo de la primera unidad de competencias plantearemos postulados estadísticamente descriptivos con la finalidad de comprobar ciertas preguntas como:

¿Cómo ha sido la variación de los casos en el tiempo? ¿Cómo se comporta esta serie de tiempo? ¿Los picos de contagios, a que eventos responden?

También buscaremos descomponer la serie de tiempo de estos datos y se realizará un análisis cíclico mensual en base a los datos comprendidos.

II. ANTECEDENTES

En el mes de diciembre de 2019, un brote de casos de una neumonía grave se inició en la ciudad de Wuhan,provincia de Hubei, en China. Los estudios epidemiológicos iniciales mostraron que la enfermedad se expandíarápidamente, que se comportaba más agresivamente en adultos entre los 30 y 79 años, con una letalidad global del 2,3% [1]. La mayoría de los primeros casos correspondían a personas que trabajaban o frecuentaban el Huanan Seafood Wholesale Market, un mercado de comidas de mar, el cual también distribuía otros tipos de carne, incluyendo la de animales silvestres, tradicionalmente consumidos por la población local. Los estudios etiológicos iniciales dirigidos a los agentes comunes de la infección respiratoria aguda, incluyendo los agentes de la influenza aviar, del síndrome respiratorio agudo severo(SARS, del inglés, Severe Acute Respiratory Syndrome) y del síndrome respiratorio del Medio Oriente (MERS, del inglés, Middle East Respiratory Syndrome), arrojaron resultados negativos. El uso de métodos de secuenciación profunda, que no requieren información previa sobre el agente que se busca, así como el aislamiento en cultivo de células, seguido de microscopía electrónica y de secuenciación profunda, demostró que se trataba de un agente viral nuevo, perteneciente al grupo de los coronavirus, y fue inicialmente llamado 2019-nCoV (novel coronavirus de 2019), genéticamente relacionado, pero distinto al agente del SARS. El brote se extendió rápidamente en número de casos y en diferentes regiones de China durante los meses de enero y febrero de 2020. La enfermedad, ahora conocida como COVID-19 (del inglés, Coronavirus disease-2019), continuó propagándose a otros países asiáticos y luego a otros continentes. El 11 de marzo de 2020, la Organización Mundial de la Salud (OMS) declaró la ocurrencia de la pandemia de COVID-19, exhortando a todos los países a tomar medidas y aunar esfuerzos de control en lo que parece ser la mayor emergencia en la salud pública mundial de los tiempos modernos.

III. OBJETIVO

*Conocer a profundidad qué es el COVID y determinar parcialmente cómo es que a impactado el COVID en México desde su comienzo hasta la actualidad.

*Determinar parcialmente cómo han sido los comportamientos y variaciones de casos durante el tiempo transcurrido y conocer con profundidad cuáles han sido los motivos que han generado estás variaciones (eventos causantes).

IV. TEORÍA

¿Qué es una pandemia?

Una pandemia es la afectación de una enfermedad infecciosa de los humanos a lo largo de un área geográficamente extensa, es decir, que se extiende a muchos países o que ataca a casi todos los individuos de una localidad o región. Por lo tanto, el término pandemia hace referencia a la afectación geográfica o numérica en cuanto al número de casos afectados y nunca referencia a la gravedad clínica del proceso. Según la Organización Mundial de la Salud (OMS), para que pueda aparecer una pandemia es necesario:

Que aparezca un nuevo virus o una nueva mutación de uno ya existente, que no haya circulado anteriormente y que la población no sea inmune a él. Que el virus tenga la capacidad de transmitirse de persona a persona de forma eficaz, provocando un rápido contagio entre la población.

Fuente: https://www.coronapedia.org/base-conocimiento/que-es-una-pandemia-definicion-y-fases/

¿Qué es el coronavirus?

Los coronavirus son una familia de virus que causan enfermedades (desde el resfriado común hasta enfermedades respiratorias más graves) y circulan entre humanos y animales.

En este caso, se trata del SARS-COV2. Apareció en China en diciembre del 2019 y provoca una enfermedad llamada COVID-19, que se extendió por el mundo y fue declarada pandemia global por la Organización Mundial de la Salud.

Fuente: https://coronavirus.gob.mx/covid-19/

¿Cómo se propaga?

Los coronavirus humanos se transmiten de una persona infectada a otras:

  • A través de las gotículas que expulsa un enfermo al toser y estornudar

  • Al tocar o estrechar la mano de una persona enferma, un objeto o superficie contaminada con el virus y luego llevarse las manos sucias a boca, nariz u ojos.

¿Cómo se produce una pandemia?

Una epidemia se produce cuando una enfermedad contagiosa se propaga rápidamente en una población determinada, afectando simultáneamente a un gran número de personas durante un periodo de tiempo concreto. En caso de propagación descontrolada, una epidemia puede colapsar un sistema de salud, como ocurrió en 2014 con el brote de Ébola en África occidental, considerado el peor de la historia. Los países más afectados fueron Sierra Leona, Liberia y Guinea.

Dicho esto, una pandemia sería básicamente esto último pero a una escala mucho más extensa, como un país, continente o en este caso con la pandemia de COVID-19, el mundo entero.

Fuente: https://www.msf.org.ar/actualidad/que-una-pandemiacual-la-diferencia-pandemia-y-epidemia

V. METODOLOGÍA

Para este análisis se utilizarán las siguientes herramientas y metodologías:

Regresión Lineal Múltiple

La regresión lineal múltiple permite generar un modelo lineal en el que el valor de la variable dependiente o respuesta (Y) se determina a partir de un conjunto de variables independientes llamadas predictores \((X_1, X_2, X_3…)\). Los modelos de regresión múltiple pueden emplearse para predecir el valor de la variable dependiente o para evaluar la influencia que tienen los predictores sobre ella (esto último se debe que analizar con cautela para no malinterpretar causa-efecto). (Rodrigo, 2016)

Los modelos lineales múltiples siguen la siguiente ecuación:

\[ Y_{i}=(\beta_{0}+\beta_{1}X_{1i}+\beta_{2}X_{2i}+\cdots+\beta_{n}X_{ni})+e_{i} \]

Data Science

Data Science o ciencia de datos es una disciplina científica centrada en el análisis de grandes fuentes de datos para extraer información, comprender la realidad y descubrir patrones con los que tomar decisiones. (Universidad Complutense Madrid, 2020)

Estadística Descriptiva

La estadística descriptiva es la parte de la estadística que sintetiza y resume la información contenida en un conjunto de datos, por tanto, un análisis descriptivo consiste en clasificar, representar y resumir los datos. La descripción se puede hacer utilizando dos tipos de procedimientos: mediante el cálculo de índices estadísticos que son números que resumen de modo sencillo la información contenida en los datos reales, o bi|en utilizando representaciones gráficas que son muy útiles, ya que pueden aportar mucha información en un solo golpe de vista.

Análisis de series de tiempo.

  • Que es una serie de tiempo?

Una serie de tiempo es una secuencia de datos u observaciones, medidos en determinados momentos y ordenados cronológicamente. Visualmente, es una curva que evoluciona en el tiempo. Una serie de tiempo es un conjunto de observaciones sobre los valores que toma una variable (cuantitativa) a través del tiempo.

Fuente: “https://www.pricing.cl/conocimiento/series-de-tiempo/

VI. RESULTADOS Y DISCUSIÓN

En el siguiente apartado se realizarán los análisis para obtención de resultados y se discutirán sus interpretaciones.

Importamos los datos

# Se realiza la declaración de las variables que contendrán las url en donde se encuentran los datos crudos de confirmados, decesos, recuperados

url_conf <- "https://raw.githubusercontent.com/CSSEGISandData/COVID-19/master/csse_covid_19_data/csse_covid_19_time_series/time_series_covid19_confirmed_global.csv"

url_decesos <- "https://raw.githubusercontent.com/CSSEGISandData/COVID-19/master/csse_covid_19_data/csse_covid_19_time_series/time_series_covid19_deaths_global.csv"

url_recuperados <- "https://raw.githubusercontent.com/CSSEGISandData/COVID-19/master/csse_covid_19_data/csse_covid_19_time_series/time_series_covid19_recovered_global.csv"

# Leer los archivos .csv de las url 

datos_conf <- read.csv(url_conf)
datos_decesos <- read.csv(url_decesos)
datos_recuperados <- read.csv(url_recuperados)

# Definir variables 

conf_mex <- t(datos_conf[datos_conf$Country.Region=="Mexico" ,])
dec_mex  <- t(datos_decesos[datos_decesos$Country.Region=="Mexico" ,])
rec_mex  <- t(datos_recuperados[datos_recuperados$Country.Region=="Mexico" ,])

library(pacman) #para importar la biblioteca "pacman"
p_load("base64enc", "htmltools", "mime", "xfun", "prettydoc","modeest","readr", "knitr","DT","dplyr", "ggplot2","plotly", "gganimate","gifski","scales", "zoo", "xts")

Se les da formato.

#vector de fecha
Fecha <- seq(from = as.Date("2020-02-18"), to = as.Date("2021-10-19"), by = "day"   )

#casos confirmados 
vec1 <- as.vector(conf_mex)
vec2 <- vec1[5:614]
num1 <- as.numeric(vec2)
Confirmados <- as.vector(num1)

#decesos 
vec1 <- as.vector(dec_mex)
vec2 <- vec1[5:614]
num1 <- as.numeric(vec2)
Decesos <- as.vector(num1)

#recuperados
vec1 <- as.vector(rec_mex)
vec2 <- vec1[5:614]
num1 <- as.numeric(vec2)
Recuperados <- as.vector(num1)

#generación de un marco de datos (data frame)

datos1 <- data.frame(Fecha, Confirmados, Decesos, Recuperados)

¿Cómo ha sido la variación de los casos en el tiempo?

Gráfica interactiva de evolución a lo largo de la duración de la pandemia.

gcov <- ggplot(data = datos1) +
  geom_line(aes(Fecha, Confirmados, colour="Confirmados")) +
  geom_line(aes(Fecha, Decesos, colour="Decesos")) +
  geom_line(aes(Fecha, Recuperados, colour="Recuperados")) +
  xlab("Fecha") +
  ylab("COVID-19 en México") +
  labs(colour="casos")+
  ggtitle("Casos de COVID-19 en México (Fuente: JHU CSSE)") +
  scale_y_continuous(labels = comma)
ggplotly(gcov)

En la gráfica anterior podemos observar que para los casos confirmados hemos visto un crecimiento exponencial a través de todo 2020, ésto debido a diversos factores tales como la renuencia del pueblo hacia las medidas implementadas por el gobierno para frenar la propagación de la pandemia sumado con el hecho de que la cuarentena que se intentó establecer a un principio fue imposible de seguir para el Mexicano promedio por la economía que se tiene en el país actualmente. Cabe mencionar el hecho de que la diligencia del gobierno al aplicar cuarentena también fue tardía.

Fuente: “https://www.bbc.com/mundo/noticias-america-latina-53074005

¿Cómo se comporta esta serie de tiempo?

ggplot(data = datos1) +
  geom_line(aes(Fecha, Confirmados, colour = "Confirmados")) +
  geom_line(aes(Fecha, Decesos, colour = "Decesos")) +
  geom_line(aes(Fecha, Recuperados, colour = "Recuperados")) +
  xlab("Fecha") +
  ylab("COVID-19 en México") +
  labs(colour = "casos") +
  ggtitle("Casos de COVID-19 en México (Fuente: JHU CSSE)") +
  scale_y_continuous(labels = comma) +
  transition_reveal(Fecha)

Podemos observar que el comportamiento en casos confirmados es de incrementar constantemente y así ha sido a través del tiempo en la totalidad de la pandemia, mientras que para los decesos tenemos que se ve más como un crecimiento lineal esto debido a que aunque el COVID-19 no tiene una tasa de mortandad muy alta la cantidad de personas contagiadas sí es muy alta y está directamente relacionada con la cantidad de casos confirmados. En cuanto a los casos recuperados podemos apreciar que es muy próxima a la tasa total de casos confirmados, ya que la gran mayoría de gente que está fuera de los grupos de riesgo(personas con obesidad y de la tercera edad y/o con enfermedades crónicas), suele tener una recuperación fructífera.

Fuente: “https://covid19.ciga.unam.mx/apps/covid-19-monitoreo-de-la-situaci%C3%B3n-por-estados/explore

Resumen de datos para cada categoría:

summary(datos1)
##      Fecha             Confirmados         Decesos        Recuperados     
##  Min.   :2020-02-18   Min.   :      0   Min.   :     0   Min.   :      0  
##  1st Qu.:2020-07-19   1st Qu.: 186694   1st Qu.: 22782   1st Qu.:  14288  
##  Median :2020-12-18   Median :1037282   Median :101525   Median : 641558  
##  Mean   :2020-12-18   Mean   :1303135   Mean   :116904   Mean   : 816727  
##  3rd Qu.:2021-05-19   3rd Qu.:2322452   3rd Qu.:214402   3rd Qu.:1659477  
##  Max.   :2021-10-19   Max.   :3597168   Max.   :273391   Max.   :2270427

Representación en una serie de tiempo

evolucion = ts(data = subset(datos1, select = -Fecha), start= c(2020,3), frequency = 365)
plot(evolucion)

Esta gráfica representa de una manera basada en tiempo los contagios a lo largo de la duración del periodo de este estudio, esto con la finalidad de determinar posibles ciclos y patrones de comportamiento en los contagios. Interpretando la gráfica que obtenemos de los contagios, podemos apreciar que en cuanto a los confirmados hay un tipo de patrón de olas con tendencia a cada ola siguiente a incrementar bastante en comparación con la primera.

Gráfico de caja y bigote

boxplot(evolucion, main = "Contagios de COVID-19 en México")

Realizamos el gráfico de caja y bigote para apreciar de manera más visual las medidas de tendencia central para cada uno de los parámetros que estaremos midiendo, a lo que podemos apreciar que hace sentido que la caja más grande sea la de Confirmados y su distribución tiene sentido teniendo nuestros valores mínimos y maximos que van de a cuerdo al resumen previo que habíamos visto, a su vez, los decesos y recuperados están de acuerdo con las proporciones que se esperarían debido a las tasas de recuperación y mortalidad que el virus tiene.

Homogeneizamos los datos.

plot(log(evolucion))

De manera homogenea podemos ver como el incremento de los contagios en México es exponencial debido a la naturaleza pandémica del virus y las consecuencias de no guardar cuarentena. Claro está que el virus es uno el cual puede estar presente en un huésped sin si quiera este estar conciente en ningún momento de su estado de contagiado.

Eliminamos la tendencia

x = log(evolucion)
difi.x=diff(x)
plot(difi.x)

Una vez eliminada la tendencia comprendemos que fuera de los picos de contagios la progresión del virus es un tanto lineal en la forma en la que se propaga y la manera en la que aumentan gradualmente los casos día con día.

Eliminamos estacionalidad

dif12.dif1.x=diff(difi.x,log=12)
plot(dif12.dif1.x)

Sin tomar en cuenta estacionalidad podemos ver como se relacionan estas tres variables que fuera de las olas estamos hablando de las fechas en las cuales se propaga el virus con más frecuencias, estos serían por supuesto los periodos en los cuales las personas están mas dispuestas a salir como las fechas decembrinas, navidad o semana santa.

VII.CONCLUSIÓN

Conclusión General

Basándonos en este estudio, bajo estos datos y usando las metodologías especificadas al principio de este trabajo llegamos como equipo a la conclusión de que el crecimiento exponencial de la pandemia en México de una manera realista dificilmente se pudo haber evitado imponiendo una cuarentena obligatoria como se hizo al principio de la misma, los datos nos dejan ver que a pesar de todas las medidas implementadas a lo largo del primer año de la pandemia los casos siguieron creciendo de forma exponencial hasta llegar a los millones.

Son muchos diversos factores los que influyeron en la propagación de la pandemia y en México uno de los más notables fue la economía. El Mexicano promedio no tiene los medios para aislarse del mundo exterior por cantidades indefinidas de tiempo ya que la mayoría ni si quiera cuenta con los ahorros suficentes para subsistir por la duración total de una cuarentena (García, 2021).

Conclusión Individual

Personalmente tuve la oportunidad de presenciar una situación en la cual la Marina Armada de México estaba prohibiendo el paso al mercado municipal de mi pueblo, esto a mediados de la pandemia, puesto que estas eran sus órdenes aún así una señora de la 3era edad en situación de desesperación discutía con un soldado que le decía que no tenía que estar en el centro del pueblo y que volviera a su casa, la señora simplemente le contestó que ya no tenía comida en su casa y le preguntó: “¿Qué se supone que tengo que hacer?”

Dicho esto es claro que no todos se pueden permitir abastecerse de víveres en un solo viaje y guardar resguardo en su casa por tiempo indefinido y más aún sin apoyo gubernamental, solo indicaciones. Fue irreal y muy fuera de tacto si quiera exigir cuarentena total sin tener en perspectiva las diferencias entre clase que hay en México.

VIII.BIBLIOGRAFÍA

|* Francisco Javier Díaz Castrillón, Ana Isabel Toro Montoya. (2020). SARS-CoV-2/COVID-19: el virus, la enfermedad y la pandemia. Octubre 15, 2021, de EDIMECO. Editorial Medica Colombiana Sitio web: https://docs.bvsalud.org/biblioref/2020/05/1096519/covid-19.pdf

García, A. M. N. (2021, 1 marzo). La cultura del ahorro en México. Este País. Recuperado 17 de octubre de 2021, de https://estepais.com/tendencias_y_opiniones/ahorro-a-la-mexicana/la-cultura-del-ahorro-en-mexico/