I. Introducción
En los últimos 2 años el mundo se ha visto envuelto en una carrera para disminuir los contagios de COVID-19, un virus responsable de la muerte de millones de personas. En México se han presentado al menos 3.74 millones de personas contagiadas, y las muertes han alcanzado una cifra mayor a 280 mil personas, sin mencionar a quienes no fueron diagnosticados.
De ahí la importancia de conocer la situación, ¿Como es que las personas se contagian?, ¿Existe alguna razón para los repentinos picos de contagio?, ¿Hay algún tipo de patrón o ciclo? Nuestra intención es contestar esta y más incógnitas. Para ello en este documento se desarrollará una investigación y análisis sobre los casos de COVID-19 en México. Se establecerá una secuencia de tiempo mediante la cual se analizará la ciclicidad de los datos, la tendencia, estacionalidad, y otras variables con el propósito de entender el comportamiento de los datos, y así arrojar algo de luz sobre la situación actual.
II. Antecedentes
El virus COVID-19 fue reportado por primera vez el martes 7 de enero de 2020, por CDC de China (Centro para el Control y la Prevención de Enfermedades), luego de que el 31 de diciembre de 2019 la Organización Mundial de la Salud (OMS) recibiera reportes de 27 casos de un tipo de neumonía, de origen desconocido, siente de los cuales eran severos, en la ciudad de Wuhan, en China.
El vínculo común de todos estos casos, es que se trataba de personas con algpun tipo de relación con el Mercado de Huanan en Wuhan, en el cual se vende al mayoreo pescados, mariscos y animales vivos. La autoridades sanitarias del luegar, tomaron muestras en el mencionado mercado y el 1 de enero fue cerrado al público, ya que las mismas dieron positivas para el nuevo virus.
En México, el primer caso de COVID-19 se detectó el 27 de febrero de 2020. El 30 de abril, 64 días después de este primer diagnóstico, el número de pacientes aumentó exponencialmente, alcanzando un total de 19,224 casos confirmados y 1,859 fallecidos.
La mayoría de casos, se ubicaron en la Ciudad de México, donde la edad promedio fue de 46 años.
III. Teoria
¿Qué fue lo qué causo la pandemia en las personas mexicanas y como esto se vio reflejado el twitter?
Ansiedad en pandemia
Vivimos en una rutina constante de ir y venir, de mantenernos ocupados en el trabajo, con las amistades, en el deporte, juegos, cine, comidas o convivios en restaurantes, etc.. En todas y cada una de las actividades que tenemos día a día y la mayoría de ellas, por no decir todas, son en contacto con el exterior, lo que nos lleva a vivir en un mundo externo a nosotros mismos, lleno de prisas, a la corre y corre, a tal grado que no tenemos tiempo o no deseamos detenernos a reflexionar en lo que se piensa o se siente realmente, en esos momentos.
Dicho de otra manera, llenamos nuestros tiempos y espacios con actividades y no nos damos tiempo para nosotros mismos, para hacer contacto con nuestro ser interior. Y cuando llega este momento de recogimiento, de limitación al afuera, se ha visto que muy frecuentemente, asusta o da miedo el solo hecho de pensar que no se saldrá de casa, que no se podrá hacer todo lo que hacía con anterioridad. Es en ese momento cuando uno se detiene a revisar lo que piensa, siente o recuerda de su vida. Al menos eso es lo que la mayoría de los pacientes en consulta reportan y que lo expresan como:
- Sentimiento de soledad
- Tener miedo primero a la situación sanitaria y posteriormente a enfermarse, y esto se agrava si algún familiar o amigo pasa por esta situación o incluso fallece por este virus.
- Dando pie a un recuento del pasado. A recordar errores cometidos en el transcurso de la vida, que se hizo, que no hizo, que me hicieron otros y que he superado y que no, en sí, todo lo bueno, en menor proporción, y lo malo, en demasía, con mi familia, amigos, conmigo mismo (a).
- Hasta llegar a estar frente a frente consigo mismos, pero ¿Cómo lo hago? Si nunca antes lo había hecho por estar enfrascado en tanta actividad, comentan algunos pacientes.
*Agotamiento mental
Ante la mezcla de la vida personal y la laboral durante el confinamiento, las especialistas mencionan que ha incrementado el sentimiento de agotamiento mental, también conocido como “burnout”. El trabajo excesivo, los horarios, todo se combinó; la noche, la mañana, ¿a qué hora empieza mi trabajo y mis labores de casa? Esto ha tenido efectos hasta biológicos en el cuerpo como el insomnio o el sedentarismo.
VI. Resultados y discusión
Importar paquetes/librerias
## Se importan paquetes y librerias.
library(pacman)
p_load("DT","xfun","ggplot2", "readr","tseries","ggfortify","tidyr", "dplyr","markdown","knitr","tidyverse","lubridate","summarytools","ggpubr","kableExtra","reshape2","gridExtra",
"sf","tmap","devtools","Rcpp","gganimate","gifski","Hmisc","corrplot","GGally")
Datos
url_decesos <- "https://raw.githubusercontent.com/CSSEGISandData/COVID-19/master/csse_covid_19_data/csse_covid_19_time_series/time_series_covid19_deaths_global.csv"
#Leer los archivos .csv de las url
datos_decesos <- read.csv(url_decesos)
twitter_diaria <- read_csv("twitter_diaria.csv")
## Rows: 2255 Columns: 7
## -- Column specification --------------------------------------------------------
## Delimiter: ","
## chr (2): tipo_usuario, lugar
## dbl (4): tuits_negativos, indice, recoleccion_promedio, tuits_positivos
## date (1): fecha
##
## i Use `spec()` to retrieve the full column specification for this data.
## i Specify the column types or set `show_col_types = FALSE` to quiet this message.
datosTwitter <- data.frame(twitter_diaria)
movilidad <- read.csv("movilidad_mexico_2020.csv")
#definir variables
dec_mex <- t(datos_decesos[datos_decesos$Country.Region=="Mexico" ,])
twt_neg <- twitter_diaria[1482:1826 ,c(3)]
Residencia <- movilidad[1:345 , c(15) ]
Fecha=seq(from = as.Date("2020-01-22"),to = as.Date("2020-12-31"),by = "day")
Series de tiempo
- Antes de empezar la pandemia
twittsST <- ts(datosTwitter[ ,c(3)],start = c(2016,1),end = c(2020,1),frequency = 12)
autoplot(twittsST, ts.colour = "blue",ts.linetype = "dotted")
- Después del inicio de la pandemia
twittsST <- ts(datosTwitter[ ,c(3)],start = c(2020,3),end = c(2022,1),frequency = 12)
autoplot(twittsST, ts.colour = "blue",ts.linetype = "dotted",main = "Serie de tiempo indice de tweets negativos",xlab = "Fecha",ylab = "Indice")
El anterior gráfico representa una serie de tiempo, la cual indica el comportamiento de los tweets negativos a lo largo de los años. Aquí podemos observar de manera más gráfica el comportamiento de los tweets negativos, desde el año 2016, hasta el presente. Se puede observar que cuando inició la pandemia hubo una ola muy notoria de twits negativos, sin embargo, la estos disminuyeron en gran medida, estando muy por debajo que años previos. También se observa como, los tweets negativos aumentan a finales y principios de cada año.
- Gráfica de caja y bigote después del inicio de la pandemia
twittsNegativosST <- ts(datosTwitter$indice,start = c(2020,3),end = c(2022,1),frequency = 12)
boxplot(twittsNegativosST~cycle(twittsNegativosST),xlab = "Mes",ylab = "Número de tweets",main = "Serie de tiempo del indice de tweets negativos")
Se observa que los datos si varían mucho, pero se alcanza a notar los cambios drásticos que hubo después de que se oficializara el comienzo de la nueva pandemia.
# tweets negativos
Tweets_negativos <- unlist(twt_neg)
#decesos
vec1 <- as.vector(dec_mex)
vec2 <- vec1[5:349]
num1 <- as.numeric(vec2)
Decesos <- as.vector(num1)
for(i in 1:345){
Residencia[i] <- Residencia[i]*10
}
Residencia <- accumulate(Residencia[1:345],`+`)
#generación de un marco de datos (data frame)
datosPandemia <- data.frame(Fecha, Tweets_negativos, Decesos, Residencia)
Se grafican los datos
A continuación se presentan los datos de tweets negativos, decesos y movilidad durente la pandemia en una gráfica
Gráfica estática
gcov <- ggplot(data = datosPandemia) +
geom_line(aes(Fecha, Tweets_negativos, colour="Tweets negativos")) +
geom_line(aes(Fecha, Decesos, colour="Decesos")) +
geom_line(aes(Fecha, Residencia, colour="Residencia")) +
xlab("Fecha") +
ylab("Pandemia COVID-19 en México") +
labs(colour="Variables")+
ggtitle("Relación entre tweets negativos, recidencia y decesos por Covid-19")
gcov
En este gráfico se pueden observar las tendencias de crecimiento de los datos de decesos, residencia y tweets negativos durante el año 2020 hasta el inicio del año 2021. A simple vista se observa una relación entre las variables de decesos y residencia, puesto que el crecimiento de los decesos, coincide con el crecimiento de la variable de residencia. Mientras que, en los tweets negativos, no se observa una relación con el resto de las variables.
Gráfica animada
ggplot(data = datosPandemia) +
geom_line(aes(Fecha, Tweets_negativos, colour="Tweets negativos")) +
geom_line(aes(Fecha, Decesos, colour="Decesos")) +
geom_line(aes(Fecha, Residencia, colour="Residencia")) +
xlab("Fecha") +
ylab("COVID-19 en México") +
labs(colour="Variables")+
ggtitle("Casos de COVID-19 en México (Fuente: JHU CSSE") +
transition_reveal(Fecha)
En este gráfico se muestran poco a poco las tendencias de crecimiento de los decesos por covid confirmados. Esta gráfica es la misma que la anterior, la única diferencia es que al ser esta interactiva, se muestra como fue el crecimiento.
Correlación
ggpairs(datosPandemia[, c(2,3,4)], lower = list(continuous ="smooth"),
diag = list (continuos = "barDiag"), axisLabels = "none")
La siguiente gráfica representa la correlación entre las tres variables, esta correlación mide la relación entre variables continuas. El gráfico presenta la representación de los datos, la correlación y la representación gráfica de esa correlación. Se observa como los los tweets negativos tiene una correlación positiva con decesos y residencia, 0.701 y 0.588 respectivamente. Esto indica que, mientras una variable aumenta, las otras también. Esto puede ser, por el efecto negativo que provocan los decesos y el confinamiento en las personas. Además de la correlación, se puede observar la graficación de esta, la cual es linal. Por otro lado, decesos y residencia están muy correlacionados, con un .943, esto debido a que, cuando los decesos por covid-19 aumentaban, el pánico de la sociedad también, lo que provocaba que las medidas de prevención, tal como quedarse en casa, fueran realizadas por un gran número de personas.
Matriz de correlación entre las variables predictoras
corrplot(cor(dplyr::select(datosPandemia,Decesos,Tweets_negativos,
Residencia)),
method = "number", tl.col = "black")
En esta gráfica de correlaciones se puede observar que tweets negatigos tiene una correlación positiva con decesos y residencia, es decir, mientras los tweets negativos aumentan, los decesos y la residencia de igual manera aumentan, esto debido a los efectos negativos que provocan los decesos, o bien, el confinamiento generado por las medidas de prevención de la pandemia. Citando una noticia del 27 de Julio del 2020 “Los hombres están siendo más afectados que las mujeres por coronavirus y también las clases bajas respecto a las acomodadas, pero el colectivo que más muertos ha puesto en esta batalla en México es el de las amas de casa, con 9.192 defunciones en lo que va de pandemia. Le sigue el grupo de jubilados y pensionados, con 3.738, una parte de los cuales también son mujeres al cuidado del hogar.”. Tomando en cuenta esto, se puede ver que la residencia tiene mucha correlación positiva con los decesos y esto se debe a que en su mayoría, los decesos fueron de personas mayores, es decir, personas que ya no necesitaban realizar alguna actividad fuera de su casa, sin embargo, al ser el grupo más vulnerable ante la situación, sus muertes si son las que más se contabilizan.
Conclusión
Después de este análisis se puede concluir que los decesos por covid-19 y la residencia tiene una gran relación con los tweets negativos, esto debido a los efectos negativos de la pandemia en las personas, tal como el estrés, la ansiedad, el miedo, la tristeza o la soledad. Además, de la posibilidad de empeorarr los transtornos de salud mental, como lo puede ser la depresión. De igual manera, los decesos y la residencia tienen gran relación, ya que las personas más vulnerables a los decesos son las personas mayores, es decir, jubilados y pensionados, por lo tanto no necesitaban salir de su hogar en muchas ocasiones.
Conclusión personal
He llegado a la conclusión de que los decesos y el pasar tanto tiempo en aislamiento afecta gravemente en nuestro ánimo, y esto se ve reflejado en nuestras redes sociales, en este caso, en los twits negativos. He concluido esto debido a la gran relación que se presentó en nuestro análisis. Por otro lado, las muertes y el aislamiento tienen también una gran relación, debido a que, el mayor número de muertes se presentaban durante los picos, donde al mismo tiempo, las medidas de prevención se intensificaban.
Para descargar los datos de los casos de covid por día
xfun::embed_file("twitter_diaria.csv")
xfun::embed_file("movilidad_mexico_2020.csv")
Download movilidad_mexico_2020.csv
- Para descarga el código de este proyecto
xfun::embed_file("A9U1.Rmd")