Estado de Ánimo de los tuiteros en México.
Introducción
En México el Instituto Nacional de Estadística y Geografía (INEGI) tiene una aplicación capaz de distinguir el estado de ánimo de los Mexicanos usuarios de Twitter (Red social enfocada a compartir información) a partir de los tweets (Texto corto de 280 caracteres) que estos mismos postean en sus perfiles, la forma en la que este algoritmo funciona está documentada en el siguiente un dato muy importante a tomar en cuenta, es que no se toman en cuenta los tweets de todos los Mexicanos, sólo se toman aquellos tweets dónde el usuario habilitó la opción de “georreferencia”.
En el presente documento analizaremos cómo ha variado el discurso de los Mexicanos en Twitter desde 2016 hasta el día de hoy en 2022.
Logo de Twitter
Estado de Ánimo
El estado de ánimo es el humor o tono sentimental, agradable o desagradable, que acompaña a una idea o situación y se mantiene por algún tiempo; ya sea individual o grupalmente.
Covid-19: Un problema mundial
Sin duda alguna no hay nada que nos cambie más de manera emocional que un cambio de paradigmas a los que estamos impuestos o vemos como “normalidad”, como bien sabemos, el virus Sars-Covid 19 llegó a México en los primeros meses del año 2020, lo cual trajo consigo que el gobierno Mexicano tomara acciones inmediatas en el flujo de la sociedad, la Secretaría de Salud aproximadamente en marzo del eso año al observar y analizar la amenaza de este virus realizo diversas acciones las cuales afectaron la formade de trabajo, la eduación y la movilidad social, debido a que la medida que más tenía efectividad en la reducción de contagios de este virus seria el aislamiento de todas los habitantes de la república Mexicana.
Con base a lo anterior, analizaremos más a detalle cómo la pandemia de covid-19 afectó al estado de ánimo de las personas (si lo afectó de alguna manera) en comparación a cómo se comportaban años atrás , por ende, se procederá a realizar una comparación para ver si el discurso ha mejorado, empeorado o se ha mantenido igual a lo largo de estos años.
Imagen Ilustrativa 1.1
Objetivo
El objetivo del siguiente caso de estudio es analizar los datos proporcionados por el Instituto Nacional de Estadística y Geografía para comparar estado de ánimo de los twitteros en México entre los años 2016-2022, esto con el fin de observar la variabilidad de tweets positivos o negativos antes y durante el evento que azotó a la humanidad, la pandemia del virus COVID-19.
Imagen Ilustrativa 1.2
Datos y Paquetes
Paquetes
Los paquetes a utilizar para el siguiente caso son los siguiente;
library(pacman)
p_load("DT","xfun","ggplot2", "readr","tseries","ggfortify","tidyr", "dplyr","prettydoc", "psych", "GGally", "stringr","vembedr", "xfun","gridExtra","corrplot", "plotly")
Datos
Los datos que analizaremos son obtenidos directamente de la página oficial del INEGI el cual puedes consultar bajo el nombre de . La información es de acceso público y puedes descargar este mismo documento en formato .csv desde el enlace proporcionado.
Importamos los datos desde el .csv
dataTwitter <- read_csv("twitterData.csv")
## Rows: 2255 Columns: 7
## -- Column specification --------------------------------------------------------
## Delimiter: ","
## chr (2): tipo_usuario, lugar
## dbl (4): tuits_negativos, indice, recoleccion_promedio, tuits_positivos
## date (1): fecha
##
## i Use `spec()` to retrieve the full column specification for this data.
## i Specify the column types or set `show_col_types = FALSE` to quiet this message.
dataTwitter
## # A tibble: 2,255 x 7
## fecha tuits_negativos indice recoleccion_promedio tipo_usuario lugar
## <date> <dbl> <dbl> <dbl> <chr> <chr>
## 1 2016-01-01 34401 2.98 136802 todos NAC
## 2 2016-01-02 34689 2.52 122121 todos NAC
## 3 2016-01-03 39431 2.41 134428 todos NAC
## 4 2016-01-04 46229 2.37 156001 todos NAC
## 5 2016-01-05 44575 2.25 144751 todos NAC
## 6 2016-01-06 43144 2.31 142602 todos NAC
## 7 2016-01-07 42547 2.26 138627 todos NAC
## 8 2016-01-08 46027 2.21 147592 todos NAC
## 9 2016-01-09 38919 2.57 138984 todos NAC
## 10 2016-01-10 40552 2.38 137241 todos NAC
## # ... with 2,245 more rows, and 1 more variable: tuits_positivos <dbl>
Conociendo los datos a través de una tabla interactiva
datatable(dataTwitter)
Significado de los datos.
Como podemos observar, los datos vienen con una marca de la fecha, en este caso varían desde el 1 de enero del 2016 hasta el 9 de marzo del 2022.
Tuits positivos y negativos - Cantidad de tweets que la INEGI detectó y clásico como Tuits positivo o negativo.
Recolección promedio - Cantidad de tweets recolectados por día.
Índice - Se calcula a través de (tuits Positivos / tuits Negativos); A mayor índice mejor estado de ánimo, por el contrario a menor índice peor estado de ánimo.
Tipo de Usuario – Ciudadano Mexicano o Turista.
Lugar – Área en la cual los tuits fueron tomados(En este caso a nivel Nacional).
Desarrollo
Representación gráfica de los datos
Para comprender mejor los datos, vamos a ver los datos con una gráfica interactiva.
plot_ly(data = dataTwitter, x = dataTwitter$fecha , y = dataTwitter$indice, type = 'scatter' , mode = 'lines')%>% layout(title = 'Estado de ánimo de twitteros en México',
yaxis = list(zeroline = FALSE, title = 'Indice'),
xaxis = list(zeroline = FALSE), title = 'Fecha')
Grafica representativa de los estados de ánimo de los comentarios y publicaciones del pueblo mexicano con proporción de 1, con lo que se da a entender que siempre existen comentarios positivos en Twitter, aunque existan eventos negativos la constante es de una mayoría de comentarios positivos.
En la gráfica se ven puntos muy altos y bajos que son sucesos que pasaron en alguna parte de México o tuvieron que ver con México. Por ejemplo Cada inicio de año hay una gran elevación en los comentarios, lo cual indica las expectativas de los mexicanos con cada nuevo año. Septiembre del 2021: Se creo un odio y indignación hacia los mexicanos con los agentes fronterizos a caballo persiguiendo a migrantes en Estados Unidos. Mayo del 2021 la selección mexicana es eliminada de la copa del mundo de las olimpiadas, generando tristeza por el equipo y enojo por los rumores de que no se les brinda equipo a los participantes que van a representar a México en las olimpiadas Octubre del 2019: Llegan a la capital de Sinaloa 230 militares de fuerzas especiales, generando un pánico entre la población de lo que puede llegar a pasar, temiendo de una posible guerra contra el narco.
Nota: A mayor índice, mejor estado de ánimo.
Curiosamente, vemos a través de esta gráfica que nunca se han tenido más tweets negativos que positivos (recordando que el índice se calcula [tweets positivos / tweets negativos]) aún que si se pueden observar algunos puntos en donde el índice era extremadamente bajo y en un caso este índice descendió a 1.
Primer acercamiento a los datos.
Podemos observar en la gráfica que hay 4 momentos en toda la historia de nuestros datos en los cuales el índice descendió a menos de 1.4.
Si nos vamos a buscar en noticias qué sucedió en esos días, encontramos lo siguiente:
(18 de Octubre de 2019) - La aprehensión y posterior liberación de un líder del cártel de Sinaloa.
(17 de Febrero de 2020) - El trágico fallecimiento de una niña llamada Fátima.
(4 de Mayo de 2021) - La caída de la Línea 12 del metro de la Ciudad de México.
(6 de Marzo de 2022) - El incidente en el estadio Corregidora en Querétaro.
Como podemos observar, todos los incidentes que nos llevaron a tener un discurso de odio / mal estado de ánimo a los mexicanos son causados por tragedias ocurridas dentro del país, donde las personas se enteran de las noticias por medio de esta red social y lanzan su opinión al respecto.
También podemos observar que los picos más altos se dan en días festivos cómo lo son:
Año nuevo
Dia de Reyes
Dia de la Candelaria
Día de las Madres
Día del Niño
Navidad
Y algunos otros sucesos que no se atienen a una fecha en particular del año como lo son partidos de futbol, eventos mundiales o nacionales. Sin embargo, queda por resolver una pregunta en particular, ¿Las personas atenderían al llamado del aislamiento social en estos picos de tuits positivos? , ¿Saldrían de paseo a algún lugar? y ¿Qué consecuencias trajo consigo, el que personas no realizaran las medidas adecuadas de protección? Entre las consecuencias principales que se presentaron durante estos periodos de fechas, los índices de personas aumento drásticamente, trayendo consigo que los hospitales naciones se saturaran en fechas posteriores a estos días donde los tuits fueron más positivos.
Comparando los datos.
Como vimos anteriormente, el estado de ánimo en Twitter es afectado de manera negativa por tragedias y aumenta en fechas familiares o eventos importantes, pero la pregunta aquí es ¿qué tanto afectó la pandemia al estado de ánimo en Twitter? y ¿ha mejorado o empeorado desde que comenzó?
Vamos a ver esta comparativa de manera gráfica
Dividiendo los datos por año
dataTwitter2022 <- dataTwitter%>%
filter(between(fecha, as.Date("2022-01-01"), as.Date("2022-12-31")))
dataTwitter2022 <- cbind(dataTwitter2022, anio=2022)
dataTwitter2021 <- dataTwitter%>%
filter(between(fecha, as.Date("2021-01-01"), as.Date("2021-12-31")))
dataTwitter2021 <- cbind(dataTwitter2021, anio=2021)
dataTwitter2020 <- dataTwitter%>%
filter(between(fecha, as.Date("2020-01-01"), as.Date("2020-12-31")))
dataTwitter2020 <- cbind(dataTwitter2020, anio=2020)
dataTwitter2019 <- dataTwitter%>%
filter(between(fecha, as.Date("2019-01-01"), as.Date("2019-12-31")))
dataTwitter2019 <- cbind(dataTwitter2019, anio=2019)
dataTwitter2018 <- dataTwitter%>%
filter(between(fecha, as.Date("2018-01-01"), as.Date("2018-12-31")))
dataTwitter2018 <- cbind(dataTwitter2018, anio=2018)
dataTwitter2017 <- dataTwitter%>%
filter(between(fecha, as.Date("2017-01-01"), as.Date("2017-12-31")))
dataTwitter2017 <- cbind(dataTwitter2017, anio=2017)
dataTwitter2016 <- dataTwitter%>%
filter(between(fecha, as.Date("2016-01-01"), as.Date("2016-12-31")))
dataTwitter2016 <- cbind(dataTwitter2016, anio=2016)
newDataTwitter = rbind(dataTwitter2016 , dataTwitter2017 , dataTwitter2018 , dataTwitter2019 , dataTwitter2020 , dataTwitter2021 , dataTwitter2022)
Graficas de variación de estado de ánimo
Para comparar cómo ha evolucionado el estado de ánimo de los Mexicanos a través del tiempo vamos a comparar los datos utilizando gráficas de caja y bigotes filtradas por años para tener una visión general.
boxplot(newDataTwitter$indice~newDataTwitter$anio ,col = "blue", xlab="Año", ylab="Indice", main="Estado de Ánimo de twitteros")
abline(h = mean(dataTwitter2016$indice) , col = "green")
abline(h = mean(newDataTwitter$indice) , col = "orange")
abline(h = mean(dataTwitter2020$indice) , col = "red")
Se pude observar que la media los tweets fue bajando con el tiempo, indicando que el estado de ánimo de los mexicanos fue disminuyendo hasta el 2020, teniendo un alza en el estado de ánimo en el 2021 y continuando con esta alza en lo que se lleva del 2022, teniendo un estado de ánimo parecido al que se tuvo en el año 2017, gracias a que ya se puede salir de la casa y las personas se sienten más relajadas en estos momentos. #### Representación de los datos
- Línea verde - Media de estado de ánimo más alta registrada
- Línea naranja - Media de estado de ánimo general.
- Línea roja - Media de estado de ánimo mínima registrada.
Como podemos observar, el estado de ánimo de los twitteros tuvo una tendencia a la baja desde su punto más alto en 2016 hasta el punto más bajo en 2020, fecha en la cual a finales de febrero se presentó el primer caso de Sars-Covid 19 aquí en México el cual trajo consigo grandes cambios a la población Mexicana, y que aun dos años después sigue afectándonos, pero se puede ver una mejora significativa, llegando incluso a superar la media total de estado de ánimo (línea naranja) en lo que va del año 2022, esto se puede deber a que se han estado tomando las medidas para volver a la normalidad postpandemia, medidas como el uso de cubrebocas, gel antibacterial y la vacuna que el gobierno Mexicano nos ha proporcionado a toda la población Mexicana, lo cual significa que más personas comienzan a salir a convivir con los demás.
También notamos que en todos los años tenemos valores extremos tanto positivos como negativos, esto debido a ciertos sucesos que impactan a la sociedad los cuales generan altos flujos de opiniones entre las personas, afortunadamente notamos que los valores extremos se encuentran del lado positivo, por lo que podemos decir que en general, pareciera que tenemos sucesos más sucesos extraordinarios buenos, que malos.
Integramos nueva variable “Movilidad 2020”
Una vez observado los datos acerca de la variabilidad de los estados de animos de los twitteros, ahora incluimos una nueva variable llamada Movilidad 2020, la cual utilizaremos para campararla y poder determinar si los estados de animo de los twitteros, tiene un cambio respecto a la movilidad, hablando del año 2020.
datosMovilidad2020 <- read_csv("movilidad2020.csv")
## Rows: 10593 Columns: 7
## -- Column specification --------------------------------------------------------
## Delimiter: ","
## dbl (6): recreacion, farmacias, parques, estaciones, trabajo, recidencia
## date (1): fecha
##
## i Use `spec()` to retrieve the full column specification for this data.
## i Specify the column types or set `show_col_types = FALSE` to quiet this message.
datosMovilidad2020
## # A tibble: 10,593 x 7
## fecha recreacion farmacias parques estaciones trabajo recidencia
## <date> <dbl> <dbl> <dbl> <dbl> <dbl> <dbl>
## 1 2020-02-15 6 4 6 4 3 -1
## 2 2020-02-16 7 6 7 6 2 -1
## 3 2020-02-17 2 4 3 5 11 -2
## 4 2020-02-18 0 -1 3 2 9 -2
## 5 2020-02-19 0 0 2 3 8 -1
## 6 2020-02-20 0 -1 2 3 7 -1
## 7 2020-02-21 -2 -2 -1 4 11 -1
## 8 2020-02-22 0 0 7 4 4 0
## 9 2020-02-23 2 1 8 7 2 -1
## 10 2020-02-24 -2 0 6 4 8 -1
## # ... with 10,583 more rows
dataMovilidad2020 <- datosMovilidad2020%>%
filter(between(fecha, as.Date("2020-01-01"), as.Date("2020-12-31")))
dataMovilidad2020 <- cbind(dataMovilidad2020, añio=2020)
Gráfica comparativa interactiva
En la gráfica a continuación vamos a poder comparar de manera directa el índice de estado de ánimo entre los diferentes años para tener una comparativa directa más visual.
p <- plot_ly(x=newDataTwitter$newDataTwitter2020, y=dataTwitter2020$indice, mode = 'lines', type="scatter", name="Indice 2020") %>%
layout(title = 'Estado de ánimo de twitteros en México x Movilidad 2020' ,
yaxis = list(zeroline = FALSE, title = 'Indice'),
xaxis = list(zeroline = FALSE, title = 'Día del Año'), legend = list(font = list(size = 15)))
p <- add_trace(p,y=dataTwitter2021$indice, name="Indice 2021")
p
Comparativa de los estados de ánimo de los mexicanos del 2020 y 2021, con base a los tweets que se usaron en ese tiempo.
El 2020 tuvo un estado de ánimo peor que el 2021 ya que en el 2020 comenzó la pandemia en México, lo que obligo a la población mexicana a permanecer encerrada, lo que no fue normal para una gran parte de la población, además de que afecto las relaciones entre los amigos por la falta de contacto entre estos, provoco conflictos entre parejas que no estaban acostumbradas a tener a sus parejas tanto tiempo con ellos, siendo esto uno de los tantos problemas que género en encierro, además de crean una mayor depresión entre la población mexicana El 2021 la tendencia del ánimo de los mexicanos fue mejorando ya que se llevaba un año en pandemia, con lo que ya se habían acostumbrado, además de que ya se comenzaban a dar las vacunas reduciendo el número de muertos por covid-19, generando un sentimiento de poder volver a sus antiguas viadas, aunque en abril se creó un odio contra las personas que no se querían vacunar, generando discusiones entre la gente que no se quiere vacunar y los fallecidos de covid-19, pero se puede decir que fue un mejor año con respecto al 2020.
Conclusión
Como vimos, el estado de ánimo de los Mexicanos ya tenía una tendencia a bajar antes del inicio de la pandemia y llegó al punto más bajo durante la misma, pero al parecer estamos retomando valores normales e incluso por encima de la media si tomamos en cuenta lo que va del año en curso, por lo que podemos concluir que el estado de ánimo de las personas sí empeoró durante la pandemia en comparación a antes de la misma, pero, en el momento actual, mientras estamos dejando atrás poco a poco la pandemia, el estado de ánimo parece que volverá a los valores sin pandemia.
Conclusión Personal
Se puede llegar a observar como los tweets representan los estados de animo de en este caso México, ya que una forma que tienen las nuevas generaciones de expresarse es a través de las redes sociales donde pueden ser escuchados por el mundo, el problema de esto es que los pensamientos se pierden, se mezclan y pierden valor ante la inmensidad de internet, ocasionando que las voces sean muy poco escuchadas, pero el problema es que los mensajes de odio o de morbo generan un mayor impacto, haciendo una bola de nieve ocasionando más odio para las demás personas, pero en otras ocupaciones este odio se genera por la desaprobación de eventos que sucedieron en México, sin embargo esto no significa que sea la mayoría haciendo pensar que los tweets en México son normalmente de odio, cuando es lo contrario la mayoría de los tweets en México son positivos por lo que se puede llegar a pensar que México es un país normalmente feliz..
Descarga este código
xfun::embed_file("A7U1_Equipo6.Rmd")
xfun::embed_file("movilidad2020.csv")
xfun::embed_file("twitterData.csv")