A7U1_Equipo6

Héctor Leal, Luis Marín, José Orozco, Aldo Mendívil

15/3/2022

Estado de Ánimo de los tuiteros en México.

Introducción

En México el Instituto Nacional de Estadística y Geografía (INEGI) tiene una aplicación capaz de distinguir el estado de ánimo de los Mexicanos usuarios de Twitter (Red social enfocada a compartir información) a partir de de los tweets (Texto corto de 280 caracteres) que estos mismos postean en sus perfiles, la forma en la que este algoritmo funciona esta documentada en el siguiente enlace a documentación. un dato muy importante a tomar en cuenta, es que no se toman en cuenta los tweets de todos los Mexicanos, sólo se toman aquellos tweets dónde el usuario habilitó la opción de “georeferencia”.

En el presente documento analizaremos cómo ha variado el discurso de los Mexicanos en twitter desde 2016 hasta el día de hoy en 2022.

Logo de Twitter

Estado de Ánimo

El estado de ánimo es el humor o tono sentimental, agradable o desagradable, que acompaña a una idea o situación y se mantiene por algún tiempo; ya sea individual o grupalmente.

Covid-19: Un problema mundial

Sin duda alguna no hay nada que nos cambie más de manera emocional que un cambio de paradigmas a los que estamos impuestos o vemos como “normalidad”, como bien sabemos, el virus Sars-Covid 19 llegó a México en los primeros meses del año 2020, pero se tomaron acciones por parte de la secretaría de salud hasta marzo del mismo año cuando se comenzó a preveer que habría contagios masivos, algunas de las acciones fue el aislamiento de todas las personas entre otras medidas que disminuían la interacción social.

Con base a lo anterior, analizaremos más a detalle cómo la pandemia de covid-19 afectó al estado de animo de las personas (si lo afectó de alguna manera) en comparación a cómo se comportaban años atrás y realizaremos una comparación para ver si el discurso ha mejorado, empeorado o se ha mantenido igual a lo largo del tiempo.

Imagen Ilustrativa 1.1

Objetivo

El objetivo del siguiente caso de estudio es analizar los datos proporcionados por el Instituto Nacional de Estadística y Geografía para comparar estado de ánimo de los twitteros en México entre los años 2016-2022, esto con el fin de observar la variabilidad de tweets positivos o negativos antes y durante el evento que azotó a la humanidad, la pandemia del virus COVID-19.

Imagen Ilustrativa 1.2

Datos y Paquetes

Paquetes

Los paquetes a utilizar para el siguiente caso son los siguiente;

library(pacman)
p_load("DT","xfun","ggplot2", "readr","tseries","ggfortify","tidyr", "dplyr","prettydoc",  "psych", "GGally", "stringr","vembedr", "xfun","gridExtra","corrplot", "plotly")

Datos

Los datos que analizaremos son obtenidos directamente de la página oficial del INEGI el cual puedes consultar bajo el nombre de animotuitero. La información es de acceso público y puedes descargar este mismo documento en formato .csv desde el link proporcionado.

Importamos los datos desde el .csv

dataTwitter <- read_csv("twitterData.csv")
## Rows: 2255 Columns: 7
## -- Column specification --------------------------------------------------------
## Delimiter: ","
## chr  (2): tipo_usuario, lugar
## dbl  (4): tuits_negativos, indice, recoleccion_promedio, tuits_positivos
## date (1): fecha
## 
## i Use `spec()` to retrieve the full column specification for this data.
## i Specify the column types or set `show_col_types = FALSE` to quiet this message.
dataTwitter
## # A tibble: 2,255 x 7
##    fecha      tuits_negativos indice recoleccion_promedio tipo_usuario lugar
##    <date>               <dbl>  <dbl>                <dbl> <chr>        <chr>
##  1 2016-01-01           34401   2.98               136802 todos        NAC  
##  2 2016-01-02           34689   2.52               122121 todos        NAC  
##  3 2016-01-03           39431   2.41               134428 todos        NAC  
##  4 2016-01-04           46229   2.37               156001 todos        NAC  
##  5 2016-01-05           44575   2.25               144751 todos        NAC  
##  6 2016-01-06           43144   2.31               142602 todos        NAC  
##  7 2016-01-07           42547   2.26               138627 todos        NAC  
##  8 2016-01-08           46027   2.21               147592 todos        NAC  
##  9 2016-01-09           38919   2.57               138984 todos        NAC  
## 10 2016-01-10           40552   2.38               137241 todos        NAC  
## # ... with 2,245 more rows, and 1 more variable: tuits_positivos <dbl>

Conociendo los datos a traves de una tabla interactiva

datatable(dataTwitter)

Definiendo los datos.

Como podemos observar, los datos vienen con una marca de la fecha, en este caso diaria desde el 1 de enero del 2016 hasta el 9 de marzo del 2022.

  • Tuits positivos y negativos - Son la cantidad de tweets que la aplicación detectó y categorizó como positivo o negativo.

  • Recolección promedio - Es la cantidad de tweets recolectados en dicho día.

  • Indice - Se calcula a través de (tuitsPositivos / tuitsNegativos); entre mayor, significa mejor estado de ánimo.

  • Tipo de Usuario - Se refiere a si es ciudadano mexicano o turista.

  • Lugar - En este caso todos son NAC (Nacional).

Desarrollo

Representación gráfica de los datos

Para comprender mejor los datos, vamos a ver los datos con una gráfica interactiva.

plot_ly(data = dataTwitter, x = dataTwitter$fecha , y = dataTwitter$indice, type = 'scatter' , mode = 'lines')%>% layout(title = 'Estado de ánimo de twitteros en México',
         yaxis = list(zeroline = FALSE, title = 'Indice'),
         xaxis = list(zeroline = FALSE), title = 'Fecha')

(Tomando en cuenta que a mayor índice, mejor estado de ánimo)

Curiosamente, vemos a través de esta gráfica que nunca se han tenido mas tweets negativos que positivos (recordando que el índice se calcula [tweets positivos / tweets negativos]) aún que si vemos algunos puntos en donde el índice era extremadamente bajo y en un caso casí llego a 1.

Interpretando los datos.

Podemos observar en la gráfica que hay 4 momentos en toda la historia de nuestros datos en los cuales el índice descendió a menos de 1.4.

Si nos vamos a buscar en noticias qué sucedio en esos días, encontramos lo siguiente:

  • (18 de Octubre de 2019) - La aprhension y posterior liberación de un líder del cártel de Sinaloa.

  • (17 de Febrero de 2020) - El trágico fallecimiento de una niña llamada Fátima.

  • (4 de Mayo de 2021) - La caída de la Línea 12 del metro de la Ciudad de México.

  • (6 de Marzo de 2022) - El incidente en el estadio Corregidora en Querétaro.

Como podemos observar, todos los incidentes que nos llevaron a tener un discurso de odio / mal estado de ánimo a los mexicanos son causados por tragedias ocurridas dentro del país, donde las personas se enteran de las noticias por medio de esta red social y lanzan su opinión al respecto.

También podemos observar que los picos más altos se dan en días festivos cómo lo son:

  • Año nuevo

  • Día de las Madres

  • Día del Niño

  • Navidad

Y algunos otros sucesos que no se atienen a una fecha en particular del año como lo son partidos de futbol, eventos mundiales o nacionales.

Comparando los datos.

Como vimos anteriormente, el estado de ánimo en twitter es afectado de manera negativa por tragedias y aumenta en fechas familiares o eventos importantos, pero la pregunta aquí es ¿que tanto afectó la pandemia al estado de ánimo en twitter? y ¿ha mejorado o empeorado desde que comenzó?

Vamos a ver esta comparativa de manera gráfica

Dividiendo los datos por año

dataTwitter2022 <- dataTwitter%>% 
  filter(between(fecha, as.Date("2022-01-01"), as.Date("2022-12-31")))

dataTwitter2022 <- cbind(dataTwitter2022, anio=2022)

dataTwitter2021 <- dataTwitter%>% 
  filter(between(fecha, as.Date("2021-01-01"), as.Date("2021-12-31")))

dataTwitter2021 <- cbind(dataTwitter2021, anio=2021)

dataTwitter2020 <- dataTwitter%>% 
  filter(between(fecha, as.Date("2020-01-01"), as.Date("2020-12-31")))

dataTwitter2020 <- cbind(dataTwitter2020, anio=2020)

dataTwitter2019 <- dataTwitter%>% 
  filter(between(fecha, as.Date("2019-01-01"), as.Date("2019-12-31")))

dataTwitter2019 <- cbind(dataTwitter2019, anio=2019)

dataTwitter2018 <- dataTwitter%>% 
  filter(between(fecha, as.Date("2018-01-01"), as.Date("2018-12-31")))

dataTwitter2018 <- cbind(dataTwitter2018, anio=2018)

dataTwitter2017 <- dataTwitter%>% 
  filter(between(fecha, as.Date("2017-01-01"), as.Date("2017-12-31")))

dataTwitter2017 <- cbind(dataTwitter2017, anio=2017)

dataTwitter2016 <- dataTwitter%>% 
  filter(between(fecha, as.Date("2016-01-01"), as.Date("2016-12-31")))

dataTwitter2016 <- cbind(dataTwitter2016, anio=2016)


newDataTwitter = rbind(dataTwitter2016 , dataTwitter2017 , dataTwitter2018 , dataTwitter2019 , dataTwitter2020 , dataTwitter2021 , dataTwitter2022)

Graficas de variación de estado de ánimo

Para comparar como ha evolucionado el estado de ánimo de los Mexicanos a través del tiempo vamos a comparar los datos utilizando gráficas de caja y bigotes filtradas por años para tener una visión general.

boxplot(newDataTwitter$indice~newDataTwitter$anio ,col = "blue", xlab="Año", ylab="Indice", main="Estado de Ánimo de twitteros")

abline(h = mean(dataTwitter2016$indice) , col = "green")
abline(h = mean(newDataTwitter$indice) , col = "orange")
abline(h = mean(dataTwitter2020$indice) , col = "red")

#### Representación de los datos

  • Línea verde - Media de estado de ánimo más alta registrada
  • Línea naranja - Media de estado de ánimo general.
  • Línea roja - Media de estado de ánimo mínima registrada.

Como podemos observar, el estado de ánimo de los twitteros tuvo una tendencia a la baja desde su punto más alto en 2016 hasta el punto más bajo en 2020, que fue el año dónde sucedió el inicio de la pandemia y sigue afectandonos hasta este año 2022, pero se puede ver una mejora significativa, llegando incluso a superar la media total de estado de ánimo (línea naranja) en lo que va del año 2022, esto se puede deber en parte a que se han estado tomando medidas para volver a la normalidad post-pandemia lo cual significa que más personas comienzan a salir a convivir con los demás.

También notamos que en todos los años tenemos valores extremos tanto positivos como negativos, esto debido a ciertos sucesos que impáctan a la sociedad los cuales generan altos flujos de opiniones entre las personas, afortunadamente notamos que los valores extremos se encuentran del lado positivo, por lo que podemos decir que en general, pareciera que tenemos sucesos más sucesos extraordinarios buenos, que malos.

Gráfica comparativa interactiva

En la gráfica a continuación vamos a poder comparar de manera directa el índice de estado de ánimo entre los diferentes años para ver cómo se comportó la variable durante estos años.

p <- plot_ly(x=newDataTwitter, y=dataTwitter2016$indice, mode = 'lines', type="scatter", name="Indice 2016") %>%
  layout(title = 'Estado de ánimo de twitteros en México' ,
         yaxis = list(zeroline = FALSE, title = 'Indice'),
         xaxis = list(zeroline = FALSE, title = 'Día del Año'), legend = list(font = list(size = 15)))
p <- add_trace(p,y=dataTwitter2017$indice, name="Indice 2017")
p <- add_trace(p,y=dataTwitter2018$indice, name="Indice 2018")
p <- add_trace(p,y=dataTwitter2019$indice, name="Indice 2019")
p <- add_trace(p,y=dataTwitter2020$indice, name="Indice 2020")
p <- add_trace(p,y=dataTwitter2021$indice, name="Indice 2021")
p <- add_trace(p,y=dataTwitter2022$indice, name="Indice 2022")
p

Agregando Datos de Movilidad Residencial

Una vez observado los datos acerca de la variabilidad de los estados de animos de los twitteros, ahora incluimos una nueva variable, esta será el índice de movilidad residencial, esta nos dice que tanto las personas se mantuvieron en su casa en comparación a un valor de referencia, con este valor analizaremos si existe una relación entre el estado de ánimo de las personas y si estuvieron o no más tiempo en sus casas, para esto utilizaremos sólo datos del año 2020.

Estos datos los obtenemos de el Reporte de Movilidad de google que puedes consultar y descargar de manera gratuita, para este análisis nos enfocaremos sólamente en el año 2020 y utilizaremos la variable de “Residential” o Residencial la cual representa el porcentaje positivo o negativo de las personas que estuvieron 24 horas en sus casas con respecto a un valor de referencia cuando no había pandemia por Covid-19.

Datos de Movilidad de Google

Los datos que utilizaremos vienen directamente de google y pueden acceder a ellos a través del siguiente enlace: https://www.google.com/covid19/mobility/?hl=es Para esta comparativa nos enfocaremos únicamente en los datos de movilidad residencial en México para el año 2020.

Estos datos son obtenidos a partir de los celulares android conectados a internet y que tienen la opción de GPS activada, de esta manera se sabe el lugar en el que permaneció la persona, luego el valor con el que vamos a tratar es un valor porcentual por encima o por debajo del valor de referencia (el cual es un valor pre pandemia del 3 de enero al 6 de febrero del 2020) y de esta manera sabremos si las personas permanecieron o no dentro de sus casas y en que periodo.

Ingresando los datos de movilidad

datosMovilidad2020 <- read_csv("movilidad2020.csv")
## Rows: 10593 Columns: 15
## -- Column specification --------------------------------------------------------
## Delimiter: ","
## chr (6): country_region_code, country_region, sub_region_1, iso_3166_2_code,...
## dbl (6): retail_and_recreation_percent_change_from_baseline, grocery_and_pha...
## lgl (3): sub_region_2, metro_area, census_fips_code
## 
## i Use `spec()` to retrieve the full column specification for this data.
## i Specify the column types or set `show_col_types = FALSE` to quiet this message.
datatable(datosMovilidad2020)
## Warning in instance$preRenderHook(instance): It seems your data is too big
## for client-side DataTables. You may consider server-side processing: https://
## rstudio.github.io/DT/server.html

Significado de los datos.

Como podemos observar, los datos del archivo de movilidad abarcan desde el 15 de febrero del 2020 hasta el 31 de diciembre del 2020. Las variables que nos proporciona el documento son las siguientes:

  • country_region_code: Código de Región de País.
  • country_region: Region de Pais.
  • sub_region_1: Sub Region 1.
  • sub_region_2: Sub Region 2.
  • metro_area: Área de metro.
  • iso_3166_2_code: Códigos de identificación de las principales subdivisiones del país.
  • census_fips_code: Códigos numéricos y alfabéticos de dos letras para identificación de estados.
  • place_id: ID del Lugar.
  • date: Fecha.
  • retail_and_recreation_percent_change_from_baseline: Porcentaje de venta minorista y recreación.
  • grocery_and_pharmacy_percent_change_from_baseline: Porcentaje de abarrotes y farmacias.
  • parks_percent_change_from_baseline: Porcentaje de parques.
  • transit_stations_percent_change_from_baseline: Porcentaje de estaciones de tránsito.
  • workplaces_percent_change_from_baseline: Porcentaje de lugares de trabajo.
  • residential_percent_change_from_baseline: Porcentaje residencial.

Sin embargo las variables que más nos interesan sobre la movilidad de la población mexicana presentadas en el anterior documento, son la fecha y el porcentaje de residencia, el cual se muestra a continuación.

Modificando los datos

Modificamos el formato de fechas para que coincida con los demás datos que ya tenemos (yyyy-mm-dd)

newDatosMovilidad <- datosMovilidad2020

newDatosMovilidad$date <- as.Date(as.character(newDatosMovilidad$date) , format = "%d/%m/%y")

Obteniendo la media diaria de movilidad en México

Cómo tenemos datos de movilidad para todas los estados para los mismos días, vamos a agrupar estos dentro de una sola fecha obteniendo la media de todos los datos de movilidad residencial para cada día del año, de esta manera obtendremos el porcentaje de personas en México que se mantuvo en sus casas.

fechaRef <- as.Date("2020-01-5")
fechaMax <- as.Date("2020-12-31")

dataMovilidadMedia <- data.frame("fecha"=c(as.Date("2020-01-4")), "porcentaje_residencial"=c(0))

while(fechaRef < fechaMax){
  dataFecha <- subset(newDatosMovilidad, date == fechaRef , select =c(residential_percent_change_from_baseline))
  
  dataMean <- data.frame("fecha"=c(fechaRef), "porcentaje_residencial"=c(mean(dataFecha$residential_percent_change_from_baseline)))
  
  fechaRef <- fechaRef+1
  
  dataMovilidadMedia <- rbind(dataMovilidadMedia, dataMean)
  
}

dataMovilidadMedia$porcentaje_residencial <- round(dataMovilidadMedia$porcentaje_residencial, 0)

datatable(dataMovilidadMedia)

Gráfica comparativa

Vamos a graficar el índice de felicidad y el porcentaje de personas que se mantuvieron en sus casas para comparar ambas gráficas y observar si existe alguna relación entre ellas.

Nota: El porcentaje residencial esta dividido en 10 para tener las gráficas mas agrupadas.

dataMovilidadMediaModificada <- dataMovilidadMedia

dataMovilidadMediaModificada$porcentaje_residencial <- dataMovilidadMediaModificada$porcentaje_residencial / 10

p <- plot_ly(data = dataTwitter2020, x = dataTwitter2020$fecha , y = dataTwitter2020$indice , mode = 'lines', type="scatter", name="Indice Felicidad") %>%
  layout(title = 'Estado de ánimo de twitteros en México x Movilidad 2020' ,
         yaxis = list(zeroline = FALSE, title = 'Indice'),
         xaxis = list(zeroline = FALSE, title = 'Día del Año'), legend = list(font = list(size = 15)))
p <- add_trace(p,y=dataMovilidadMediaModificada$porcentaje_residencial , name="Porcentaje Residencial")
p

Como podemos observar, pareciera existir una relación entre el estado de ánimo de las personas y el porcentaje de personas que salieron de sus casas, cuanto más aumenta el porcentaje de personas que salieron de sus casas (en comparación al valor de referencia) podemos notar que el estado de ánimo baja, y al momento de más personas estar en sus casas, el estado de ánimo se normaliza un poco.

Agregando datos de Descesos por Covid 19

Ya vimos que existe una relación entre la cantidad de personas en sus casas y el estado de ánimo de las personas, pero vamos a ver si realmente el estado de ánimo baja porque las personas salen de sus casas, o porque se enteran de las cifras de descesos ocasionadas por el virus.

Decesos Covid 19

Los siguientes datos son obtenidos del sitio web de la Universidad de Medicina Johns Hopkins University, la cual proporciona datos a nivel sobre el avance el impacto que ha causado esta enfermedad alrededor del mundo. El sitio web nos proporciona datos específicos de los casos de confirmados de personas de por COVID 19, casos recuperados y decesos de esta enfermedad, sin embargo, solo nos concentraremos en los decesos que se han presentado en México.

Datos obtenidos de: “Coronavirus COVID-19 Global Cases by the Center for Systems Science and Engineering (CSSE) at Johns Hopkins University (JHU)” https://coronavirus.jhu.edu/map.html

Para la obtención de los datos se realizara los siguiente;

Declaración de la variables que contendra la url en donde se encuentran los datos crudos de los decesos.

url_decesos <- "https://raw.githubusercontent.com/CSSEGISandData/COVID-19/master/csse_covid_19_data/csse_covid_19_time_series/time_series_covid19_deaths_global.csv"

Lectura del archiv.csv url_decesos

datos_decesos <- read.csv(url_decesos)

Definición de Variable, la cual solo abarcara los datos de la región de México, debido a que se encuentran datos de otros países.

dec_mex  <- t(datos_decesos[datos_decesos$Country.Region=="Mexico" ,])

Creación de Vector, para la posterior obtención de los datos en el siguiente rango de fechas 2020-01-22 y 2020-12-31

Fecha <- seq(from = as.Date("2020-01-22"), to = as.Date("2020-12-31"), by = "day")

Obtención de los datos a partir del vector establecido.

vec1 <- as.vector(dec_mex)
vec2 <- vec1[5:349]
num1 <- as.numeric(vec2)
Decesos <- as.vector(num1)

Datos de Decesos por covid

En esta tabla podemos observar la cantidad de decesos acumulados por día

datos1 <- data.frame(Fecha,Decesos)

fechaRef <- as.Date("2020-01-06")
fechaMax <- as.Date("2020-01-22")

datosDecesosAjustados <- data.frame("Fecha"=c(as.Date("2020-01-05")), "Decesos"=c(0))

while(fechaRef < fechaMax){
  dataFecha <- subset(newDatosMovilidad, date == fechaRef  , select =c(residential_percent_change_from_baseline))
  
  extraData <- data.frame("Fecha"=c(fechaRef), "Decesos"=c(0))
  
  fechaRef <- fechaRef+1
  
  datosDecesosAjustados <- rbind(datosDecesosAjustados, extraData);
}


datosDecesosAjustados <- rbind(datosDecesosAjustados, datos1)

datatable(datosDecesosAjustados)

Gráfica interactiva de Decesos

En la siguiente gráfica podremos ver nuestros datos de decesos y como incrementaron a lo largo del tiempo de forma interactiva

gcov <- ggplot(data = datos1) +
  geom_line(aes(Fecha, Decesos, colour="Decesos"))  +
  xlab("Fecha") +
  ylab("COVID-19 en México") +
  labs(colour="casos")+
  ggtitle("Casos de COVID-19 en México (Fuente: JHU CSSE") +
  scale_y_continuous(labels = )
ggplotly(gcov)

Como habrán notado el índice de personas fallecidas era prácticamente de 0 personas al día al comienzo del año 2020, sin embargo, cabe resaltar que la primera persona confirmada que contrajo esta enfermedad fue detectada el 27 de febrero del 2020 en un joven de 35 años que estuvo en un viaje a Italia, este fue el primer caso en confirmado, pero esto no nos aseguraba que fuera el único de miles de personas que ya estaban contagiados por COVID 19. No paso mucho tiempo que la enfermedad se esparciera rápidamente por México, un mes después del se presentaron los primeros decesos de personas fallecidas por COVID 19, situación que fue en aumento, como se muestra en la grafica.

Gráfica de Decesos, Residencial y Felicidad

Como hemos visto hasta el momento hemos analizado el estado de ánimo de la personas usuarias de Twitter , la movilidad de los usuarios Android dede México y el índice de decesos presentados en México por COVID 19, ahora procederemos a observar la relación entre estos en base al índice de estados de ánimos de los twitteros(2020), el porcentaje de residencia de la movilidad de los usuarios Android en México (2020) y el índice de decesos por COVID 19 (2020).

NOTA: La cantidad de decesos esta dividida entre 100,000 Nota2: El porcentaje de movilidad residencial está dividido en 10

datosAjustadosDecesos <- datosDecesosAjustados

datosAjustadosDecesos$Decesos <- datosDecesosAjustados$Decesos / 100000

datosMovilidadAjustados <- dataMovilidadMedia

datosMovilidadAjustados$porcentaje_residencial <- dataMovilidadMedia$porcentaje_residencial / 10

e <- plot_ly(data = datosAjustadosDecesos, x = datosAjustadosDecesos$Fecha , y = datosAjustadosDecesos$Deceso , mode = 'lines', type="scatter", name="Decesos") %>%
  layout(title = 'Estado de ánimo de twitteros en México x Movilidad x Decesos' ,
         yaxis = list(zeroline = FALSE, title = 'Indice'),
         xaxis = list(zeroline = FALSE, title = 'Día del Año'), legend = list(font = list(size = 15)))
e <- add_trace(e,y= datosMovilidadAjustados$porcentaje_residencial , name="Porcentaje Residencial")
e <- add_trace(e,y=  dataTwitter2020$indice  , name="Indice de felicidad")
e

Gráfica con todas las variables

Ahora vamos a comparar todos nuestros datos, siendo la cantidad de Decesos, el porcentaje de personas en sus casas, la cantidad de Tweets Negativos y la cantidad de Tweets Positivos de manera diaria en 2020.

Nota: El porcentaje de movilidad residencial está multiplicado por 1,000

dataMovilidadAjustada <- dataMovilidadMedia

dataMovilidadAjustada$porcentaje_residencial <- dataMovilidadMedia$porcentaje_residencial * 1000

e <- plot_ly(data = datosDecesosAjustados, x = datosDecesosAjustados$Fecha , y = datosDecesosAjustados$Deceso , mode = 'lines', type="scatter", name="Decesos") %>%
  layout(title = 'Tweets negativos en México x Movilidad Residencial x Decesos por Covid' ,
         yaxis = list(zeroline = FALSE, title = 'Indice'),
         xaxis = list(zeroline = FALSE, title = 'Día del Año'), legend = list(font = list(size = 15)))
e <- add_trace(e,y= dataMovilidadAjustada$porcentaje_residencial , name="Porcentaje Residencial")
e <- add_trace(e,y=  dataTwitter2020$tuits_negativos   , name="Tweets Negativos")
e <- add_trace(e,y=  dataTwitter2020$tuits_positivos   , name="Tweets Positivos")
e

Como podemos observar, los tweets negativos y positivos se mantuvieron de manera constante durante todo el año 2020 a pesar del aumento en los decesos, también podemos observar como, a pesar de tener la pandemia encima, los Meixcanos salieron aún más de lo que lo hacían entes de la pandemia a pesar, de que en teoría, las recomendaciones era manenterse en casa el mayor tiempo posible.

Conclusion

Como pudimos observar, el estado de ánimo de los Mexicanos tenía una tendencia a bajar incluso antes del inicio de la pandemia, pero este llegó a su punto más bajo durante la misma y pareciera que el estado de ánimo se está recuperando poco a poco a pesar de que la cantidad de decesos sigue aumentando, una vez realizado este análisis, los datos parecen indicar que el estado de ánimo de los tuiteros si disminuyó con la pandemia, pero la movilidad no tiene un impácto en esta, pues como observamos, se mantuvo en porcentajes elevados al valor de referencia y de manera constante durante toda la pandemia a excepción del inicio, dónde el gobierno hizo una cuarentena casi obligatoria.

Conslusion personal “José Jesús Orozco Hernández”

Al observar el siguiente caso podemos mencionar que la pandemia trajo consigo grandes consecuencias a toda la república mexicana situación que cambio el estado de ánimo de los habitantes de México, la forma de movilidad, entre muchas cosas más. Pero al no ser un país los suficientemente desarrollado el índice de decesos por COVID 19 alcanzo limites demasiado altos. Pero hay que recordar, todo debe de continuar y nunca quedarse estancados , poco a poco a pesar de estar lo suficientemente preparados podemos salir adelante.

Descargas

Documento Markdown

xfun::embed_file("A7U1_Equipo6.Rmd")

Download A7U1_Equipo6.Rmd

Datos Twitter

xfun::embed_file("twitterData.csv")

Download twitterData.csv

Datos Movilidad

xfun::embed_file("movilidad2020.csv")

Download movilidad2020.csv