Tarea 7

Luis Ochoa, Cinthia Corral, Rafael Soqui, Omar Cortez

15/3/2022

Tarea 7 estudio sobre el estado de animo de tuiteros

En esta actividad busca evaluar el estado de animo de los tuiteros para despues determinar la razon de ese comportamiento, para eso usamos los datos proporcionados por el INEGI este a su vez recolecta tuits publicos y georeferenciados que se publican dentro del terrritorio mexicano

library(pacman)
p_load("DT","xfun", "readr","tidyr", "dplyr","prettydoc", "stringr","vembedr", "xfun", "ggplot2", "lubridate", "plotly")
Twitter <- read_csv("data.csv")
## Rows: 2259 Columns: 7
## -- Column specification --------------------------------------------------------
## Delimiter: ","
## chr (3): fecha, tipo_usuario, lugar
## dbl (4): tuits_negativos, indice, recoleccion_promedio, tuits_positivos
## 
## i Use `spec()` to retrieve the full column specification for this data.
## i Specify the column types or set `show_col_types = FALSE` to quiet this message.
twitter<- read_csv("estado de animo .csv")
## Rows: 2259 Columns: 8
## -- Column specification --------------------------------------------------------
## Delimiter: ","
## chr (3): fecha, tipo_usuario, lugar
## dbl (5): tuits_negativos, indice, recoleccion_promedio, tuits_positivos, year
## 
## i Use `spec()` to retrieve the full column specification for this data.
## i Specify the column types or set `show_col_types = FALSE` to quiet this message.
datatable(twitter)

Analsis de los datos

plot_ly(data = Twitter, x = Twitter$fecha , y = Twitter$indice, type = 'scatter' , mode = 'lines', line = list(color = 'rgb(205, 12, 24)', width = 4))%>% layout(title = 'Estado de animo',
         yaxis = list(zeroline = FALSE, title = 'Indice'),
         xaxis = list(zeroline = FALSE), title = 'Fecha')
boxplot(indice ~ year, data = twitter , xlab="Año", ylab="Indice", main="Estado de Ánimo")

Nos podemos dar cuenta que hay cuatro fechas que destacan en terminos de negatividad, revisando la tabla podemos darnos cuenta que son eventos ocurridos en:

  • 18/10/2019
  • 04/05/2021
  • 06/03/2022
  • 17/02/2020

en cuanto a positividad los datos mas destacados serian relacionados a días festivos como año nuevo. navidad, etc.

al reconocer los datos más atipicos ahora solo se tiene que investigar que paso en esas epocas podemos determinar usando el buscador de google para saber lo que paso esos dias.

  • 18/10/2019: Las revueltas provocadas porel arresto de Ovidio Guzman Lopez
  • 04/05/2021: Colapso del paso elevado en la linea 12 del metro en CDMX
  • 06/03/2022: Riña en el estadio corregidora en Queretaro
  • 17/02/2020: aumento en los contagios de coronavirus

Conclusión:

Se concluye que el estado de animo de los usuarios de twitter mostro una tendencia bajista que se extendio desde mediados de 2017 teniendo su punto mas bajo en abril de 2020 desde entoces los animos de twitter han ido a la alza pero teniendo una gran fluctuacion hasta dia de hoy. Las fechas mas importantes en terminos de negatividad serian:
* 18/10/2019 * 04/05/2021 * 06/03/2022 * 17/02/2020 y en terminos de positividad serian los dias festivos como navidad, año nuevo, el dia de la candelaria y el dia del niño

xfun::embed_file("tarea.rmd")

Download tarea.rmd