Tarea 7 estudio sobre el estado de animo de tuiteros
En esta actividad busca evaluar el estado de animo de los tuiteros para despues determinar la razon de ese comportamiento, para eso usamos los datos proporcionados por el INEGI este a su vez recolecta tuits publicos y georeferenciados que se publican dentro del terrritorio mexicano
library(pacman)
p_load("DT","xfun", "readr","tidyr", "dplyr","prettydoc", "stringr","vembedr", "xfun", "ggplot2", "lubridate")
Twitter <- read_csv("data.csv")## Rows: 444 Columns: 9
## -- Column specification --------------------------------------------------------
## Delimiter: ","
## chr (3): fecha, tipo_usuario, lugar
## dbl (6): tuits_negativos, indice, recoleccion_promedio, tuits_positivos, neg...
##
## i Use `spec()` to retrieve the full column specification for this data.
## i Specify the column types or set `show_col_types = FALSE` to quiet this message.
twitter<- read_csv("estado de animo .csv")## Rows: 2259 Columns: 8
## -- Column specification --------------------------------------------------------
## Delimiter: ","
## chr (3): fecha, tipo_usuario, lugar
## dbl (5): tuits_negativos, indice, recoleccion_promedio, tuits_positivos, year
##
## i Use `spec()` to retrieve the full column specification for this data.
## i Specify the column types or set `show_col_types = FALSE` to quiet this message.
twitter## # A tibble: 2,259 x 8
## fecha tuits_negativos indice recoleccion_promedio tipo_usuario lugar
## <chr> <dbl> <dbl> <dbl> <chr> <chr>
## 1 01/01/2016 34401 2.98 136802 todos NAC
## 2 02/01/2016 34689 2.52 122121 todos NAC
## 3 03/01/2016 39431 2.41 134428 todos NAC
## 4 04/01/2016 46229 2.37 156001 todos NAC
## 5 05/01/2016 44575 2.25 144751 todos NAC
## 6 06/01/2016 43144 2.31 142602 todos NAC
## 7 07/01/2016 42547 2.26 138627 todos NAC
## 8 08/01/2016 46027 2.21 147592 todos NAC
## 9 09/01/2016 38919 2.57 138984 todos NAC
## 10 10/01/2016 40552 2.38 137241 todos NAC
## # ... with 2,249 more rows, and 2 more variables: tuits_positivos <dbl>,
## # year <dbl>
Analsis de los datos
library(plotly)##
## Attaching package: 'plotly'
## The following object is masked from 'package:ggplot2':
##
## last_plot
## The following object is masked from 'package:stats':
##
## filter
## The following object is masked from 'package:graphics':
##
## layout
plot_ly(data = Twitter, x = Twitter$fecha, y = Twitter$indice, type = 'scatter', mode = 'lines', line = list(color = 'rgb(205, 12, 24)', width = 4))%>% plotly::layout(title = "Estado de animo")boxplot(indice ~ year, data = twitter , xlab="Año", ylab="Indice", main="Estado de Ánimo")Nos podemos dar cuenta que hay cuatro fechas que destacan en terminos de negatividad, revisando la tabla podemos darnos cuenta que son eventos ocurridos en:
- 18/10/2019
- 04/05/2021
- 06/03/2022
- 17/02/2020
en cuanto a positividad los datos mas destacados serian relacionados a días festivos como año nuevo. navidad, etc.
al reconocer los datos más atipicos ahora solo se tiene que investigar que paso en esas epocas podemos determinar usando el buscador de google para saber lo que paso esos dias.
- 18/10/2019: Las revueltas provocadas porel arresto de Ovidio Guzman Lopez
- 04/05/2021: Colapso del paso elevado en la linea 12 del metro en CDMX
- 06/03/2022: Riña en el estadio corregidora en Queretaro
- 17/02/2020: aumento en los contagios de coronavirus
conclusión: Se concluye que el estado de animo de los usuarios de
twitter mostro una tendencia bajista que se extendio desde mediados de
2017 teniendo su punto mas bajo en abril de 2020 desde entoces los
animos de twitter han ido a la alza pero teniendo una gran fluctuacion
hasta dia de hoy. Las fechas mas importantes en terminos de negatividad
serian:
* 18/10/2019 * 04/05/2021 * 06/03/2022 * 17/02/2020 y en terminos de
positividad serian los dias festivos como navidad, año nuevo, el dia de
la candelaria y el dia del niño