En esta actividad busca evaluar el estado de animo de los tuiteros para despues determinar la razon de ese comportamiento, para eso usamos los datos proporcionados por el INEGI este a su vez recolecta tuits publicos y georeferenciados que se publican dentro del terrritorio mexicano
library(pacman)
p_load("DT","xfun", "readr","tidyr", "dplyr","prettydoc", "stringr","vembedr", "xfun", "ggplot2", "lubridate")
Twitter <- read_csv("data.csv")
## Rows: 444 Columns: 9
## -- Column specification --------------------------------------------------------
## Delimiter: ","
## chr (3): fecha, tipo_usuario, lugar
## dbl (6): tuits_negativos, indice, recoleccion_promedio, tuits_positivos, neg...
##
## i Use `spec()` to retrieve the full column specification for this data.
## i Specify the column types or set `show_col_types = FALSE` to quiet this message.
twitter<- read_csv("estado de animo .csv")
## Rows: 2259 Columns: 8
## -- Column specification --------------------------------------------------------
## Delimiter: ","
## chr (3): fecha, tipo_usuario, lugar
## dbl (5): tuits_negativos, indice, recoleccion_promedio, tuits_positivos, year
##
## i Use `spec()` to retrieve the full column specification for this data.
## i Specify the column types or set `show_col_types = FALSE` to quiet this message.
twitter
## # A tibble: 2,259 x 8
## fecha tuits_negativos indice recoleccion_promedio tipo_usuario lugar
## <chr> <dbl> <dbl> <dbl> <chr> <chr>
## 1 01/01/2016 34401 2.98 136802 todos NAC
## 2 02/01/2016 34689 2.52 122121 todos NAC
## 3 03/01/2016 39431 2.41 134428 todos NAC
## 4 04/01/2016 46229 2.37 156001 todos NAC
## 5 05/01/2016 44575 2.25 144751 todos NAC
## 6 06/01/2016 43144 2.31 142602 todos NAC
## 7 07/01/2016 42547 2.26 138627 todos NAC
## 8 08/01/2016 46027 2.21 147592 todos NAC
## 9 09/01/2016 38919 2.57 138984 todos NAC
## 10 10/01/2016 40552 2.38 137241 todos NAC
## # ... with 2,249 more rows, and 2 more variables: tuits_positivos <dbl>,
## # year <dbl>
library(plotly)
##
## Attaching package: 'plotly'
## The following object is masked from 'package:ggplot2':
##
## last_plot
## The following object is masked from 'package:stats':
##
## filter
## The following object is masked from 'package:graphics':
##
## layout
plot_ly(data = Twitter, x = Twitter$fecha, y = Twitter$indice, type = 'scatter', mode = 'lines', line = list(color = 'rgb(205, 12, 24)', width = 4))%>% plotly::layout(title = "Estado de animo")
boxplot(indice ~ year, data = twitter , xlab="Año", ylab="Indice", main="Estado de Ánimo")
Nos podemos dar cuenta que hay cuatro fechas que destacan en terminos de negatividad, revisando la tabla podemos darnos cuenta que son eventos ocurridos en:
en cuanto a positividad los datos mas destacados serian relacionados a días festivos como año nuevo. navidad, etc.
al reconocer los datos más atipicos ahora solo se tiene que investigar que paso en esas epocas podemos determinar usando el buscador de google para saber lo que paso esos dias.
conclusión: Se concluye que el estado de animo de los usuarios de twitter mostro una tendencia bajista que se extendio desde mediados de 2017 teniendo su punto mas bajo en abril de 2020 desde entoces los animos de twitter han ido a la alza pero teniendo una gran fluctuacion hasta dia de hoy. Las fechas mas importantes en terminos de negatividad serian:
* 18/10/2019 * 04/05/2021 * 06/03/2022 * 17/02/2020 y en terminos de positividad serian los dias festivos como navidad, año nuevo, el dia de la candelaria y el dia del niño