CASO DE ESTUDIO 4

Luis Ochoa, Cinthia Corral, Rafael Soqui, Omar Cortez

16/3/2022

Introduccion

En esta actividad en base a datos estadísticos recuperados de diversos sitios de internet, pudimos sacar estadísticamente cuando las personas son más felicidades, si en cuarentena o cuando no hay cuarentena y gracias a los datos obtenidos nos pudimos percatar gráficamente realmente como es más feliz las personas, en este caso utilizamos la variable “twitter” para extraer la data de este y poder concluir el trabajo en base al estado de “felicidad” de las personas desde inicio de pandemía hasta hoy día, en la variable busqueda de covid nos encontramos con la data de busquedas de covid por la plataforma google trend, “tweets positivos” que da referencia a los tweets ya no tan deprimentes como solía ser al inicio de pandemía y como fueron cambiando a lo largo de toda la pandemia, y “tweets negativos como fueron intensificandose a lo largo y ancho de estos 2 años, más al inicio como se presentará a continuación.

Carga de las variables

options(readr.show_col_types = FALSE)
Movilidad<- read_csv("2020_MX_Region_Mobility_Report (1).csv")
twitter <- read_excel("data.xlsx")
Busquedas_covid <- read_csv("Busquedas covid.csv")
View(twitter)
tweetsxcovid <- data.frame(twitter$fecha[1506:1823], Movilidad$residential_percent_change_from_baseline[1:318], twitter$tuits_negativos[1506:1823],twitter$tuits_positivos[1506:1823], twitter$indicex10[1506:1823],twitter$neg1000[1506:1823],twitter$pos1000[1506:1823])
show_col_types = FALSE
datatable(twitter)
datatable(Busquedas_covid)
datatable(Movilidad)
## Warning in instance$preRenderHook(instance): It seems your data is too big
## for client-side DataTables. You may consider server-side processing: https://
## rstudio.github.io/DT/server.html

Representacion grafica de los datos

library(GGally)
## Registered S3 method overwritten by 'GGally':
##   method from   
##   +.gg   ggplot2
ggpairs(tweetsxcovid, lower = list(continuous ="smooth"),
        diag = list (continuos = "barDiag"), axisLabels = "none")

Nos podemos dar cuenta que hay una ligera correlacion entre el indice de felicidad tuitera y cuantas personas estan en cuarentena.

En este grfico interactivo se compararan las variables de positivad con la cantidad de personas en areas residenciales para ver si hay alguna relación.

fig <- plot_ly(data=tweetsxcovid,x=tweetsxcovid$twitter.fecha.1506.1823., y = tweetsxcovid$twitter.indicex10.1506.1823., name = 'indice tuiteros', type = 'scatter', mode = 'lines') 
fig <- fig %>% add_trace(y = tweetsxcovid$Movilidad.residential_percent_change_from_baseline.1.318., name = 'movilidad') 
fig <- fig %>% add_trace(y = tweetsxcovid$twitter.neg1000.1506.1823., name = 'tuits negativos', mode = 'lines',line = list(color = 'rgb(205, 12, 24)')) 
fig <- fig %>% add_trace(y = tweetsxcovid$twitter.pos1000.1506.1823., name = 'tuits positivos', mode = 'lines',line = list(color = 'rgb(0,128,0)'))

fig

Se puede observar que al disminuir las personas en cuarentena aumenta la felicidad de los tuiteros levemente respecto al indice.

anydate(Busquedas_covid$Semana)
##  [1] "2020-02-16" "2020-02-23" "2020-03-01" "2020-03-08" "2020-03-15"
##  [6] "2020-03-22" "2020-03-29" "2020-04-05" "2020-04-12" "2020-04-19"
## [11] "2020-04-26" "2020-05-03" "2020-05-10" "2020-05-17" "2020-05-24"
## [16] "2020-05-31" "2020-06-07" "2020-06-14" "2020-06-21" "2020-06-28"
## [21] "2020-07-05" "2020-07-12" "2020-07-19" "2020-07-26" "2020-08-02"
## [26] "2020-08-09" "2020-08-16" "2020-08-23" "2020-08-30" "2020-09-06"
## [31] "2020-09-13" "2020-09-20" "2020-09-27" "2020-10-04" "2020-10-11"
## [36] "2020-10-18" "2020-10-25" "2020-11-01" "2020-11-08" "2020-11-15"
## [41] "2020-11-22" "2020-11-29" "2020-12-06" "2020-12-13" "2020-12-20"
## [46] "2020-12-27"
ggplot(Busquedas_covid, aes(x=anydate(Busquedas_covid$Semana), y=Busquedas_covid$covid)) +
      geom_point() +
      geom_line() + 
      scale_y_continuous(limits = c(0,100), breaks=seq(0,100,10)) + 
      scale_x_date(date_breaks = "months" , date_labels = "%b-%y")+labs(x=("Fecha"), y=("Popularidad"))

se puede notar que al mismo tiempo que se busco menos la palabra “covid” en internet tambien se reducieron en gran medida los tweets negativos

Conclusion:

se puede concluir que la felicidad de los usuarios de tuiter esta ligada a la cuarentena que ocurrio en 2020 y parte de 2021

Descarga este código

xfun::embed_file("caso de estudio 4.Rmd")

Download caso de estudio 4.Rmd