¿Que están buscando las personas durante la pandemia últimamente?
Para este ejercicio utilizamos la herramienta de google trenes para analizar datos de búsqueda en México en los últimos 12 meses. Nos llamó la atención que muchas personas buscaron “Síntomas del coronavirus” y planteamos la hipótesis de que algunas personas podían enfermar de gripe y no saber si estaban enfermas de gripe o coronavirus o viceversa lo que los llevo a buscar síntomas de coronavirus para descartarlo o viceversa. Al compararlas nos dimos cuenta que ambas graficas eran muy similares.
Planteamos la pregunta entonces ¿Las búsquedas de “Síntomas de coronavirus” están relacionadas con búsquedas de “Gripe” o es mera coincidencia?
library(readr)
busqueda <- read_csv("busqueda.csv")
## Rows: 52 Columns: 3
## -- Column specification --------------------------------------------------------
## Delimiter: ","
## dbl (3): Semana, sintomas del coronavirus, Gripe
##
## i Use `spec()` to retrieve the full column specification for this data.
## i Specify the column types or set `show_col_types = FALSE` to quiet this message.
View(busqueda)
names(busqueda)
## [1] "Semana" "sintomas del coronavirus"
## [3] "Gripe"
pairs(busqueda)
Las busquedas "sintomas del coronavirus estan correlacionadas con las busquedas de gripe?
h0: Si estan h1: no estan
cor(busqueda)
## Semana sintomas del coronavirus Gripe
## Semana 1.0000000 -0.3663596 -0.1455227
## sintomas del coronavirus -0.3663596 1.0000000 0.7584601
## Gripe -0.1455227 0.7584601 1.0000000
Los datos estan moderadamente correlacionados ya que como se puede observar en las busquedas de ambas variables nos dan valores de coorrelacion entre 0.61 y 0.80 lo cual indica una coorelacion medio alta. De igual manera nos dan valores de coorrelación de 1 que sería una coorrelación perfecta.
Correlacion implica causalidad? No, siempre hay una causa, efecto o consecuencia