Analisis de correlacion de las busquedas en google en mexico en los ultimos 12 meses

Utilizando la herramienta goole trends obtenemos las busquedas de coronavirus y cubrebocas, dolor de cabeza y fiebre y tortillaland y Auronplay para mexico.

Equipo 1

Villarreal Madero, Melanie

Cota García,Víctor Manuel

Nuñez Aguirre,Jose Alfredo

Salcedo Rodríguez,Mario Alejandro

##Importar datos

  • Establecemos el directorio de trabajo.

  • Necesitamos importar nuestros sets de datos.

library(readr)
busquedas <- read_csv("busquedas.csv")
## Rows: 52 Columns: 3
## -- Column specification --------------------------------------------------------
## Delimiter: ","
## dbl (3): Semana, coronavirus, cubrebocas
## 
## i Use `spec()` to retrieve the full column specification for this data.
## i Specify the column types or set `show_col_types = FALSE` to quiet this message.
View(busquedas)

Matriz de coeficientes de correlacion

Correlacion pearson * El coeficiente de correlación de Pearson es un tipo de coeficiente empleado en estadística descriptiva, se utiliza en la estadística descriptiva aplicada al estudio de dos variables,

*El coeficiente de correlación de Pearson comprende valores entre el -1 y el +1. Así, dependiendo de su valor, tendrá un significado u otro.

*Si el coeficiente de correlación de Pearson es igual a 1 o a -1, podemos considerar que la correlación que existe entre las variables estudiadas es perfecta.

*Si el coeficiente es mayor que 0, la correlación es positiva (“A más, más, y a menos menos). En cambio, si es menor que 0 (negativo), la correlación es negativa (“A más, menos, y a menos, más). Finalmente, si el coeficiente es igual a 0, sólo podemos afirmar que no hay relación lineal entre las variables, pero puede haber algún otro tipo de relación.

*Fuente: https://psicologiaymente.com/miscelanea/coeficiente-correlacion-pearson

  • El coeficiente de correlación se puede calcular usando las funcion “cor”.

*Fuente: http://www.sthda.com/english/wiki/correlation-test-between-two-variables-in-r

cor(busquedas)
##                 Semana coronavirus cubrebocas
## Semana       1.0000000   -0.881784 -0.3456287
## coronavirus -0.8817840    1.000000  0.6378070
## cubrebocas  -0.3456287    0.637807  1.0000000

Matriz de diagramas de dispersion

  • Es una herramienta gráfica que permite demostrar la relación existente entre dos clases de datos y cuantificar la intensidad de dicha relación. Se utiliza para conocer si efectivamente existe una correlación entre dos magnitudes o parámetros de un problema y, en caso positivo, de qué tipo es la correlación.

*Fuente:

pairs(busquedas)

*En el 2020 al inicio, con la presencia de la pandemia muchas personas no conocían sobre que era en realidad, por lo que las búsquedas empezaron así como las medidas de seguridad necesarias. Aquí es donde entran las búsquedas de cubrebocas, existiendo así correlación entre ambas búsquedas, Por lo que podemos darnos cuenta que ninguna surgió por casualidad tuvo una relación ya sea baja o muy alta para pasar de una a otra. En fin no podemos decir que que un acontecimiento sucede solo porque sí tuvo que existir alguna causa.

library(readr)
tortillaland <- read_csv("tortillaland.csv")
## Rows: 52 Columns: 3
## -- Column specification --------------------------------------------------------
## Delimiter: ","
## dbl (3): Semana, Tortillaland, Auronplay
## 
## i Use `spec()` to retrieve the full column specification for this data.
## i Specify the column types or set `show_col_types = FALSE` to quiet this message.
View(tortillaland)
cor(tortillaland)
##                  Semana Tortillaland  Auronplay
## Semana        1.0000000    0.5249722 -0.7059273
## Tortillaland  0.5249722    1.0000000 -0.3120090
## Auronplay    -0.7059273   -0.3120090  1.0000000
pairs(tortillaland)

  • En el resultado del diagrama de dispersión podemos notar que existe una correlación negativa entre las búsquedas realizadas, podemos ver qué una es más concurrente que la otra, a medida que un valor disminuye, el otro se encuentra en aumento.

Importar datos

library(readr)
gripefiebre <- read_csv("gripefiebre.csv")
## Rows: 52 Columns: 3
## -- Column specification --------------------------------------------------------
## Delimiter: ","
## dbl (3): Semana, gripe, fiebre
## 
## i Use `spec()` to retrieve the full column specification for this data.
## i Specify the column types or set `show_col_types = FALSE` to quiet this message.
View(gripefiebre)

Matriz de coeficientes de correlacion

Correlacion pearson

cor(gripefiebre)
##           Semana     gripe    fiebre
## Semana 1.0000000 0.1262067 0.4116417
## gripe  0.1262067 1.0000000 0.7866761
## fiebre 0.4116417 0.7866761 1.0000000

Matriz de diagramas de dispersion

pairs (gripefiebre)

  • Se puede identificar que existe correlación positiva entre ambas búsquedas pero no son demasiado altas, pero esto no significa que exista que ambas variables sean independientes, ya que se llego a notar que para buscar una cosa se tuvo que buscar otra. En otras palabras estas búsquedas tienen cierta relación entre sí y no suceden al azar aunque pueden llegar a ocurrir pero es algo que en mi opinión es poco probable.