u1a2

Paloma Arguello

04/02/2021

Flujo de trabajo reproducible de estadística para el análisis de la correlación entre 2 variables.

##¿Existe una relación temporal entre las búsquedas de: 16 de septiembre y pozole en México?

Ejemplo

Se puede observar en Google Trends que los picos de estas, aumentan al mismo tiempo en las fechas de septiembre, lo cual indica que la gente busca pozole en las fechas de la independencia.

##Importar los datos.

setwd("~/Estadistica Aplicada")#Folder donde se trabaja
library(prettydoc) #Para formato de documentos
library(readr) #Para leer los datos
library(DT)
datos <- read_csv("datos.csv") #Importar datos
## 
## -- Column specification --------------------------------------------------------
## cols(
##   `16 de septiembre` = col_double(),
##   Pozole = col_double()
## )

Visualizar datos

Tabla

datatable(datos)

Gráfica

Matriz de diagramas de dispersión

Los datos se pueden observar un poco agrupados.

pairs(datos)

Inferencias

cor(datos)
##                  16 de septiembre   Pozole
## 16 de septiembre         1.000000 0.801454
## Pozole                   0.801454 1.000000

Matriz de coeficientes de correlación

Según se indica: 0.8, lo que comprueba una alta correlación entre ambas variables.