Flujo de trabajo reproducible de estadística para el análisis de la correlación entre 2 variables.
##¿Existe una relación temporal entre las búsquedas de: 16 de septiembre y pozole en México?
Ejemplo
Se puede observar en Google Trends que los picos de estas, aumentan al mismo tiempo en las fechas de septiembre, lo cual indica que la gente busca pozole en las fechas de la independencia.
##Importar los datos.
setwd("~/Estadistica Aplicada")#Folder donde se trabaja
library(prettydoc) #Para formato de documentos
library(readr) #Para leer los datos
library(DT)
datos <- read_csv("datos.csv") #Importar datos##
## -- Column specification --------------------------------------------------------
## cols(
## `16 de septiembre` = col_double(),
## Pozole = col_double()
## )
Visualizar datos
Tabla
datatable(datos)Gráfica
Matriz de diagramas de dispersión
Los datos se pueden observar un poco agrupados.
pairs(datos)Inferencias
cor(datos)## 16 de septiembre Pozole
## 16 de septiembre 1.000000 0.801454
## Pozole 0.801454 1.000000
Matriz de coeficientes de correlación
Según se indica: 0.8, lo que comprueba una alta correlación entre ambas variables.