Flujo de trabajo reproducible de estadística para el análisis de la correlación entre 2 variables

Importar

library(pacman)
p_load('readr','prettydoc','DT','knitr', 'xfun')
# Aquí se pueden descargar los datos
xfun::embed_file('datos.csv')

Download datos.csv

datos <- read_csv('datos.csv')
## 
## ── Column specification ────────────────────────────────────────────────────────
## cols(
##   navidad = col_double(),
##   `Santa claus` = col_double()
## )

Visualizar datos

Tabla

datatable(datos)

Gráfica

Matriz de diagramas de dispersión

pairs(datos)

Se puede ver en la matriz que evidente mente existe una relación entre navidad y Santa Claus, esto es debido a que entre mas se acerca la fecha de navidad, las personas empiezan a buscas mas a Santa Claus.

Inferencia

cor(datos)
##               navidad Santa claus
## navidad     1.0000000   0.9858614
## Santa claus 0.9858614   1.0000000

Matriz de coeficientes de correlación

Gracias a la matriz de coeficiente de correlación se puede ver que existe una relación de 98% entre ambos, esto debido a la estrecha relación que existe entre la navidad y Santa Claus