Flujo de trabajo reproducible de estadística para el análisis de la correlación entre 2 variables
Importar
library(pacman)
p_load('readr','prettydoc','DT','knitr', 'xfun')
# Aquí se pueden descargar los datos
xfun::embed_file('datos.csv')datos <- read_csv('datos.csv')##
## ── Column specification ────────────────────────────────────────────────────────
## cols(
## navidad = col_double(),
## `Santa claus` = col_double()
## )
Visualizar datos
Tabla
datatable(datos)Gráfica
Matriz de diagramas de dispersión
pairs(datos)Se puede ver en la matriz que evidente mente existe una relación entre navidad y Santa Claus, esto es debido a que entre mas se acerca la fecha de navidad, las personas empiezan a buscas mas a Santa Claus.
Inferencia
cor(datos)## navidad Santa claus
## navidad 1.0000000 0.9858614
## Santa claus 0.9858614 1.0000000
Matriz de coeficientes de correlación
Gracias a la matriz de coeficiente de correlación se puede ver que existe una relación de 98% entre ambos, esto debido a la estrecha relación que existe entre la navidad y Santa Claus