Flujo de trabajo reproducible de estadística para el análisis de la correlación
Bibliotecas y datos
setwd("~/Stat206145") #Folder de trabajo
library(prettydoc) #Formato de documentos
library(readr)
library(DT)
datos <- read_csv("datosSF.csv")##
## -- Column specification --------------------------------------------------------
## cols(
## valentin = col_double(),
## flores = col_double()
## )
datos## # A tibble: 52 x 2
## valentin flores
## <dbl> <dbl>
## 1 100 54
## 2 8 43
## 3 3 43
## 4 3 47
## 5 3 45
## 6 3 37
## 7 3 36
## 8 3 36
## 9 4 39
## 10 3 41
## # ... with 42 more rows
Hipótesis
¿Existirá una relación temporal entre la bisqueda en México de las flores y el dia de San Valentín?
Visualización de datos
Tabla
datatable(datos)Diagrama de dispersión
pairs(datos)Gráfico de caja y bigote
boxplot(datos$valentin ~ datos$flores, col=blues9)Análisis de correlación
cor(datos)## valentin flores
## valentin 1.0000000 0.3200066
## flores 0.3200066 1.0000000
Conclusión
Después de hacer los distintos análisis podemos notar que existe una mínima relación entre ambas búsquedas, por lo que podemos deducir que no hay mucha relación entre ambas.