Prueba de hipótesis para un experimento
Se utilizarán datos de google trends para analizar si existe una relación entre las búsquedas de semana santa con las de playa
Importar
Bibliotecas y datos
library(readr) #para leer datos
library(DT) # tablas interactivas
library(prettydoc) #documentos con mejor formato
setwd("~/EAMJ1130") # folder de trabajo
datos <- read_csv("datos.csv") #importar datos##
## -- Column specification --------------------------------------------------------
## cols(
## playa = col_double(),
## semana = col_double()
## )
#visualizar datos en tabla Visualizar
Tabla
Tabla interactiva con todos los datos
datatable(datos)Gráficas
- Exploraremos la relación que existe ente las variables por medio de una matriz de diagramas de dispersión
pairs(datos)Modelar
Coeficiente de correlación de pearson
¿Existe alguna relación?
- Matriz de coeficientes de correlación
cor(datos)## playa semana
## playa 1.0000000 0.4305642
## semana 0.4305642 1.0000000
Con un índice de correlación Pearson de 0.43 determinamos que existe una correlación, mas no necesariamente una causalidad.
Calculo y representación de la recta de minimos cadrados
regresion = lm(semana ~ playa, data=datos)
summary(regresion)##
## Call:
## lm(formula = semana ~ playa, data = datos)
##
## Residuals:
## Min 1Q Median 3Q Max
## -21.494 -6.378 -2.723 4.486 44.151
##
## Coefficients:
## Estimate Std. Error t value Pr(>|t|)
## (Intercept) -5.7834 2.4301 -2.380 0.0182 *
## playa 0.3291 0.0483 6.814 1.05e-10 ***
## ---
## Signif. codes: 0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
##
## Residual standard error: 10.92 on 204 degrees of freedom
## Multiple R-squared: 0.1854, Adjusted R-squared: 0.1814
## F-statistic: 46.43 on 1 and 204 DF, p-value: 1.049e-10
Ecuación de la recta de mínimos cuadrados \(y\)
\[ y = -5.7834 + 0.3291x \]
Con esta ecuación podemos modelar y predecir valores