u1a3

Alec Fox

08/02/2021

Prueba de hipótesis para un experimento

Se utilizarán datos de google trends para analizar si existe una relación entre las búsquedas de semana santa con las de playa

Importar

Bibliotecas y datos

library(readr) #para leer datos
library(DT) # tablas interactivas
library(prettydoc) #documentos con mejor formato
setwd("~/EAMJ1130") # folder de trabajo
datos <- read_csv("datos.csv") #importar datos
## 
## -- Column specification --------------------------------------------------------
## cols(
##   playa = col_double(),
##   semana = col_double()
## )
 #visualizar datos en tabla 

Visualizar

Tabla

Tabla interactiva con todos los datos

datatable(datos)

Gráficas

  • Exploraremos la relación que existe ente las variables por medio de una matriz de diagramas de dispersión
pairs(datos)

Modelar

Coeficiente de correlación de pearson

¿Existe alguna relación?

  • Matriz de coeficientes de correlación
cor(datos)
##            playa    semana
## playa  1.0000000 0.4305642
## semana 0.4305642 1.0000000

Con un índice de correlación Pearson de 0.43 determinamos que existe una correlación, mas no necesariamente una causalidad.

Calculo y representación de la recta de minimos cadrados

regresion = lm(semana ~ playa, data=datos)
summary(regresion)
## 
## Call:
## lm(formula = semana ~ playa, data = datos)
## 
## Residuals:
##     Min      1Q  Median      3Q     Max 
## -21.494  -6.378  -2.723   4.486  44.151 
## 
## Coefficients:
##             Estimate Std. Error t value Pr(>|t|)    
## (Intercept)  -5.7834     2.4301  -2.380   0.0182 *  
## playa         0.3291     0.0483   6.814 1.05e-10 ***
## ---
## Signif. codes:  0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
## 
## Residual standard error: 10.92 on 204 degrees of freedom
## Multiple R-squared:  0.1854, Adjusted R-squared:  0.1814 
## F-statistic: 46.43 on 1 and 204 DF,  p-value: 1.049e-10

Ecuación de la recta de mínimos cuadrados \(y\)

\[ y = -5.7834 + 0.3291x \]

Con esta ecuación podemos modelar y predecir valores