U1A3

Jonathan Velazquez

08/02/2021

Prueba de hipótesis para un experimento estadistico

En este pequeño experimento se analizaran dos variables que pueden estar correlacionadas entre si en un analisis estadistico

Importar los datos

library(readr)
library(DT)
library(prettydoc)
setwd("C:/Users/Angel/Documents/sexto semestre/Estadistica aplicada/EAMJ1130/Semana 1/U1A3")
datos <- read_csv("datos.csv")
## 
## -- Column specification --------------------------------------------------------
## cols(
##   pandemuerto = col_double(),
##   hallowen = col_double()
## )

Se utilizaran datos de google trends para analizar si existe una relacion entre las búsquedas del evento de hallowen con el pan de muerto en Mexico.

Visualizar la hipotesis

Hallowen y pan de muerto En simple vista existe una correlaciÓn entre si en una fecha entre el 25 y 31 de octubre. Nos indica en una media que por cada 100 de busqueda de pan de muerto, 64 de ellos también buscan al mismo tiempo el evento de hallowen.

Visualizar datos

Tablas

Tabla interactiva con todos los datos

datatable(datos)

Graficas

Exploramos la relación que existe entre las variables mediante una matriz de diagrama de dispersión

pairs(datos)

Modelar

Coeficiente de correlación de pearson

¿Existe alguna relación?

  • Matriz de coeficientes de correlación
cor(datos)
##             pandemuerto  hallowen
## pandemuerto   1.0000000 0.9766842
## hallowen      0.9766842 1.0000000

Con un índice de correlación Pearson de 0.97 determinamos que existe una correlación.

Calculo y representación de la recta de minimos cuadrados

regresion = lm(pandemuerto ~ hallowen, data=datos)
summary(regresion)
## 
## Call:
## lm(formula = pandemuerto ~ hallowen, data = datos)
## 
## Residuals:
##      Min       1Q   Median       3Q      Max 
## -12.5921  -1.4923  -0.4923   0.5152  14.3782 
## 
## Coefficients:
##             Estimate Std. Error t value Pr(>|t|)    
## (Intercept) 0.007074   0.567277   0.012     0.99    
## hallowen    1.485181   0.046167  32.170   <2e-16 ***
## ---
## Signif. codes:  0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
## 
## Residual standard error: 3.734 on 50 degrees of freedom
## Multiple R-squared:  0.9539, Adjusted R-squared:  0.953 
## F-statistic:  1035 on 1 and 50 DF,  p-value: < 2.2e-16

Ecuación de la recta de minimos cuadrados.

\[ y = 0.007074 + 1.485181x \]

Con esta ecuación podemos modelar y predecir valores.