Prueba de hipótesis para un experimento estadistico
En este pequeño experimento se analizaran dos variables que pueden estar correlacionadas entre si en un analisis estadistico
Importar los datos
library(readr)
library(DT)
library(prettydoc)
setwd("C:/Users/Angel/Documents/sexto semestre/Estadistica aplicada/EAMJ1130/Semana 1/U1A3")
datos <- read_csv("datos.csv")##
## -- Column specification --------------------------------------------------------
## cols(
## pandemuerto = col_double(),
## hallowen = col_double()
## )
Se utilizaran datos de google trends para analizar si existe una relacion entre las búsquedas del evento de hallowen con el pan de muerto en Mexico.
Visualizar la hipotesis
En simple vista existe una correlaciÓn entre si en una fecha entre el 25 y 31 de octubre. Nos indica en una media que por cada 100 de busqueda de pan de muerto, 64 de ellos también buscan al mismo tiempo el evento de hallowen.
Visualizar datos
Tablas
Tabla interactiva con todos los datos
datatable(datos)Graficas
Exploramos la relación que existe entre las variables mediante una matriz de diagrama de dispersión
pairs(datos)Modelar
Coeficiente de correlación de pearson
¿Existe alguna relación?
- Matriz de coeficientes de correlación
cor(datos)## pandemuerto hallowen
## pandemuerto 1.0000000 0.9766842
## hallowen 0.9766842 1.0000000
Con un índice de correlación Pearson de 0.97 determinamos que existe una correlación.
Calculo y representación de la recta de minimos cuadrados
regresion = lm(pandemuerto ~ hallowen, data=datos)
summary(regresion)##
## Call:
## lm(formula = pandemuerto ~ hallowen, data = datos)
##
## Residuals:
## Min 1Q Median 3Q Max
## -12.5921 -1.4923 -0.4923 0.5152 14.3782
##
## Coefficients:
## Estimate Std. Error t value Pr(>|t|)
## (Intercept) 0.007074 0.567277 0.012 0.99
## hallowen 1.485181 0.046167 32.170 <2e-16 ***
## ---
## Signif. codes: 0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
##
## Residual standard error: 3.734 on 50 degrees of freedom
## Multiple R-squared: 0.9539, Adjusted R-squared: 0.953
## F-statistic: 1035 on 1 and 50 DF, p-value: < 2.2e-16
Ecuación de la recta de minimos cuadrados.
\[ y = 0.007074 + 1.485181x \]
Con esta ecuación podemos modelar y predecir valores.