Introduccion a la prueba de hipotesis
En este trabajo representaremos la relación que hay entre el día demuertos y las calaveras por medio de búsquedas de google y llegar a la conclusión sobre si tienen correlación o no
Bibliotecas y datos
setwd("~/Estadistica")
library(prettydoc)
library(DT)
library(readr)
library(reactable)
calaveras <- read_csv("calaveras.csv")##
## -- Column specification --------------------------------------------------------
## cols(
## DiaMuertos = col_double(),
## Calaveras = col_double()
## )
Primera Visualización
Podemos ver que en nuestra primera tabla se mantiene en un nivel bajo las dos búsquedas, una vez que está empieza a llegar a finales de Octubre y principios de Noviembre podemos notar como suben de igual manera,lo que nos da indicios sobre que las dos si están relacionadas entre sí
datatable(calaveras)Segunda Visualización
Nos encontramos con el mismo caso en la segunda tabla de visualización que tenemos, los dos aumentan a finales de Octubre y principios de Noviembre
reactable(calaveras)Inferencias
pairs(calaveras)Procederemos con nuestras propias inferencias analizando y revisando los datos obtenidos sobre esta tabla de valores.
Cálculo y representación de mínimos cuadrados
Llamamos a la función “lm” junto con la función “summary” y obtenemos los estimados de cada columna de valores, lo que nos da nuestra aproximación hacía la correlación de Dia de Muertos y Calaveras.
regresion <- lm (DiaMuertos ~ Calaveras, data=calaveras)
summary(regresion)##
## Call:
## lm(formula = DiaMuertos ~ Calaveras, data = calaveras)
##
## Residuals:
## Min 1Q Median 3Q Max
## -26.219 -0.489 -0.489 -0.489 35.304
##
## Coefficients:
## Estimate Std. Error t value Pr(>|t|)
## (Intercept) -0.25451 0.25956 -0.981 0.328
## Calaveras 1.74385 0.03849 45.309 <2e-16 ***
## ---
## Signif. codes: 0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
##
## Residual standard error: 3.885 on 259 degrees of freedom
## Multiple R-squared: 0.888, Adjusted R-squared: 0.8875
## F-statistic: 2053 on 1 and 259 DF, p-value: < 2.2e-16
\[y=-0.25451 + 1.74385x\] * Graficación de la recta Como podemos ver los datos no están del todo calibrados ya que la recta no pasa a traves de los puntos planteados en el plano
plot(calaveras$DiaMuertos, calaveras$Calaveras,xlab = "Dia de Muertos",ylab = "Calaveras")
abline(regresion)cor(calaveras)## DiaMuertos Calaveras
## DiaMuertos 1.0000000 0.9423211
## Calaveras 0.9423211 1.0000000
Modelación
Por último modelamos (predecimos) los datos usando la recta de mínimos cuadrados para saber como es que va evolucionando nuestra tabla de valores cuando los valores varían desde 1 a 21 (en este caso)
nuevos.calaveras <- data.frame(Calaveras=seq(0,20))
predict(regresion,nuevos.calaveras)## 1 2 3 4 5 6 7
## -0.2545136 1.4893354 3.2331844 4.9770335 6.7208825 8.4647315 10.2085806
## 8 9 10 11 12 13 14
## 11.9524296 13.6962786 15.4401277 17.1839767 18.9278257 20.6716748 22.4155238
## 15 16 17 18 19 20 21
## 24.1593728 25.9032219 27.6470709 29.3909199 31.1347690 32.8786180 34.6224670
Conclusión
Las búsquedas de el día de muertos y calaveras están claramente relacionadas ya que se presentan en las mismas fechas en las que el día de muertos ocurre y a su vez la búsqueda de calaveras se presenta enlas mismas fechas por que a la gente le interesa saber sobre ellas solo en esas fechas