Introduccion a la prueba de hipotesis

En este trabajo representaremos la relación que hay entre el día demuertos y las calaveras por medio de búsquedas de google y llegar a la conclusión sobre si tienen correlación o no

Bibliotecas y datos

setwd("~/Estadistica")
library(prettydoc)
library(DT)
library(readr)
library(reactable)
calaveras <- read_csv("calaveras.csv")
## 
## -- Column specification --------------------------------------------------------
## cols(
##   DiaMuertos = col_double(),
##   Calaveras = col_double()
## )

Primera Visualización

Podemos ver que en nuestra primera tabla se mantiene en un nivel bajo las dos búsquedas, una vez que está empieza a llegar a finales de Octubre y principios de Noviembre podemos notar como suben de igual manera,lo que nos da indicios sobre que las dos si están relacionadas entre sí

datatable(calaveras)

Segunda Visualización

Nos encontramos con el mismo caso en la segunda tabla de visualización que tenemos, los dos aumentan a finales de Octubre y principios de Noviembre

reactable(calaveras)

Inferencias

pairs(calaveras)

Procederemos con nuestras propias inferencias analizando y revisando los datos obtenidos sobre esta tabla de valores.

Cálculo y representación de mínimos cuadrados

Llamamos a la función “lm” junto con la función “summary” y obtenemos los estimados de cada columna de valores, lo que nos da nuestra aproximación hacía la correlación de Dia de Muertos y Calaveras.

regresion <- lm (DiaMuertos ~ Calaveras, data=calaveras)
summary(regresion)
## 
## Call:
## lm(formula = DiaMuertos ~ Calaveras, data = calaveras)
## 
## Residuals:
##     Min      1Q  Median      3Q     Max 
## -26.219  -0.489  -0.489  -0.489  35.304 
## 
## Coefficients:
##             Estimate Std. Error t value Pr(>|t|)    
## (Intercept) -0.25451    0.25956  -0.981    0.328    
## Calaveras    1.74385    0.03849  45.309   <2e-16 ***
## ---
## Signif. codes:  0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
## 
## Residual standard error: 3.885 on 259 degrees of freedom
## Multiple R-squared:  0.888,  Adjusted R-squared:  0.8875 
## F-statistic:  2053 on 1 and 259 DF,  p-value: < 2.2e-16

\[y=-0.25451 + 1.74385x\] * Graficación de la recta Como podemos ver los datos no están del todo calibrados ya que la recta no pasa a traves de los puntos planteados en el plano

plot(calaveras$DiaMuertos, calaveras$Calaveras,xlab = "Dia de Muertos",ylab = "Calaveras")
abline(regresion)

cor(calaveras)
##            DiaMuertos Calaveras
## DiaMuertos  1.0000000 0.9423211
## Calaveras   0.9423211 1.0000000

Modelación

Por último modelamos (predecimos) los datos usando la recta de mínimos cuadrados para saber como es que va evolucionando nuestra tabla de valores cuando los valores varían desde 1 a 21 (en este caso)

nuevos.calaveras <- data.frame(Calaveras=seq(0,20))
predict(regresion,nuevos.calaveras)
##          1          2          3          4          5          6          7 
## -0.2545136  1.4893354  3.2331844  4.9770335  6.7208825  8.4647315 10.2085806 
##          8          9         10         11         12         13         14 
## 11.9524296 13.6962786 15.4401277 17.1839767 18.9278257 20.6716748 22.4155238 
##         15         16         17         18         19         20         21 
## 24.1593728 25.9032219 27.6470709 29.3909199 31.1347690 32.8786180 34.6224670

Conclusión

Las búsquedas de el día de muertos y calaveras están claramente relacionadas ya que se presentan en las mismas fechas en las que el día de muertos ocurre y a su vez la búsqueda de calaveras se presenta enlas mismas fechas por que a la gente le interesa saber sobre ellas solo en esas fechas