Prueba de hipótesis para un experimento

Muestreo

library(readr)
library(DT)
setwd("~/PYE1213")
elecciones <- read_csv("elecciones.csv")
## Parsed with column specification:
## cols(
##   elecciones = col_double(),
##   amlo = col_double()
## )
datatable(elecciones)

Visualizamos los datos

podemos ver los datos en modo tabla

head(elecciones)
## # A tibble: 6 x 2
##   elecciones  amlo
##        <dbl> <dbl>
## 1          1     1
## 2          0     0
## 3          0     1
## 4          1     1
## 5          0     2
## 6          1     2

Analisis de correalación

Matriz de diagramas de dispersión podemos ver que a simple vista no existe una relación clara, sin embargo la relación se verá mas adelante

pairs(elecciones)

Matriz de correlación

Se hace una matriz de correlación

cor(elecciones)
##            elecciones      amlo
## elecciones  1.0000000 0.3426461
## amlo        0.3426461 1.0000000

Se puede ver que existe una relación de 34%, esto es debido a que las busquedas se relacionan mucho cada 6 años, en épocas electorales.

Recta de minimos cuadrados

Generamos mediante la siguiente formula la recta de minimos cuadrados para conocer la relacion y confianza que tienen los datos

datos <- lm(formula = elecciones,data = elecciones)
summary(datos)
## 
## Call:
## lm(formula = elecciones, data = elecciones)
## 
## Residuals:
##     Min      1Q  Median      3Q     Max 
## -1.5670 -0.0945 -0.0323 -0.0115 12.0552 
## 
## Coefficients:
##              Estimate Std. Error t value Pr(>|t|)    
## (Intercept) -0.009213   0.078639  -0.117    0.907    
## amlo         0.020739   0.004031   5.145 6.39e-07 ***
## ---
## Signif. codes:  0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
## 
## Residual standard error: 0.9559 on 199 degrees of freedom
## Multiple R-squared:  0.1174, Adjusted R-squared:  0.113 
## F-statistic: 26.47 on 1 and 199 DF,  p-value: 6.388e-07

Ecuación de minimos cuadrados

\[y= -0.009213 + 0.020739\]

Graficamos los datos de acuerdo a la obtención de la recta de mínimos cuadrados

plot(elecciones$elecciones, elecciones$amlo, xlab = "Elecciones Presidenciales de México", ylab="AMLO")
abline(datos)

Calculamos la confiablilidad

confint(datos)
##                   2.5 %     97.5 %
## (Intercept) -0.16428548 0.14586038
## amlo         0.01279048 0.02868794

Predicciones

grado <- data.frame(amlo=seq(0,12))
predict(datos,grado)
##            1            2            3            4            5            6 
## -0.009212551  0.011526658  0.032265866  0.053005075  0.073744283  0.094483492 
##            7            8            9           10           11           12 
##  0.115222700  0.135961909  0.156701117  0.177440326  0.198179534  0.218918742 
##           13 
##  0.239657951

Representación de los intervalos de confianza

plot(elecciones$elecciones, elecciones$amlo, xlab = "Elecciónes presidenciales", ylab="AMLO")
abline(datos)
intervalo <- predict(datos, grado, interval = "confidence")
lines(grado$amlo, intervalo[, 2], lty=2, col="red")
lines(grado$amlo, intervalo[, 3], lty=2, col="red")


intervalo <- predict(datos, grado, interval = "prediction")
lines(grado$amlo, intervalo[, 2], lty=2, col="blue")
lines(grado$amlo, intervalo[, 3], lty=2, col="blue")

A manera de conclusión es visible que las búsqueda son mas comunes en diferentes fechas, estas fechas son las épocas electorales que se viven en México, haciendo énfasis en que estas épocas electorales son las presidenciales, las cuales son cada 6 años, debido a que AMLO se postulo para para la presidencia 3 veces, es normal que la búsqueda de el se aumente al mismo tiempo de las épocas electorales.