Prueba de hipotesis para un experimento
Se utilizarán datos de google trends para analizar si existe una relación entre las búsquedas de fuegos artificiales con la independencia de estados unidos.
library(readr) #Leer datos
library(DT) #Tablas interactivas
library(prettydoc) #Formato bien bonito
setwd("~/Escuela/ITSON/4to Semestre/Estadistica") #Working Directory
datos <- read_csv("datos_tabla.csv") #Importacion de datos##
## -- Column specification --------------------------------------------------------
## cols(
## Pirotecnia = col_double(),
## Independencia_USA = col_double()
## )
datatable(datos) #Mostrar datosGráficas
- Exploraremos la relación que existe entre las variables por medio de una matriz de diagramas de dispersión
pairs(datos)¿Existe alguna relación?
- Matriz de coeficientes de correlación:
cor(datos)## Pirotecnia Independencia_USA
## Pirotecnia 1.0000000 0.9733865
## Independencia_USA 0.9733865 1.0000000
Con un índice de correlación Pearson de 0.97 determinamos que existe una correlación, mas no necesariamente una causalidad.
Calculo y representación de la recta de minimos cuadrados
regresion = lm(Pirotecnia ~ Independencia_USA, data = datos)
summary(regresion)##
## Call:
## lm(formula = Pirotecnia ~ Independencia_USA, data = datos)
##
## Residuals:
## Min 1Q Median 3Q Max
## -3.4829 -1.3626 -0.5432 -0.3626 12.4568
##
## Coefficients:
## Estimate Std. Error t value Pr(>|t|)
## (Intercept) 1.54316 0.39443 3.912 0.000276 ***
## Independencia_USA 0.81940 0.02728 30.034 < 2e-16 ***
## ---
## Signif. codes: 0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
##
## Residual standard error: 2.768 on 50 degrees of freedom
## Multiple R-squared: 0.9475, Adjusted R-squared: 0.9464
## F-statistic: 902 on 1 and 50 DF, p-value: < 2.2e-16
Ecuación de la recta de minimos cuadrados
\[y = 1.54316 + 0.81940x\] Con la anterior ecuación podemos llegar a predecir y modelar los valores que hay entre las busquedas de google en cuanto a los temas “Pirotecnia” y Indepencia USA.