Prueba de hipótesis para un experimento
Reddit y GameStop, ¿Cuál es su relación?
A continuación se realizará un análisis de correlación con datos obtenidos de Google Trends en búsquedas web con las palabras Reddit y GameStop.
GameStop
Importar
Bibliotecas y datos
library(readr) #para leer datos
library(DT) # tablas interactivas
datos <- read_csv("datos.csv") #importar datos## Parsed with column specification:
## cols(
## reddit = col_double(),
## gamestop = col_double()
## )
Visualizar
Modelar
Coeficiente de correlación de pearson
¿Qué tanto se han relacionado estos temas en los últimos 7 días y en todo el mundo?
- Matriz de coeficientes de correlación
## reddit gamestop
## reddit 1.0000000 0.6088754
## gamestop 0.6088754 1.0000000
Con un coeficiente de correlación de 0.6088754 se puede decir que no existe una correlación tan alta en las búsquedas de la semana pasada debido a lo sucedido, ni mucho menos una causalidad. Sin embargo, la correlación no es nula ya que queda presente una pequeña relación entre ambas búsquedas.
:)
Cálculo y representación de la recta de mínimos cuadrados
##
## Call:
## lm(formula = gamestop ~ reddit, data = datos)
##
## Residuals:
## Min 1Q Median 3Q Max
## -33.144 -11.734 -0.853 8.414 58.090
##
## Coefficients:
## Estimate Std. Error t value Pr(>|t|)
## (Intercept) -8.7331 4.6028 -1.897 0.0595 .
## reddit 1.3234 0.1338 9.889 <2e-16 ***
## ---
## Signif. codes: 0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
##
## Residual standard error: 18.26 on 166 degrees of freedom
## Multiple R-squared: 0.3707, Adjusted R-squared: 0.3669
## F-statistic: 97.8 on 1 and 166 DF, p-value: < 2.2e-16
El valor de p es muy pequeño, por lo cual se puede seguir aceptando que existe una correlación.
Ecuación de la recta de mínimos cuadrados \(y\)
\[ y = -8.7331 + 1.3234x \]
Con esta ecuación podemos modelar y predecir valores