U1A3

Marijose González del Real

04/02/2021

Prueba de hipótesis para un experimento

Reddit y GameStop, ¿Cuál es su relación?

A continuación se realizará un análisis de correlación con datos obtenidos de Google Trends en búsquedas web con las palabras Reddit y GameStop.

Reddit

GameStop

Importar

Bibliotecas y datos

library(readr) #para leer datos
library(DT) # tablas interactivas
datos <- read_csv("datos.csv") #importar datos
## Parsed with column specification:
## cols(
##   reddit = col_double(),
##   gamestop = col_double()
## )

Visualizar

Tabla

Tabla interactiva con todos los datos

datatable(datos)

Gráficas

  • Exploraremos la relación que existe ente las variables por medio de una matriz de diagramas de dispersión
pairs(datos)

Los datos cuentan con una alta dispersión. Sin embargo, mantienen una linealidad positiva.

Modelar

Coeficiente de correlación de pearson

¿Qué tanto se han relacionado estos temas en los últimos 7 días y en todo el mundo?

  • Matriz de coeficientes de correlación
cor(datos)
##             reddit  gamestop
## reddit   1.0000000 0.6088754
## gamestop 0.6088754 1.0000000

Con un coeficiente de correlación de 0.6088754 se puede decir que no existe una correlación tan alta en las búsquedas de la semana pasada debido a lo sucedido, ni mucho menos una causalidad. Sin embargo, la correlación no es nula ya que queda presente una pequeña relación entre ambas búsquedas.

:)

Cálculo y representación de la recta de mínimos cuadrados

regresion = lm(gamestop ~ reddit, data=datos)
summary(regresion)
## 
## Call:
## lm(formula = gamestop ~ reddit, data = datos)
## 
## Residuals:
##     Min      1Q  Median      3Q     Max 
## -33.144 -11.734  -0.853   8.414  58.090 
## 
## Coefficients:
##             Estimate Std. Error t value Pr(>|t|)    
## (Intercept)  -8.7331     4.6028  -1.897   0.0595 .  
## reddit        1.3234     0.1338   9.889   <2e-16 ***
## ---
## Signif. codes:  0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
## 
## Residual standard error: 18.26 on 166 degrees of freedom
## Multiple R-squared:  0.3707, Adjusted R-squared:  0.3669 
## F-statistic:  97.8 on 1 and 166 DF,  p-value: < 2.2e-16

El valor de p es muy pequeño, por lo cual se puede seguir aceptando que existe una correlación.

Ecuación de la recta de mínimos cuadrados \(y\)

\[ y = -8.7331 + 1.3234x \]

Con esta ecuación podemos modelar y predecir valores