U1A3

Andrea Felix

9/2/2021

Prueba de hipotesis para un experimiento.

Se utilizaran datos de google trends para analizar si existe una relacion entre las busquedas de Noticia con WhatsApp, para ver que tanto las personas relacionan ambos terminos. Recientemente WhatsApp fue protagonista de muchas publicaciones y noticias globales por sus nuevos terminos. Asi que veremos como estas se relacionan:

WhatsApp

Importar

Bibliotecas y datos

library(readr)
library(DT)
data <- read_csv("data.csv")
## Parsed with column specification:
## cols(
##   Noticia = col_double(),
##   WhatsApp = col_double()
## )

Visualizar

Tabla de los datos

datatable(data)

Graficas

Exploraremos la relación que existe ente las variables por medio de una matriz de diagramas de dispersión.

pairs(data)

Podemos observar los datos, notar que se alejan y acercan unos de otros y no tienen una linealidad tan positiva pero…¿Existe alguna relacion?

Modelar

Para esto haremos una matriz de coeficientes de correlacion:

cor(data)
##             Noticia   WhatsApp
## Noticia   1.0000000 -0.4669631
## WhatsApp -0.4669631  1.0000000

Con un indice de correlacion Pearson de -0.46, nos podemos dar cuenta que no hay tanta relacion entre ellos. Lo cual es sorprendente ya que fue un topico bastante hablado pero al parecer no fue buscado como una noticia por el publico general.

Calculo y representacion de la recta de minimos cuadrados

reg = lm(Noticia ~ WhatsApp, data=data)
summary(reg)
## 
## Call:
## lm(formula = Noticia ~ WhatsApp, data = data)
## 
## Residuals:
##     Min      1Q  Median      3Q     Max 
## -9.6002 -1.9801 -0.8490  0.9234 15.4492 
## 
## Coefficients:
##             Estimate Std. Error t value Pr(>|t|)    
## (Intercept) 28.85143    2.92874   9.851 2.66e-13 ***
## WhatsApp    -0.15247    0.04083  -3.734 0.000483 ***
## ---
## Signif. codes:  0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
## 
## Residual standard error: 4.208 on 50 degrees of freedom
## Multiple R-squared:  0.2181, Adjusted R-squared:  0.2024 
## F-statistic: 13.94 on 1 and 50 DF,  p-value: 0.0004834

Ecuación de la recta de mínimos cuadrados \(y\) \[ y = 28.85143 + -0.15247x \]

Con esta ecuación podemos modelar y predecir valores