Prueba de hipĂłtesis para un experimento
Se utilizarán datos de google trends para analizar si existe una relación entre las búsquedas de reyes magos con las roscas.
Importar
Biblioteca y datos
dia de reyes
library(readr) #para leer datos
library(DT) # tablas interactivas
library(prettydoc) #documentos con mejor formato
setwd("~/paola 6to semestre/eamj1130") # folder de trabajo
<- read_csv("datos.csv") #importar datos datos
##
## -- Column specification --------------------------------------------------------
## cols(
## `reyes magos` = col_double(),
## rosca = col_double()
## )
#visualizar datos en tabla
Visualizar
Gráfica de Google Trends
Tabla interactiva de datos
datatable(datos) #visualizar datos en tabla
Gráficas
Exploraremos la relaciĂłn que existe entre las variables del dia de los reyes magos con roscas por medio de una matriz de diagrama de dispersiĂłn.
pairs(datos)
Modelar
Coeficiente de correlaciĂłn de pearson
ÂżExiste alguna relaciĂłn?
- Matriz de coeficientes de correlaciĂłn
cor(datos)
## reyes magos rosca
## reyes magos 1.0000000 0.9671031
## rosca 0.9671031 1.0000000
ConclusiĂłn
Con un Ăndice de correlaciĂłn Pearson de 0.96 determinamos que existe una correlaciĂłn.
Cálculo y representaciĂłn de la recta de mĂnimos cuadrados
= lm(`reyes magos` ~ rosca, data=datos)
regresion summary(regresion)
##
## Call:
## lm(formula = `reyes magos` ~ rosca, data = datos)
##
## Residuals:
## Min 1Q Median 3Q Max
## -15.2917 -1.0765 -1.0765 -0.0765 16.3196
##
## Coefficients:
## Estimate Std. Error t value Pr(>|t|)
## (Intercept) -0.08900 0.18292 -0.487 0.627
## rosca 1.16546 0.01909 61.065 <2e-16 ***
## ---
## Signif. codes: 0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
##
## Residual standard error: 2.826 on 258 degrees of freedom
## Multiple R-squared: 0.9353, Adjusted R-squared: 0.935
## F-statistic: 3729 on 1 and 258 DF, p-value: < 2.2e-16
Como podemos observar en nuestros datos tenemos un punto mĂnimo de -15.2917 nuestro primer curtil es de -1.0765 y una mediana de -1.0765 nustro tercer cuartil de -0.0765 y un punto máximo de 16.3196
EcuaciĂłn de la recta de mĂnimos cuadrados \[ y=-0.08900 + 1.16546x \] Con esta ecuaciĂłn podemos modelar y predecir valores relacionados con las variables estudiadas en este caso.
rosca