U1A3

Prueba de hipótesis para un experimento

Nuestro conocimiento solo puede ser finito, mientras que nuestra ignorancia debe ser necesariamente infinita. -Karl Popper

Karl Popper

¿Cuál es la relación entre la Navidad y los juguetes?

Se analizaron datos obtenidos de Google Trends respecto a la correlación que tienen los juguetes y la Navidad basados en los últimos 5 años.

Navidad

Juguetes

Datos obtenidos

En dichos datos pudimos observar los siguiente:

Gráfica

Importar

  • Importar datos
datos <- read_csv("datos.csv")
## 
## -- Column specification --------------------------------------------------------
## cols(
##   Navidad = col_double(),
##   Juguete = col_double()
## )

Visualizar

Tabla

Tabla de datos interactiva

datatable(datos)

Gráficas

  • Exploramos la relación que existe entre las variables por medio de una matriz de diagramas de dispersión
pairs(datos, col = "red")

  • Gráfico de caja y bigote
boxplot(datos$Navidad ~ datos$Juguete, col="deeppink4" )

Modelar

Coeficiente de correlación de Pearson

¿Existe alguna relación?

  • Matriz de coeficientes de correlación
cor(datos)
##           Navidad   Juguete
## Navidad 1.0000000 0.7450653
## Juguete 0.7450653 1.0000000

Con un índice de correlación de Pearson de 0.745 determinamos que existe una correlación, mas no necesariamente una casualidad.

Cálculos y representación de la recta de minímos cuadrados

regresion = lm(Juguete ~ Navidad, data = datos)
summary(regresion)
## 
## Call:
## lm(formula = Juguete ~ Navidad, data = datos)
## 
## Residuals:
##     Min      1Q  Median      3Q     Max 
## -2.6617 -0.3097 -0.1282 -0.1282  9.4182 
## 
## Coefficients:
##             Estimate Std. Error t value Pr(>|t|)    
## (Intercept) 3.037515   0.100058   30.36   <2e-16 ***
## Navidad     0.090712   0.005046   17.98   <2e-16 ***
## ---
## Signif. codes:  0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
## 
## Residual standard error: 1.467 on 259 degrees of freedom
## Multiple R-squared:  0.5551, Adjusted R-squared:  0.5534 
## F-statistic: 323.2 on 1 and 259 DF,  p-value: < 2.2e-16

Ecuación de la recta de mínimos cuadrados \(y\)

\[ y = 3.037515 + 0.090712x \]

Con esta ecuación podemos modelas y predecir valores.

Conclusión

Si bien el coeficiente de correlación de Pearson puede tomarse como un índice que sirve para medir el grado de relación de dos variables; obtuvimos una correlación de 0.745 es decir de un 74.5 %, por lo que podemos decir que refleja que se da una correlación positiva.