Primero cargamos la libreria de openintro para poder usar la base de datos
library(openintro)
## Warning: package 'openintro' was built under R version 4.2.3
## Loading required package: airports
## Warning: package 'airports' was built under R version 4.2.3
## Loading required package: cherryblossom
## Warning: package 'cherryblossom' was built under R version 4.2.3
## Loading required package: usdata
## Warning: package 'usdata' was built under R version 4.2.3
Ahora vamos a ver si hay relación lineal entre alguna de las variables de la base de datos
pairs(mariokart)
Parece que entre el número de subastas y precio inicial hay una correlación negativa, por lo que comprobamos con el comando:
cor(mariokart$n_bids,mariokart$start_pr)
## [1] -0.6331036
Parece que tiene una correlación fuerte, así que para terminar de corroborar vamos a hacer un contraste de hipótesis para ver si hay una relación lineal entre ambas
H0:p=0
H1:p≠0
summary(lm(mariokart$n_bids~mariokart$start_pr))
##
## Call:
## lm(formula = mariokart$n_bids ~ mariokart$start_pr)
##
## Residuals:
## Min 1Q Median 3Q Max
## -10.4620 -2.6176 -0.4595 2.5392 13.5405
##
## Coefficients:
## Estimate Std. Error t value Pr(>|t|)
## (Intercept) 15.70656 0.44235 35.507 <2e-16 ***
## mariokart$start_pr -0.24701 0.02543 -9.712 <2e-16 ***
## ---
## Signif. codes: 0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
##
## Residual standard error: 4.567 on 141 degrees of freedom
## Multiple R-squared: 0.4008, Adjusted R-squared: 0.3966
## F-statistic: 94.32 on 1 and 141 DF, p-value: < 2.2e-16
Como el pvalor sale muy pequeño, prácticamente de 0, podemos rechazar la hipótesis nula y decir que no hay relación lineal entre ambas
Una hipótesis que hemos planteado es la de si la media del precio final en los juegos es mayor en los que están nuevos que en los que están usados:
H0:μ1 ≥ μ2
H1:μ1 < μ2
t.test(mariokart$total_pr[mariokart$cond=="new"],mariokart$total_pr[mariokart$cond=="used"],alternative = "greater")
##
## Welch Two Sample t-test
##
## data: mariokart$total_pr[mariokart$cond == "new"] and mariokart$total_pr[mariokart$cond == "used"]
## t = 1.7893, df = 94.902, p-value = 0.03838
## alternative hypothesis: true difference in means is greater than 0
## 95 percent confidence interval:
## 0.4745165 Inf
## sample estimates:
## mean of x mean of y
## 53.77068 47.14810
Como el p_valor nos sale de 0.03838 y es menor que alfa que es 0.05 rechazamos la hipótesis nula y tenemos evidencia a favor de que no es mayor el precio final del producto si son nuevos
Otra hipótesis que tenemos es que los gastos de envío son menores en los productos que vienen sin volante que en los que vienen con volante, por lo que hacemos la hipótesis:
H0:μ1 ≤ μ2
H1:μ1 > μ2
t.test(mariokart$ship_pr[mariokart$wheels==0],mariokart$ship_pr[mariokart$wheels>0],alternative = "less")
##
## Welch Two Sample t-test
##
## data: mariokart$ship_pr[mariokart$wheels == 0] and mariokart$ship_pr[mariokart$wheels > 0]
## t = -1.3155, df = 102.39, p-value = 0.09565
## alternative hypothesis: true difference in means is less than 0
## 95 percent confidence interval:
## -Inf 0.1695154
## sample estimates:
## mean of x mean of y
## 2.663784 3.311226
Como nos sale que el pvalor es mayor que alfa, no rechazamos la hipótesis nula y podemos decir que la media del precio de envío es menor en los que no llevan volantes.
Nuesta ultima hipotesis es que se el numero de pujas es igual para los juegos nuevos y los juegos usados
H0:μ1 = μ2
H1:μ1 ≠ μ2
t.test(mariokart$n_bids[mariokart$cond=="new"],mariokart$n_bids[mariokart$cond=="used"])
##
## Welch Two Sample t-test
##
## data: mariokart$n_bids[mariokart$cond == "new"] and mariokart$n_bids[mariokart$cond == "used"]
## t = 0.87826, df = 112.62, p-value = 0.3817
## alternative hypothesis: true difference in means is not equal to 0
## 95 percent confidence interval:
## -1.131715 2.933975
## sample estimates:
## mean of x mean of y
## 14.06780 13.16667
Como nos sale un pvalor mayor que alfa, no rechazamos la hipótesis nula y podemos decir que los juegos nuevos y los de segunda mano se venden por igual