R Markdown

Primero cargamos la libreria de openintro para poder usar la base de datos

library(openintro)
## Warning: package 'openintro' was built under R version 4.2.3
## Loading required package: airports
## Warning: package 'airports' was built under R version 4.2.3
## Loading required package: cherryblossom
## Warning: package 'cherryblossom' was built under R version 4.2.3
## Loading required package: usdata
## Warning: package 'usdata' was built under R version 4.2.3

Ahora vamos a ver si hay relación lineal entre alguna de las variables de la base de datos

pairs(mariokart)

Parece que entre el número de subastas y precio inicial hay una correlación negativa, por lo que comprobamos con el comando:

cor(mariokart$n_bids,mariokart$start_pr)
## [1] -0.6331036

Parece que tiene una correlación fuerte, así que para terminar de corroborar vamos a hacer un contraste de hipótesis para ver si hay una relación lineal entre ambas

H0:p=0

H1:p≠0

summary(lm(mariokart$n_bids~mariokart$start_pr))
## 
## Call:
## lm(formula = mariokart$n_bids ~ mariokart$start_pr)
## 
## Residuals:
##      Min       1Q   Median       3Q      Max 
## -10.4620  -2.6176  -0.4595   2.5392  13.5405 
## 
## Coefficients:
##                    Estimate Std. Error t value Pr(>|t|)    
## (Intercept)        15.70656    0.44235  35.507   <2e-16 ***
## mariokart$start_pr -0.24701    0.02543  -9.712   <2e-16 ***
## ---
## Signif. codes:  0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
## 
## Residual standard error: 4.567 on 141 degrees of freedom
## Multiple R-squared:  0.4008, Adjusted R-squared:  0.3966 
## F-statistic: 94.32 on 1 and 141 DF,  p-value: < 2.2e-16

Como el pvalor sale muy pequeño, prácticamente de 0, podemos rechazar la hipótesis nula y decir que no hay relación lineal entre ambas

Una hipótesis que hemos planteado es la de si la media del precio final en los juegos es mayor en los que están nuevos que en los que están usados:

H0:μ1 ≥ μ2

H1:μ1 < μ2

t.test(mariokart$total_pr[mariokart$cond=="new"],mariokart$total_pr[mariokart$cond=="used"],alternative = "greater")
## 
##  Welch Two Sample t-test
## 
## data:  mariokart$total_pr[mariokart$cond == "new"] and mariokart$total_pr[mariokart$cond == "used"]
## t = 1.7893, df = 94.902, p-value = 0.03838
## alternative hypothesis: true difference in means is greater than 0
## 95 percent confidence interval:
##  0.4745165       Inf
## sample estimates:
## mean of x mean of y 
##  53.77068  47.14810

Como el p_valor nos sale de 0.03838 y es menor que alfa que es 0.05 rechazamos la hipótesis nula y tenemos evidencia a favor de que no es mayor el precio final del producto si son nuevos

Otra hipótesis que tenemos es que los gastos de envío son menores en los productos que vienen sin volante que en los que vienen con volante, por lo que hacemos la hipótesis:

H0:μ1 ≤ μ2

H1:μ1 > μ2

t.test(mariokart$ship_pr[mariokart$wheels==0],mariokart$ship_pr[mariokart$wheels>0],alternative = "less")
## 
##  Welch Two Sample t-test
## 
## data:  mariokart$ship_pr[mariokart$wheels == 0] and mariokart$ship_pr[mariokart$wheels > 0]
## t = -1.3155, df = 102.39, p-value = 0.09565
## alternative hypothesis: true difference in means is less than 0
## 95 percent confidence interval:
##       -Inf 0.1695154
## sample estimates:
## mean of x mean of y 
##  2.663784  3.311226

Como nos sale que el pvalor es mayor que alfa, no rechazamos la hipótesis nula y podemos decir que la media del precio de envío es menor en los que no llevan volantes.

Nuesta ultima hipotesis es que se el numero de pujas es igual para los juegos nuevos y los juegos usados

H0:μ1 = μ2

H1:μ1 ≠ μ2

t.test(mariokart$n_bids[mariokart$cond=="new"],mariokart$n_bids[mariokart$cond=="used"])
## 
##  Welch Two Sample t-test
## 
## data:  mariokart$n_bids[mariokart$cond == "new"] and mariokart$n_bids[mariokart$cond == "used"]
## t = 0.87826, df = 112.62, p-value = 0.3817
## alternative hypothesis: true difference in means is not equal to 0
## 95 percent confidence interval:
##  -1.131715  2.933975
## sample estimates:
## mean of x mean of y 
##  14.06780  13.16667

Como nos sale un pvalor mayor que alfa, no rechazamos la hipótesis nula y podemos decir que los juegos nuevos y los de segunda mano se venden por igual