Ejericio 1: Queremos estudiar la efectividad de dos teoremas de matemáticas, el Teorema de Bolzano-Weierstrass y el Teorema de Pitágoras para los estudiantes de cara a un examen. Se selecciona una muestra de 10 estudiantes que se examinaron con una nota media de 8. A la semana siguiente se publicaron las notas medias de los 10 estudiantes obteniéndose una media de 6.2 y una desviación típica muestral de 2 y se registran sus calificaciones siendo las siguientes:
Bolzano: 78, 82, 75, 80, 85, 79, 81, 83, 77, 84 Pitágoras: 72, 75, 78, 70, 74, 76, 73, 71, 79, 72
Apartado a: Compara si hay una diferencia significativa en los puntajes promedio entre Pitágoras y Bolzano
Pitágoras <- c(78, 82, 75, 80, 85, 79, 81, 83, 77, 84)
Bolzano <- c(72, 75, 78, 70, 74, 76, 73, 71, 79, 72)
t_result <- t.test(Pitágoras, Bolzano, alternative = "two.sided")
t_result
##
## Welch Two Sample t-test
##
## data: Pitágoras and Bolzano
## t = 4.6242, df = 17.907, p-value = 0.0002134
## alternative hypothesis: true difference in means is not equal to 0
## 95 percent confidence interval:
## 3.49117 9.30883
## sample estimates:
## mean of x mean of y
## 80.4 74.0
Como p-value es menor de 0.05, desechamos la hipótesis nula que nos indica que hay una diferencia significativa en los puntajes promedio entre el Pitágoras y Bolzano
Apartado b: Comprueba la hipótesis con el test Wilcoxon y los siguientes valores con una confianza del 95%
Pitágoras <- c(78, 82, 75, 80, 85, 79, 81, 83, 77, 84)
Bolzano <- c(72, 75, 78, 70, 74, 76, 73, 71, 79, 72)
wilcox.test(Pitágoras, Bolzano, alternative = "less", conf.level = 0.95)
## Warning in wilcox.test.default(Pitágoras, Bolzano, alternative = "less", :
## cannot compute exact p-value with ties
##
## Wilcoxon rank sum test with continuity correction
##
## data: Pitágoras and Bolzano
## W = 92.5, p-value = 0.9994
## alternative hypothesis: true location shift is less than 0
Si p-valor < alpha -> rechazamos hipótesis nula Si p-valor > alpha -> no podemos concluir que existe diferencia significativa
Apartado c: 3. ¿Cuál es la hipótesis nula y cuál es la hipótesis alternativa?
Apartado d: ¿Cuál sería el valor del estadístico de contraste y el p_valor?
# Valor estadístico
n = 10
s <- 2* sqrt(10/9)
z <- (abs(6.2-8)) / (s * sqrt(n))
z
## [1] 0.27
# p_valor
p_valor = 2*pnorm(-abs(z))
p_valor
## [1] 0.7871603
Ejercicio 2:
El Ministerio de Sanidad ha realizado diferentes mediciones sobre la liberación de CO2 en gramos en distintos electrodomésticos del hogar.
Televisión: 0.93, 0.96, 0.87, 0.9, 1.02, 0.99, 1.05, 0.89, 0.91 Lavadora: 1.12, 1.09, 0.98, 1.01, 0.99, 1.15, 1.03, 0.92, 1.19 Lavavajillas: 0.98, 1.11, 0.9, 1.13, 2.1, 0.97, 1.04, 1.02, 0.96 Microondas: 0.88, 0.79, 0.92, 0.97, 0.86, 0.74, 1.03, 1.09, 0.91
Apartado a: Calcula el p_valor
Televisión<- c (0.93, 0.96, 0.87, 0.9, 1.02, 0.99, 1.05, 0.89, 0.91)
Lavadora <- c (1.12, 1.09, 0.98, 1.01, 0.99, 1.15, 1.03, 0.92, 1.19)
Lavavajillas <- c (0.98, 1.11, 0.9, 1.13, 2.1, 0.97, 1.04, 1.02, 0.96)
Microondas <- c (0.88, 0.79, 0.92, 0.97, 0.86, 0.74, 1.03, 1.09, 0.91)
datos = c(Televisión,Lavadora,Lavavajillas,Microondas)
electrodomesticos <- factor(rep(c("Television","Lavadora","Lavavajillas","Microondas"), c(9,9,9,9)))
summary(aov(datos~electrodomesticos))
## Df Sum Sq Mean Sq F value Pr(>F)
## electrodomesticos 3 0.2823 0.09411 2.348 0.0912 .
## Residuals 32 1.2828 0.04009
## ---
## Signif. codes: 0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
En este caso, nos quedamos con Pr(<F) que sería = 0.0912
Apartado b: Calcula el valor estadístico
Televisión<- c (0.93, 0.96, 0.87, 0.9, 1.02, 0.99, 1.05, 0.89, 0.91)
Lavadora <- c (1.12, 1.09, 0.98, 1.01, 0.99, 1.15, 1.03, 0.92, 1.19)
Lavavajillas <- c (0.98, 1.11, 0.9, 1.13, 2.1, 0.97, 1.04, 1.02, 0.96)
Microondas <- c (0.88, 0.79, 0.92, 0.97, 0.86, 0.74, 1.03, 1.09, 0.91)
datos = c(Televisión,Lavadora,Lavavajillas,Microondas)
electrodomesticos <- factor(rep(c("Television","Lavadora","Lavavajillas","Microondas"), c(9,9,9,9)))
summary(aov(datos~electrodomesticos))
## Df Sum Sq Mean Sq F value Pr(>F)
## electrodomesticos 3 0.2823 0.09411 2.348 0.0912 .
## Residuals 32 1.2828 0.04009
## ---
## Signif. codes: 0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
En este apartado, nos quedamos con F value que es 2.348
Apartado c: Calcula el límite superior de las emisiones prodcuidas por una lavadora
media_lavadora <- mean(Lavadora)
valor_t <- pt(0.01/2, 36-3)
sp <- sqrt(0.04009)
error_emision <- valor_t * (sp/sqrt(9))
media_lavadora + error_emision
## [1] 1.086836
boxplot(datos~electrodomesticos, col=c("pink", "purple", "green", "orange"), ylab="Liberación de CO2")
Televisión<- c (0.93, 0.96, 0.87, 0.9, 1.02, 0.99, 1.05, 0.89, 0.91)
Lavadora <- c (1.12, 1.09, 0.98, 1.01, 0.99, 1.15, 1.03, 0.92, 1.19)
Lavavajillas <- c (0.98, 1.11, 0.9, 1.13, 2.1, 0.97, 1.04, 1.02, 0.96)
Microondas <- c (0.88, 0.79, 0.92, 0.97, 0.86, 0.74, 1.03, 1.09, 0.91)
datos = c(Televisión,Lavadora,Lavavajillas,Microondas)
electrodomesticos <- factor(rep(c("Television","Lavadora","Lavavajillas","Microondas"), c(9,9,9,9)))
summary(aov(datos~electrodomesticos))
## Df Sum Sq Mean Sq F value Pr(>F)
## electrodomesticos 3 0.2823 0.09411 2.348 0.0912 .
## Residuals 32 1.2828 0.04009
## ---
## Signif. codes: 0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
Ejercicio 3: En Metodología de la Programación durante el cuatrimestre se hacen dos parciales, a mediados (x) y al final del cuatri (y) y las notas de los alumnos fueron las siguientes:
x = c(65, 89, 56, 78, 34, 90, 43, 71, 46) y = c(72, 67, 84, 49, 50, 77, 65, 47, 69)
Apartado a: Estima la calificación final de un alumno que tuvo una calificación de 50 en el primer parcial.
x = c(65, 89, 56, 78, 34, 90, 43, 71, 46)
y = c(72, 67, 84, 49, 50, 77, 65, 47, 69)
modelo <- lm(y~x)
calificacion <- predict (modelo, newdata = data.frame(x= 50))
calificacion
## 1
## 63.43932
Apartado b: ¿Existe relación de tipo lineal entre las variables x e y?
x = c(65, 89, 56, 78, 34, 90, 43, 71, 46)
y = c(72, 67, 84, 49, 50, 77, 65, 47, 69)
correlacion <- cor(x,y)
correlacion
## [1] 0.1143696
Apartado c: ¿Cuál es la ordenada en el origen de la recta de regresión de y (variable dependiente) sobre x (variable independiente)?
x = c(65, 89, 56, 78, 34, 90, 43, 71, 46)
y = c(72, 67, 84, 49, 50, 77, 65, 47, 69)
modelo <- lm(y~x)
ordenada <- coef(modelo)[1]
ordenada
## (Intercept)
## 59.73191
Apartado d: ¿Cuál es la pendiente de la recta de regresión?
x = c(65, 89, 56, 78, 34, 90, 43, 71, 46)
y = c(72, 67, 84, 49, 50, 77, 65, 47, 69)
modelo <- lm(y~x)
pendiente <- coef(modelo)[2]
pendiente
## x
## 0.07414823