Los datos de dicho experimento se presentan en la tabla a continuación:
plastico <- c(1,2,3,4,5)
plasticoA <- c(135,175,97,169,213,171,115,143)
plasticoB <- c(275,170,154,133,219,187,220,185)
plasticoC <- c(169,239,184,222,253,179,280,193)
plasticoD <- c(115,105,93,85,120,74,87,63)
tabla_resistencias <- data.frame(plasticoA, plasticoB, plasticoC, plasticoD)
print(tabla_resistencias)
## plasticoA plasticoB plasticoC plasticoD
## 1 135 275 169 115
## 2 175 170 239 105
## 3 97 154 184 93
## 4 169 133 222 85
## 5 213 219 253 120
## 6 171 187 179 74
## 7 115 220 280 87
## 8 143 185 193 63
summary(plasticoA)
## Min. 1st Qu. Median Mean 3rd Qu. Max.
## 97.0 130.0 156.0 152.2 172.0 213.0
summary(plasticoB)
## Min. 1st Qu. Median Mean 3rd Qu. Max.
## 133.0 166.0 186.0 192.9 219.2 275.0
summary(plasticoC)
## Min. 1st Qu. Median Mean 3rd Qu. Max.
## 169.0 182.8 207.5 214.9 242.5 280.0
summary(plasticoD)
## Min. 1st Qu. Median Mean 3rd Qu. Max.
## 63.00 82.25 90.00 92.75 107.50 120.00
# Creamos un vector con todos los datos:
medias <- c(mean(plasticoA), mean(plasticoB), mean(plasticoC), mean(plasticoD))
plasticos <- c(plasticoA, plasticoB, plasticoC, plasticoD)
grupo <- c(rep("Plástico A", 8), rep("Plástico B", 8), rep("Plástico C", 8), rep("Plástico D", 8))
grupo <- factor(grupo, levels = c("Plástico A", "Plástico B", "Plástico C", "Plástico D"))
# Dibujamos el diagrama de cajas:
boxplot(plasticos~grupo,
col = c("lightblue", "lightgreen", "orange", "yellow"),
main = "Resistencia por tipo de plástico")
# Dibujamos las medias en cada caja:
points(1:4, medias, pch = 19, col = "red", cex = 1.2)
Podemos ver que no hay una superposición clara entre las cajas de cada grupo, lo que nos puede dar un indicio de diferencia de medias. No hay presencia de valores atípicos en ninguno de los tres grupos de datos.
El grupo de “Plástico D” tiene una menor variabilidad en sus datos que los grupos demás grupos, los cuáles presentan una variabilidad en sus datos similar. Los grupos “Plástico B” y “Plástico C” tienen una leve asímetria positiva en sus datos, estando sus medias unos puntos por encima de la mediana. Por otro lado, el grupo “Plástico A” tiene una leve asimetría negativa y “Plástico D” se aproxima a una simétrica.
Podemos ver que los datos o observaciones del experimento son independientes ya que un mismo grupo, o tipo de plástico, no se somete a dos distintas pruebas de resistencia.
# ANÁLISIS DE SUPUESTOS
# Pruebas de normalidad:
shapiro.test(plasticoA)
##
## Shapiro-Wilk normality test
##
## data: plasticoA
## W = 0.97241, p-value = 0.9163
shapiro.test(plasticoB)
##
## Shapiro-Wilk normality test
##
## data: plasticoB
## W = 0.96099, p-value = 0.8195
shapiro.test(plasticoC)
##
## Shapiro-Wilk normality test
##
## data: plasticoC
## W = 0.93005, p-value = 0.5165
shapiro.test(plasticoD)
##
## Shapiro-Wilk normality test
##
## data: plasticoD
## W = 0.96835, p-value = 0.8847
Como podemos ver, el p-value de la spruebas de cada grupo fueron mayores a 0.05. Por lo tanto, todos los grupos presentan una distribución normal y podemos utilizar ANOVA para probar la diferencia de medias entre los grupos.
# Prueba de igualdad de varianzas:
library(car)
## Loading required package: carData
leveneTest(plasticos, grupo)
## Levene's Test for Homogeneity of Variance (center = median)
## Df F value Pr(>F)
## group 3 1.3103 0.2907
## 28
El p-value > 0.05, por tanto los grupos presentan igualdad en sus varianzas y ésta no tiene un impacto significativo en nuestra prueba de ANOVA.
# CONSTRUCCIÓN DE LA TABLA ANOVA
# Calculamos las sumatorias:
k <- 4
n <- 8
N <- n*k
X <- sum(mean(plasticoA), mean(plasticoB), mean(plasticoC), mean(plasticoD))
T1 <- sum(plasticoA)
T2 <- sum(plasticoB)
T3 <- sum(plasticoC)
T4 <- sum(plasticoD)
Ttotal <- sum(T1, T2, T3, T4)
# SSA:
v1 <- c((T1^2/n), (T2^2/n), (T3^2/n), (T4^2/n))
ssa <- sum(v1) - (Ttotal^2/N)
print(ssa)
## [1] 69072.12
# SSE:
sse <- 0
for (i in 1:k) {
suma_interna <- 0
for (j in 1:n) {
indice <- (i - 1) * n + j
v <- (plasticos[indice] - medias[i])^2
suma_interna = suma_interna + v
}
sse <- sse + suma_interna
}
print(sse)
## [1] 37410.75
# SST:
sst <- ssa + sse
print(sst)
## [1] 106482.9
# MSA:
MSA <- ssa/(k-1)
print(MSA)
## [1] 23024.04
# MSE:
MSE <- sse/(N-k)
print(MSE)
## [1] 1336.098
# Razon F:
razon_F <- MSA/MSE
print(razon_F)
## [1] 17.2323
# Cálculo de ANOVA computacionalmente:
anova <- aov(plasticos~grupo)
summary(anova)
## Df Sum Sq Mean Sq F value Pr(>F)
## grupo 3 69072 23024 17.23 1.55e-06 ***
## Residuals 28 37411 1336
## ---
## Signif. codes: 0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
Como podemos evidenciar, tanto en el método manual como en el computacional coinciden en una F Razón = 17.23. Por lo tanto, nuestros cálculos manuales están correctos. Por otro lado, p-value = 0.00000155 < 0.05 y por tanto se rechaza la hipótesis nula, lo que implica que existe una diferencia significativa entre los grados de resistencia medios a la degradación ambiental medidas antropométricas entre los 4 tipos de plástico: Plástico A, Plástico B, Plástico C y Plástico D. En conclusión, la calidad del plástico afecta la resistencia.
Por lo tanto, vamos a aplicar una prueba post-hoc llamada la Prueba de Tukey.
# Prueba de para hallar la media diferente:
TukeyHSD(anova)
## Tukey multiple comparisons of means
## 95% family-wise confidence level
##
## Fit: aov(formula = plasticos ~ grupo)
##
## $grupo
## diff lwr upr p adj
## Plástico B-Plástico A 40.625 -9.275099 90.525099 0.1417355
## Plástico C-Plástico A 62.625 12.724901 112.525099 0.0097183
## Plástico D-Plástico A -59.500 -109.400099 -9.599901 0.0147847
## Plástico C-Plástico B 22.000 -27.900099 71.900099 0.6296380
## Plástico D-Plástico B -100.125 -150.025099 -50.224901 0.0000426
## Plástico D-Plástico C -122.125 -172.025099 -72.224901 0.0000017
De los resultados de la prueba podemos ver que existen diferencias significativas entre las medias de los siguientes pares de grupos: Plásctico C - Plástico A; Plástico D - Plástico A; Plástico D - Plástico B; Plástico D - Plástico C. No habiendo diferencias entre los siguientes pares de grupos: Plástico B - Plástico A y Plástico C - Plástico B.
Entonces, podemos evidencisar que el tipos de plástico que produce modificaciones significativas en la resistencia es el Plástico D.