Los datos de dicho experimento se presentan en la tabla a continuación:

plastico <- c(1,2,3,4,5)
plasticoA <- c(135,175,97,169,213,171,115,143)
plasticoB <- c(275,170,154,133,219,187,220,185)
plasticoC <- c(169,239,184,222,253,179,280,193)
plasticoD <- c(115,105,93,85,120,74,87,63)

tabla_resistencias <- data.frame(plasticoA, plasticoB, plasticoC, plasticoD)
print(tabla_resistencias)
##   plasticoA plasticoB plasticoC plasticoD
## 1       135       275       169       115
## 2       175       170       239       105
## 3        97       154       184        93
## 4       169       133       222        85
## 5       213       219       253       120
## 6       171       187       179        74
## 7       115       220       280        87
## 8       143       185       193        63

Análisis Exploratorio de los Datos (EDA)

Plástico A:

summary(plasticoA)
##    Min. 1st Qu.  Median    Mean 3rd Qu.    Max. 
##    97.0   130.0   156.0   152.2   172.0   213.0

Plástico B:

summary(plasticoB)
##    Min. 1st Qu.  Median    Mean 3rd Qu.    Max. 
##   133.0   166.0   186.0   192.9   219.2   275.0

Plástico C:

summary(plasticoC)
##    Min. 1st Qu.  Median    Mean 3rd Qu.    Max. 
##   169.0   182.8   207.5   214.9   242.5   280.0

Plástico D:

summary(plasticoD)
##    Min. 1st Qu.  Median    Mean 3rd Qu.    Max. 
##   63.00   82.25   90.00   92.75  107.50  120.00

Diagrama de cajas y bigotes:

# Creamos un vector con todos los datos:
medias <- c(mean(plasticoA), mean(plasticoB), mean(plasticoC), mean(plasticoD))
plasticos <- c(plasticoA, plasticoB, plasticoC, plasticoD)
grupo <- c(rep("Plástico A", 8), rep("Plástico B", 8), rep("Plástico C", 8), rep("Plástico D", 8))
grupo <- factor(grupo, levels = c("Plástico A", "Plástico B", "Plástico C", "Plástico D"))

# Dibujamos el diagrama de cajas:
boxplot(plasticos~grupo,
        col = c("lightblue", "lightgreen", "orange", "yellow"),
        main = "Resistencia por tipo de plástico")

# Dibujamos las medias en cada caja:
points(1:4, medias, pch = 19, col = "red", cex = 1.2)

Podemos ver que no hay una superposición clara entre las cajas de cada grupo, lo que nos puede dar un indicio de diferencia de medias. No hay presencia de valores atípicos en ninguno de los tres grupos de datos.

El grupo de “Plástico D” tiene una menor variabilidad en sus datos que los grupos demás grupos, los cuáles presentan una variabilidad en sus datos similar. Los grupos “Plástico B” y “Plástico C” tienen una leve asímetria positiva en sus datos, estando sus medias unos puntos por encima de la mediana. Por otro lado, el grupo “Plástico A” tiene una leve asimetría negativa y “Plástico D” se aproxima a una simétrica.

Análisis de Supuestos:

Independencia:

Podemos ver que los datos o observaciones del experimento son independientes ya que un mismo grupo, o tipo de plástico, no se somete a dos distintas pruebas de resistencia.

Prueba de normalidad con Shapiro-Wilk:

# ANÁLISIS DE SUPUESTOS
# Pruebas de normalidad:
shapiro.test(plasticoA)
## 
##  Shapiro-Wilk normality test
## 
## data:  plasticoA
## W = 0.97241, p-value = 0.9163
shapiro.test(plasticoB)
## 
##  Shapiro-Wilk normality test
## 
## data:  plasticoB
## W = 0.96099, p-value = 0.8195
shapiro.test(plasticoC)
## 
##  Shapiro-Wilk normality test
## 
## data:  plasticoC
## W = 0.93005, p-value = 0.5165
shapiro.test(plasticoD)
## 
##  Shapiro-Wilk normality test
## 
## data:  plasticoD
## W = 0.96835, p-value = 0.8847

Como podemos ver, el p-value de la spruebas de cada grupo fueron mayores a 0.05. Por lo tanto, todos los grupos presentan una distribución normal y podemos utilizar ANOVA para probar la diferencia de medias entre los grupos.

Prueba de igualdad de varianzas con Test de Levenne:

# Prueba de igualdad de varianzas:
library(car)
## Loading required package: carData
leveneTest(plasticos, grupo)
## Levene's Test for Homogeneity of Variance (center = median)
##       Df F value Pr(>F)
## group  3  1.3103 0.2907
##       28

El p-value > 0.05, por tanto los grupos presentan igualdad en sus varianzas y ésta no tiene un impacto significativo en nuestra prueba de ANOVA.

ANOVA:

# CONSTRUCCIÓN DE LA TABLA ANOVA
# Calculamos las sumatorias:
k <- 4
n <- 8
N <- n*k
X <- sum(mean(plasticoA), mean(plasticoB), mean(plasticoC), mean(plasticoD))
T1 <- sum(plasticoA)
T2 <- sum(plasticoB)
T3 <- sum(plasticoC)
T4 <- sum(plasticoD)
Ttotal <- sum(T1, T2, T3, T4)

# SSA:
v1 <- c((T1^2/n), (T2^2/n), (T3^2/n), (T4^2/n))
ssa <- sum(v1) - (Ttotal^2/N)
print(ssa)
## [1] 69072.12
# SSE:
sse <- 0
for (i in 1:k) {
  suma_interna <- 0
  for (j in 1:n) {
    indice <- (i - 1) * n + j
    v <- (plasticos[indice] - medias[i])^2
    suma_interna = suma_interna + v
  }
  sse <- sse + suma_interna
}
print(sse)
## [1] 37410.75
# SST:
sst <- ssa + sse
print(sst)
## [1] 106482.9
# MSA:
MSA <- ssa/(k-1)
print(MSA)
## [1] 23024.04
# MSE:
MSE <- sse/(N-k)
print(MSE)
## [1] 1336.098
# Razon F:
razon_F <- MSA/MSE
print(razon_F)
## [1] 17.2323
# Cálculo de ANOVA computacionalmente:
anova <- aov(plasticos~grupo)
summary(anova)
##             Df Sum Sq Mean Sq F value   Pr(>F)    
## grupo        3  69072   23024   17.23 1.55e-06 ***
## Residuals   28  37411    1336                     
## ---
## Signif. codes:  0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1

Como podemos evidenciar, tanto en el método manual como en el computacional coinciden en una F Razón = 17.23. Por lo tanto, nuestros cálculos manuales están correctos. Por otro lado, p-value = 0.00000155 < 0.05 y por tanto se rechaza la hipótesis nula, lo que implica que existe una diferencia significativa entre los grados de resistencia medios a la degradación ambiental medidas antropométricas entre los 4 tipos de plástico: Plástico A, Plástico B, Plástico C y Plástico D. En conclusión, la calidad del plástico afecta la resistencia.

Por lo tanto, vamos a aplicar una prueba post-hoc llamada la Prueba de Tukey.

# Prueba de para hallar la media diferente:
TukeyHSD(anova)
##   Tukey multiple comparisons of means
##     95% family-wise confidence level
## 
## Fit: aov(formula = plasticos ~ grupo)
## 
## $grupo
##                           diff         lwr        upr     p adj
## Plástico B-Plástico A   40.625   -9.275099  90.525099 0.1417355
## Plástico C-Plástico A   62.625   12.724901 112.525099 0.0097183
## Plástico D-Plástico A  -59.500 -109.400099  -9.599901 0.0147847
## Plástico C-Plástico B   22.000  -27.900099  71.900099 0.6296380
## Plástico D-Plástico B -100.125 -150.025099 -50.224901 0.0000426
## Plástico D-Plástico C -122.125 -172.025099 -72.224901 0.0000017

De los resultados de la prueba podemos ver que existen diferencias significativas entre las medias de los siguientes pares de grupos: Plásctico C - Plástico A; Plástico D - Plástico A; Plástico D - Plástico B; Plástico D - Plástico C. No habiendo diferencias entre los siguientes pares de grupos: Plástico B - Plástico A y Plástico C - Plástico B.

Entonces, podemos evidencisar que el tipos de plástico que produce modificaciones significativas en la resistencia es el Plástico D.