Una compañía farmacéutica desea evaluar el efecto que tiene la cantidad de almidón en la dureza de las tabletas. Se decidió producir lotes con una cantidad determinada de almidón, y que las cantidades de almidón a aprobar fueran 2%, 5% y 10%. La variable de respuesta sería el promedio de la dureza de 20 tabletas de cada lote. Se hicieron 4 réplicas por tratamiento y se obtuvieron los siguientes resultados1:
| Almidón | Dureza | Dureza | Dureza | Dureza |
|---|---|---|---|---|
| 2 | 4.3 | 5.2 | 4.8 | 4.5 |
| 5 | 6.5 | 7.3 | 6.9 | 6.1 |
| 10 | 9.0 | 7.8 | 8.5 | 8.1 |
¿Hay evidencia suficiente de que el almidón influye en la dureza en las tabletas? Halle el ANOVA.
Realice los análisis complementarios necesarios.
Si se desea maximizar la dureza de las tabletas, ¿qué recomendaría al fabricante?
Verifique los supuestos.
Para responder a esta pregunta, se plantea la hipótesis nula de que no hay diferencias significativas entre las medias de los tratamientos, y la hipótesis alternativa de que al menos una de las medias es diferente.
\[ H_0: \mu_1 = \mu_2 = \mu_3, \] existe evidencia suficiente de que el almidón influye en la dureza de las tabletas.
\[ H_1: \mu_1 \neq \mu_2 \neq \mu_3 ,\] no existe evidencia suficiente de que el almidón influye en la dureza de las tabletas.
\[ Y_{ij} = \mu + \tau_i + \varepsilon_{ij} \] Donde:
El análisis de varianza (ANOVA) se realiza con el siguiente código:
# Datos
almidon <- c(2, 5, 10)
dureza <- c(4.3, 5.2, 4.8, 4.5, 6.5, 7.3, 6.9, 6.1, 9.0, 7.8, 8.5, 8.1)
data_tablet<- data.frame(almidon = factor(rep(almidon, each = 4)),
dureza = dureza)
# ANOVA
dureza_anova <- aov(dureza ~ almidon, data = data_tablet)
summary(dureza_anova)
## Df Sum Sq Mean Sq F value Pr(>F)
## almidon 2 26.73 13.36 58.1 7.16e-06 ***
## Residuals 9 2.07 0.23
## ---
## Signif. codes: 0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
El resultado del ANOVA muestra que el valor \(p=\) 7.1585748^{-6} es menor que 0.05, por lo que se rechaza la hipótesis nula y se concluye que hay evidencia suficiente de que el almidón influye en la dureza de las tabletas.
Para realizar los análisis complementarios, se realiza la prueba de Tukey para comparar las medias de los tratamientos dos a dos. El resultado de la prueba de Tukey se muestra en la tabla siguiente:
# Prueba de Tukey
tukey_dureza <- TukeyHSD(dureza_anova)
tukey_dureza
## Tukey multiple comparisons of means
## 95% family-wise confidence level
##
## Fit: aov(formula = dureza ~ almidon, data = data_tablet)
##
## $almidon
## diff lwr upr p adj
## 5-2 2.00 1.0531848 2.946815 0.0006016
## 10-2 3.65 2.7031848 4.596815 0.0000052
## 10-5 1.65 0.7031848 2.596815 0.0022940
Los resultados de la prueba Tukey’s HSD muestran las diferencias significativas entre los niveles del factor “almidon”.
Diferencia entre 5 y 2: La diferencia media entre el nivel de almidón 5 y el nivel de almidón 2 es de aproximadamente 2.00. El intervalo de confianza del 95% para esta diferencia va desde 1.05 hasta 2.95. El valor ajustado de p (p-valor ajustado) es muy bajo (0.0006), lo que indica que hay una diferencia significativa entre estos dos niveles de almidón.
Diferencia entre 10 y 2: La diferencia media entre el nivel de almidón 10 y el nivel de almidón 2 es de aproximadamente 3.65. El intervalo de confianza del 95% para esta diferencia va desde 2.70 hasta 4.60. El valor ajustado de p es muy bajo (0.0000052), lo que sugiere una diferencia significativa entre estos dos niveles de almidón.
Diferencia entre 10 y 5: La diferencia media entre el nivel de almidón 10 y el nivel de almidón 5 es de aproximadamente 1.65. El intervalo de confianza del 95% para esta diferencia va desde 0.70 hasta 2.60. El valor ajustado de p es también bajo (0.0022940), lo que indica una diferencia significativa entre estos dos niveles de almidón.
En resumen, según la prueba Tukey’s HSD, hay diferencias significativas en la dureza entre los niveles de almidón 2, 5 y 10.
Si se desea maximizar la dureza de las tabletas, se recomendaría utilizar un 10% de almidón, ya que este tratamiento tiene la mayor dureza promedio.
Para verificar los supuestos, se realiza un gráfico de los residuos y las pruebas de Shapiro-Wilk y Levene.
library(car)
## Warning: package 'car' was built under R version 4.2.2
## Loading required package: carData
## Warning: package 'carData' was built under R version 4.2.1
# Histograma de residuos
hist(residuals(dureza_anova))
# Prueba de Shapiro-Wilk
shapiro.test(residuals(dureza_anova))
##
## Shapiro-Wilk normality test
##
## data: residuals(dureza_anova)
## W = 0.93444, p-value = 0.4295
# Prueba de Levene
leveneTest(residuals(dureza_anova) ~ data_tablet$almidon)
## Levene's Test for Homogeneity of Variance (center = median)
## Df F value Pr(>F)
## group 2 0.2667 0.7718
## 9
El histograma de los residuos muestra una distribución aproximadamente normal.
La prueba de Shapiro-Wilk tiene un valor \(p\) de 0.4295 lo que indica que no hay evidencia suficiente para rechazar la hipótesis nula de normalidad. En otras palabras, los datos de los residuos no muestran una diferencia significativa de la normalidad. Esto sugiere que los residuos del modelo ANOVA se ajustan razonablemente bien a una distribución normal.
La prueba de Levene tiene un valor \(p\) de 0.7718, lo que indica que no hay evidencia suficiente para rechazar la homocedasticidad de los residuos.
Por lo tanto, se puede asumir que los supuestos del ANOVA se cumplen.
# Gráfico de cajas
boxplot(dureza ~ almidon, data = data_tablet, col = "lightgray", xlab = "Almidón (%)", ylab = "Dureza", main = "Dureza de tabletas por porcentaje de almidón")
# Gráfico de medias
means <- tapply(data_tablet$dureza, data_tablet$almidon, mean)
means
## 2 5 10
## 4.70 6.70 8.35
barplot(means, col = "lightgray", xlab = "Almidón (%)", ylab = "Dureza", main = "Dureza de tabletas por porcentaje de almidón")
# Histograma
hist(dureza, col = "lightgray", xlab = "Dureza", ylab = "Frecuencia", main = "Distribución de la dureza de las tabletas")
El gráfico de cajas muestra que el tratamiento con 10% de almidón tiene la mayor dureza promedio, seguido por el tratamiento con 5% de almidón y el tratamiento con 2% de almidón. Al igual que el gráfico de medias.
El histograma muestra que la dureza de las tabletas tiene una distribución aproximadamente normal.
Ejercicio extraido del libro Análisis y diseño de experimentos.
Gutiérrez Pulido, H., & Vara Salazar, R. d. l. (2012). Análisis y diseño de experimentos (3a. ed. --.). México D.F.: McGrawHill.↩︎