En un centro de investigación se realiza un estudio para comparar varios tratamientos que, al aplicarse previamente a los frijoles crudos, reducen su tiempo de cocción. Estos tratamientos son a base de bicarbonato de sodio (NaHCO3) y cloruro de sodio o sal común (NaCl). El primer tratamiento es el de control, que consiste en no aplicar ningún tratamiento. El tratamiento T2 es el remojo en agua con bicarbonato de sodio, el T3 es remojar en agua con sal común y el T4 es remojar en agua con una combinación de ambos ingredientes en proporciones iguales. La variable de respuesta es el tiempo de cocción en minutos. Los datos se muestran en la siguiente tabla1:
| Control | T1 | T2 | T3 |
|---|---|---|---|
| 213 | 76 | 57 | 84 |
| 214 | 85 | 67 | 82 |
| 204 | 74 | 55 | 85 |
| 208 | 78 | 64 | 92 |
| 212 | 82 | 61 | 87 |
| 200 | 75 | 63 | 79 |
| 207 | 82 | 63 | 90 |
Aleatorización de los experimentos: - Orden de Aplicación de Tratamientos: Aleatorizar el orden en que se aplican los tratamientos a los frijoles crudos. Por ejemplo, utilizando un diseño completamente aleatorizado, se podría asignar aleatoriamente cada tratamiento a un lote de frijoles. - Asignación de Lotes: Si se realizan múltiples lotes de frijoles, aleatorizar la asignación de tratamientos a cada lote. Esto ayuda a controlar posibles variaciones entre lotes.
Aleatorización del material experimental: - Utilizar materiales idénticos: Asegurarse de que todos los frijoles crudos utilizados en el estudio sean de la misma variedad y tengan características similares (tamaño, color, etc.). - Preparación de Tratamientos: Aleatorizar la preparación de las soluciones de bicarbonato de sodio, sal común y la combinación de ambos. Esto puede ayudar a evitar posibles variaciones sistemáticas en la preparación de las soluciones.
La hipótesis nula es que las medias de los tratamientos son iguales, es decir, no hay diferencias significativas en el tiempo de cocción entre los tratamientos. La hipótesis alternativa es que al menos una de las medias de los tratamientos es diferente.
\(H0: \mu control = \mu1 = \mu2 = \mu3\) Las medias de los tratamientos son iguales.
\(H1: \mu control \neq \mu1 \neq \mu2 \neq \mu3\) Al menos una de las medias es diferente.
Para probar esta hipótesis, se puede utilizar un análisis de varianza (ANOVA) de un factor, que compara las medias de los tratamientos y evalúa si hay diferencias significativas entre ellas.
# Datos
control <- c(213, 214, 204, 208, 212, 200, 207)
t1 <- c(76, 85, 74, 78, 82, 75, 82)
t2 <- c(57, 67, 55, 64, 61, 63, 63)
t3 <- c(84, 82, 85, 92, 87, 79, 90)
# Crear un data frame con los datos
d_frijoles <- data.frame(control, t1, t2, t3)
# Ordenar los datos en un formato larg
df_order <- stack(d_frijoles)
# Realizar un análisis de varianza (ANOVA) de un factor
anova_frijoles <- aov(values ~ ind, data = df_order)
summary(anova_frijoles)
## Df Sum Sq Mean Sq F value Pr(>F)
## ind 3 95041 31680 1559 <2e-16 ***
## Residuals 24 488 20
## ---
## Signif. codes: 0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
El p-valor del ANOVA es menor que 0.05, lo que indica que hay diferencias significativas entre al menos una de las medias de los tratamientos. Por lo tanto, se rechaza la hipótesis nula y se concluye que al menos una de las medias de los tratamientos es diferente.
# Diagrama de caja
boxplot(d_frijoles, col = "lightblue", main = "Diagrama de Caja de Tiempo de Cocción
por Tratamiento", ylab = "Tiempo de Cocción (minutos)", xlab = "Tratamiento")
# Gráfico de medias
means <- colMeans(d_frijoles)
barplot(means, col = "lightblue", main = "Gráfico de Medias de Tiempo
de Cocción por Tratamiento", ylab = "Tiempo de Cocción (minutos)",
names.arg = c("Control", "T1", "T2", "T3"))
El diagrama de caja muestra la distribución del tiempo de cocción para cada tratamiento. Se observa que el tratamiento T2 tiene un rango intercuartílico más pequeño y una mediana más baja en comparación con los otros tratamientos. El tratamiento T3 tiene el rango intercuartílico más grande y una mediana más alta. El tratamiento T1 tiene una mediana y rango intercuartílico intermedios. El control tiene la mediana más alta y un rango intercuartílico similar al tratamiento T3.
El gráfico de medias muestra las medias del tiempo de cocción para cada tratamiento. Se observa que el tratamiento T2 tiene la media más baja, seguido T1 y el tratamiento T3, finalmente el contro tiene la media más alta.
El mejor tratamiento es el que tiene la media más baja, que en este caso es el tratamiento T2. El tiempo de cocción esperado para el mejor tratamiento es de aproximadamente 61 minutos.
Sin embargo, es al haber diferencias significativas entre las medias de los tratamientos, es importante realizar pruebas de comparaciones múltiples para determinar cuáles tratamientos son significativamente diferentes entre sí.
library(agricolae)
## Warning: package 'agricolae' was built under R version 4.2.3
# Realizar pruebas de comparaciones múltiples (Tukey)
tukey_frijoles <- TukeyHSD(anova_frijoles)
tukey_frijoles
## Tukey multiple comparisons of means
## 95% family-wise confidence level
##
## Fit: aov(formula = values ~ ind, data = df_order)
##
## $ind
## diff lwr upr p adj
## t1-control -129.428571 -136.07568671 -122.78146 0.0000000
## t2-control -146.857143 -153.50425813 -140.21003 0.0000000
## t3-control -122.714286 -129.36140099 -116.06717 0.0000000
## t2-t1 -17.428571 -24.07568671 -10.78146 0.0000010
## t3-t1 6.714286 0.06717044 13.36140 0.0471059
## t3-t2 24.142857 17.49574187 30.78997 0.0000000
# Realizar pruebas de comparaciones múltiples (LSD)
lsd_frijoles <- LSD.test(anova_frijoles, "ind",p.adj="bonferroni",console=TRUE)
##
## Study: anova_frijoles ~ "ind"
##
## LSD t Test for values
## P value adjustment method: bonferroni
##
## Mean Square Error: 20.32143
##
## ind, means and individual ( 95 %) CI
##
## values std r se LCL UCL Min Max Q25 Q50
## control 208.28571 5.122313 7 1.703837 204.76917 211.80226 200 214 205.5 208
## t1 78.85714 4.180453 7 1.703837 75.34060 82.37369 74 85 75.5 78
## t2 61.42857 4.157609 7 1.703837 57.91202 64.94512 55 67 59.0 63
## t3 85.57143 4.503967 7 1.703837 82.05488 89.08798 79 92 83.0 85
## Q75
## control 212.5
## t1 82.0
## t2 63.5
## t3 88.5
##
## Alpha: 0.05 ; DF Error: 24
## Critical Value of t: 2.875094
##
## Minimum Significant Difference: 6.927798
##
## Treatments with the same letter are not significantly different.
##
## values groups
## control 208.28571 a
## t3 85.57143 b
## t1 78.85714 b
## t2 61.42857 c
lsd_frijoles
## $statistics
## MSerror Df Mean CV t.value MSD
## 20.32143 24 108.5357 4.153407 2.875094 6.927798
##
## $parameters
## test p.ajusted name.t ntr alpha
## Fisher-LSD bonferroni ind 4 0.05
##
## $means
## values std r se LCL UCL Min Max Q25 Q50
## control 208.28571 5.122313 7 1.703837 204.76917 211.80226 200 214 205.5 208
## t1 78.85714 4.180453 7 1.703837 75.34060 82.37369 74 85 75.5 78
## t2 61.42857 4.157609 7 1.703837 57.91202 64.94512 55 67 59.0 63
## t3 85.57143 4.503967 7 1.703837 82.05488 89.08798 79 92 83.0 85
## Q75
## control 212.5
## t1 82.0
## t2 63.5
## t3 88.5
##
## $comparison
## NULL
##
## $groups
## values groups
## control 208.28571 a
## t3 85.57143 b
## t1 78.85714 b
## t2 61.42857 c
##
## attr(,"class")
## [1] "group"
Las pruebas de comparaciones múltiples (Tukey y LSD) muestran que el tratamiento T2 es significativamente diferente de los otros tratamientos, mientras que los tratamientos T1, T3 y el control no son significativamente diferentes entre sí. Por lo tanto, el tratamiento T2 es el mejor tratamiento, con un tiempo de cocción esperado de aproximadamente 61 minutos.
El mejor tratamiento, T2, podría tener efectos colaterales no deseados, como cambios en la textura, sabor o valor nutricional de los frijoles. Además, el tratamiento T2 podría requerir un método de cocción específico o una cantidad de agua diferente, lo que podría afectar la facilidad de preparación y el consumo de los frijoles. Por lo tanto, es importante realizar pruebas adicionales para investigar los posibles efectos colaterales del tratamiento T2 y determinar si es la mejor opción para reducir el tiempo de cocción de los frijoles.
Los supuestos del modelo de ANOVA incluyen la normalidad, la
homogeneidad de varianzas y la independencia de las observaciones. Estos
supuestos se pueden verificar gráficamente utilizando un gráfico de
cuantiles normales y un gráfico de residuos.
Los gráficos de residuos vs valores ajustados, cuantiles
normales y residuos vs orden no muestran patrones evidentes, lo que
sugiere que los supuestos del modelo de ANOVA se cumplen.
La prueba de Levene se utiliza para probar la hipótesis de igualdad de varianzas entre tratamientos. La hipótesis nula es que las varianzas son iguales entre tratamientos, y la hipótesis alternativa es que al menos una de las varianzas es diferente.
# Prueba de Levene
# Carga la librería car
library(car)
## Warning: package 'car' was built under R version 4.2.2
## Loading required package: carData
## Warning: package 'carData' was built under R version 4.2.1
# Test de Levene
leveneTest(residuals(anova_frijoles), group = df_order$ind)
## Levene's Test for Homogeneity of Variance (center = median)
## Df F value Pr(>F)
## group 3 0.1631 0.9201
## 24
La prueba de Levene para homogeneidad de varianzas evalúa si las varianzas son significativamente diferentes entre grupos. En tu resultado, la estadística de prueba (F value) es 0.1631 y el valor p asociado es 0.9201.
La interpretación general es la siguiente:
En este caso, dado que el valor p (0.9201) es mayor que el nivel de significancia comúnmente utilizado (por ejemplo, 0.05), no hay evidencia suficiente para rechazar la hipótesis nula. Por lo tanto, basado en esta prueba, no tienes suficiente evidencia para decir que las varianzas son diferentes entre los grupos. Puedes asumir que la igualdad de varianzas no es un problema significativo en tu conjunto de datos, al menos según la prueba de Levene.
Ejercicio extraido del libro Análisis y diseño de experimentos.
Gutiérrez Pulido, H., & Vara Salazar, R. d. l. (2012). Análisis y diseño de experimentos (3a. ed. --.). México D.F.: McGrawHill.↩︎