Diseño y analisis de experimentos

Ejercicio 12

En un centro de investigación se realiza un estudio para comparar varios tratamientos que, al aplicarse previamente a los frijoles crudos, reducen su tiempo de cocción. Estos tratamientos son a base de bicarbonato de sodio (NaHCO3) y cloruro de sodio o sal común (NaCl). El primer tratamiento es el de control, que consiste en no aplicar ningún tratamiento. El tratamiento T2 es el remojo en agua con bicarbonato de sodio, el T3 es remojar en agua con sal común y el T4 es remojar en agua con una combinación de ambos ingredientes en proporciones iguales. La variable de respuesta es el tiempo de cocción en minutos. Los datos se muestran en la siguiente tabla1:

Control T1 T2 T3
213 76 57 84
214 85 67 82
204 74 55 85
208 78 64 92
212 82 61 87
200 75 63 79
207 82 63 90
  1. ¿De qué manera el experimentador debe aleatorizar los experimentos y el material experimental?
  2. Dé ejemplos de factores que deben estar fijos durante las pruebas experimentales, para que no afecten los resultados y las conclusiones.
  3. Formule y pruebe la hipótesis de que las medias de los tratamientos son iguales.
  4. Obtenga el diagrama de caja y el gráfico de medias, después interprételos.
  5. ¿Hay algún tratamiento mejor? ¿Cuál es el tiempo de cocción esperado para el mejor tratamiento? f ) Algo importante a cuidar en un experimento es que no haya efectos colaterales no deseados, causados por el tratamiento ganador; en este caso, piense en los posibles efectos colaterales que podría causar el mejor tratamiento.
  6. ¿Se cumplen los supuestos del modelo? Verifique gráficamente.
  7. Pruebe la hipótesis de igualdad de varianzas entre tratamientos (que corresponde a un supuesto).

Solución

  1. ¿De qué manera el experimentador debe aleatorizar los experimentos y el material experimental?

Aleatorización de los experimentos: - Orden de Aplicación de Tratamientos: Aleatorizar el orden en que se aplican los tratamientos a los frijoles crudos. Por ejemplo, utilizando un diseño completamente aleatorizado, se podría asignar aleatoriamente cada tratamiento a un lote de frijoles. - Asignación de Lotes: Si se realizan múltiples lotes de frijoles, aleatorizar la asignación de tratamientos a cada lote. Esto ayuda a controlar posibles variaciones entre lotes.

Aleatorización del material experimental: - Utilizar materiales idénticos: Asegurarse de que todos los frijoles crudos utilizados en el estudio sean de la misma variedad y tengan características similares (tamaño, color, etc.). - Preparación de Tratamientos: Aleatorizar la preparación de las soluciones de bicarbonato de sodio, sal común y la combinación de ambos. Esto puede ayudar a evitar posibles variaciones sistemáticas en la preparación de las soluciones.

  1. Dé ejemplos de factores que deben estar fijos durante las pruebas experimentales, para que no afecten los resultados y las conclusiones.
  • Tipo de frijol: El tipo de frijol utilizado en el estudio debe ser fijo, para evitar posibles diferencias en el tiempo de cocción debido a las características intrínsecas de los frijoles.
  • Método de cocción: El método de cocción utilizado para medir el tiempo de cocción debe ser fijo, para asegurar que las diferencias observadas sean atribuibles a los tratamientos y no a variaciones en el método de cocción.
  • Cantidad de agua: La cantidad de agua utilizada para cocinar los frijoles debe ser fija, para evitar posibles diferencias en el tiempo de cocción debido a variaciones en la cantidad de agua.
  • Tipo de Olla y Fuente de Calor: Fijar el tipo de olla y la fuente de calor utilizados para cocinar los frijoles. Cambios en estos factores podrían afectar el tiempo de cocción y confundir los efectos de los tratamientos.
  1. Formule y pruebe la hipótesis de que las medias de los tratamientos son iguales.

La hipótesis nula es que las medias de los tratamientos son iguales, es decir, no hay diferencias significativas en el tiempo de cocción entre los tratamientos. La hipótesis alternativa es que al menos una de las medias de los tratamientos es diferente.

\(H0: \mu control = \mu1 = \mu2 = \mu3\) Las medias de los tratamientos son iguales.

\(H1: \mu control \neq \mu1 \neq \mu2 \neq \mu3\) Al menos una de las medias es diferente.

Para probar esta hipótesis, se puede utilizar un análisis de varianza (ANOVA) de un factor, que compara las medias de los tratamientos y evalúa si hay diferencias significativas entre ellas.

# Datos
control <- c(213, 214, 204, 208, 212, 200, 207)
t1 <- c(76, 85, 74, 78, 82, 75, 82)
t2 <- c(57, 67, 55, 64, 61, 63, 63)
t3 <- c(84, 82, 85, 92, 87, 79, 90)

# Crear un data frame con los datos
d_frijoles <- data.frame(control, t1, t2, t3)

# Ordenar los datos en un formato larg
df_order <- stack(d_frijoles)

# Realizar un análisis de varianza (ANOVA) de un factor
anova_frijoles <- aov(values ~ ind, data = df_order)
summary(anova_frijoles)
##             Df Sum Sq Mean Sq F value Pr(>F)    
## ind          3  95041   31680    1559 <2e-16 ***
## Residuals   24    488      20                   
## ---
## Signif. codes:  0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1

El p-valor del ANOVA es menor que 0.05, lo que indica que hay diferencias significativas entre al menos una de las medias de los tratamientos. Por lo tanto, se rechaza la hipótesis nula y se concluye que al menos una de las medias de los tratamientos es diferente.

  1. Obtenga el diagrama de caja y el gráfico de medias, después interprételos.
# Diagrama de caja
boxplot(d_frijoles, col = "lightblue", main = "Diagrama de Caja de Tiempo de Cocción 
        por Tratamiento", ylab = "Tiempo de Cocción (minutos)", xlab = "Tratamiento")

# Gráfico de medias
means <- colMeans(d_frijoles)
barplot(means, col = "lightblue", main = "Gráfico de Medias de Tiempo 
        de Cocción por Tratamiento", ylab = "Tiempo de Cocción (minutos)",
        names.arg = c("Control", "T1", "T2", "T3")) 

El diagrama de caja muestra la distribución del tiempo de cocción para cada tratamiento. Se observa que el tratamiento T2 tiene un rango intercuartílico más pequeño y una mediana más baja en comparación con los otros tratamientos. El tratamiento T3 tiene el rango intercuartílico más grande y una mediana más alta. El tratamiento T1 tiene una mediana y rango intercuartílico intermedios. El control tiene la mediana más alta y un rango intercuartílico similar al tratamiento T3.

El gráfico de medias muestra las medias del tiempo de cocción para cada tratamiento. Se observa que el tratamiento T2 tiene la media más baja, seguido T1 y el tratamiento T3, finalmente el contro tiene la media más alta.

  1. ¿Cuál es el mejor tratamiento? ¿Cuál es el tiempo de cocción esperado para el mejor tratamiento?

El mejor tratamiento es el que tiene la media más baja, que en este caso es el tratamiento T2. El tiempo de cocción esperado para el mejor tratamiento es de aproximadamente 61 minutos.

Sin embargo, es al haber diferencias significativas entre las medias de los tratamientos, es importante realizar pruebas de comparaciones múltiples para determinar cuáles tratamientos son significativamente diferentes entre sí.

library(agricolae)
## Warning: package 'agricolae' was built under R version 4.2.3
# Realizar pruebas de comparaciones múltiples (Tukey)
tukey_frijoles <- TukeyHSD(anova_frijoles)  
tukey_frijoles
##   Tukey multiple comparisons of means
##     95% family-wise confidence level
## 
## Fit: aov(formula = values ~ ind, data = df_order)
## 
## $ind
##                   diff           lwr        upr     p adj
## t1-control -129.428571 -136.07568671 -122.78146 0.0000000
## t2-control -146.857143 -153.50425813 -140.21003 0.0000000
## t3-control -122.714286 -129.36140099 -116.06717 0.0000000
## t2-t1       -17.428571  -24.07568671  -10.78146 0.0000010
## t3-t1         6.714286    0.06717044   13.36140 0.0471059
## t3-t2        24.142857   17.49574187   30.78997 0.0000000
# Realizar pruebas de comparaciones múltiples (LSD)
lsd_frijoles <- LSD.test(anova_frijoles, "ind",p.adj="bonferroni",console=TRUE)
## 
## Study: anova_frijoles ~ "ind"
## 
## LSD t Test for values 
## P value adjustment method: bonferroni 
## 
## Mean Square Error:  20.32143 
## 
## ind,  means and individual ( 95 %) CI
## 
##            values      std r       se       LCL       UCL Min Max   Q25 Q50
## control 208.28571 5.122313 7 1.703837 204.76917 211.80226 200 214 205.5 208
## t1       78.85714 4.180453 7 1.703837  75.34060  82.37369  74  85  75.5  78
## t2       61.42857 4.157609 7 1.703837  57.91202  64.94512  55  67  59.0  63
## t3       85.57143 4.503967 7 1.703837  82.05488  89.08798  79  92  83.0  85
##           Q75
## control 212.5
## t1       82.0
## t2       63.5
## t3       88.5
## 
## Alpha: 0.05 ; DF Error: 24
## Critical Value of t: 2.875094 
## 
## Minimum Significant Difference: 6.927798 
## 
## Treatments with the same letter are not significantly different.
## 
##            values groups
## control 208.28571      a
## t3       85.57143      b
## t1       78.85714      b
## t2       61.42857      c
lsd_frijoles
## $statistics
##    MSerror Df     Mean       CV  t.value      MSD
##   20.32143 24 108.5357 4.153407 2.875094 6.927798
## 
## $parameters
##         test  p.ajusted name.t ntr alpha
##   Fisher-LSD bonferroni    ind   4  0.05
## 
## $means
##            values      std r       se       LCL       UCL Min Max   Q25 Q50
## control 208.28571 5.122313 7 1.703837 204.76917 211.80226 200 214 205.5 208
## t1       78.85714 4.180453 7 1.703837  75.34060  82.37369  74  85  75.5  78
## t2       61.42857 4.157609 7 1.703837  57.91202  64.94512  55  67  59.0  63
## t3       85.57143 4.503967 7 1.703837  82.05488  89.08798  79  92  83.0  85
##           Q75
## control 212.5
## t1       82.0
## t2       63.5
## t3       88.5
## 
## $comparison
## NULL
## 
## $groups
##            values groups
## control 208.28571      a
## t3       85.57143      b
## t1       78.85714      b
## t2       61.42857      c
## 
## attr(,"class")
## [1] "group"

Las pruebas de comparaciones múltiples (Tukey y LSD) muestran que el tratamiento T2 es significativamente diferente de los otros tratamientos, mientras que los tratamientos T1, T3 y el control no son significativamente diferentes entre sí. Por lo tanto, el tratamiento T2 es el mejor tratamiento, con un tiempo de cocción esperado de aproximadamente 61 minutos.

  1. Algo importante a cuidar en un experimento es que no haya efectos colaterales no deseados, causados por el tratamiento ganador; en este caso, piense en los posibles efectos colaterales que podría causar el mejor tratamiento.

El mejor tratamiento, T2, podría tener efectos colaterales no deseados, como cambios en la textura, sabor o valor nutricional de los frijoles. Además, el tratamiento T2 podría requerir un método de cocción específico o una cantidad de agua diferente, lo que podría afectar la facilidad de preparación y el consumo de los frijoles. Por lo tanto, es importante realizar pruebas adicionales para investigar los posibles efectos colaterales del tratamiento T2 y determinar si es la mejor opción para reducir el tiempo de cocción de los frijoles.

  1. ¿Se cumplen los supuestos del modelo? Verifique gráficamente.

Los supuestos del modelo de ANOVA incluyen la normalidad, la homogeneidad de varianzas y la independencia de las observaciones. Estos supuestos se pueden verificar gráficamente utilizando un gráfico de cuantiles normales y un gráfico de residuos.

Los gráficos de residuos vs valores ajustados, cuantiles normales y residuos vs orden no muestran patrones evidentes, lo que sugiere que los supuestos del modelo de ANOVA se cumplen.

  1. Pruebe la hipótesis de igualdad de varianzas entre tratamientos (que corresponde a un supuesto).

La prueba de Levene se utiliza para probar la hipótesis de igualdad de varianzas entre tratamientos. La hipótesis nula es que las varianzas son iguales entre tratamientos, y la hipótesis alternativa es que al menos una de las varianzas es diferente.

# Prueba de Levene
# Carga la librería car
library(car)
## Warning: package 'car' was built under R version 4.2.2
## Loading required package: carData
## Warning: package 'carData' was built under R version 4.2.1
# Test de Levene
leveneTest(residuals(anova_frijoles), group = df_order$ind)
## Levene's Test for Homogeneity of Variance (center = median)
##       Df F value Pr(>F)
## group  3  0.1631 0.9201
##       24

La prueba de Levene para homogeneidad de varianzas evalúa si las varianzas son significativamente diferentes entre grupos. En tu resultado, la estadística de prueba (F value) es 0.1631 y el valor p asociado es 0.9201.

La interpretación general es la siguiente:

  • Hipótesis nula (\(H_0\)): Las varianzas son iguales entre los grupos.
  • Hipótesis alternativa (\(H_a\)): Al menos una de las varianzas es diferente.

En este caso, dado que el valor p (0.9201) es mayor que el nivel de significancia comúnmente utilizado (por ejemplo, 0.05), no hay evidencia suficiente para rechazar la hipótesis nula. Por lo tanto, basado en esta prueba, no tienes suficiente evidencia para decir que las varianzas son diferentes entre los grupos. Puedes asumir que la igualdad de varianzas no es un problema significativo en tu conjunto de datos, al menos según la prueba de Levene.


  1. Ejercicio extraido del libro Análisis y diseño de experimentos.

    Gutiérrez Pulido, H., & Vara Salazar, R. d. l. (2012). Análisis y diseño de experimentos (3a. ed. --.). México D.F.: McGrawHill.↩︎