Diseño y analisis de experimentos

Ejercicio 11

  1. Se hace un estudio sobre la efectividad de tres marcas de spray para matar moscas. Para ello, cada producto se aplica a un grupo de 100 moscas, y se cuenta el número de moscas muertas expresado en porcentajes. Se hacen seis réplicas y los resultados obtenidos se muestran a continuación1.
Número de spry 1 2 3 4 5 6
1 77 65 67 75 62 73
2 55 59 68 70 53 50
3 64 74 61 58 51 69
  1. Formule la hipótesis adecuada y el modelo estadístico.

  2. ¿Existe diferencia entre la efectividad promedio de los productos en spray?

  3. ¿Hay algún spray mejor? Argumente su respuesta.

  4. Dé un intervalo al 95% de confianza para la efectividad promedio (porcentaje) de cada una de las marcas.

  5. Dibuje las gráficas de medias y los diagramas de caja simultáneos, después interprételos.

  6. Verifique los supuestos de normalidad y de igual varianza entre las marcas.

Solución

# Carga de paquetes
library(stats)
library(utils)
library(agricolae)
library(ggplot2)
  1. Formule la hipótesis adecuada y el modelo estadístico.

La hipotesis adecuada es:

  • Hipótesis nula: \(H_0: \mu_1 = \mu_2 = \mu_3,\) es decir que las medias de los porcentajes de moscas muertas por cada marca de spray son iguales.

  • Hipótesis alternativa\(H_1: \mu_1 \neq \mu_2 \neq \mu_3,\) es decir que al menos una de las medias de los porcentajes de moscas muertas por cada marca de spray es diferente.

El modelo estadístico es: \(Y_{ij} = \mu + \tau_i + \varepsilon_{ij}\), donde \(Y_{ij}\) es el porcentaje de moscas muertas, \(\mu\) es la media general, \(\tau_i\) es el efecto del \(i\)-ésimo tratamiento y \(\varepsilon_{ij}\) es el error aleatorio.

  1. ¿Existe diferencia entre la efectividad promedio de los productos en spray?

Para saber si existe diferencia entre la efectividad promedio de los productos en spray, se realiza un ANOVA.

# Combina los datos en un marco de datos
data <- data.frame(
  Spray = rep(c("spray1", "spray2", "spray3"), each = 6),
  Value = c(77, 65, 67, 75, 62, 73, 55, 59, 68, 70, 53, 50, 64, 74, 61, 58, 51, 69)
)

# Realiza el ANOVA
modelo_anova <- aov(Value ~ Spray, data = data)
summary(modelo_anova)
##             Df Sum Sq Mean Sq F value Pr(>F)  
## Spray        2  352.4  176.22   3.123 0.0735 .
## Residuals   15  846.5   56.43                 
## ---
## Signif. codes:  0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
  • De acuerdo al anova, p-valor = 0.0735, como el p-valor es mayor que 0.05, por lo tanto se acepta la hipótesis nula, es decir, se concluye que no existe diferencia entre la efectividad promedio de los productos en spray.
  1. ¿Hay algún spray mejor? Argumente su respuesta.

Para saber si hay algún spray mejor, se realiza una prueba de comparaciones múltiples.

# Realiza el test de Tukey
comparison_tukey <- TukeyHSD(modelo_anova)
print(comparison_tukey)
##   Tukey multiple comparisons of means
##     95% family-wise confidence level
## 
## Fit: aov(formula = Value ~ Spray, data = data)
## 
## $Spray
##                     diff        lwr        upr     p adj
## spray2-spray1 -10.666667 -21.932357  0.5990235 0.0647534
## spray3-spray1  -7.000000 -18.265690  4.2656902 0.2703892
## spray3-spray2   3.666667  -7.599023 14.9323568 0.6815169
  • La comparación entre el “spray2” y el “spray1” tiene una diferencia media de -10.67, con un intervalo de confianza que va desde -21.93 hasta 0.60. El valor p ajustado es 0.0647, lo que sugiere que esta diferencia no es estadísticamente significativa a un nivel de significancia del 0.05. Aunque el valor p no es menor de 0.05, podría considerarse marginalmente significativo, ya que está cerca de este umbral.

  • La comparación entre el “spray3” y el “spray1” tiene una diferencia media de -7.00, con un intervalo de confianza que va desde -18.27 hasta 4.27. El valor p ajustado es 0.2704, lo que indica que esta diferencia no es estadísticamente significativa.

  • La comparación entre el “spray3” y el “spray2” tiene una diferencia media de 3.67, con un intervalo de confianza que va desde -7.60 hasta 14.93. El valor p ajustado es 0.6815, indicando que esta diferencia tampoco es estadísticamente significativa.

En el análisis realizado, no hay evidencia estadística suficiente para concluir que un spray es significativamente mejor que otro en términos de sus efectos.

  1. Dé un intervalo al 95% de confianza para la efectividad promedio (porcentaje) de cada una de las marcas.

Para dar un intervalo al 95% de confianza para la efectividad promedio (porcentaje) de cada una de las marcas, se realiza una prueba de comparaciones múltiples.

# Realiza el test LSD
comparison_lsd <- LSD.test(modelo_anova, "Spray", group = TRUE)
comparison_lsd
## $statistics
##    MSerror Df     Mean       CV t.value      LSD
##   56.43333 15 63.94444 11.74803 2.13145 9.244476
## 
## $parameters
##         test p.ajusted name.t ntr alpha
##   Fisher-LSD      none  Spray   3  0.05
## 
## $means
##           Value      std r       se      LCL      UCL Min Max   Q25  Q50   Q75
## spray1 69.83333 6.013873 6 3.066848 63.29650 76.37016  62  77 65.50 70.0 74.50
## spray2 59.16667 8.183316 6 3.066848 52.62984 65.70350  50  70 53.50 57.0 65.75
## spray3 62.83333 8.134290 6 3.066848 56.29650 69.37016  51  74 58.75 62.5 67.75
## 
## $comparison
## NULL
## 
## $groups
##           Value groups
## spray1 69.83333      a
## spray3 62.83333     ab
## spray2 59.16667      b
## 
## attr(,"class")
## [1] "group"
  • El intervalo de confianza del 95% para la efectividad promedio de spray1 está entre 63.30% y 76.37%.

  • El intervalo de confianza del 95% para la efectividad promedio de spray2 está entre 52.63% y 65.70%.

  • El intervalo de confianza del 95% para la efectividad promedio de spray3 está entre 56.30% y 69.37%.

e ) Dibuje las gráficas de medias y los diagramas de caja simultáneos, después interprételos.

# Se realiza un diagrama de caja
boxplot(Value ~ Spray, data = data, col = c("red", "blue", "green"), 
        ylab = "Porcentaje de moscas muertas", 
        xlab = "Spray", 
        main = "Diagrama de caja")

# Se realiza un diagrama de medias

means <- tapply(data$Value, data$Spray, mean) 
barplot(means, col = c("red", "blue", "green"), 
        ylab = "Porcentaje de moscas muertas", 
        xlab = "Spray", 
        main = "Diagrama de medias")

  • En el diagrama de caja se observa que el spray1 tiene una mediana más alta que el spray2 y el spray3, lo que sugiere que el spray1 es más efectivo. De igual manera, el diagrama de medias nos muestra que spray1 tiene una media más alta que el spray2 y el spray3. Sin embargo, el análisis de comparaciones múltiples no mostró diferencias significativas entre los sprays.

  1. Ejercicio extraido del libro Análisis y diseño de experimentos.

    Gutiérrez Pulido, H., & Vara Salazar, R. d. l. (2012). Análisis y diseño de experimentos (3a. ed. --.). México D.F.: McGrawHill.↩︎