| Número de spry | 1 | 2 | 3 | 4 | 5 | 6 |
|---|---|---|---|---|---|---|
| 1 | 77 | 65 | 67 | 75 | 62 | 73 |
| 2 | 55 | 59 | 68 | 70 | 53 | 50 |
| 3 | 64 | 74 | 61 | 58 | 51 | 69 |
Formule la hipótesis adecuada y el modelo estadístico.
¿Existe diferencia entre la efectividad promedio de los productos en spray?
¿Hay algún spray mejor? Argumente su respuesta.
Dé un intervalo al 95% de confianza para la efectividad promedio (porcentaje) de cada una de las marcas.
Dibuje las gráficas de medias y los diagramas de caja simultáneos, después interprételos.
Verifique los supuestos de normalidad y de igual varianza entre las marcas.
# Carga de paquetes
library(stats)
library(utils)
library(agricolae)
library(ggplot2)
La hipotesis adecuada es:
Hipótesis nula: \(H_0: \mu_1 = \mu_2 = \mu_3,\) es decir que las medias de los porcentajes de moscas muertas por cada marca de spray son iguales.
Hipótesis alternativa\(H_1: \mu_1 \neq \mu_2 \neq \mu_3,\) es decir que al menos una de las medias de los porcentajes de moscas muertas por cada marca de spray es diferente.
El modelo estadístico es: \(Y_{ij} = \mu + \tau_i + \varepsilon_{ij}\), donde \(Y_{ij}\) es el porcentaje de moscas muertas, \(\mu\) es la media general, \(\tau_i\) es el efecto del \(i\)-ésimo tratamiento y \(\varepsilon_{ij}\) es el error aleatorio.
Para saber si existe diferencia entre la efectividad promedio de los productos en spray, se realiza un ANOVA.
# Combina los datos en un marco de datos
data <- data.frame(
Spray = rep(c("spray1", "spray2", "spray3"), each = 6),
Value = c(77, 65, 67, 75, 62, 73, 55, 59, 68, 70, 53, 50, 64, 74, 61, 58, 51, 69)
)
# Realiza el ANOVA
modelo_anova <- aov(Value ~ Spray, data = data)
summary(modelo_anova)
## Df Sum Sq Mean Sq F value Pr(>F)
## Spray 2 352.4 176.22 3.123 0.0735 .
## Residuals 15 846.5 56.43
## ---
## Signif. codes: 0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
Para saber si hay algún spray mejor, se realiza una prueba de comparaciones múltiples.
# Realiza el test de Tukey
comparison_tukey <- TukeyHSD(modelo_anova)
print(comparison_tukey)
## Tukey multiple comparisons of means
## 95% family-wise confidence level
##
## Fit: aov(formula = Value ~ Spray, data = data)
##
## $Spray
## diff lwr upr p adj
## spray2-spray1 -10.666667 -21.932357 0.5990235 0.0647534
## spray3-spray1 -7.000000 -18.265690 4.2656902 0.2703892
## spray3-spray2 3.666667 -7.599023 14.9323568 0.6815169
La comparación entre el “spray2” y el “spray1” tiene una diferencia media de -10.67, con un intervalo de confianza que va desde -21.93 hasta 0.60. El valor p ajustado es 0.0647, lo que sugiere que esta diferencia no es estadísticamente significativa a un nivel de significancia del 0.05. Aunque el valor p no es menor de 0.05, podría considerarse marginalmente significativo, ya que está cerca de este umbral.
La comparación entre el “spray3” y el “spray1” tiene una diferencia media de -7.00, con un intervalo de confianza que va desde -18.27 hasta 4.27. El valor p ajustado es 0.2704, lo que indica que esta diferencia no es estadísticamente significativa.
La comparación entre el “spray3” y el “spray2” tiene una diferencia media de 3.67, con un intervalo de confianza que va desde -7.60 hasta 14.93. El valor p ajustado es 0.6815, indicando que esta diferencia tampoco es estadísticamente significativa.
En el análisis realizado, no hay evidencia estadística suficiente para concluir que un spray es significativamente mejor que otro en términos de sus efectos.
Para dar un intervalo al 95% de confianza para la efectividad promedio (porcentaje) de cada una de las marcas, se realiza una prueba de comparaciones múltiples.
# Realiza el test LSD
comparison_lsd <- LSD.test(modelo_anova, "Spray", group = TRUE)
comparison_lsd
## $statistics
## MSerror Df Mean CV t.value LSD
## 56.43333 15 63.94444 11.74803 2.13145 9.244476
##
## $parameters
## test p.ajusted name.t ntr alpha
## Fisher-LSD none Spray 3 0.05
##
## $means
## Value std r se LCL UCL Min Max Q25 Q50 Q75
## spray1 69.83333 6.013873 6 3.066848 63.29650 76.37016 62 77 65.50 70.0 74.50
## spray2 59.16667 8.183316 6 3.066848 52.62984 65.70350 50 70 53.50 57.0 65.75
## spray3 62.83333 8.134290 6 3.066848 56.29650 69.37016 51 74 58.75 62.5 67.75
##
## $comparison
## NULL
##
## $groups
## Value groups
## spray1 69.83333 a
## spray3 62.83333 ab
## spray2 59.16667 b
##
## attr(,"class")
## [1] "group"
El intervalo de confianza del 95% para la efectividad promedio de spray1 está entre 63.30% y 76.37%.
El intervalo de confianza del 95% para la efectividad promedio de spray2 está entre 52.63% y 65.70%.
El intervalo de confianza del 95% para la efectividad promedio de spray3 está entre 56.30% y 69.37%.
e ) Dibuje las gráficas de medias y los diagramas de caja simultáneos, después interprételos.
# Se realiza un diagrama de caja
boxplot(Value ~ Spray, data = data, col = c("red", "blue", "green"),
ylab = "Porcentaje de moscas muertas",
xlab = "Spray",
main = "Diagrama de caja")
# Se realiza un diagrama de medias
means <- tapply(data$Value, data$Spray, mean)
barplot(means, col = c("red", "blue", "green"),
ylab = "Porcentaje de moscas muertas",
xlab = "Spray",
main = "Diagrama de medias")
Ejercicio extraido del libro Análisis y diseño de experimentos.
Gutiérrez Pulido, H., & Vara Salazar, R. d. l. (2012). Análisis y diseño de experimentos (3a. ed. --.). México D.F.: McGrawHill.↩︎