Estamos interesados en conocer si hay colores más atractivos para los insectos. Para ello se diseñaron trampas con los siguientes colores: amarillo, azul, blanco y verde. Se cuantificó el número de insectos que quedaban atrapados:
Azul: 16 11 20 21 14 7
Verde: 37 32 15 25 39 41
Blanco: 21 12 14 17 13 17
Amarillo: 45 59 48 46 38 47
Generamos dos variables: insectos es la variable respuesta y colores es la variable factor (establece los grupos de interés):
insectos <- c(16,11,20,21,14,7,37,32,15,25,39,41,21,12,14,17,13,17,45,59,48,46,38,47)
colores <- as.factor(c(rep(c("azul", "verde", "blanco", "amarillo"), each =6)))
Exploramos los datos de la muestra:
boxplot(insectos ~ colores, col = c("yellow", "blue", "white","green"), ylab = "Número de insectos atrapados")
tapply(insectos, colores, mean)
amarillo azul blanco verde
47.16667 14.83333 15.66667 31.50000
Los supuestos que se deben cumplir son tres: independencia, homocedasticidad y normalidad.
fm = aov( lm(insectos ~ colores) )
plot(fm$residuals)
Los gráficos y descriptivos nos informan si se verifica la igualdad de varianzas en los grupos descritos.
summary(fm$residuals)
Min. 1st Qu. Median Mean 3rd Qu. Max.
-16.5000 -2.9167 0.1667 0.0000 5.2083 11.8333
boxplot(fm$residuals)
hist(fm$residuals)
qqnorm(fm$residuals)
qqline(fm$residuals)
El test de Shapiro-Wilk indica que no tenemos evidencia suficiente para rechazar la hipótesis nula (normalidad de los residuos).
shapiro.test(fm$residuals)
Shapiro-Wilk normality test
data: fm$residuals
W = 0.97337, p-value = 0.75
Los gráficos y descriptivos nos informan si se verifica la igualdad de varianzas en los grupos descritos:
boxplot(fm$residuals~colores, col = c("yellow", "blue", "white","green"))
desviaciones <- tapply(fm$residuals, colores, sd)
Comparando la desviación máxima con la mínima obtenemos una orientación sobre la falta de homocedasticidad (>2 aproximadamente).
max(desviaciones) / min(desviaciones)
[1] 2.980357
El test de Bartlett indica que no tenemos evidencia suficiente para rechazar la hipótesis nula (las varianzas son iguales).
bartlett.test(fm$residuals ~ colores)
Bartlett test of homogeneity of variances
data: fm$residuals by colores
Bartlett's K-squared = 5.2628, df = 3, p-value = 0.1535
Esta es la forma de pedir un ANOVA en R:
fm = aov( lm(insectos ~ colores) )
Pedimos un resumen de la tabla del ANOVA.
summary(fm)
Df Sum Sq Mean Sq F value Pr(>F)
colores 3 4218 1406 30.55 1.15e-07 ***
Residuals 20 921 46
---
Signif. codes: 0 ‘***’ 0.001 ‘**’ 0.01 ‘*’ 0.05 ‘.’ 0.1 ‘ ’ 1
Elementos generados en el ANOVA:
names(fm)
[1] "coefficients" "residuals" "effects" "rank" "fitted.values" "assign"
[7] "qr" "df.residual" "contrasts" "xlevels" "call" "terms"
[13] "model"
Bajo la Ho el estadístico de contraste F se distribuye como una F de grados de libertad (I-1), (n-I) donde I es el número de grupos que disponemos y n el tamaño total de la muestral. Así obtenemos el cuantil buscado.
qf(0.05, 3-1, 18-3, lower.tail = F)
[1] 3.68232
Valores del estadístico > 3.68232 estarán incluidos en la región de rechazo. En nuetro caso 30.55 es mucho mayor que el valor crítico obtenido.
Este sería el intervalo de confianza de la media de los insectos capturados para las trampas amarillas, con un nivel de confianza del 95%:
media <- mean(insectos[colores =="amarillo"])
valor_t <- pt(0.05/2, 18 - 3)
sp <- sqrt(46) #desviación típica de la varianza muestral común
ee <- valor_t * (sp/ sqrt(6)) #error de estimación
media
[1] 47.16667
Límite superior del intervalo de confianza de la media de insectos capturados para las trampas amarillas.
media + ee
[1] 48.57826
Límite inferior del intervalo de confianza de la media de insectos capturados para las trampas amarillas.
media - ee
[1] 45.75507
Si hemos detectado diferencias significativas entre las medias de las poblaciones.
intervals = TukeyHSD(fm)
intervals
Tukey multiple comparisons of means
95% family-wise confidence level
Fit: aov(formula = lm(insectos ~ colores))
$colores
diff lwr upr p adj
azul-amarillo -32.3333333 -43.296330 -21.37034 0.0000004
blanco-amarillo -31.5000000 -42.462996 -20.53700 0.0000006
verde-amarillo -15.6666667 -26.629663 -4.70367 0.0036170
blanco-azul 0.8333333 -10.129663 11.79633 0.9964823
verde-azul 16.6666667 5.703670 27.62966 0.0020222
verde-blanco 15.8333333 4.870337 26.79633 0.0032835