El diseño de experimentos tiene como objetivo buscar comparacion,para ello emplea el ANOVA.El ANOVA,consiste en una particion de la variabilidad total,para determinar si existe diferencia en las medias poblacionales.Pero puede que el problema para el investigador no termine, solo con decir que por lo menos un par de medias es diferente.Entonces tiene una alternativa,las comparaciones multiples,estas pruebas buscan determinar cuales de los posibles pares de media,difieren de forma significativa,brindando otro enfoque al problema.En la literatura se les conoce como Pruebas post-hoc,lo que significa que se aplican luego de realizar un ANOVA,y haber rechazado Ho.
Supongamos que queremos determinar si cuatro dosificaciones de un hormigón A,B,C y D presentan una misma resistencia característica a compresión.Para ello se han elaborado 5 probetas para cada tipo de dosificación y, a los 28 días, se han roto las probetas a compresión simple y los resultados son los que hemos recogido en la tabla que sigue. Tomado de:
https://victoryepes.blogs.upv.es/2013/04/27/diseno-completamente-al-azar-y-anova/
Hipotesis
Ho:La resistencia media a la compresion es igual para todas las dosificaciones
Ha:Por lo menos un par de resistencias medias a la compresion son diferentes segun la dosificacion
med<-c(42,39,48,43,44,45,46,45,39,43,64,61,50,55,58,56,55,62,59,60) #compresion
por <- gl(4,5,labels=c(rep(c("A", "B", "C","D")))) #Dosificacion
x<-data.frame(por,med)
x
## por med
## 1 A 42
## 2 A 39
## 3 A 48
## 4 A 43
## 5 A 44
## 6 B 45
## 7 B 46
## 8 B 45
## 9 B 39
## 10 B 43
## 11 C 64
## 12 C 61
## 13 C 50
## 14 C 55
## 15 C 58
## 16 D 56
## 17 D 55
## 18 D 62
## 19 D 59
## 20 D 60
library(agricolae)
## Warning: package 'agricolae' was built under R version 4.2.1
modelo<-aov(med~por)
#verficar supuestos
par(mfrow=c(2,2),mar=c(4,4,2,1.5))
plot(modelo)
stripchart(med~por,method="stack",xlab="resistencia")
plot(por,med,xlab="Dosificacion",ylab="resistencia")
#prueba de normalidad
shapiro.test(resid(modelo))
##
## Shapiro-Wilk normality test
##
## data: resid(modelo)
## W = 0.98818, p-value = 0.9949
#prueba de homogeneidad de varianzas
bartlett.test(med~por)
##
## Bartlett test of homogeneity of variances
##
## data: med by por
## Bartlett's K-squared = 2.3372, df = 3, p-value = 0.5054
modelo<-aov(med~por)
summary(modelo)
## Df Sum Sq Mean Sq F value Pr(>F)
## por 3 1067.8 355.9 25.38 2.54e-06 ***
## Residuals 16 224.4 14.0
## ---
## Signif. codes: 0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
El modelo cumple los supuestos del ANOVA(DCA).Es decir,Normalidad,varianza constante e independencia de los residuales.
A un nivel de significancia de 0.05,podemos concluir que si hay diferencias.Por lo menos un par de medias de resistencia es diferente segun el tipo de dosificacion.
Luego de comprobar que por lo menos hay un par de medias diferentes, el investigador podria estar interesado en donde se produce la diferencia.Para contestar este interrogante, existen una serie de pruebas de comparaciones multiples, que se aplican luego de la realizacion de un ANOVA tras el rechazo de Ho.
Prueba de Tukey
Es un método que tiene como fin comparar las medias individuales, provenientes de un análisis de varianza de varias muestras sometidas a tratamientos distintos.
TukeyHSD(modelo,conf.level = 0.95)
## Tukey multiple comparisons of means
## 95% family-wise confidence level
##
## Fit: aov(formula = med ~ por)
##
## $por
## diff lwr upr p adj
## B-A 0.4 -6.376451 7.176451 0.9982132
## C-A 14.4 7.623549 21.176451 0.0000854
## D-A 15.2 8.423549 21.976451 0.0000459
## C-B 14.0 7.223549 20.776451 0.0001171
## D-B 14.8 8.023549 21.576451 0.0000625
## D-C 0.8 -5.976451 7.576451 0.9862341
plot(TukeyHSD (modelo, conf.level = 0.95 ), las = 2 )
A un nivel de significancia de 0.05, podemos concluir que se presentan diferencias en las medias de las resistencia segun las dosificaciones:C-A,D-A,C-B,D-B.
El metodo de la diferencia significativa minima de Fisher(LSD)
Se basa en detectar si el valor absoluto de la diferencia de medias es mayor a el LSD(diferencia significativa minima).
LSD.test(y=modelo, trt = "por",group = T, console = T)
##
## Study: modelo ~ "por"
##
## LSD t Test for med
##
## Mean Square Error: 14.025
##
## por, means and individual ( 95 %) CI
##
## med std r LCL UCL Min Max
## A 43.2 3.271085 5 39.64955 46.75045 39 48
## B 43.6 2.792848 5 40.04955 47.15045 39 46
## C 57.6 5.412947 5 54.04955 61.15045 50 64
## D 58.4 2.880972 5 54.84955 61.95045 55 62
##
## Alpha: 0.05 ; DF Error: 16
## Critical Value of t: 2.119905
##
## least Significant Difference: 5.021089
##
## Treatments with the same letter are not significantly different.
##
## med groups
## D 58.4 a
## C 57.6 a
## B 43.6 b
## A 43.2 b
Al emplear el LSD de fisher a un nivel de significancia de 0.05 se puede concluir que todos los pares de medias de resistencia son significativamente diferentes.
Prueba de rango multiple de Duncan
Duncan emplea un umbral que dependerá del número de medias implicadas en la comparación.(En el caso de Tukey ese umbral es fijo)
duncan.test(modelo, "por", group=FALSE)$comparison
## difference pvalue signif. LCL UCL
## A - B -0.4 0.8680 -5.421089 4.621089
## A - C -14.4 0.0000 *** -19.665283 -9.134717
## A - D -15.2 0.0000 *** -20.617929 -9.782071
## B - C -14.0 0.0000 *** -19.021089 -8.978911
## B - D -14.8 0.0000 *** -20.065283 -9.534717
## C - D -0.8 0.7399 -5.821089 4.221089
Se obtienen las mismas conclusiones que al emplear la prueba de Tukey es decir a un nivel de significancia de 0.05, se presentan diferencias entre los pares de medias de resistencia:C-A,D-A,C-B,D-B.
Prueba de Newman Keuls
Similar a la prueba de Duncan, solo que los valores criticos entre las medias, se calculan de forma diferente.
SNK.test(modelo, "por",console=TRUE)
##
## Study: modelo ~ "por"
##
## Student Newman Keuls Test
## for med
##
## Mean Square Error: 14.025
##
## por, means
##
## med std r Min Max
## A 43.2 3.271085 5 39 48
## B 43.6 2.792848 5 39 46
## C 57.6 5.412947 5 50 64
## D 58.4 2.880972 5 55 62
##
## Alpha: 0.05 ; DF Error: 16
##
## Critical Range
## 2 3 4
## 5.021089 6.111627 6.776451
##
## Means with the same letter are not significantly different.
##
## med groups
## D 58.4 a
## C 57.6 a
## B 43.6 b
## A 43.2 b
Al emplear la prueba de Newman Keuls,a un nivel de significancia de 0.05 se puede concluir que todos los pares de medias de resistencia son significativamente diferentes.
En este ejemplo, La prueba de Tukey y Duncan arrojaron resultados identicos para la diferencia de medias de resistencia.Al igual que la prueba de LSD de fisher y Newman Keuls,arrojaron la misma conclusion sobre la diferencia media de las medidas de resistencia.
No existe una formula que nos indique que prueba de comparacion multiple debemos emplear.La prueda LSD de Fisher es buena detectando la diferencia,solo cuando se ha rechazado Ho a un nivel de significancia de 0.05.La prueba de Duncan y Tukey son las mas potentes.En el caso de Tukey ya que controla la tasa de error global.Por otra parte,la prueba de Newman Keuls sigue siendo buena,pero menos potente que la prueba de Duncan.