Cuando se construye un diseño en bloques aleatorizados, puede suceder que no sea posible realizar todos los tratamientos en cada bloque. En estos casos es posible usar diseños en bloques aleatorizados en los que cada tratamiento no estÔ presente en cada bloque. Estos diseño reciben el nombre de diseños en bloques incompletos. Hay varios tipos de diseños en bloques incompletos, siendo uno de los mÔs utilizados el diseño en bloque incompletos balanceado (BIB), que estudiaremos a continuación.
Los diseƱo en bloques incompletos balanceados (BIB) deben verificar:
Cada tratamiento ocurre el mismo número de veces en el diseño.
Cada par de tratamientos ocurren juntos el mismo nĆŗmero de veces que cualquier otro par.
Supongamos que se tienen I tratamientos de los cuales sólo se pueden experimentar K (K < I) tratamientos en cada bloque. Se puede construir un diseño BIB tomando \(\binom{I}{K}\) bloques de forma que a cada bloque se le asigne una de las \(\binom{I}{K}\) combinacionesde tratamientos posibles. En algunas ocasiones es posible reducir el número de bloques necesarios para formar el diseño.
Los parƔmetros que caracterizan este modelo son los siguientes:
I, nĆŗmero de tratamientos o niveles del factor principal.
J, nĆŗmero de bloques
K, nĆŗmero de tratamientos por bloque.
R, número de veces que cada tratamiento se presenta en el diseño, es decir el número de réplicas de un tratamiento dado.
Ī», nĆŗmero de bloques en los que un par de tratamientos ocurren juntos.
N, nĆŗmero total de observaciones.
Estos parƔmetros deben verificar las siguientes relaciones:
Cuando \(J=I\) el diseño recibe el nombre de simétrico. Al igual que en el diseño en bloques completos, la asignación de los tratamientos a las unidades experimentales en cada bloque se debe realizar de forma aleatoria.
El modelo estadĆstico para este diseƱo es el mismo que para el diseƱo en bloques aleatorizados completos, es decir :
\(y_{ij}=\mu+\tau_{i}+\beta_{j}+\epsilon_{ij}\)
En este diseƱo la variabilidad total SCT se descompone en
\(SC_{Total} = SC_{Tratamieno,ajustado} + SC_{Bloque} + SC_{Error}\)
donde \(SC_{Tratamieno,ajustado}\) es la suma de cuadrados de tratamientos ajustada, que tiene la siguiente expresión :
\(SC_{Tratamiento,ajustado}=\frac{K\sum_{i=1}^{I}T_{i=}^{2}}{λI}\)
siendo \({T_{i}}\) el total ajustado por bloques del i-Ʃsimo tratamiento, definido como
\({T_{i}}={y_{i.}}-\frac{I}{K}\sum_{j=1}^{J}n_{ij}y_{.j}\) Ā \(i= 1,2,...I\)
con
\(n_{ij}=\left\{\begin{matrix}1, si \: el tratamiento\, i \, ocurre \, en \, el \, bloque\, j& \\0,\, en \, otro\, caso & \end{matrix}\right.\)
Notamos que
\(\frac{I}{K}\sum_{j=1}^{J}n_{ij}y_{.j}\)
es el valor medio de los totales de los bloques que contienen al tratamiento i-Ʃsimo.
Se verifica que
\(\sum_{i=1}^{I}T_{i}=0\)
la suma de cuadrados ajustada de los tratamientos tiene, por tanto, I ā 1 grados de libertad.
Como en este diseño se realizan K de los I tratamientos en cada bloque, la suma de cuadrados correspondiente a los bloques tiene la siguiente expresión
\(SC_{Bloque}= \sum_{j=1}^{J}\frac{y_{.j}^2}{K}-\frac{y_{..}^2}{N}\),
con J ā 1 grados de libertad.
\(SC_{Total}\) tiene la misma expresión que en el diseño en bloques completos aleatorizados, es decir
\(SC_{Total} = \sum_{i}\sum_{j} y_{ij}^2-\left(\frac{y_{..}^2}{N}\right)\)
con N ā 1 grados de libertad.
\(SC_{Error}\) se calcula a partir de las otras sumas de cuadrados, es decir
\(SC_{Error} = SC_{Total} - SC_{Tratamieno,ajustado} - SC_{Bloque}\)
con N ā I ā J + 1 grados de libertad, que se obtienen como la diferencia entre los grados de libertad de \(SC_{Total}\) y los grados de libertad de \(SC_{Tratamieno,ajustado}\) y \(SC_{Bloque}\)
(N ā 1) ā (I ā 1) ā (J ā 1) = N ā I ā J + 1
En este modelo el estadĆstico de contraste para los tratamientos es :
\(F_{\tau }=\frac{MC_{Tratamieno,ajustado}}{MC_{Error}}\)
donde los cuadrados medios tienen las siguientes expresiones
\(MC_{Tratamieno,ajustado}=\frac{SC_{Tratamieno,ajustado}}{I-1}\)
\(MC_{Error} = \frac{SC_{Error}}{N ā I ā J + 1}\)
La correspondiente tabla de anÔlisis de la varianza se presenta a continuación
En algunas ocasiones puede resultar de interƩs contrastar tambiƩn la igualdad de efectos de los bloques, para ello la suma de cuadrados total se debe descomponer de la siguiente forma
\(SC_{Total} = SC_{Tratamiento} + SC_{Bloque ajustado} + SC_{Error}\)
donde \(SC_{Tratamiento}\) es la suma de cuadrados de tratamientos no-ajustada
\(SC_{Tratamiento}=\sum_{i=1}^{I}\frac{y_{i.}^{2}}{R}-\frac{y_{..}^{2}}{N})\)
\(SC_{Bloque ajustado}\) es la suma de cuadrados ajustada de los bloques, que en el caso del diseño en bloques incompletos balanceado tiene la siguiente expresión
\(SC_{Bloque ajustado}=R \sum_{j=1}^{J}\frac{B_{j}^{2}}{\lambda J}\)
siendo \(B_{j}\) el total ajustado por tratamientos del j-Ʃsimo bloque, definido como
\(B_{j}=y_{.j}-\frac{1}{R}\sum_{i=1}^{I}n_{ij}y_{.i}\)
Se verifica que
\(\sum_{j=1}^{J}B_{j}=0\)
La tabla Anova que darĆa de e sa forma :
Como ilustración de este modelo se considera el siguiente ejemplo:
Una industria algodonera, interesada en maximizar el rendimiento de la semilla de algodón, quiere comprobar si dicho rendimiento depende del tipo de fertilizante utilizado para tratar la planta. A su disposición tiene 5 tipos de fertilizantes. Como se cree que el tipo de terreno puede influir también en el rendimiento de la semilla de algodón se considera el terreno dividido en bloques. Para ello, divide el terreno en 4 bloques1 y cada bloque en 5 parcelas, fumigando dentro de cada bloque cada una de las parcelas con un fertilizante,pero debido a la extensión de los bloques y a la falta de recursos, no se pueden aplicar todos los fertilizantes en cada bloque, sino que sólo se pueden aplicar 4 de los 5 fertilizantes en cada uno de ellos. Al recoger la cosecha se mide el rendimiento de la semilla, obteniéndose las siguientes observaciones que se muestran a continuación :
| Fertilizante | Bloque | Repetición |
|---|---|---|
| F1 | B1 | 94 |
| F2 | B1 | 95 |
| F3 | B1 | 76 |
| F4 | B1 | 94 |
| F1 | B2 | 96 |
| F2 | B2 | 75 |
| F3 | B2 | 100 |
| F5 | B2 | 75 |
| F1 | B3 | 100 |
| F2 | B3 | 76 |
| F4 | B3 | 102 |
| F5 | B3 | 91 |
| F1 | B4 | 92 |
| F3 | B4 | 97 |
| F4 | B4 | 93 |
| F5 | B4 | 86 |
| F2 | B5 | 92 |
| F3 | B5 | 98 |
| F4 | B5 | 96 |
| F5 | B5 | 95 |
Realicemos una inspección visual de los datos
library(ggplot2)
ggplot(data = datos, aes(x = Fertilizante, y = Repetición, color = Fertilizante)) +
geom_boxplot() +
theme_bw()Para obtener la tabla anova utilizaremos la funcion aov como se muestra a continuación
fit <- aov(Repetición~Fertilizante+Bloque+Error(Bloque),data = datos)
summary(fit)##
## Error: Bloque
## Df Sum Sq Mean Sq
## Fertilizante 4 169.3 42.33
##
## Error: Within
## Df Sum Sq Mean Sq F value Pr(>F)
## Fertilizante 4 477.5 119.37 1.614 0.239
## Residuals 11 813.8 73.98
Si realizamos el contraste al 5 % y comparamos con el p-valor concluimos que los efectos de los fertilizantes no son significativos.
A continuación vamos a estudiar el efecto de los bloques, para lo cual calculamos:
summary(aov(Repetición~Fertilizante+Bloque+Error(Fertilizante),data = datos))##
## Error: Fertilizante
## Df Sum Sq Mean Sq
## Fertilizante 4 444.3 111.1
##
## Error: Within
## Df Sum Sq Mean Sq F value Pr(>F)
## Bloque 4 202.5 50.63 0.684 0.617
## Residuals 11 813.8 73.98
Notamos que al nivel de significación del 5 % tampoco son significativos los efectos del tipo de terreno.
De este modo no serĆa necesaria una prueba de comparación de rangos multiples, sin embargo, a modo de ejemplo realizaremos dicha comparación.
Para ella haremos uso de funcion BIB.test que esta contenida en la libreria agricolae esta función tiene los siguientes parametros de entrada:
BIB.test(block, trt, y, test = c(ālsdā,ātukeyā,āduncanā,āwallerā,āsnkā), alpha = 0.05, group = TRUE, console = FALSE)
utilizaremos el test de tuckey con la opcion group= FALSE
library(agricolae)
out <- BIB.test(block = datos$Bloque, trt = datos$Fertilizante, y = datos$Repetición,
test= "tukey", alpha = 0.05, group = FALSE)
out## $parameters
## lambda treatmeans blockSize blocks r alpha test
## 3 5 4 5 4 0.05 BIB
##
## $statistics
## Mean Efficiency CV
## 91.15 0.9375 9.436099
##
## $comparison
## Difference pvalue sig.
## F1 - F2 12.600000 0.3240
## F1 - F3 3.733333 0.9731
## F1 - F4 1.533333 0.9991
## F1 - F5 10.800000 0.4615
## F2 - F3 -8.866667 0.6333
## F2 - F4 -11.066667 0.4394
## F2 - F5 -1.800000 0.9983
## F3 - F4 -2.200000 0.9963
## F3 - F5 7.066667 0.7907
## F4 - F5 9.266667 0.5969
##
## $means
## datos$Repetición mean.adj SE r std Min Max Q25 Q50 Q75
## F1 95.50 96.88333 4.413693 4 3.415650 92 100 93.50 95.0 97.00
## F2 84.50 84.28333 4.413693 4 10.472185 75 95 75.75 84.0 92.75
## F3 92.75 93.15000 4.413693 4 11.236103 76 100 91.75 97.5 98.50
## F4 96.25 95.35000 4.413693 4 4.031129 93 102 93.75 95.0 97.50
## F5 86.75 86.08333 4.413693 4 8.655441 75 95 83.25 88.5 92.00
##
## $groups
## NULL
##
## attr(,"class")
## [1] "group"
con la opcion group= TRUE
library(agricolae)
out <- BIB.test(block = datos$Bloque, trt = datos$Fertilizante, y = datos$Repetición,
test= "tukey", alpha = 0.05, group = TRUE)
out## $parameters
## lambda treatmeans blockSize blocks r alpha test
## 3 5 4 5 4 0.05 BIB
##
## $statistics
## Mean Efficiency CV
## 91.15 0.9375 9.436099
##
## $comparison
## NULL
##
## $means
## datos$Repetición mean.adj SE r std Min Max Q25 Q50 Q75
## F1 95.50 96.88333 4.413693 4 3.415650 92 100 93.50 95.0 97.00
## F2 84.50 84.28333 4.413693 4 10.472185 75 95 75.75 84.0 92.75
## F3 92.75 93.15000 4.413693 4 11.236103 76 100 91.75 97.5 98.50
## F4 96.25 95.35000 4.413693 4 4.031129 93 102 93.75 95.0 97.50
## F5 86.75 86.08333 4.413693 4 8.655441 75 95 83.25 88.5 92.00
##
## $groups
## datos$Repetición groups
## F1 96.88333 a
## F4 95.35000 a
## F3 93.15000 a
## F5 86.08333 a
## F2 84.28333 a
##
## attr(,"class")
## [1] "group"
Por supuesto el Anova carecerĆa de validez sin la correspondiente verificacio e los supuestos de los modelos. Lo realizaremos de forma grafica, para ello utilizaremos la funcion autoplot de la libreria ggfortify
library(ggfortify)
autoplot(lm(Repetición~Fertilizante+Bloque,data = datos),label.size = 1,ncol=2)