Capítulo 7

ALEATORIZADO (DBCA) DISEÑO DE BLOQUES COMPLETOS AL AZAR

Es el más usado de los diseños de bloques al azar (Hinkelman, 1994), aquí, el material experimental es dividido en b grupos de t unidades experimentales (UE) cada uno, donde t es el número de tratamientos, tales que las UE dentro de cada grupo son lo más homogénea posible y las diferencias entre las UE sea dada por estar en diferentes grupos. Los conjuntos son llamados bloques. Dentro de cada bloque las UE son asignadas aleatoriamente, cada tratamiento ocurre exactamente una vez en un bloque. Si la variación entre las UE dentro de los bloques es apreciablemente pequeña en comparación con la variación entre bloques, un diseño de bloque completo al azar es más potente que un diseño completo al azar. El diseño completo al azar (DCA) es aplicable en casos en los que la única fuente de variabilidad son los tratamientos. En dichos diseños hemos supuesto que existe bastante homogeneidad entre las unidades experimentales, pero puede suceder que dichas unidades experimentales sean heterogéneas y contribuyan a la variabilidad observada en la variable respuesta, si en esta situación se utiliza un DCA, la diferencia entre dos unidades experimentales sometidas a distintos tratamientos no sabremos si se deben a una diferencia real entre los efectos de los tratamientos o a la heterogeneidad de dichas unidades, como resultado el error experimental reflejará esta variabilidad, en esta situación, se debe sustraer del error experimental la variabilidad producida por las unidades experimentales y para ello el experimentador puede formar bloques de manera que las unidades experimentales de cada bloque sean lo más homogéneas posible y los bloques entre sí sean heterogéneos. En el diseño en bloques Aleatorizados, primero se clasifican las unidades experimentales en grupos homogéneos, llamados bloques, y los tratamientos son entonces asignados

aleatoriamente dentro de los bloques. Esta estrategia de diseño mejora efectivamente la precisión en las comparaciones al reducir la variabilidad residual. El concepto de bloques fue introducido por Fisher (1925) en la agricultura; observó que las unidades experimentales marcaban una heterogeneidad de fertilidad en el suelo, lo que complicaba la asignación de los tratamientos de un punto a otro, de aquí que el bloque permitía la partición de la variabilidad inherente en la unidad experimental. Diferencias o variaciones entre tratamientos. - Variación dentro de bloques. - Variación entre bloques.

Modelo Aditivo Lineal El modelo aditivo lineal para un experimento en un diseño de bloques aleatorizado requiere un término que represente la variación identificable en las observaciones como consecuencia de los bloques. La respuesta de la unidad con el i-ésimo tratamiento en el j- ésimo bloque se escribe como:

donde:

𝑦𝑖𝑗 = 𝜇 + 𝜏𝑖 + 𝛽𝑗 + 𝑒𝑖𝑗 i = 1, 2, …, t j = 1, 2, …, b

𝑦𝑖𝑗: Es la variable de respuesta observada en el j-ésimo bloque que recibe el i-ésimo tratamiento. 𝜇: Es la media general de la variable respuesta. 𝜏𝑖: Es el efecto del i-ésimo tratamiento, el cual es constante para todas las observaciones dentro del i e-simo tratamiento 𝛽𝑗: Es el efecto debido del j-ésimo bloque.

𝑒𝑖𝑗: Es el error aleatorio atribuible a la medición

y , con 𝑒𝑖𝑗~𝐷𝑁𝐼(0, 𝜎2). Es el efecto del

error experimental en el i-esimo tratamiento, j-esimo bloque. t : es el número de tratamientos b : es el número de bloques

7.8 SUPUESTOS DEL MODELO ESTADISTICO

El modelo estadístico debe cumplir con los siguientes supuestos: 1. Aditividad: Los efectos del modelo son aditivos 2. Linealidad: Las relaciones entre los efectos del modelo son lineales 3. Normalidad: los errores del modelo deben tener una distribución normal con media cero y varianza 𝜎2. 4. Independencia: Los resultados obtenidos en el experimento son independientes entre sí. 5. Homogeneidad de varianzas: Las diferentes poblaciones generadas por la aplicación de los diferentes tratamientos tienen varianzas iguales 6. No existe interacción entre los bloques y los tratamientos.

Ejercicios

  1. se va a comparar 5 variedades de soya con respecto a sus rendimientos, disponiéndose para tal efecto de 20 parcelas experimentales, sin mebargo, exsiten evidencias de que hay una tendencia a la fertilidad de norte a sur, siendo mas fértiles las parcelas del norte. de acuerdo a esto parece razonable agrupar parcelas en 4 grupos de 5 parcelas cada uno, es decir, en conveniente utilizar un DBCA con 4 replicas; los resultados luego del experimento son: Tratamientos Bloque
    A B C D E

I 117 119 118 120 121

II 121 122 116 123 128

III 119 125 117 125 129

IV 111 118 113 120 118

When you click the Knit button a document will be generated that includes both content as well as the output of any embedded R code chunks within the document. You can embed an R code chunk like this:

# DCA CON SUB MUESTREO
# Ejemplo concentracion de mezcla # CREANDO LA BASE DE DATOS
#tiempo<-c(10.3,9.8,5.8,5.4,8.7,10,8.9,9.4,4.4,4.7,2.7,1.6,4.6,4,5.6, 3.4,3.1,3.3,6.5,5.4,5.1,7.5,5.6,4.2)

producciones<-c(24,23,21,25,28,30,56,65,58,24,19,23,19,21,24,31,24,32,62,60,59,21,22,24,18,19,22,28,32,36,61,60,64,23,18,22,23,22,20,34,33,29,62,60,61,19,21,23)
trat<-c(rep(1:4,rep(12,4)))
repet<-c(rep(1:4,rep(3,4)))
repet<-c(rep(repet,4))

# creando un data.frame

datos<-data.frame(trat=factor(trat,labels=c("I","II","III","IV")), repet=factor(repet),producciones)
datos
##    trat repet producciones
## 1     I     1           24
## 2     I     1           23
## 3     I     1           21
## 4     I     2           25
## 5     I     2           28
## 6     I     2           30
## 7     I     3           56
## 8     I     3           65
## 9     I     3           58
## 10    I     4           24
## 11    I     4           19
## 12    I     4           23
## 13   II     1           19
## 14   II     1           21
## 15   II     1           24
## 16   II     2           31
## 17   II     2           24
## 18   II     2           32
## 19   II     3           62
## 20   II     3           60
## 21   II     3           59
## 22   II     4           21
## 23   II     4           22
## 24   II     4           24
## 25  III     1           18
## 26  III     1           19
## 27  III     1           22
## 28  III     2           28
## 29  III     2           32
## 30  III     2           36
## 31  III     3           61
## 32  III     3           60
## 33  III     3           64
## 34  III     4           23
## 35  III     4           18
## 36  III     4           22
## 37   IV     1           23
## 38   IV     1           22
## 39   IV     1           20
## 40   IV     2           34
## 41   IV     2           33
## 42   IV     2           29
## 43   IV     3           62
## 44   IV     3           60
## 45   IV     3           61
## 46   IV     4           19
## 47   IV     4           21
## 48   IV     4           23
# Diagrama de cajas
par(mfrow=c(1,2))
boxplot(producciones~trat,xlab="cantidad de estiercol",ylab="produccion forraje",col=terrain.colors(4)) 
boxplot(producciones~repet,xlab="Dosis",ylab="produccion forraje",col=terrain.colors(4))

# cuadro ANVA efecto del muestreo
g<-aov(producciones~trat + repet %in% trat,data=datos) 
anova(g)
## Analysis of Variance Table
## 
## Response: producciones
##            Df  Sum Sq Mean Sq F value Pr(>F)    
## trat        3     5.7    1.91   0.268 0.8479    
## trat:repet 12 12532.1 1044.34 146.574 <2e-16 ***
## Residuals  32   228.0    7.12                   
## ---
## Signif. codes:  0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
# cuadro ANVA efecto de los tratamientos
ge<-aov(producciones~trat + Error(repet/trat),data=datos) 
summary(ge)
## 
## Error: repet
##           Df Sum Sq Mean Sq F value Pr(>F)
## Residuals  3  12470    4157               
## 
## Error: repet:trat
##           Df Sum Sq Mean Sq F value Pr(>F)
## trat       3   5.73    1.91   0.276  0.841
## Residuals  9  62.19    6.91               
## 
## Error: Within
##           Df Sum Sq Mean Sq F value Pr(>F)
## Residuals 32    228   7.125
# medias y desviaciones estandar por producto
tapply(datos$producciones,datos$trat,mean)
##        I       II      III       IV 
## 33.00000 33.25000 33.58333 33.91667
tapply(datos$producciones,datos$trat,sd)
##        I       II      III       IV 
## 16.45379 16.78270 17.81959 17.03183
# errores residuales dentro de unidades experimentales
Ed<-g$residuals; Ed
##             1             2             3             4             5 
##  1.333333e+00  3.333333e-01 -1.666667e+00 -2.666667e+00  3.333333e-01 
##             6             7             8             9            10 
##  2.333333e+00 -3.666667e+00  5.333333e+00 -1.666667e+00  2.000000e+00 
##            11            12            13            14            15 
## -3.000000e+00  1.000000e+00 -2.333333e+00 -3.333333e-01  2.666667e+00 
##            16            17            18            19            20 
##  2.000000e+00 -5.000000e+00  3.000000e+00  1.666667e+00 -3.333333e-01 
##            21            22            23            24            25 
## -1.333333e+00 -1.333333e+00 -3.333333e-01  1.666667e+00 -1.666667e+00 
##            26            27            28            29            30 
## -6.666667e-01  2.333333e+00 -4.000000e+00  3.885781e-16  4.000000e+00 
##            31            32            33            34            35 
## -6.666667e-01 -1.666667e+00  2.333333e+00  2.000000e+00 -3.000000e+00 
##            36            37            38            39            40 
##  1.000000e+00  1.333333e+00  3.333333e-01 -1.666667e+00  2.000000e+00 
##            41            42            43            44            45 
##  1.000000e+00 -3.000000e+00  1.000000e+00 -1.000000e+00  1.387779e-16 
##            46            47            48 
## -2.000000e+00 -3.053113e-16  2.000000e+00
# residuales entre unidades experimentales
g1<-aov(producciones~trat,data=datos) 
EE<-g1$residuals; EE
##            1            2            3            4            5 
##  -9.00000000 -10.00000000 -12.00000000  -8.00000000  -5.00000000 
##            6            7            8            9           10 
##  -3.00000000  23.00000000  32.00000000  25.00000000  -9.00000000 
##           11           12           13           14           15 
## -14.00000000 -10.00000000 -14.25000000 -12.25000000  -9.25000000 
##           16           17           18           19           20 
##  -2.25000000  -9.25000000  -1.25000000  28.75000000  26.75000000 
##           21           22           23           24           25 
##  25.75000000 -12.25000000 -11.25000000  -9.25000000 -15.58333333 
##           26           27           28           29           30 
## -14.58333333 -11.58333333  -5.58333333  -1.58333333   2.41666667 
##           31           32           33           34           35 
##  27.41666667  26.41666667  30.41666667 -10.58333333 -15.58333333 
##           36           37           38           39           40 
## -11.58333333 -10.91666667 -11.91666667 -13.91666667   0.08333333 
##           41           42           43           44           45 
##  -0.91666667  -4.91666667  28.08333333  26.08333333  27.08333333 
##           46           47           48 
## -14.91666667 -12.91666667 -10.91666667
Ee=EE-Ed
Ee
##          1          2          3          4          5          6 
## -10.333333 -10.333333 -10.333333  -5.333333  -5.333333  -5.333333 
##          7          8          9         10         11         12 
##  26.666667  26.666667  26.666667 -11.000000 -11.000000 -11.000000 
##         13         14         15         16         17         18 
## -11.916667 -11.916667 -11.916667  -4.250000  -4.250000  -4.250000 
##         19         20         21         22         23         24 
##  27.083333  27.083333  27.083333 -10.916667 -10.916667 -10.916667 
##         25         26         27         28         29         30 
## -13.916667 -13.916667 -13.916667  -1.583333  -1.583333  -1.583333 
##         31         32         33         34         35         36 
##  28.083333  28.083333  28.083333 -12.583333 -12.583333 -12.583333 
##         37         38         39         40         41         42 
## -12.250000 -12.250000 -12.250000  -1.916667  -1.916667  -1.916667 
##         43         44         45         46         47         48 
##  27.083333  27.083333  27.083333 -12.916667 -12.916667 -12.916667
# graficos de probabilidad normal

qqnorm(Ed,main="Error dentro UE",col="blue", lwd=2) 
qqline(Ed,col="red", lwd=3)
qqnorm(Ee,main="Error entre UE",col="blue", lwd=2) 
qqline(Ee,col="red", lwd=3)

# test de normalidad dentro de las UE
shapiro.test(Ed)
## 
##  Shapiro-Wilk normality test
## 
## data:  Ed
## W = 0.98652, p-value = 0.8504
# test de normalidad entre las UE
shapiro.test(Ee)
## 
##  Shapiro-Wilk normality test
## 
## data:  Ee
## W = 0.7101, p-value = 2.01e-08
#test de homogeneidad de varianzas 
plot(g$fitted.values,Ed,main="Estimado vs Residual dentro") 
abline(h=0,lty=2,col="red", lwd=3) 
plot(g$residuals~trat,main="Tratamiento vs Residual dentro")

bartlett.test(producciones~trat)
## 
##  Bartlett test of homogeneity of variances
## 
## data:  producciones by trat
## Bartlett's K-squared = 0.073926, df = 3, p-value = 0.9948
# independencia 
par(mfrow=c(1,1)) 
plot(Ed,xlab="Orden de corrida") 
abline(h=0,lty=2,col="blue", lwd=2)

# test de Durwin Watson
library(zoo) 
## 
## Attaching package: 'zoo'
## The following objects are masked from 'package:base':
## 
##     as.Date, as.Date.numeric

library(lmtest) 
dwtest(g)
## 
##  Durbin-Watson test
## 
## data:  g
## DW = 2.7651, p-value = 0.7144
## alternative hypothesis: true autocorrelation is greater than 0
# PRUEBAS DE COMPARACIONES MULTIPLES
# instalar libreria agricolae y mas
# agricolae,zoo,mvtnorm,survival,gmodels,Matrix,
# sp,spdep,MASS,klaR,TH.data,multcomp,lmtest

andeva<-aov(producciones~trat,data=datos)
andeva
## Call:
##    aov(formula = producciones ~ trat, data = datos)
## 
## Terms:
##                      trat Residuals
## Sum of Squares      5.729 12760.083
## Deg. of Freedom         3        44
## 
## Residual standard error: 17.02944
## Estimated effects may be unbalanced
summary(andeva,split = list(trat=list("C1"=1,"C2"=2,"C3"=3,"C4"=4)))
##             Df Sum Sq Mean Sq F value Pr(>F)
## trat         3      6    1.91   0.007  0.999
##   trat: C1   1      1    0.56   0.002  0.965
##   trat: C2   1      0    0.12   0.000  0.984
##   trat: C3   1      5    5.04   0.017  0.896
##   trat: C4   1                              
## Residuals   44  12760  290.00
# recordando los niveles (tratamientos o factores)
levels(datos$trat)
## [1] "I"   "II"  "III" "IV"
# prueba de significancia Dunnet
library(mvtnorm)
library(survival)
library(TH.data)
## Loading required package: MASS
## 
## Attaching package: 'TH.data'
## The following object is masked from 'package:MASS':
## 
##     geyser
library(MASS)
library(multcomp)
Dunnet<-glht(andeva, linfct=mcp(trat="Dunnett"))
summary(Dunnet)
## 
##   Simultaneous Tests for General Linear Hypotheses
## 
## Multiple Comparisons of Means: Dunnett Contrasts
## 
## 
## Fit: aov(formula = producciones ~ trat, data = datos)
## 
## Linear Hypotheses:
##              Estimate Std. Error t value Pr(>|t|)
## II - I == 0    0.2500     6.9522   0.036    1.000
## III - I == 0   0.5833     6.9522   0.084    1.000
## IV - I == 0    0.9167     6.9522   0.132    0.998
## (Adjusted p values reported -- single-step method)
confint(Dunnet)
## 
##   Simultaneous Confidence Intervals
## 
## Multiple Comparisons of Means: Dunnett Contrasts
## 
## 
## Fit: aov(formula = producciones ~ trat, data = datos)
## 
## Quantile = 2.434
## 95% family-wise confidence level
##  
## 
## Linear Hypotheses:
##              Estimate lwr      upr     
## II - I == 0    0.2500 -16.6717  17.1717
## III - I == 0   0.5833 -16.3384  17.5050
## IV - I == 0    0.9167 -16.0050  17.8384
plot(Dunnet)

# prueba t
pairwise.t.test(datos$producciones,datos$trat,p.adjust.method = "none")
## 
##  Pairwise comparisons using t tests with pooled SD 
## 
## data:  datos$producciones and datos$trat 
## 
##     I    II   III 
## II  0.97 -    -   
## III 0.93 0.96 -   
## IV  0.90 0.92 0.96
## 
## P value adjustment method: none
# prueba de significancia DLS
library(agricolae)
cmLSD<-LSD.test(andeva, "trat", console = T)
## 
## Study: andeva ~ "trat"
## 
## LSD t Test for producciones 
## 
## Mean Square Error:  290.0019 
## 
## trat,  means and individual ( 95 %) CI
## 
##     producciones      std  r      LCL      UCL Min Max
## I       33.00000 16.45379 12 23.09250 42.90750  19  65
## II      33.25000 16.78270 12 23.34250 43.15750  19  62
## III     33.58333 17.81959 12 23.67583 43.49083  18  64
## IV      33.91667 17.03183 12 24.00917 43.82417  19  62
## 
## Alpha: 0.05 ; DF Error: 44
## Critical Value of t: 2.015368 
## 
## least Significant Difference: 14.01132 
## 
## Treatments with the same letter are not significantly different.
## 
##     producciones groups
## IV      33.91667      a
## III     33.58333      a
## II      33.25000      a
## I       33.00000      a
# diagrama de barras
bar.group(cmLSD$groups,ylim=c(0,70),density=4,border="blue")

# diagrama de errores
graf1<-bar.err(cmLSD$means,variation="range",ylim=c(1,70),
               bar=FALSE,col=0,las=1)

# duncan test
duncan.test(andeva,"trat",alpha=0.05,console=TRUE)
## 
## Study: andeva ~ "trat"
## 
## Duncan's new multiple range test
## for producciones 
## 
## Mean Square Error:  290.0019 
## 
## trat,  means
## 
##     producciones      std  r Min Max
## I       33.00000 16.45379 12  19  65
## II      33.25000 16.78270 12  19  62
## III     33.58333 17.81959 12  18  64
## IV      33.91667 17.03183 12  19  62
## 
## Alpha: 0.05 ; DF Error: 44 
## 
## Critical Range
##        2        3        4 
## 14.01132 14.73431 15.20836 
## 
## Means with the same letter are not significantly different.
## 
##     producciones groups
## IV      33.91667      a
## III     33.58333      a
## II      33.25000      a
## I       33.00000      a
# tukey test
cmT <- HSD.test(andeva, "trat", console=TRUE)
## 
## Study: andeva ~ "trat"
## 
## HSD Test for producciones 
## 
## Mean Square Error:  290.0019 
## 
## trat,  means
## 
##     producciones      std  r Min Max
## I       33.00000 16.45379 12  19  65
## II      33.25000 16.78270 12  19  62
## III     33.58333 17.81959 12  18  64
## IV      33.91667 17.03183 12  19  62
## 
## Alpha: 0.05 ; DF Error: 44 
## Critical Value of Studentized Range: 3.775958 
## 
## Minimun Significant Difference: 18.56252 
## 
## Treatments with the same letter are not significantly different.
## 
##     producciones groups
## IV      33.91667      a
## III     33.58333      a
## II      33.25000      a
## I       33.00000      a
plot(cmT,variation="IQR")

# NSK test
cmSNK<-SNK.test(andeva, "trat", alpha=0.05,console=TRUE)
## 
## Study: andeva ~ "trat"
## 
## Student Newman Keuls Test
## for producciones 
## 
## Mean Square Error:  290.0019 
## 
## trat,  means
## 
##     producciones      std  r Min Max
## I       33.00000 16.45379 12  19  65
## II      33.25000 16.78270 12  19  62
## III     33.58333 17.81959 12  18  64
## IV      33.91667 17.03183 12  19  62
## 
## Alpha: 0.05 ; DF Error: 44 
## 
## Critical Range
##        2        3        4 
## 14.01132 16.86253 18.56252 
## 
## Means with the same letter are not significantly different.
## 
##     producciones groups
## IV      33.91667      a
## III     33.58333      a
## II      33.25000      a
## I       33.00000      a
# Scheffe test
scheffe<-scheffe.test(andeva, "trat", main = NULL, console=FALSE)
scheffe
## $statistics
##    MSerror Df        F    Mean       CV  Scheffe CriticalDifference
##   290.0019 44 2.816466 33.4375 50.92917 2.906785           20.20867
## 
## $parameters
##      test name.t ntr alpha
##   Scheffe   trat   4  0.05
## 
## $means
##     producciones      std  r Min Max   Q25  Q50   Q75
## I       33.00000 16.45379 12  19  65 23.00 24.5 36.50
## II      33.25000 16.78270 12  19  62 21.75 24.0 38.75
## III     33.58333 17.81959 12  18  64 21.25 25.5 42.00
## IV      33.91667 17.03183 12  19  62 21.75 26.0 40.50
## 
## $comparison
## NULL
## 
## $groups
##     producciones groups
## IV      33.91667      a
## III     33.58333      a
## II      33.25000      a
## I       33.00000      a
## 
## attr(,"class")
## [1] "group"

Including Plots

You can also embed plots, for example:

Note that the echo = FALSE parameter was added to the code chunk to prevent printing of the R code that generated the plot.