Diseño de parcela dividida en R

El diseño tradicional de parcela dividida es, desde el punto de vista del análisis estadístico, similar al diseño de medidas repetidas de dos factores de la semana pasada. El diseño consta de bloques (o parcelas enteras) en los que se aplica un factor (el factor de parcela completa) al azar. Dentro de cada parcela / bloque completo, se divide en unidades más pequeñas y los niveles del segundo factor se aplican aleatoriamente a las partes más pequeñas de toda la parcela. La clave es que la unidad experimental es diferente para cada factor.

##Ejemplo de avena En este ejemplo, se plantan campos enteros con uno de los tres tipos de avena. Estas son las parcelas completas, de las cuales hay 18. Cada parcela completa se divide en cuatro parcelas divididas, a cada una de las cuales se le asignó aleatoriamente uno de los cuatro niveles de nitrógeno. Se determinó el rendimiento (en bushels / acre) de avena. Son de interés las diferencias en la variedad de avena y los niveles de nitrógeno.

library(readxl)
avena <- read_excel("C:/Users/Sara/Downloads/oats.xlsx")
avena <- within(avena, nitroF <- factor(nitro))
head(avena)
## # A tibble: 6 x 6
##   observacion repeticion variedad    nitro rendimiento nitroF
##         <dbl> <chr>      <chr>       <chr>       <dbl> <fct> 
## 1           1 I          Victory     0.00          111 0.00  
## 2           2 I          Victory     0.20          130 0.20  
## 3           3 I          Victory     0.40          157 0.40  
## 4           4 I          Victory     0.60          174 0.60  
## 5           5 I          Golden.rain 0.00          117 0.00  
## 6           6 I          Golden.rain 0.20          114 0.20
library(lattice)  
library(car)
## Loading required package: carData
library(agricolae)
with(avena, xyplot(rendimiento ~ nitroF | variedad))

with(avena, xyplot(rendimiento ~ nitroF | variedad, groups = repeticion))

with(avena, xyplot(rendimiento ~ nitroF | variedad, groups = repeticion, aspect = "xy"))

with(avena, xyplot(rendimiento ~ nitroF | variedad, groups = repeticion, aspect = "xy", 
    type = "o"))

with(avena, xyplot(rendimiento ~ nitroF | variedad, groups = repeticion, aspect = "xy", 
    type = "a"))

Si ignora el diseño experimental, obtendrá los siguientes resultados incorrectos. Tenga en cuenta que el error df es mayor, lo que facilita la detección de diferencias que realmente no existen.

res.malo <- lm(rendimiento ~ variedad * nitroF, data = avena)
anova(res.malo)
## Analysis of Variance Table
## 
## Response: rendimiento
##                 Df  Sum Sq Mean Sq F value    Pr(>F)    
## variedad         2  1786.4   893.2  1.7949    0.1750    
## nitroF           3 20020.5  6673.5 13.4108 8.367e-07 ***
## variedad:nitroF  6   321.7    53.6  0.1078    0.9952    
## Residuals       60 29857.3   497.6                      
## ---
## Signif. codes:  0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1

El análisis en R sigue el mismo patrón que la semana pasada. El factor de “variedad” solo tiene (18-1) gl total para usar cuando se prueban las diferencias en la variedad. Por lo tanto, necesitamos especificar correctamente el término de error para variedad. Cabe señalar que la forma del “Error (A: parcela completa)” puede cambiar dependiendo de la disposición de los datos. La clave es saber el gl correcto para que sepa tener los resultados correctos.

res.bueno <- aov(rendimiento ~ variedad * nitroF + Error(repeticion:variedad), data = avena)
## Warning in aov(rendimiento ~ variedad * nitroF + Error(repeticion:variedad), :
## Error() model is singular
summary(res.bueno)
## 
## Error: repeticion:variedad
##           Df Sum Sq Mean Sq F value Pr(>F)
## variedad   2   1786   893.2   0.612  0.555
## Residuals 15  21889  1459.2               
## 
## Error: Within
##                 Df Sum Sq Mean Sq F value   Pr(>F)    
## nitroF           3  20020    6673  37.686 2.46e-12 ***
## variedad:nitroF  6    322      54   0.303    0.932    
## Residuals       45   7969     177                     
## ---
## Signif. codes:  0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1

Para verificar las suposiciones, no es necesario utilizar el término de error. Puede agregar el término sin error, pero las pruebas F son incorrectas. Sin embargo, la verificación de suposiciones está bien.

res.bueno2 <- aov(rendimiento ~ variedad * nitroF + repeticion:variedad, data = avena)
summary(res.bueno2)
##                     Df Sum Sq Mean Sq F value   Pr(>F)    
## variedad             2   1786     893   5.044   0.0106 *  
## nitroF               3  20020    6673  37.686 2.46e-12 ***
## variedad:nitroF      6    322      54   0.303   0.9322    
## variedad:repeticion 15  21889    1459   8.240 1.61e-08 ***
## Residuals           45   7969     177                     
## ---
## Signif. codes:  0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
plot(res.bueno2, 1)

plot(res.bueno2, 2)

#w = plot(res.bueno2, 5)
#w
boxCox(res.bueno2)

Dado que la gráfica de Box-Cox es buena, no es necesario realizar ninguna transformación. Aún necesita identificar qué niveles de nitrógeno son diferentes.

a = with(avena, HSD.test(rendimiento, nitroF, DFerror = 45, MSerror = 117))
a
## $statistics
##   MSerror Df     Mean       CV      MSD
##       117 45 103.9722 10.40341 9.618527
## 
## $parameters
##    test name.t ntr StudentizedRange alpha
##   Tukey nitroF   4         3.772697  0.05
## 
## $means
##      rendimiento      std  r Min Max    Q25   Q50    Q75
## 0.00    79.38889 19.39417 18  53 117  63.25  72.0  94.25
## 0.20    98.88889 21.84407 18  64 140  83.75  95.0 112.50
## 0.40   114.22222 22.31738 18  81 161  97.75 115.0 124.75
## 0.60   123.38889 22.99908 18  86 174 106.25 121.5 139.00
## 
## $comparison
## NULL
## 
## $groups
##      rendimiento groups
## 0.60   123.38889      a
## 0.40   114.22222      a
## 0.20    98.88889      b
## 0.00    79.38889      c
## 
## attr(,"class")
## [1] "group"
library(gplots)
## Warning: package 'gplots' was built under R version 4.0.3
## 
## Attaching package: 'gplots'
## The following object is masked from 'package:stats':
## 
##     lowess
b = plot.stuff <- with(avena, HSD.test(rendimiento, nitroF, DFerror = 45, MSerror = 117))
b
## $statistics
##   MSerror Df     Mean       CV      MSD
##       117 45 103.9722 10.40341 9.618527
## 
## $parameters
##    test name.t ntr StudentizedRange alpha
##   Tukey nitroF   4         3.772697  0.05
## 
## $means
##      rendimiento      std  r Min Max    Q25   Q50    Q75
## 0.00    79.38889 19.39417 18  53 117  63.25  72.0  94.25
## 0.20    98.88889 21.84407 18  64 140  83.75  95.0 112.50
## 0.40   114.22222 22.31738 18  81 161  97.75 115.0 124.75
## 0.60   123.38889 22.99908 18  86 174 106.25 121.5 139.00
## 
## $comparison
## NULL
## 
## $groups
##      rendimiento groups
## 0.60   123.38889      a
## 0.40   114.22222      a
## 0.20    98.88889      b
## 0.00    79.38889      c
## 
## attr(,"class")
## [1] "group"
names(plot.stuff)
## [1] "statistics" "parameters" "means"      "comparison" "groups"
plot.stuff$means
##      rendimiento      std  r Min Max    Q25   Q50    Q75
## 0.00    79.38889 19.39417 18  53 117  63.25  72.0  94.25
## 0.20    98.88889 21.84407 18  64 140  83.75  95.0 112.50
## 0.40   114.22222 22.31738 18  81 161  97.75 115.0 124.75
## 0.60   123.38889 22.99908 18  86 174 106.25 121.5 139.00
plot.stuff$groups
##      rendimiento groups
## 0.60   123.38889      a
## 0.40   114.22222      a
## 0.20    98.88889      b
## 0.00    79.38889      c
barplot2(plot.stuff$means[, 1])

# Agregar algunas etiquetas
barplot2(plot.stuff$means[, 1], names.arg = rownames(plot.stuff$means), xlab = "Nitrogeno", 
    ylab = "Rendimiento por Acre")

# Agregar algunas barras
mu.i <- plot.stuff$means[, 1]
se.i <- qt(1 - 0.05/2, 45) * plot.stuff$means[, 2]
bp <- barplot2(mu.i, names.arg = rownames(plot.stuff$means), xlab = "Nitrogeno", 
    ylab = "Rendimiento por Acre", plot.ci = TRUE, ci.l = mu.i - se.i, ci.u = mu.i + 
        se.i)
# Group them together
text(bp, 0, plot.stuff$groups[,2], cex = 1, pos = 3)

# Es esto correcto?
plot.stuff$groups
##      rendimiento groups
## 0.60   123.38889      a
## 0.40   114.22222      a
## 0.20    98.88889      b
## 0.00    79.38889      c
order(plot.stuff$groups[,1])
## [1] 4 3 2 1
plot.stuff$groups[order(plot.stuff$groups[,1]),2]
## [1] "c" "b" "a" "a"
# Este es mejor
bp <- barplot2(mu.i, names.arg = rownames(plot.stuff$means), xlab = "Nitrogeno", 
    ylab = "Rendimiento por Acre", plot.ci = TRUE, ci.l = mu.i - se.i, ci.u = mu.i + 
        se.i)
text(bp, 0, plot.stuff$groups[order(plot.stuff$groups[,1]), 2], cex = 1, pos = 3)

# Algunas veces es mas facil hacerlo a mano
bp <- barplot2(mu.i, names.arg = rownames(plot.stuff$means), xlab = "Nitrogeno", 
    ylab = "Rendimiento por Acre", plot.ci = TRUE, ci.l = mu.i - se.i, ci.u = mu.i + 
        se.i)
text(bp, 0, c("A", "B", "C", "C"), cex = 1, pos = 3)

Diseño de parcela dividida-dividida-dividida (4 FACTORES = SUBPARCELAS DIVIDIDAS)

En este experimento, desea medir los efectos de tres factores sobre la cantidad de glucógeno en el hígado. En su experimento, hay 6 ratas (parcelas completas).

A cada rata, se le asignó al azar una de las tres dietas alimentarias (T1, T2 y T3).

De cada rata, se extrajo el hígado y se dividió en cuatro segmentos. Cada segmento se preparó utilizando uno de dos productos químicos diferentes (P1 y P2).

Finalmente, se midió el nivel de glucógeno de cada pedazo de hígado usando dos técnicas analíticas diferentes (A y B).

La unidad experimental de la dieta es la rata. La unidad experimental para la preparación química del hígado es una tira de hígado. La unidad experimental de la técnica analítica es un trozo de hígado. Todos son diferentes.

library(readxl)


pdd.rat <- read_excel("C:/Users/Sara/Downloads/split_split_rat.xlsx")
pdd.rat
## # A tibble: 48 x 5
##    Glucogeno Comida Rata      Preparacion Metodo
##        <dbl> <chr>  <chr>     <chr>       <chr> 
##  1       127 T1     Remy      P1          A     
##  2       126 T1     Remy      P1          B     
##  3       127 T1     Remy      P2          A     
##  4       121 T1     Remy      P2          B     
##  5       124 T1     Remy      P1          A     
##  6       125 T1     Remy      P1          B     
##  7       132 T1     Remy      P2          A     
##  8       138 T1     Remy      P2          B     
##  9       146 T1     Templeton P1          A     
## 10       144 T1     Templeton P1          B     
## # ... with 38 more rows
with(pdd.rat, xyplot(Glucogeno ~ factor(Metodo):factor(Preparacion) | Comida, groups = Rata, aspect = "xy"))

Este es un diseño loco, pero sucede. El tratamiento, la preparación y el método tienen EM denominador diferente para su prueba f. ¿Y si lo hiciste mal?

fact.malo <- lm(Glucogeno ~ Comida * Preparacion * Metodo, data = pdd.rat)
anova(fact.malo)
## Analysis of Variance Table
## 
## Response: Glucogeno
##                           Df Sum Sq Mean Sq F value    Pr(>F)    
## Comida                     2 3530.0 1765.02 32.2583 9.401e-09 ***
## Preparacion                1   35.0   35.02  0.6401    0.4289    
## Metodo                     1   54.2   54.19  0.9904    0.3263    
## Comida:Preparacion         2  133.3   66.65  1.2180    0.3077    
## Comida:Metodo              2    5.4    2.69  0.0491    0.9521    
## Preparacion:Metodo         1   11.0   11.02  0.2014    0.6563    
## Comida:Preparacion:Metodo  2    5.3    2.65  0.0484    0.9529    
## Residuals                 36 1969.7   54.72                      
## ---
## Signif. codes:  0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
# Acá no hay interaccion segun el anova

Primero, supongamos que se ignora el factor del método. Eso hace que este sea un diseño de parcela dividida.

pd.res <- aov(Glucogeno ~ Comida * Preparacion + Error(Rata/Comida), data = pdd.rat)
## Warning in aov(Glucogeno ~ Comida * Preparacion + Error(Rata/Comida), data =
## pdd.rat): Error() model is singular
summary(pd.res)
## 
## Error: Rata
##           Df Sum Sq Mean Sq F value Pr(>F)  
## Comida     2   3530  1765.0    6.22 0.0856 .
## Residuals  3    851   283.8                 
## ---
## Signif. codes:  0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
## 
## Error: Within
##                    Df Sum Sq Mean Sq F value Pr(>F)
## Preparacion         1   35.0   35.02   1.144  0.291
## Comida:Preparacion  2  133.3   66.65   2.176  0.127
## Residuals          39 1194.3   30.62

Ahora agregue el método como una segunda división, por lo que ahora es un diseño de parcela dividida (subparcela dividida?).

#pd.res <- aov(Glucogeno ~ Comida * Preparacion * Metodo + Error(Rata/Comida:Preparacion), data = pd.rat)
summary(pd.res)
## 
## Error: Rata
##           Df Sum Sq Mean Sq F value Pr(>F)  
## Comida     2   3530  1765.0    6.22 0.0856 .
## Residuals  3    851   283.8                 
## ---
## Signif. codes:  0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
## 
## Error: Within
##                    Df Sum Sq Mean Sq F value Pr(>F)
## Preparacion         1   35.0   35.02   1.144  0.291
## Comida:Preparacion  2  133.3   66.65   2.176  0.127
## Residuals          39 1194.3   30.62