DISEÑO FACTORIAL SIMPLE COMPLETAMENTE AL AZAR (FSA) - DESBALANCEADO

Primero se hace balanceado y luego se elimina algun dato para que se vuelva desbalanceado, es decir, no hay la misma cantidad de repeticiones ya que algunas de estas se dañaron
  • Un solo factor
  • No hay bloques

ANÁLISIS DE VARIANZA DESBALANCEADO

  1. FACTOR (ácido) = escarificación de la semilla (único factor)
  • Control C0 = sin el ácido.
  • Concentración C1 = con el ácido.
  • Concentración C2 = mayor concentración del ácido.
Se realiza la escarificación de la semilla con un ácido para utilizar 3 concetraciones del ácido sobre la semilla para ver cual funciona para mejorar su germinación.
  • Ácido que no perjudica a la semilla.
  • Concentración suave para ayudar y no perjudicar a la semilla.
  1. PORCENTAJE DE GERMINACIÓN (porc_germ) = Se va a medir (variable respuesta)
set.seed(123)

porc_germ = c(
  rnorm(40, 60, 6),
  rnorm(40, 70, 7),
  rnorm(40, 80, 8)
)

acido = gl(3, 40, 120, c('C0', 'C1', 'C2'))

datos1 = data.frame(acido, porc_germ)
head(datos1)
##   acido porc_germ
## 1    C0  56.63715
## 2    C0  58.61894
## 3    C0  69.35225
## 4    C0  60.42305
## 5    C0  60.77573
## 6    C0  70.29039
table(datos1$acido)
## 
## C0 C1 C2 
## 40 40 40
La tabla permite ver que hay 40 repeticiones para cada concentración, pero no es el objetivo ya que se quiere un comportamiento desbalanceado, por lo tanto se procede a dañar dos concentraciones:
  • En C3 se dañan 2 tratamientos.
  • En C2 se daña un tratamiento.
  • En C0 no se dañó ninguno.
datos_des = datos1[-c(50, 111, 120),]
table(datos_des$acido)
## 
## C0 C1 C2 
## 40 39 38
Finalmente, se tienen datos desbalanceados.

1. Análisis Inferencial

  • Hipótesis: el asterisco se usa cuando se tiene un diseño desbalanceado y aquí las medias estan desbalanceadas ya que no hay las mismas repeticiones por tratamiento

\[*H_0: \mu_{C0} = \mu_{C1} = \mu_{C2}\] ##### A continuación se corren los dos análisis de varianza (Desbalanceado y balanceado) como si no importara el hecho de que se dañaron los tratamientos y así saber hasta que punto se perjudicó el análisis.

2.1. Análisis de Varianza balanceado

mod1 = aov(porc_germ ~ acido, datos1)
summary(mod1)
##              Df Sum Sq Mean Sq F value Pr(>F)    
## acido         2   7835    3918   98.15 <2e-16 ***
## Residuals   117   4670      40                   
## ---
## Signif. codes:  0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
p-value = 2e-16 < 0.05.
  • Se rechaza la H0 y por lo tanto, la germinación no fue igual en todas las concentraciones.
Se realiza un boxplot para saber como se comportó la geminación en cada dosis del ácido:
boxplot(datos1$porc_germ ~ datos1$acido)

Se observa que hay una mayor germinación cuando se uso una dosis más alta de ácido (C2), una germinación intermedia (C2) y donde no se aplicó ácido se tiene la peor germinación (C0)
  • Lo anterior es cierto en un diseño balanceado, pero será igual cuando:
se pierden datos, cambio datos.
  • ¿El análsis de varianza funcionará igualmente y R se dará cuenta?
  • ¿Se puede utilizar aov cuando tengo un diseño desbalanceado?

2.2 Análisis de varianza balanceado (con los datos desbalanceados)

mod2 = aov(porc_germ ~ acido, datos_des)
summary(mod2)
##              Df Sum Sq Mean Sq F value Pr(>F)    
## acido         2   7898    3949   98.39 <2e-16 ***
## Residuals   114   4576      40                   
## ---
## Signif. codes:  0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
p-value = 2e-16 < 0.05.
  • Se rechaza la H0 y por lo tanto, la germinación no fue igual en todas las concentraciones.
Observación de ambas tablas:
  • Se espera que las tablas tengan valores diferentes ya que en la última se perdieron 3 datos.
  • Conclusión = Hay pequeños cambios.
Los diseño desbalanceados requieren de un tratamiento especial y aov está diseñado para modelos balanceados.

2.3 Libreria Car

Permite correr diseños desbalanceados.

  • Tipo II = Suma de cuadrados que se calcula por debalance (método especial).
mod3 = lm(porc_germ ~ acido, datos_des)
library(car)
## Loading required package: carData
mod3_res = Anova(mod3, type = 'II')
mod3_res
## Anova Table (Type II tests)
## 
## Response: porc_germ
##           Sum Sq  Df F value    Pr(>F)    
## acido     7898.3   2  98.392 < 2.2e-16 ***
## Residuals 4575.6 114                      
## ---
## Signif. codes:  0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
p-value = 2.2e-16 < 0.05.
  • Se rechaza la H0 y por lo tanto, la germinación no fue igual en todas las concentraciones.

Comparación de 2.2 (aov) y 2.3 (Anova)

  • Los dos se rechazan.
  • Las concentraciones tienen que ver.
  • Grados de libertad igual.

CONCLUSIÓN

  • Balanceado o no balanceado funciona aov cuando solo está utilizando un ÚNICO factor.
  • Si se agregan otras cosas ya no funciona de la misma manera.

DISEÑO FACTORIAL SIMPLE CON BLOQUES AL AZAR (FSBA) - DESBALANCEADO

Se le aplican 4 tipos de concentraciones del ácido:
  • C0
  • C1
  • C2
  • C3
Se le agregan 3 bloques.
Se realiza el mismo proceso que anteriormente se aplicó, creación de datos balanceados y luego se desbalancean.
set.seed(123)

porc_germ = c(
  rnorm(40, 60, 6),
  rnorm(40, 70, 7),
  rnorm(40, 80, 8)
)

bloq = gl(3, 40, 120, c('B0','B1','B2'))
acido = gl(4, 10, 120, c('C0','C1','C2','C3'))

datos2 = data.frame(acido, bloq, porc_germ)

# datos_des = datos[-c(50, 111, 120), ]
datos_des2 = datos2[-sample(120, 5), ]
datos_des2
##     acido bloq porc_germ
## 1      C0   B0  56.63715
## 2      C0   B0  58.61894
## 3      C0   B0  69.35225
## 4      C0   B0  60.42305
## 5      C0   B0  60.77573
## 6      C0   B0  70.29039
## 7      C0   B0  62.76550
## 8      C0   B0  52.40963
## 9      C0   B0  55.87888
## 10     C0   B0  57.32603
## 11     C1   B0  67.34449
## 12     C1   B0  62.15888
## 13     C1   B0  62.40463
## 15     C1   B0  56.66495
## 17     C1   B0  62.98710
## 18     C1   B0  48.20030
## 19     C1   B0  64.20814
## 20     C1   B0  57.16325
## 21     C2   B0  53.59306
## 22     C2   B0  58.69215
## 23     C2   B0  53.84397
## 24     C2   B0  55.62665
## 25     C2   B0  56.24976
## 26     C2   B0  49.87984
## 27     C2   B0  65.02672
## 28     C2   B0  60.92024
## 29     C2   B0  53.17118
## 30     C2   B0  67.52289
## 31     C3   B0  62.55879
## 32     C3   B0  58.22957
## 34     C3   B0  65.26880
## 35     C3   B0  64.92949
## 36     C3   B0  64.13184
## 37     C3   B0  63.32351
## 38     C3   B0  59.62853
## 39     C3   B0  58.16422
## 40     C3   B0  57.71717
## 41     C0   B1  65.13705
## 42     C0   B1  68.54458
## 43     C0   B1  61.14223
## 44     C0   B1  85.18269
## 45     C0   B1  78.45573
## 46     C0   B1  62.13824
## 47     C0   B1  67.17981
## 48     C0   B1  66.73341
## 49     C0   B1  75.45976
## 50     C0   B1  69.41642
## 51     C1   B1  71.77323
## 52     C1   B1  69.80017
## 53     C1   B1  69.69991
## 54     C1   B1  79.58022
## 55     C1   B1  68.41960
## 56     C1   B1  80.61529
## 57     C1   B1  59.15873
## 58     C1   B1  74.09230
## 59     C1   B1  70.86698
## 60     C1   B1  71.51159
## 61     C2   B1  72.65748
## 62     C2   B1  66.48374
## 63     C2   B1  67.66755
## 64     C2   B1  62.86997
## 65     C2   B1  62.49746
## 66     C2   B1  72.12470
## 67     C2   B1  73.13747
## 68     C2   B1  70.37103
## 69     C2   B1  76.45587
## 70     C2   B1  84.35059
## 71     C3   B1  66.56278
## 72     C3   B1  53.83582
## 73     C3   B1  77.04017
## 74     C3   B1  65.03559
## 75     C3   B1  65.18394
## 76     C3   B1  77.17900
## 77     C3   B1  68.00659
## 78     C3   B1  61.45498
## 79     C3   B1  71.26912
## 80     C3   B1  69.02776
## 81     C0   B2  80.04611
## 82     C0   B2  83.08224
## 83     C0   B2  77.03472
## 84     C0   B2  85.15501
## 85     C0   B2  78.23611
## 86     C0   B2  82.65426
## 88     C0   B2  83.48145
## 89     C0   B2  77.39255
## 90     C0   B2  89.19046
## 91     C1   B2  87.94803
## 92     C1   B2  84.38718
## 93     C1   B2  81.90985
## 94     C1   B2  74.97675
## 95     C1   B2  90.88522
## 96     C1   B2  75.19792
## 97     C1   B2  97.49866
## 98     C1   B2  92.26089
## 99     C1   B2  78.11440
## 100    C1   B2  71.78863
## 101    C2   B2  74.31675
## 102    C2   B2  82.05507
## 103    C2   B2  78.02646
## 104    C2   B2  77.21966
## 105    C2   B2  72.38705
## 106    C2   B2  79.63978
## 107    C2   B2  73.72076
## 108    C2   B2  66.65646
## 109    C2   B2  76.95819
## 110    C2   B2  87.35197
## 111    C3   B2  75.39722
## 112    C3   B2  84.86371
## 113    C3   B2  67.05694
## 114    C3   B2  79.55550
## 115    C3   B2  84.15526
## 116    C3   B2  82.40923
## 118    C3   B2  74.87435
## 119    C3   B2  73.20237
## 120    C3   B2  71.80697
table(datos_des2$bloq, datos_des2$acido)
##     
##      C0 C1 C2 C3
##   B0 10  8 10  9
##   B1 10 10 10 10
##   B2  9 10 10  9
La tabla permite ver que uno tiene 8 datos y el otro 9, observando el desbalance.

2.1. Análisis de Varianza con aov.

Se agregan primero los bloques y luego los factores.
mod1 = aov(porc_germ ~ bloq * acido,
           datos_des2)
summary(mod1)
##              Df Sum Sq Mean Sq F value Pr(>F)    
## bloq          2   7478    3739  97.858 <2e-16 ***
## acido         3    238      79   2.073  0.108    
## bloq:acido    6    276      46   1.203  0.311    
## Residuals   103   3936      38                   
## ---
## Signif. codes:  0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
mod2 = lm(porc_germ ~ bloq * acido,
          datos_des2)
mod2_res = Anova(mod2, type='II')
mod2_res
## Anova Table (Type II tests)
## 
## Response: porc_germ
##            Sum Sq  Df F value Pr(>F)    
## bloq       7399.0   2 96.8208 <2e-16 ***
## acido       237.7   3  2.0734 0.1083    
## bloq:acido  275.8   6  1.2030 0.3108    
## Residuals  3935.6 103                   
## ---
## Signif. codes:  0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
Los valores son muy similares.
Resultados para la conclusión:
  • No hay interación.
  • No hay efecto del ácido.
  • Parece que hay un efecto de los bloques.
El que realmente es válido es el segundo, ya que cuando se trata de un desbalanceado la función aov NO se debe usar a menos que sea un solo factor.

2.2. Análisis de Varianza con lm.

Con la diferencia de que se realiza un ajuste desbalanceado provando diferentes ordenes.
mod3 = lm(porc_germ ~ bloq + acido + bloq:acido, datos_des2)
Anova(mod3, type='II')
## Anova Table (Type II tests)
## 
## Response: porc_germ
##            Sum Sq  Df F value Pr(>F)    
## bloq       7399.0   2 96.8208 <2e-16 ***
## acido       237.7   3  2.0734 0.1083    
## bloq:acido  275.8   6  1.2030 0.3108    
## Residuals  3935.6 103                   
## ---
## Signif. codes:  0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
mod3 = lm(porc_germ ~ acido + bloq + bloq:acido, datos_des2)
Anova(mod3, type='II')
## Anova Table (Type II tests)
## 
## Response: porc_germ
##            Sum Sq  Df F value Pr(>F)    
## acido       237.7   3  2.0734 0.1083    
## bloq       7399.0   2 96.8208 <2e-16 ***
## acido:bloq  275.8   6  1.2030 0.3108    
## Residuals  3935.6 103                   
## ---
## Signif. codes:  0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
mod3 = lm(porc_germ ~ bloq:acido + acido + bloq, datos_des2)
Anova(mod3, type='II')
## Anova Table (Type II tests)
## 
## Response: porc_germ
##            Sum Sq  Df F value Pr(>F)    
## acido       237.7   3  2.0734 0.1083    
## bloq       7399.0   2 96.8208 <2e-16 ***
## bloq:acido  275.8   6  1.2030 0.3108    
## Residuals  3935.6 103                   
## ---
## Signif. codes:  0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
mod3 = lm(porc_germ ~ bloq:acido + bloq + acido, datos_des2)
Anova(mod3, type='II')
## Anova Table (Type II tests)
## 
## Response: porc_germ
##            Sum Sq  Df F value Pr(>F)    
## bloq       7399.0   2 96.8208 <2e-16 ***
## acido       237.7   3  2.0734 0.1083    
## bloq:acido  275.8   6  1.2030 0.3108    
## Residuals  3935.6 103                   
## ---
## Signif. codes:  0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
Se observa que los resultados son idénticos ya que se coloca la suma de cuadrados tipo II para quitar las diferencias, si no se coloca, los resultados serían diferentes.
Cuando existe un desbalanceo y esté la preocupación del orden de los factores en el modelo se utiliza tipo II ya que el mismo realiza el ajuste.

ARTICULO: ANOVA for unbalanced data: Use type II instead of type III sums of squares.

Se referencia el artículo como una demostración de la importancia de utilizar Tipo II en lugar de Tipo III en diseños desbalanceados, para evitar cometer errores a futuro.

DISEÑO FACTORIAL SIMPLE EN BLOQUES COMPLETOS GENERALIZADOS Y AL AZAR - DESBALANCEADO Y CON TÉCNICA DE ANÁLISIS E COVARIANZA (FSBCGA - D)

Covariable = Diámetro medio de la semilla
Calculo medio de un objeto que no es circular:
  • Se realiza un promedio geométrico = Media geométrica
set.seed(123)

porc_germ = c(
  rnorm(40, 60, 6),
  rnorm(40, 70, 7),
  rnorm(40, 80, 8)
)
diam_med = sort(rnorm(120, 12, 1.3))

bloq = gl(3, 40, 120, c('B0','B1','B2'))
acido = gl(4, 10, 120, c('C0','C1','C2','C3'))

datos3 = data.frame(acido, bloq,
                   porc_germ, diam_med)
class(datos3$acido)
## [1] "factor"
datos_desA = datos3
datos_desA[sample(120, 5), 'porc_germ'] = NA

datos_desA
##     acido bloq porc_germ  diam_med
## 1      C0   B0  56.63715  9.330779
## 2      C0   B0  58.61894  9.918003
## 3      C0   B0  69.35225  9.956213
## 4      C0   B0  60.42305 10.030932
## 5      C0   B0  60.77573 10.099718
## 6      C0   B0  70.29039 10.101168
## 7      C0   B0  62.76550 10.122939
## 8      C0   B0  52.40963 10.287879
## 9      C0   B0  55.87888 10.295958
## 10     C0   B0  57.32603 10.326860
## 11     C1   B0  67.34449 10.329870
## 12     C1   B0  62.15888 10.361798
## 13     C1   B0  62.40463 10.373347
## 14     C1   B0  60.66410 10.392845
## 15     C1   B0  56.66495 10.458876
## 16     C1   B0        NA 10.575205
## 17     C1   B0  62.98710 10.617676
## 18     C1   B0  48.20030 10.636070
## 19     C1   B0  64.20814 10.679730
## 20     C1   B0  57.16325 10.689110
## 21     C2   B0  53.59306 10.709741
## 22     C2   B0        NA 10.749586
## 23     C2   B0  53.84397 10.768283
## 24     C2   B0  55.62665 10.836028
## 25     C2   B0  56.24976 10.874833
## 26     C2   B0  49.87984 10.974816
## 27     C2   B0  65.02672 10.984003
## 28     C2   B0  60.92024 11.036263
## 29     C2   B0  53.17118 11.039914
## 30     C2   B0  67.52289 11.060014
## 31     C3   B0  62.55879 11.067616
## 32     C3   B0  58.22957 11.084025
## 33     C3   B0  65.37075 11.152465
## 34     C3   B0  65.26880 11.205484
## 35     C3   B0  64.92949 11.226998
## 36     C3   B0  64.13184 11.253295
## 37     C3   B0  63.32351 11.253834
## 38     C3   B0  59.62853 11.309822
## 39     C3   B0  58.16422 11.329117
## 40     C3   B0  57.71717 11.350920
## 41     C0   B1  65.13705 11.362275
## 42     C0   B1  68.54458 11.371085
## 43     C0   B1  61.14223 11.380879
## 44     C0   B1  85.18269 11.404125
## 45     C0   B1  78.45573 11.426488
## 46     C0   B1  62.13824 11.450754
## 47     C0   B1  67.17981 11.458085
## 48     C0   B1  66.73341 11.461358
## 49     C0   B1  75.45976 11.513045
## 50     C0   B1  69.41642 11.515830
## 51     C1   B1  71.77323 11.527246
## 52     C1   B1  69.80017 11.545454
## 53     C1   B1  69.69991 11.577908
## 54     C1   B1  79.58022 11.635486
## 55     C1   B1  68.41960 11.655311
## 56     C1   B1  80.61529 11.659143
## 57     C1   B1  59.15873 11.667080
## 58     C1   B1  74.09230 11.692837
## 59     C1   B1  70.86698 11.720005
## 60     C1   B1  71.51159 11.743671
## 61     C2   B1  72.65748 11.762197
## 62     C2   B1  66.48374 11.844712
## 63     C2   B1  67.66755 11.882585
## 64     C2   B1  62.86997 11.907299
## 65     C2   B1  62.49746 11.929763
## 66     C2   B1  72.12470 11.955713
## 67     C2   B1  73.13747 12.049125
## 68     C2   B1  70.37103 12.053603
## 69     C2   B1        NA 12.077675
## 70     C2   B1  84.35059 12.084881
## 71     C3   B1  66.56278 12.101349
## 72     C3   B1  53.83582 12.110158
## 73     C3   B1  77.04017 12.122959
## 74     C3   B1        NA 12.152941
## 75     C3   B1  65.18394 12.155019
## 76     C3   B1  77.17900 12.278779
## 77     C3   B1  68.00659 12.278900
## 78     C3   B1  61.45498 12.306003
## 79     C3   B1  71.26912 12.316794
## 80     C3   B1  69.02776 12.387696
## 81     C0   B2  80.04611 12.403625
## 82     C0   B2  83.08224 12.421596
## 83     C0   B2  77.03472 12.431863
## 84     C0   B2  85.15501 12.479654
## 85     C0   B2  78.23611 12.544677
## 86     C0   B2  82.65426 12.567481
## 87     C0   B2  88.77471 12.586955
## 88     C0   B2  83.48145 12.671921
## 89     C0   B2  77.39255 12.706152
## 90     C0   B2  89.19046 12.731886
## 91     C1   B2  87.94803 12.780921
## 92     C1   B2  84.38718 12.803382
## 93     C1   B2  81.90985 12.827541
## 94     C1   B2        NA 12.894292
## 95     C1   B2  90.88522 12.912320
## 96     C1   B2  75.19792 12.919865
## 97     C1   B2  97.49866 12.961932
## 98     C1   B2  92.26089 12.980270
## 99     C1   B2  78.11440 12.999755
## 100    C1   B2  71.78863 13.024061
## 101    C2   B2  74.31675 13.150046
## 102    C2   B2  82.05507 13.270065
## 103    C2   B2  78.02646 13.368525
## 104    C2   B2  77.21966 13.442803
## 105    C2   B2  72.38705 13.442896
## 106    C2   B2  79.63978 13.470738
## 107    C2   B2  73.72076 13.602219
## 108    C2   B2  66.65646 13.642141
## 109    C2   B2  76.95819 13.706137
## 110    C2   B2  87.35197 13.877916
## 111    C3   B2  75.39722 14.146180
## 112    C3   B2  84.86371 14.178406
## 113    C3   B2  67.05694 14.397021
## 114    C3   B2  79.55550 14.481835
## 115    C3   B2  84.15526 14.541882
## 116    C3   B2  82.40923 14.596377
## 117    C3   B2  80.84541 14.730142
## 118    C3   B2  74.87435 14.766987
## 119    C3   B2  73.20237 14.858453
## 120    C3   B2  71.80697 16.213352
Los datos tienen NA y para poder realizar el análisis de varianza con Anova se deben presentar los datos son NA como se hace a continuación:
#datos_des= datos[-c(50,111,120),]
datos_desB= datos3[-sample(120, 5)]

datos_desB
##     acido bloq porc_germ  diam_med
## 1      C0   B0  56.63715  9.330779
## 2      C0   B0  58.61894  9.918003
## 3      C0   B0  69.35225  9.956213
## 4      C0   B0  60.42305 10.030932
## 5      C0   B0  60.77573 10.099718
## 6      C0   B0  70.29039 10.101168
## 7      C0   B0  62.76550 10.122939
## 8      C0   B0  52.40963 10.287879
## 9      C0   B0  55.87888 10.295958
## 10     C0   B0  57.32603 10.326860
## 11     C1   B0  67.34449 10.329870
## 12     C1   B0  62.15888 10.361798
## 13     C1   B0  62.40463 10.373347
## 14     C1   B0  60.66410 10.392845
## 15     C1   B0  56.66495 10.458876
## 16     C1   B0  70.72148 10.575205
## 17     C1   B0  62.98710 10.617676
## 18     C1   B0  48.20030 10.636070
## 19     C1   B0  64.20814 10.679730
## 20     C1   B0  57.16325 10.689110
## 21     C2   B0  53.59306 10.709741
## 22     C2   B0  58.69215 10.749586
## 23     C2   B0  53.84397 10.768283
## 24     C2   B0  55.62665 10.836028
## 25     C2   B0  56.24976 10.874833
## 26     C2   B0  49.87984 10.974816
## 27     C2   B0  65.02672 10.984003
## 28     C2   B0  60.92024 11.036263
## 29     C2   B0  53.17118 11.039914
## 30     C2   B0  67.52289 11.060014
## 31     C3   B0  62.55879 11.067616
## 32     C3   B0  58.22957 11.084025
## 33     C3   B0  65.37075 11.152465
## 34     C3   B0  65.26880 11.205484
## 35     C3   B0  64.92949 11.226998
## 36     C3   B0  64.13184 11.253295
## 37     C3   B0  63.32351 11.253834
## 38     C3   B0  59.62853 11.309822
## 39     C3   B0  58.16422 11.329117
## 40     C3   B0  57.71717 11.350920
## 41     C0   B1  65.13705 11.362275
## 42     C0   B1  68.54458 11.371085
## 43     C0   B1  61.14223 11.380879
## 44     C0   B1  85.18269 11.404125
## 45     C0   B1  78.45573 11.426488
## 46     C0   B1  62.13824 11.450754
## 47     C0   B1  67.17981 11.458085
## 48     C0   B1  66.73341 11.461358
## 49     C0   B1  75.45976 11.513045
## 50     C0   B1  69.41642 11.515830
## 51     C1   B1  71.77323 11.527246
## 52     C1   B1  69.80017 11.545454
## 53     C1   B1  69.69991 11.577908
## 54     C1   B1  79.58022 11.635486
## 55     C1   B1  68.41960 11.655311
## 56     C1   B1  80.61529 11.659143
## 57     C1   B1  59.15873 11.667080
## 58     C1   B1  74.09230 11.692837
## 59     C1   B1  70.86698 11.720005
## 60     C1   B1  71.51159 11.743671
## 61     C2   B1  72.65748 11.762197
## 62     C2   B1  66.48374 11.844712
## 63     C2   B1  67.66755 11.882585
## 64     C2   B1  62.86997 11.907299
## 65     C2   B1  62.49746 11.929763
## 66     C2   B1  72.12470 11.955713
## 67     C2   B1  73.13747 12.049125
## 68     C2   B1  70.37103 12.053603
## 69     C2   B1  76.45587 12.077675
## 70     C2   B1  84.35059 12.084881
## 71     C3   B1  66.56278 12.101349
## 72     C3   B1  53.83582 12.110158
## 73     C3   B1  77.04017 12.122959
## 74     C3   B1  65.03559 12.152941
## 75     C3   B1  65.18394 12.155019
## 76     C3   B1  77.17900 12.278779
## 77     C3   B1  68.00659 12.278900
## 78     C3   B1  61.45498 12.306003
## 79     C3   B1  71.26912 12.316794
## 80     C3   B1  69.02776 12.387696
## 81     C0   B2  80.04611 12.403625
## 82     C0   B2  83.08224 12.421596
## 83     C0   B2  77.03472 12.431863
## 84     C0   B2  85.15501 12.479654
## 85     C0   B2  78.23611 12.544677
## 86     C0   B2  82.65426 12.567481
## 87     C0   B2  88.77471 12.586955
## 88     C0   B2  83.48145 12.671921
## 89     C0   B2  77.39255 12.706152
## 90     C0   B2  89.19046 12.731886
## 91     C1   B2  87.94803 12.780921
## 92     C1   B2  84.38718 12.803382
## 93     C1   B2  81.90985 12.827541
## 94     C1   B2  74.97675 12.894292
## 95     C1   B2  90.88522 12.912320
## 96     C1   B2  75.19792 12.919865
## 97     C1   B2  97.49866 12.961932
## 98     C1   B2  92.26089 12.980270
## 99     C1   B2  78.11440 12.999755
## 100    C1   B2  71.78863 13.024061
## 101    C2   B2  74.31675 13.150046
## 102    C2   B2  82.05507 13.270065
## 103    C2   B2  78.02646 13.368525
## 104    C2   B2  77.21966 13.442803
## 105    C2   B2  72.38705 13.442896
## 106    C2   B2  79.63978 13.470738
## 107    C2   B2  73.72076 13.602219
## 108    C2   B2  66.65646 13.642141
## 109    C2   B2  76.95819 13.706137
## 110    C2   B2  87.35197 13.877916
## 111    C3   B2  75.39722 14.146180
## 112    C3   B2  84.86371 14.178406
## 113    C3   B2  67.05694 14.397021
## 114    C3   B2  79.55550 14.481835
## 115    C3   B2  84.15526 14.541882
## 116    C3   B2  82.40923 14.596377
## 117    C3   B2  80.84541 14.730142
## 118    C3   B2  74.87435 14.766987
## 119    C3   B2  73.20237 14.858453
## 120    C3   B2  71.80697 16.213352

1.1 Análisis de Covarianza

Cálculo de la media de cada tratamiento sabiendo que los datos tienen NA:

  • Donde hay NA no es capaz de sacar la media y para que pueda calcularla se debe realizar la imputación de datos.
library(car)
mod1 = lm(porc_germ ~ diam_med + bloq + acido + bloq:acido, datos_desB)
Anova(mod1, type = 'II')
## Anova Table (Type II tests)
## 
## Response: porc_germ
##            Sum Sq  Df F value    Pr(>F)    
## diam_med      3.0   1  0.0794    0.7786    
## bloq        963.3   2 12.5622 1.257e-05 ***
## acido       129.4   3  1.1253    0.3422    
## bloq:acido  247.7   6  1.0767    0.3811    
## Residuals  4102.3 107                      
## ---
## Signif. codes:  0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
Algunas veces se realiza imputación para quitar el problema de desbalanceo.
  • Aquí se puede utilizar para los datos que tienen NA la función na.rm la cual omite los NA para que saque la media sin inconvenientes.
tapply(datos_desA$porc_germ,
       datos_desA$acido,
       mean, na.rm = TRUE)
##       C0       C1       C2       C3 
## 70.96384 72.04659 68.44023 69.07068