FSCA en un caso desbalanceado -La variable respuesta es el porcentaje de germinación -El factor es la calificación de la semilla El primer paso para realizar el analisis de varianza (anova) es crear los datos con una distribución normal y luego eliminar algunos datos para hacer el experimento desbalanceado
set.seed(123)
porc_germ = c(
rnorm(40, 60, 6),
rnorm(40, 70, 7),
rnorm(40, 80, 8))
acido = gl(3, 40, 120, c('c0','c1','c2'))
datos= data.frame(acido, porc_germ)
head(datos)
## acido porc_germ
## 1 c0 56.63715
## 2 c0 58.61894
## 3 c0 69.35225
## 4 c0 60.42305
## 5 c0 60.77573
## 6 c0 70.29039
table(datos$acido)
##
## c0 c1 c2
## 40 40 40
datos
## acido porc_germ
## 1 c0 56.63715
## 2 c0 58.61894
## 3 c0 69.35225
## 4 c0 60.42305
## 5 c0 60.77573
## 6 c0 70.29039
## 7 c0 62.76550
## 8 c0 52.40963
## 9 c0 55.87888
## 10 c0 57.32603
## 11 c0 67.34449
## 12 c0 62.15888
## 13 c0 62.40463
## 14 c0 60.66410
## 15 c0 56.66495
## 16 c0 70.72148
## 17 c0 62.98710
## 18 c0 48.20030
## 19 c0 64.20814
## 20 c0 57.16325
## 21 c0 53.59306
## 22 c0 58.69215
## 23 c0 53.84397
## 24 c0 55.62665
## 25 c0 56.24976
## 26 c0 49.87984
## 27 c0 65.02672
## 28 c0 60.92024
## 29 c0 53.17118
## 30 c0 67.52289
## 31 c0 62.55879
## 32 c0 58.22957
## 33 c0 65.37075
## 34 c0 65.26880
## 35 c0 64.92949
## 36 c0 64.13184
## 37 c0 63.32351
## 38 c0 59.62853
## 39 c0 58.16422
## 40 c0 57.71717
## 41 c1 65.13705
## 42 c1 68.54458
## 43 c1 61.14223
## 44 c1 85.18269
## 45 c1 78.45573
## 46 c1 62.13824
## 47 c1 67.17981
## 48 c1 66.73341
## 49 c1 75.45976
## 50 c1 69.41642
## 51 c1 71.77323
## 52 c1 69.80017
## 53 c1 69.69991
## 54 c1 79.58022
## 55 c1 68.41960
## 56 c1 80.61529
## 57 c1 59.15873
## 58 c1 74.09230
## 59 c1 70.86698
## 60 c1 71.51159
## 61 c1 72.65748
## 62 c1 66.48374
## 63 c1 67.66755
## 64 c1 62.86997
## 65 c1 62.49746
## 66 c1 72.12470
## 67 c1 73.13747
## 68 c1 70.37103
## 69 c1 76.45587
## 70 c1 84.35059
## 71 c1 66.56278
## 72 c1 53.83582
## 73 c1 77.04017
## 74 c1 65.03559
## 75 c1 65.18394
## 76 c1 77.17900
## 77 c1 68.00659
## 78 c1 61.45498
## 79 c1 71.26912
## 80 c1 69.02776
## 81 c2 80.04611
## 82 c2 83.08224
## 83 c2 77.03472
## 84 c2 85.15501
## 85 c2 78.23611
## 86 c2 82.65426
## 87 c2 88.77471
## 88 c2 83.48145
## 89 c2 77.39255
## 90 c2 89.19046
## 91 c2 87.94803
## 92 c2 84.38718
## 93 c2 81.90985
## 94 c2 74.97675
## 95 c2 90.88522
## 96 c2 75.19792
## 97 c2 97.49866
## 98 c2 92.26089
## 99 c2 78.11440
## 100 c2 71.78863
## 101 c2 74.31675
## 102 c2 82.05507
## 103 c2 78.02646
## 104 c2 77.21966
## 105 c2 72.38705
## 106 c2 79.63978
## 107 c2 73.72076
## 108 c2 66.65646
## 109 c2 76.95819
## 110 c2 87.35197
## 111 c2 75.39722
## 112 c2 84.86371
## 113 c2 67.05694
## 114 c2 79.55550
## 115 c2 84.15526
## 116 c2 82.40923
## 117 c2 80.84541
## 118 c2 74.87435
## 119 c2 73.20237
## 120 c2 71.80697
Para este experimento contaremos con 40 datos
datos_des = datos [-c(50, 111, 120),]
table(datos_des$acido)
##
## c0 c1 c2
## 40 39 38
datos_des
## acido porc_germ
## 1 c0 56.63715
## 2 c0 58.61894
## 3 c0 69.35225
## 4 c0 60.42305
## 5 c0 60.77573
## 6 c0 70.29039
## 7 c0 62.76550
## 8 c0 52.40963
## 9 c0 55.87888
## 10 c0 57.32603
## 11 c0 67.34449
## 12 c0 62.15888
## 13 c0 62.40463
## 14 c0 60.66410
## 15 c0 56.66495
## 16 c0 70.72148
## 17 c0 62.98710
## 18 c0 48.20030
## 19 c0 64.20814
## 20 c0 57.16325
## 21 c0 53.59306
## 22 c0 58.69215
## 23 c0 53.84397
## 24 c0 55.62665
## 25 c0 56.24976
## 26 c0 49.87984
## 27 c0 65.02672
## 28 c0 60.92024
## 29 c0 53.17118
## 30 c0 67.52289
## 31 c0 62.55879
## 32 c0 58.22957
## 33 c0 65.37075
## 34 c0 65.26880
## 35 c0 64.92949
## 36 c0 64.13184
## 37 c0 63.32351
## 38 c0 59.62853
## 39 c0 58.16422
## 40 c0 57.71717
## 41 c1 65.13705
## 42 c1 68.54458
## 43 c1 61.14223
## 44 c1 85.18269
## 45 c1 78.45573
## 46 c1 62.13824
## 47 c1 67.17981
## 48 c1 66.73341
## 49 c1 75.45976
## 51 c1 71.77323
## 52 c1 69.80017
## 53 c1 69.69991
## 54 c1 79.58022
## 55 c1 68.41960
## 56 c1 80.61529
## 57 c1 59.15873
## 58 c1 74.09230
## 59 c1 70.86698
## 60 c1 71.51159
## 61 c1 72.65748
## 62 c1 66.48374
## 63 c1 67.66755
## 64 c1 62.86997
## 65 c1 62.49746
## 66 c1 72.12470
## 67 c1 73.13747
## 68 c1 70.37103
## 69 c1 76.45587
## 70 c1 84.35059
## 71 c1 66.56278
## 72 c1 53.83582
## 73 c1 77.04017
## 74 c1 65.03559
## 75 c1 65.18394
## 76 c1 77.17900
## 77 c1 68.00659
## 78 c1 61.45498
## 79 c1 71.26912
## 80 c1 69.02776
## 81 c2 80.04611
## 82 c2 83.08224
## 83 c2 77.03472
## 84 c2 85.15501
## 85 c2 78.23611
## 86 c2 82.65426
## 87 c2 88.77471
## 88 c2 83.48145
## 89 c2 77.39255
## 90 c2 89.19046
## 91 c2 87.94803
## 92 c2 84.38718
## 93 c2 81.90985
## 94 c2 74.97675
## 95 c2 90.88522
## 96 c2 75.19792
## 97 c2 97.49866
## 98 c2 92.26089
## 99 c2 78.11440
## 100 c2 71.78863
## 101 c2 74.31675
## 102 c2 82.05507
## 103 c2 78.02646
## 104 c2 77.21966
## 105 c2 72.38705
## 106 c2 79.63978
## 107 c2 73.72076
## 108 c2 66.65646
## 109 c2 76.95819
## 110 c2 87.35197
## 112 c2 84.86371
## 113 c2 67.05694
## 114 c2 79.55550
## 115 c2 84.15526
## 116 c2 82.40923
## 117 c2 80.84541
## 118 c2 74.87435
## 119 c2 73.20237
El desbalanceo se realiza al eliminar 1 y 2 datos en c1 y c2, respectivamente. Ahora, correremos de diferentes maneras el anova con el fin de analizar sus diferencias. Primero, se realizará el anova teniendo los datos balanceados y con la función aov. Segundo, se hara el anova con datos desbalanceados con las funciones aov y lm.
#Analisis de varianza balanceado con solo un factor
mod1 = aov (porc_germ ~ acido, datos)
summary(mod1)
## Df Sum Sq Mean Sq F value Pr(>F)
## acido 2 7835 3918 98.15 <2e-16 ***
## Residuals 117 4670 40
## ---
## Signif. codes: 0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
Según los resultado de la tabla de anova, se rechaza la hipotesis nula en donde se declará que las varianza son iguales debido a que su p-value es menor al 5%.
boxplot(datos$porc_germ ~ datos$acido)
Al hacer un grafico de caja (boxplot), se puede ver que c2 obtuvo un
mayor porcentaje de germinación.
#Analisis de varianza con datos desbalanceados (función aov)
mod2= aov(porc_germ ~ acido, datos_des)
summary(mod2)
## Df Sum Sq Mean Sq F value Pr(>F)
## acido 2 7898 3949 98.39 <2e-16 ***
## Residuals 114 4576 40
## ---
## Signif. codes: 0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
Del mismo modo que el ejemplo anterior, el anova con datos desbalanceados y con la función aov al tener un p-value menor al 5%, se rechaza la hipotesis nula, lo que quiere decir que las varianzas de los tratamientos no son iguales
#Analisis de varianza con datos desbalanceados (función lm)
mod3= lm(porc_germ ~ acido, datos_des)
library(car)
## Loading required package: carData
Anova(mod3, type = 'II')
## Anova Table (Type II tests)
##
## Response: porc_germ
## Sum Sq Df F value Pr(>F)
## acido 7898.3 2 98.392 < 2.2e-16 ***
## Residuals 4575.6 114
## ---
## Signif. codes: 0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
Al igual que los dos casos anterior, corriendo el anova con esta función se rechaza la hipostesis nula. Analizando los tres anovas, no se evidencian diferencias entre los tres casos, por lo cual podemos concluir que al ser de un solo factor el experimento podemos usar las dos funciones sin obtener un diferencia considerable en el p-value.
Ahora haremos la misma prueba pero con bloques para ver sus diferencias, pero esta vez solo corremos el caso con los datos desbalanceados con las funciones aov y lm
#Factorial Simple en Bloques al Azar Desblanceado.
set.seed(123)
porc_germ = c(
rnorm(40, 60, 6),
rnorm(40, 70, 7),
rnorm(40, 80, 8)
)
bloq = gl (3, 40, 120, c('B0', 'B1', 'B2'))
acido = gl (4, 10, 120, c('C0', 'C1', 'C2', 'C3'))
datos = data.frame(acido, bloq, porc_germ)
datos_des = datos [-sample(120,5),]
datos_des
## acido bloq porc_germ
## 1 C0 B0 56.63715
## 2 C0 B0 58.61894
## 3 C0 B0 69.35225
## 4 C0 B0 60.42305
## 5 C0 B0 60.77573
## 6 C0 B0 70.29039
## 7 C0 B0 62.76550
## 8 C0 B0 52.40963
## 9 C0 B0 55.87888
## 10 C0 B0 57.32603
## 11 C1 B0 67.34449
## 12 C1 B0 62.15888
## 13 C1 B0 62.40463
## 15 C1 B0 56.66495
## 17 C1 B0 62.98710
## 18 C1 B0 48.20030
## 19 C1 B0 64.20814
## 20 C1 B0 57.16325
## 21 C2 B0 53.59306
## 22 C2 B0 58.69215
## 23 C2 B0 53.84397
## 24 C2 B0 55.62665
## 25 C2 B0 56.24976
## 26 C2 B0 49.87984
## 27 C2 B0 65.02672
## 28 C2 B0 60.92024
## 29 C2 B0 53.17118
## 30 C2 B0 67.52289
## 31 C3 B0 62.55879
## 32 C3 B0 58.22957
## 34 C3 B0 65.26880
## 35 C3 B0 64.92949
## 36 C3 B0 64.13184
## 37 C3 B0 63.32351
## 38 C3 B0 59.62853
## 39 C3 B0 58.16422
## 40 C3 B0 57.71717
## 41 C0 B1 65.13705
## 42 C0 B1 68.54458
## 43 C0 B1 61.14223
## 44 C0 B1 85.18269
## 45 C0 B1 78.45573
## 46 C0 B1 62.13824
## 47 C0 B1 67.17981
## 48 C0 B1 66.73341
## 49 C0 B1 75.45976
## 50 C0 B1 69.41642
## 51 C1 B1 71.77323
## 52 C1 B1 69.80017
## 53 C1 B1 69.69991
## 54 C1 B1 79.58022
## 55 C1 B1 68.41960
## 56 C1 B1 80.61529
## 57 C1 B1 59.15873
## 58 C1 B1 74.09230
## 59 C1 B1 70.86698
## 60 C1 B1 71.51159
## 61 C2 B1 72.65748
## 62 C2 B1 66.48374
## 63 C2 B1 67.66755
## 64 C2 B1 62.86997
## 65 C2 B1 62.49746
## 66 C2 B1 72.12470
## 67 C2 B1 73.13747
## 68 C2 B1 70.37103
## 69 C2 B1 76.45587
## 70 C2 B1 84.35059
## 71 C3 B1 66.56278
## 72 C3 B1 53.83582
## 73 C3 B1 77.04017
## 74 C3 B1 65.03559
## 75 C3 B1 65.18394
## 76 C3 B1 77.17900
## 77 C3 B1 68.00659
## 78 C3 B1 61.45498
## 79 C3 B1 71.26912
## 80 C3 B1 69.02776
## 81 C0 B2 80.04611
## 82 C0 B2 83.08224
## 83 C0 B2 77.03472
## 84 C0 B2 85.15501
## 85 C0 B2 78.23611
## 86 C0 B2 82.65426
## 88 C0 B2 83.48145
## 89 C0 B2 77.39255
## 90 C0 B2 89.19046
## 91 C1 B2 87.94803
## 92 C1 B2 84.38718
## 93 C1 B2 81.90985
## 94 C1 B2 74.97675
## 95 C1 B2 90.88522
## 96 C1 B2 75.19792
## 97 C1 B2 97.49866
## 98 C1 B2 92.26089
## 99 C1 B2 78.11440
## 100 C1 B2 71.78863
## 101 C2 B2 74.31675
## 102 C2 B2 82.05507
## 103 C2 B2 78.02646
## 104 C2 B2 77.21966
## 105 C2 B2 72.38705
## 106 C2 B2 79.63978
## 107 C2 B2 73.72076
## 108 C2 B2 66.65646
## 109 C2 B2 76.95819
## 110 C2 B2 87.35197
## 111 C3 B2 75.39722
## 112 C3 B2 84.86371
## 113 C3 B2 67.05694
## 114 C3 B2 79.55550
## 115 C3 B2 84.15526
## 116 C3 B2 82.40923
## 118 C3 B2 74.87435
## 119 C3 B2 73.20237
## 120 C3 B2 71.80697
table (datos_des$bloq, datos_des$acido)
##
## C0 C1 C2 C3
## B0 10 8 10 9
## B1 10 10 10 10
## B2 9 10 10 9
Cabe resaltar que al ser un modelo desbalanceado en el script de la función primero se pone los bloques y luego de estos se colocan los factores, como se realizara a continuación:
#Anova con función aov
mod4= aov (porc_germ ~ bloq * acido, datos_des)
summary(mod4)
## Df Sum Sq Mean Sq F value Pr(>F)
## bloq 2 7478 3739 97.858 <2e-16 ***
## acido 3 238 79 2.073 0.108
## bloq:acido 6 276 46 1.203 0.311
## Residuals 103 3936 38
## ---
## Signif. codes: 0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
#Anova con función lm
mod5 = lm(porc_germ ~ bloq * acido,
datos_des)
mod5_res = Anova(mod5, type='II')
mod5_res
## Anova Table (Type II tests)
##
## Response: porc_germ
## Sum Sq Df F value Pr(>F)
## bloq 7399.0 2 96.8208 <2e-16 ***
## acido 237.7 3 2.0734 0.1083
## bloq:acido 275.8 6 1.2030 0.3108
## Residuals 3935.6 103
## ---
## Signif. codes: 0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
Para el analisis de un anova donde hay interacción, primero se revisa si hay interacción o no entre los factores, para ambos casos los p-value son menores al 5%, por ende se concluye que no hay interacción. Debido a que no hay interacción, pasamos a ver los facotres, en ambos casos el factor de acido tienen un p-value mayor al 5%, por lo cual se concluye que no hay efecto del factor sobre el porcentaje de germinación. Si vemos en conjunto ambas tablas de anova, no se evidencian diferencias entre usar las funciones aov y lm. Sin embargo, segun la literatura se recomienda usar un anova para un caso desbalanceado con la función lm.
Ahora veremos que diferencias hay si colocamos en diferentes ordenes el factor, el bloque y la interacción. #Ajustando el balanceado con diferentes ordenes
mod6 = lm(porc_germ ~ bloq + acido + bloq:acido, datos_des)
Anova(mod6, type='II')
## Anova Table (Type II tests)
##
## Response: porc_germ
## Sum Sq Df F value Pr(>F)
## bloq 7399.0 2 96.8208 <2e-16 ***
## acido 237.7 3 2.0734 0.1083
## bloq:acido 275.8 6 1.2030 0.3108
## Residuals 3935.6 103
## ---
## Signif. codes: 0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
mod6 = lm(porc_germ ~ bloq:acido + acido + bloq, datos_des)
Anova(mod6, type='II')
## Anova Table (Type II tests)
##
## Response: porc_germ
## Sum Sq Df F value Pr(>F)
## acido 237.7 3 2.0734 0.1083
## bloq 7399.0 2 96.8208 <2e-16 ***
## bloq:acido 275.8 6 1.2030 0.3108
## Residuals 3935.6 103
## ---
## Signif. codes: 0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
mod6 = lm(porc_germ ~ bloq:acido + acido + bloq, datos_des)
Anova(mod6, type='II')
## Anova Table (Type II tests)
##
## Response: porc_germ
## Sum Sq Df F value Pr(>F)
## acido 237.7 3 2.0734 0.1083
## bloq 7399.0 2 96.8208 <2e-16 ***
## bloq:acido 275.8 6 1.2030 0.3108
## Residuals 3935.6 103
## ---
## Signif. codes: 0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
mod6 = lm(porc_germ ~ bloq:acido + bloq + acido, datos_des)
Anova(mod6, type='II')
## Anova Table (Type II tests)
##
## Response: porc_germ
## Sum Sq Df F value Pr(>F)
## bloq 7399.0 2 96.8208 <2e-16 ***
## acido 237.7 3 2.0734 0.1083
## bloq:acido 275.8 6 1.2030 0.3108
## Residuals 3935.6 103
## ---
## Signif. codes: 0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
Como podemos observar, no existe diferencia si colocamos en diferente orden el factor, el bloque y la interacción, ya que en la funcion se pone el type II, cuya expresion ajusta la suma de cuadrados para evitar diferencias en el orden. Según el articulo “ANOVA for Unbalanced Data Use Type II Instead of Type III Sums of Square” de Oyvind langsrud publicado en el año 2003, advierte sobre el error de manejar un type III y exhorta al uso del type II, debido al ajuste de la suma de cuadrados. Este articulo lo podemos encontrar en el siguente en enlace: https://www.researchgate.net/publication/220286726_ANOVA_for_unbalanced_data_Use_type_II_instead_of_type_III_sums_of_squares
#Ahora con covariable Diseño factorial simple en bloques completos generalizado al azar , desbalanceado y con la tecnica de analisis de covarianza
Para este caso se agrega la covariable diametro medio
Hay que recordar, que al no ser una semilla un ciruculo perfecto sino en cambio una figura irregular para poder medir el diametro se debe realizar diferentes medidas tomando como referencia el centro de la semilla, para luego hacer un promedio geometrico.
set.seed(123)
porc_germ = c(
rnorm(40, 60, 6),
rnorm(40, 70, 7),
rnorm(40, 80, 8)
)
diam_med =sort(rnorm(120,12,1.3))
bloq = gl(3, 40, 120, c('B0','B1','B2'))
acido = gl(4, 10, 120, c('C0','C1','C2','C3'))
datos = data.frame(acido, bloq,
porc_germ, diam_med)
datos_des = datos
datos_des[sample(120, 5), 'porc_germ'] = NA
datos_des
## acido bloq porc_germ diam_med
## 1 C0 B0 56.63715 9.330779
## 2 C0 B0 58.61894 9.918003
## 3 C0 B0 69.35225 9.956213
## 4 C0 B0 60.42305 10.030932
## 5 C0 B0 60.77573 10.099718
## 6 C0 B0 70.29039 10.101168
## 7 C0 B0 62.76550 10.122939
## 8 C0 B0 52.40963 10.287879
## 9 C0 B0 55.87888 10.295958
## 10 C0 B0 57.32603 10.326860
## 11 C1 B0 67.34449 10.329870
## 12 C1 B0 62.15888 10.361798
## 13 C1 B0 62.40463 10.373347
## 14 C1 B0 60.66410 10.392845
## 15 C1 B0 56.66495 10.458876
## 16 C1 B0 NA 10.575205
## 17 C1 B0 62.98710 10.617676
## 18 C1 B0 48.20030 10.636070
## 19 C1 B0 64.20814 10.679730
## 20 C1 B0 57.16325 10.689110
## 21 C2 B0 53.59306 10.709741
## 22 C2 B0 NA 10.749586
## 23 C2 B0 53.84397 10.768283
## 24 C2 B0 55.62665 10.836028
## 25 C2 B0 56.24976 10.874833
## 26 C2 B0 49.87984 10.974816
## 27 C2 B0 65.02672 10.984003
## 28 C2 B0 60.92024 11.036263
## 29 C2 B0 53.17118 11.039914
## 30 C2 B0 67.52289 11.060014
## 31 C3 B0 62.55879 11.067616
## 32 C3 B0 58.22957 11.084025
## 33 C3 B0 65.37075 11.152465
## 34 C3 B0 65.26880 11.205484
## 35 C3 B0 64.92949 11.226998
## 36 C3 B0 64.13184 11.253295
## 37 C3 B0 63.32351 11.253834
## 38 C3 B0 59.62853 11.309822
## 39 C3 B0 58.16422 11.329117
## 40 C3 B0 57.71717 11.350920
## 41 C0 B1 65.13705 11.362275
## 42 C0 B1 68.54458 11.371085
## 43 C0 B1 61.14223 11.380879
## 44 C0 B1 85.18269 11.404125
## 45 C0 B1 78.45573 11.426488
## 46 C0 B1 62.13824 11.450754
## 47 C0 B1 67.17981 11.458085
## 48 C0 B1 66.73341 11.461358
## 49 C0 B1 75.45976 11.513045
## 50 C0 B1 69.41642 11.515830
## 51 C1 B1 71.77323 11.527246
## 52 C1 B1 69.80017 11.545454
## 53 C1 B1 69.69991 11.577908
## 54 C1 B1 79.58022 11.635486
## 55 C1 B1 68.41960 11.655311
## 56 C1 B1 80.61529 11.659143
## 57 C1 B1 59.15873 11.667080
## 58 C1 B1 74.09230 11.692837
## 59 C1 B1 70.86698 11.720005
## 60 C1 B1 71.51159 11.743671
## 61 C2 B1 72.65748 11.762197
## 62 C2 B1 66.48374 11.844712
## 63 C2 B1 67.66755 11.882585
## 64 C2 B1 62.86997 11.907299
## 65 C2 B1 62.49746 11.929763
## 66 C2 B1 72.12470 11.955713
## 67 C2 B1 73.13747 12.049125
## 68 C2 B1 70.37103 12.053603
## 69 C2 B1 NA 12.077675
## 70 C2 B1 84.35059 12.084881
## 71 C3 B1 66.56278 12.101349
## 72 C3 B1 53.83582 12.110158
## 73 C3 B1 77.04017 12.122959
## 74 C3 B1 NA 12.152941
## 75 C3 B1 65.18394 12.155019
## 76 C3 B1 77.17900 12.278779
## 77 C3 B1 68.00659 12.278900
## 78 C3 B1 61.45498 12.306003
## 79 C3 B1 71.26912 12.316794
## 80 C3 B1 69.02776 12.387696
## 81 C0 B2 80.04611 12.403625
## 82 C0 B2 83.08224 12.421596
## 83 C0 B2 77.03472 12.431863
## 84 C0 B2 85.15501 12.479654
## 85 C0 B2 78.23611 12.544677
## 86 C0 B2 82.65426 12.567481
## 87 C0 B2 88.77471 12.586955
## 88 C0 B2 83.48145 12.671921
## 89 C0 B2 77.39255 12.706152
## 90 C0 B2 89.19046 12.731886
## 91 C1 B2 87.94803 12.780921
## 92 C1 B2 84.38718 12.803382
## 93 C1 B2 81.90985 12.827541
## 94 C1 B2 NA 12.894292
## 95 C1 B2 90.88522 12.912320
## 96 C1 B2 75.19792 12.919865
## 97 C1 B2 97.49866 12.961932
## 98 C1 B2 92.26089 12.980270
## 99 C1 B2 78.11440 12.999755
## 100 C1 B2 71.78863 13.024061
## 101 C2 B2 74.31675 13.150046
## 102 C2 B2 82.05507 13.270065
## 103 C2 B2 78.02646 13.368525
## 104 C2 B2 77.21966 13.442803
## 105 C2 B2 72.38705 13.442896
## 106 C2 B2 79.63978 13.470738
## 107 C2 B2 73.72076 13.602219
## 108 C2 B2 66.65646 13.642141
## 109 C2 B2 76.95819 13.706137
## 110 C2 B2 87.35197 13.877916
## 111 C3 B2 75.39722 14.146180
## 112 C3 B2 84.86371 14.178406
## 113 C3 B2 67.05694 14.397021
## 114 C3 B2 79.55550 14.481835
## 115 C3 B2 84.15526 14.541882
## 116 C3 B2 82.40923 14.596377
## 117 C3 B2 80.84541 14.730142
## 118 C3 B2 74.87435 14.766987
## 119 C3 B2 73.20237 14.858453
## 120 C3 B2 71.80697 16.213352
Para realizar un correcto ANCOVA, en este caso vamos a eliminar los valores que tienen “NA”
#datos_des= datos[-c(50,111,120),]
datos_des= datos[-sample(120, 5)]
datos_des
## acido bloq porc_germ diam_med
## 1 C0 B0 56.63715 9.330779
## 2 C0 B0 58.61894 9.918003
## 3 C0 B0 69.35225 9.956213
## 4 C0 B0 60.42305 10.030932
## 5 C0 B0 60.77573 10.099718
## 6 C0 B0 70.29039 10.101168
## 7 C0 B0 62.76550 10.122939
## 8 C0 B0 52.40963 10.287879
## 9 C0 B0 55.87888 10.295958
## 10 C0 B0 57.32603 10.326860
## 11 C1 B0 67.34449 10.329870
## 12 C1 B0 62.15888 10.361798
## 13 C1 B0 62.40463 10.373347
## 14 C1 B0 60.66410 10.392845
## 15 C1 B0 56.66495 10.458876
## 16 C1 B0 70.72148 10.575205
## 17 C1 B0 62.98710 10.617676
## 18 C1 B0 48.20030 10.636070
## 19 C1 B0 64.20814 10.679730
## 20 C1 B0 57.16325 10.689110
## 21 C2 B0 53.59306 10.709741
## 22 C2 B0 58.69215 10.749586
## 23 C2 B0 53.84397 10.768283
## 24 C2 B0 55.62665 10.836028
## 25 C2 B0 56.24976 10.874833
## 26 C2 B0 49.87984 10.974816
## 27 C2 B0 65.02672 10.984003
## 28 C2 B0 60.92024 11.036263
## 29 C2 B0 53.17118 11.039914
## 30 C2 B0 67.52289 11.060014
## 31 C3 B0 62.55879 11.067616
## 32 C3 B0 58.22957 11.084025
## 33 C3 B0 65.37075 11.152465
## 34 C3 B0 65.26880 11.205484
## 35 C3 B0 64.92949 11.226998
## 36 C3 B0 64.13184 11.253295
## 37 C3 B0 63.32351 11.253834
## 38 C3 B0 59.62853 11.309822
## 39 C3 B0 58.16422 11.329117
## 40 C3 B0 57.71717 11.350920
## 41 C0 B1 65.13705 11.362275
## 42 C0 B1 68.54458 11.371085
## 43 C0 B1 61.14223 11.380879
## 44 C0 B1 85.18269 11.404125
## 45 C0 B1 78.45573 11.426488
## 46 C0 B1 62.13824 11.450754
## 47 C0 B1 67.17981 11.458085
## 48 C0 B1 66.73341 11.461358
## 49 C0 B1 75.45976 11.513045
## 50 C0 B1 69.41642 11.515830
## 51 C1 B1 71.77323 11.527246
## 52 C1 B1 69.80017 11.545454
## 53 C1 B1 69.69991 11.577908
## 54 C1 B1 79.58022 11.635486
## 55 C1 B1 68.41960 11.655311
## 56 C1 B1 80.61529 11.659143
## 57 C1 B1 59.15873 11.667080
## 58 C1 B1 74.09230 11.692837
## 59 C1 B1 70.86698 11.720005
## 60 C1 B1 71.51159 11.743671
## 61 C2 B1 72.65748 11.762197
## 62 C2 B1 66.48374 11.844712
## 63 C2 B1 67.66755 11.882585
## 64 C2 B1 62.86997 11.907299
## 65 C2 B1 62.49746 11.929763
## 66 C2 B1 72.12470 11.955713
## 67 C2 B1 73.13747 12.049125
## 68 C2 B1 70.37103 12.053603
## 69 C2 B1 76.45587 12.077675
## 70 C2 B1 84.35059 12.084881
## 71 C3 B1 66.56278 12.101349
## 72 C3 B1 53.83582 12.110158
## 73 C3 B1 77.04017 12.122959
## 74 C3 B1 65.03559 12.152941
## 75 C3 B1 65.18394 12.155019
## 76 C3 B1 77.17900 12.278779
## 77 C3 B1 68.00659 12.278900
## 78 C3 B1 61.45498 12.306003
## 79 C3 B1 71.26912 12.316794
## 80 C3 B1 69.02776 12.387696
## 81 C0 B2 80.04611 12.403625
## 82 C0 B2 83.08224 12.421596
## 83 C0 B2 77.03472 12.431863
## 84 C0 B2 85.15501 12.479654
## 85 C0 B2 78.23611 12.544677
## 86 C0 B2 82.65426 12.567481
## 87 C0 B2 88.77471 12.586955
## 88 C0 B2 83.48145 12.671921
## 89 C0 B2 77.39255 12.706152
## 90 C0 B2 89.19046 12.731886
## 91 C1 B2 87.94803 12.780921
## 92 C1 B2 84.38718 12.803382
## 93 C1 B2 81.90985 12.827541
## 94 C1 B2 74.97675 12.894292
## 95 C1 B2 90.88522 12.912320
## 96 C1 B2 75.19792 12.919865
## 97 C1 B2 97.49866 12.961932
## 98 C1 B2 92.26089 12.980270
## 99 C1 B2 78.11440 12.999755
## 100 C1 B2 71.78863 13.024061
## 101 C2 B2 74.31675 13.150046
## 102 C2 B2 82.05507 13.270065
## 103 C2 B2 78.02646 13.368525
## 104 C2 B2 77.21966 13.442803
## 105 C2 B2 72.38705 13.442896
## 106 C2 B2 79.63978 13.470738
## 107 C2 B2 73.72076 13.602219
## 108 C2 B2 66.65646 13.642141
## 109 C2 B2 76.95819 13.706137
## 110 C2 B2 87.35197 13.877916
## 111 C3 B2 75.39722 14.146180
## 112 C3 B2 84.86371 14.178406
## 113 C3 B2 67.05694 14.397021
## 114 C3 B2 79.55550 14.481835
## 115 C3 B2 84.15526 14.541882
## 116 C3 B2 82.40923 14.596377
## 117 C3 B2 80.84541 14.730142
## 118 C3 B2 74.87435 14.766987
## 119 C3 B2 73.20237 14.858453
## 120 C3 B2 71.80697 16.213352
table(datos_des$porc_germ, datos_des$acido)
##
## C0 C1 C2 C3
## 48.2002970602222 0 1 0 0
## 49.8798401355455 0 0 1 0
## 52.4096325923608 1 0 0 0
## 53.1711783779283 0 0 1 0
## 53.5930577640789 0 0 1 0
## 53.8358178705143 0 0 0 1
## 53.8439733101566 0 0 1 0
## 55.6266526242532 0 0 1 0
## 55.8788828886388 1 0 0 0
## 56.2497643929045 0 0 1 0
## 56.6371461206867 1 0 0 0
## 56.6649531914755 0 1 0 0
## 57.1632515536324 0 1 0 0
## 57.3260281794003 1 0 0 0
## 57.7171739939257 0 0 0 1
## 58.1642240175605 0 0 0 1
## 58.2295711020464 0 0 0 1
## 58.6189350631003 1 0 0 0
## 58.6921505120502 0 0 1 0
## 59.1587303703885 0 1 0 0
## 59.6285297365397 0 0 0 1
## 60.4230503485475 1 0 0 0
## 60.6640962956707 0 1 0 0
## 60.7757264109657 1 0 0 0
## 60.9202387070191 0 0 1 0
## 61.1422255390221 1 0 0 0
## 61.4549760142182 0 0 0 1
## 62.1382399175766 1 0 0 0
## 62.1588829623442 0 1 0 0
## 62.4046287035643 0 1 0 0
## 62.497461414671 0 0 1 0
## 62.5587853288609 0 0 0 1
## 62.7654972359352 1 0 0 0
## 62.8699723182504 0 0 1 0
## 62.9871028693754 0 1 0 0
## 63.3235059212255 0 0 0 1
## 64.1318415246005 0 0 0 1
## 64.2081354093821 0 1 0 0
## 64.9294864898249 0 0 0 1
## 65.0267222669671 0 0 1 0
## 65.0355946619233 0 0 0 1
## 65.1370511475564 1 0 0 0
## 65.1839396847285 0 0 0 1
## 65.2688009251982 0 0 0 1
## 65.3707539662701 0 0 0 1
## 66.4837358282349 0 0 1 0
## 66.5627818376042 0 0 0 1
## 66.6564645072949 0 0 1 0
## 66.7334125246375 1 0 0 0
## 67.0569383336867 0 0 0 1
## 67.1798061529065 1 0 0 0
## 67.3444907846368 0 1 0 0
## 67.5228895264196 0 0 1 0
## 67.6675483143141 0 0 1 0
## 68.0065889506429 0 0 0 1
## 68.4196031003851 0 1 0 0
## 68.5445790538628 1 0 0 0
## 69.0277604629267 0 0 0 1
## 69.3522498848947 1 0 0 0
## 69.4164165346972 1 0 0 0
## 69.6999067989608 0 1 0 0
## 69.8001727125591 0 1 0 0
## 70.2903899212997 1 0 0 0
## 70.3710295871135 0 0 1 0
## 70.7214788208185 0 1 0 0
## 70.8669797069123 0 1 0 0
## 71.2691243582441 0 0 0 1
## 71.5115909812078 0 1 0 0
## 71.7732295979633 0 1 0 0
## 71.7886327975458 0 1 0 0
## 71.8069696751607 0 0 0 1
## 72.1247004898298 0 0 1 0
## 72.3870514618799 0 0 1 0
## 72.6574763793192 0 0 1 0
## 73.137468450406 0 0 1 0
## 73.2023652317313 0 0 0 1
## 73.7207642443434 0 0 1 0
## 74.0922962474525 0 1 0 0
## 74.3167474904056 0 0 1 0
## 74.874351933557 0 0 0 1
## 74.976751391685 0 1 0 0
## 75.197923302823 0 1 0 0
## 75.3972242991329 0 0 0 1
## 75.4597558283542 1 0 0 0
## 76.4558722751582 0 0 1 0
## 76.9581878376979 0 0 1 0
## 77.0347197456607 1 0 0 0
## 77.0401696712358 0 0 0 1
## 77.1789995878769 0 0 0 1
## 77.2196592048181 0 0 1 0
## 77.3925473157502 1 0 0 0
## 78.026464972301 0 0 1 0
## 78.1143971271962 0 1 0 0
## 78.23610750545 1 0 0 0
## 78.4557339881349 1 0 0 0
## 79.5555042758037 0 0 0 1
## 79.5802159881012 0 1 0 0
## 79.6397782015286 0 0 1 0
## 80.0461134871991 1 0 0 0
## 80.6152942310068 0 1 0 0
## 80.8454095531915 0 0 0 1
## 81.9098538808915 0 1 0 0
## 82.0550696732522 0 0 1 0
## 82.4092268973337 0 0 0 1
## 82.6542557113256 1 0 0 0
## 83.0822432090106 1 0 0 0
## 83.4814519266704 1 0 0 0
## 84.1552576315477 0 0 0 1
## 84.35059279939 0 0 1 0
## 84.3871756760646 0 1 0 0
## 84.8637145778003 0 0 0 1
## 85.1550123881507 1 0 0 0
## 85.1826917573696 1 0 0 0
## 87.3519728724861 0 0 1 0
## 87.948030847697 0 1 0 0
## 88.7747121051948 1 0 0 0
## 89.1904609476088 1 0 0 0
## 90.8852195882401 0 1 0 0
## 92.2608850094815 0 1 0 0
## 97.4986639441326 0 1 0 0
mod7 = lm(porc_germ ~ diam_med + bloq + acido + bloq:acido, datos_des)
Anova(mod7, type='II')
## Anova Table (Type II tests)
##
## Response: porc_germ
## Sum Sq Df F value Pr(>F)
## diam_med 3.0 1 0.0794 0.7786
## bloq 963.3 2 12.5622 1.257e-05 ***
## acido 129.4 3 1.1253 0.3422
## bloq:acido 247.7 6 1.0767 0.3811
## Residuals 4102.3 107
## ---
## Signif. codes: 0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
Observando la tabla de anova, podemos ver que al ser el p-value de la interacción mayor al 5%, no se rechaza la hipotesis nula, por ende quiere decir que no hay interacción entre el bloqueo y el factor. Ahora miraremos el resto de los items de la tabla, el p-value del acido dio por encima del 5%, esto quiere decir que no se rechaza la hipotesis nula confirmando que no hubo efecto del factor sobre el porcentaje de germinación. Para confirmar si debio bloquear o no, miramos el p-value del bloque y al ser menor del 5%, confirmamos que valio la pena el bloque. Y por último, si miramos la covarible, podemos observar que el p-value es mayor al 5%, por ende no hay relación entre el diametro promedio y el porcentaje de germinación.
tapply(datos_des$porc_germ,
datos_des$acido,
mean,na.rm=TRUE)
## C0 C1 C2 C3
## 70.96384 72.10010 68.38248 68.93618