#**1.-INTRODUCCIÓN**
#**ANOVA Factorial**
# Se trata de un diseño de bloques aleatorizados. Suponga se mide la producción, utilizando cuatro tipo de fertilizantes (cada finca es un bloque).
produc <- c(2.1, 2.2, 1.8, 2, 1.9, 2.2, 2.6, 2.7, 2.5, 2.8, 1.8, 1.9, 1.6, 2, 1.9, 2.1, 2, 2.2, 2.4, 2.1)
fert <- gl(4, 5)
finca <- factor(rep(1:5, 4))
#Permite crear una tabla de contingencia
xtabs(produc ~ finca + fert)
## fert
## finca 1 2 3 4
## 1 2.1 2.2 1.8 2.1
## 2 2.2 2.6 1.9 2.0
## 3 1.8 2.7 1.6 2.2
## 4 2.0 2.5 2.0 2.4
## 5 1.9 2.8 1.9 2.1
#Reporte de cada factor.
tapply(produc, fert, summary)
## $`1`
## Min. 1st Qu. Median Mean 3rd Qu. Max.
## 1.8 1.9 2.0 2.0 2.1 2.2
##
## $`2`
## Min. 1st Qu. Median Mean 3rd Qu. Max.
## 2.20 2.50 2.60 2.56 2.70 2.80
##
## $`3`
## Min. 1st Qu. Median Mean 3rd Qu. Max.
## 1.60 1.80 1.90 1.84 1.90 2.00
##
## $`4`
## Min. 1st Qu. Median Mean 3rd Qu. Max.
## 2.00 2.10 2.10 2.16 2.20 2.40
Fertiliz 1: la media es 2.00
Fertiliz 2: la media es 2.56 MAYOR
Fertiliz 3: la media es 1.84 MENOR
Fertiliz 4: la media es 2.16
#Reporte de cada factor.
tapply(produc, finca, summary)
## $`1`
## Min. 1st Qu. Median Mean 3rd Qu. Max.
## 1.800 2.025 2.100 2.050 2.125 2.200
##
## $`2`
## Min. 1st Qu. Median Mean 3rd Qu. Max.
## 1.900 1.975 2.100 2.175 2.300 2.600
##
## $`3`
## Min. 1st Qu. Median Mean 3rd Qu. Max.
## 1.600 1.750 2.000 2.075 2.325 2.700
##
## $`4`
## Min. 1st Qu. Median Mean 3rd Qu. Max.
## 2.000 2.000 2.200 2.225 2.425 2.500
##
## $`5`
## Min. 1st Qu. Median Mean 3rd Qu. Max.
## 1.900 1.900 2.000 2.175 2.275 2.800
Finca 1: El promedio es 2.05 MENOR
Finca 2: El promedio es 2.175
Finca 3: El promedio es 2.075
Finca 4: El promedio es 2.225 MAYOR
Finca 5: El promedio es 2.175
ANOVA
ANOVA1<- aov(produc ~ finca + fert)
summary(ANOVA1)
## Df Sum Sq Mean Sq F value Pr(>F)
## finca 4 0.088 0.0220 0.647 0.639572
## fert 3 1.432 0.4773 14.039 0.000314 ***
## Residuals 12 0.408 0.0340
## ---
## Signif. codes: 0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
##FINCA El estadistico F asciende a 0.64 con p valor 0.63>0.05. No existen diferencias significativas en las medias segün la finca.
FERT: EI estadistico F asciende a 14.039 con p valor 0.0003<0.05. Si existen diferencias significativas en las medias segün el fertilizante.
model.tables(ANOVA1)
## Tables of effects
##
## finca
## finca
## 1 2 3 4 5
## -0.090 0.035 -0.065 0.085 0.035
##
## fert
## fert
## 1 2 3 4
## -0.14 0.42 -0.30 0.02
resid1<- ANOVA1$residuals
summary(resid1)
## Min. 1st Qu. Median Mean 3rd Qu. Max.
## -0.2700 -0.1350 0.0250 0.0000 0.1175 0.2050
shapiro.test(resid1)
##
## Shapiro-Wilk normality test
##
## data: resid1
## W = 0.94318, p-value = 0.2751
El p valor 0.2751 > 0.05. El residuo tiene distribución normal.
TUKEY<-TukeyHSD(ANOVA1)
TUKEY
## Tukey multiple comparisons of means
## 95% family-wise confidence level
##
## Fit: aov(formula = produc ~ finca + fert)
##
## $finca
## diff lwr upr p adj
## 2-1 0.125 -0.2905903 0.5405903 0.8681818
## 3-1 0.025 -0.3905903 0.4405903 0.9996508
## 4-1 0.175 -0.2405903 0.5905903 0.6722693
## 5-1 0.125 -0.2905903 0.5405903 0.8681818
## 3-2 -0.100 -0.5155903 0.3155903 0.9353571
## 4-2 0.050 -0.3655903 0.4655903 0.9947771
## 5-2 0.000 -0.4155903 0.4155903 1.0000000
## 4-3 0.150 -0.2655903 0.5655903 0.7777730
## 5-3 0.100 -0.3155903 0.5155903 0.9353571
## 5-4 -0.050 -0.4655903 0.3655903 0.9947771
##
## $fert
## diff lwr upr p adj
## 2-1 0.56 0.21376961 0.90623039 0.0021078
## 3-1 -0.16 -0.50623039 0.18623039 0.5385596
## 4-1 0.16 -0.18623039 0.50623039 0.5385596
## 3-2 -0.72 -1.06623039 -0.37376961 0.0002414
## 4-2 -0.40 -0.74623039 -0.05376961 0.0223807
## 4-3 0.32 -0.02623039 0.66623039 0.0734811
plot(ANOVA1)
plot(TUKEY)
Analizando por IC al 95%, no existen diferencias significativas en la producción entre las diferentes fincas. Las fincas producen medias similares.
diff lwr upr p adj 2-1 0.56 0.21376961 0.90623039 0.0021078 3-2 -0.72 -1.06623039 -0.37376961 0.0002414 4-2 -0.40 -0.74623039 -0.05376961 0.0223807
2-1; se estima que la diferencia de medias esté comprendida entre 0.21 y 0.906 (+;+). Esto quiere decir que la producción media del fertilizante 2 supera a la producción media del fertilizante 1. La diferencia es estadísticamente significativa.
3-2; se estima que la diferencia de medias esté comprendida entre -1.06 y -0.37 (-;-). Esto quiere decir que la producción media del fertilizante 3 es inferior a la producción media del fertilizante 2. La diferencia es estadísticamente significativa.
4-2; se estima que la diferencia de medias esté comprendida entre -0.74 y -0.053 (-;-). Esto quiere decir que la producción media del fertilizante 4 es inferior a la producción media del fertilizante 2. La diferencia es estadísticamente significativa.
model.tables(ANOVA1, type="means")
## Tables of means
## Grand mean
##
## 2.14
##
## finca
## finca
## 1 2 3 4 5
## 2.050 2.175 2.075 2.225 2.175
##
## fert
## fert
## 1 2 3 4
## 2.00 2.56 1.84 2.16
Interacción
Su interpretación es: cuandoe existe interacción cuando el efecto de un factor depende del nivel del otro (o se comporte diferente para cada nivel del factor).
ANOVA2<-aov(produc~finca+fert+finca*fert)
summary(ANOVA2)
## Df Sum Sq Mean Sq
## finca 4 0.088 0.0220
## fert 3 1.432 0.4773
## finca:fert 12 0.408 0.0340
ANOVA2
## Call:
## aov(formula = produc ~ finca + fert + finca * fert)
##
## Terms:
## finca fert finca:fert
## Sum of Squares 0.088 1.432 0.408
## Deg. of Freedom 4 3 12
##
## Estimated effects may be unbalanced
par(mfrows=c(1,2),
interaction.plot(fert, finca, produc, legend = TRUE),
interaction.plot(finca, fert, produc, legend = TRUE))
## Warning in par(mfrows = c(1, 2), interaction.plot(fert, finca, produc, legend =
## TRUE), : "mfrows" is not a graphical parameter
## Warning in par(mfrows = c(1, 2), interaction.plot(fert, finca, produc, legend =
## TRUE), : argument 2 does not name a graphical parameter
## Warning in par(mfrows = c(1, 2), interaction.plot(fert, finca, produc, legend =
## TRUE), : argument 3 does not name a graphical parameter
Existe una dependencia del fertilizante y el tipo de finca, se observa que el máximo de la producción ocurre en la finca 5 con el fertilizante 2. Por otro lado, el fertilizante 2 proporciona la mayor producción independientemente de la finca.
lm1<-lm(produc~finca+fert)
anova(lm1)
## Analysis of Variance Table
##
## Response: produc
## Df Sum Sq Mean Sq F value Pr(>F)
## finca 4 0.088 0.02200 0.6471 0.6395716
## fert 3 1.432 0.47733 14.0392 0.0003137 ***
## Residuals 12 0.408 0.03400
## ---
## Signif. codes: 0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
drop1(lm1, test = "F") #tipo II ANOVA. Permite medir los efectos aleatorios (componentes de varianza)
## Single term deletions
##
## Model:
## produc ~ finca + fert
## Df Sum of Sq RSS AIC F value Pr(>F)
## <none> 0.408 -61.844
## finca 4 0.088 0.496 -65.938 0.6471 0.6395716
## fert 3 1.432 1.840 -37.719 14.0392 0.0003137 ***
## ---
## Signif. codes: 0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
plot(produc~finca+fert, col=100)
sesion_info <- devtools::session_info()
dplyr::select(
tibble::as_tibble(sesion_info$packages),
c(package, loadedversion, source)
)
## # A tibble: 50 × 3
## package loadedversion source
## <chr> <chr> <chr>
## 1 bslib 0.4.2 CRAN (R 4.2.2)
## 2 cachem 1.0.6 CRAN (R 4.2.2)
## 3 callr 3.7.3 CRAN (R 4.2.3)
## 4 cli 3.6.0 CRAN (R 4.2.2)
## 5 crayon 1.5.2 CRAN (R 4.2.3)
## 6 devtools 2.4.5 CRAN (R 4.2.3)
## 7 digest 0.6.31 CRAN (R 4.2.2)
## 8 ellipsis 0.3.2 CRAN (R 4.2.2)
## 9 evaluate 0.20 CRAN (R 4.2.2)
## 10 fastmap 1.1.0 CRAN (R 4.2.2)
## # ℹ 40 more rows