se realizo un ensayo observar la efectividad de 8 insecticidas en la reduccion del da;o foliar en determinado cultivo para lo cual se tomo como variable respuesta el porcentaje de da;o foliar observado 8 despues de la aplicacion de los tratamientos se considero la ubicacion espacial de cada unidad de muestreo como un factor que podia afectar la respuesta ; para lo cual se establecieron latitud y longitud como dos factores de bloqueo ##datos iniciales
resp= c(16.6,15.9,17.1,17.7,17.4,16.5,15.8,16.9,16.4,16.8,15.9,17.0,16.0,16.9,17.4,15.8,19.2,16.3,16.8,16.9,15.9,17.4,19.0,16.6,16.0,19.2,15.9,16.5,15.8,17.6,15.8,17.6,20.3,17.1,17.6,18.2,17.8,17.8,17.8,18.4,17.5,19.4,15.7,18.9,18.4,18.1,15.9,17.4,17.1,15.8,17.1,18.3,18.3,15.7,19.6,18.3)
trat= c('d','f','b','a','c','e','g','h','e','c','g','b','f','a','c','g','h','e','d','a','f','b','a','d','f','h','g','e','e','h','g','c','a','d','b','a','b','f','d','e','c','h','g','c','e','h','f','b','d','f','d','a','b','g','h','c')
lat= gl(7, 1, 56, c(1,2,3,4,5,6,7))
long= gl(8,7, 56, c(1,2,3,4,5,6,7,8))
DF= data.frame(resp,trat,lat,long)
DF
## resp trat lat long
## 1 16.6 d 1 1
## 2 15.9 f 2 1
## 3 17.1 b 3 1
## 4 17.7 a 4 1
## 5 17.4 c 5 1
## 6 16.5 e 6 1
## 7 15.8 g 7 1
## 8 16.9 h 1 2
## 9 16.4 e 2 2
## 10 16.8 c 3 2
## 11 15.9 g 4 2
## 12 17.0 b 5 2
## 13 16.0 f 6 2
## 14 16.9 a 7 2
## 15 17.4 c 1 3
## 16 15.8 g 2 3
## 17 19.2 h 3 3
## 18 16.3 e 4 3
## 19 16.8 d 5 3
## 20 16.9 a 6 3
## 21 15.9 f 7 3
## 22 17.4 b 1 4
## 23 19.0 a 2 4
## 24 16.6 d 3 4
## 25 16.0 f 4 4
## 26 19.2 h 5 4
## 27 15.9 g 6 4
## 28 16.5 e 7 4
## 29 15.8 e 1 5
## 30 17.6 h 2 5
## 31 15.8 g 3 5
## 32 17.6 c 4 5
## 33 20.3 a 5 5
## 34 17.1 d 6 5
## 35 17.6 b 7 5
## 36 18.2 a 1 6
## 37 17.8 b 2 6
## 38 17.8 f 3 6
## 39 17.8 d 4 6
## 40 18.4 e 5 6
## 41 17.5 c 6 6
## 42 19.4 h 7 6
## 43 15.7 g 1 7
## 44 18.9 c 2 7
## 45 18.4 e 3 7
## 46 18.1 h 4 7
## 47 15.9 f 5 7
## 48 17.4 b 6 7
## 49 17.1 d 7 7
## 50 15.8 f 1 8
## 51 17.1 d 2 8
## 52 18.3 a 3 8
## 53 18.3 b 4 8
## 54 15.7 g 5 8
## 55 19.6 h 6 8
## 56 18.3 c 7 8
b<-8#columnas
k<-7#filas
##se establece entonces un arbol de jerarquia de los datos
library(collapsibleTree)
collapsibleTreeSummary(DF, hierarchy = c('long','lat','trat','resp'))
##analisis descriptivo de los datos
medias = tapply(DF$resp, DF$trat, mean); medias
## a b c d e f g h
## 18.18571 17.51429 17.70000 17.01429 16.90000 16.18571 15.80000 18.57143
boxplot(DF$resp~DF$trat,main='varianza y tendencia central por tratamiento')
points(1:8, medias, pch = 15, col='blue')
en este grafico se puede evidenciar diferencias en la varianza de los tratamientos y en las tendencias centrales de los mismos
library(ggplot2)
ggplot(DF) + aes(trat,resp)+ geom_point()+ facet_grid(long~trat)
ggplot(DF) + aes(trat,resp)+ geom_point()+ facet_grid(lat~trat)
se puede evideciar en estos graficos el comportamiento de los tratamientos en cada factor de bloqueo, se evidencia tambien el caracter que define el cuadrado de youden ya que para cada nivel de logitud hace falta un tratamiento a evaluar
boxpbloq=boxplot(DF$resp~DF$long, main='Distribución de la varianza por niveles de long')
boxpbloq=boxplot(DF$resp~DF$lat, main='Distribución de la varianza por niveles de lat')
en estos dos graficos se puede evidenciar la varianza de la respuesta en los niveles de cada factor de bloqueo de los cuales se puede notar que la varianza en los niveles de latitud es homogenea lo cual puede indicar una baja eficiencia de bloqueo
med_trat = tapply(DF$resp, DF$trat, mean)
barplot(med_trat, ylim = c(0,20),
main='Distribución de la respuesta por tratamiento')
abline(h=mean(DF$resp))
med_lat = tapply(DF$resp, DF$lat, mean)
barplot(med_lat, ylim = c(0,20),
main='Distribución de la respuesta por bloque lat')
abline(h=mean(DF$resp))
med_long = tapply(DF$resp, DF$long, mean)
barplot(med_long, ylim = c(0,20),
main='Distribución de la respuesta por bloque long')
abline(h=mean(DF$resp))
nuevamente se evidencia homogeneidad en los niveles de latitud como factor de bloqueo se puede ver que los tratamientos f y g presentan la tendencia central mas baja que la media total lo cual los coloca como mejores tratamientos teniendo en cuenta que el objetivo es minimizar el da;o foliar
#MODELO ESTABLECIDO \[y_{jl} = \mu + \sum_{i=1}^v{f_{jl}^{(i)} \alpha_i}+ \beta_j+\gamma_l+\epsilon_{jl}\] \[y_{jl} = \mu + f_{jl}^{(1)} \alpha_1+ f_{jl}^{(2)} \alpha_2+ f_{jl}^{(3)} \alpha_3+ f_{jl}^{(4)} \alpha_4+ f_{jl}^{(5)} \alpha_5+ f_{jl}^{(6)} \alpha_6+ f_{jl}^{(7)} \alpha_7+ f_{jl}^{(8)} \alpha_8+ \beta_j+\gamma_l+\epsilon_{jl}\] #CORREMOS ENTONCES EL ANALISIS DE VARIANZA PERTINENTE
N<-xtabs(~trat + long, data <- DF);N
## long
## trat 1 2 3 4 5 6 7 8
## a 1 1 1 1 1 1 0 1
## b 1 1 0 1 1 1 1 1
## c 1 1 1 0 1 1 1 1
## d 1 0 1 1 1 1 1 1
## e 1 1 1 1 1 1 1 0
## f 1 1 1 1 0 1 1 1
## g 1 1 1 1 1 0 1 1
## h 0 1 1 1 1 1 1 1
v<-nlevels(trat);
n<-b*k;
T1<-aggregate(DF$resp, by<-list(trat<-DF$trat),FUN<-sum);
Tt<-matrix(T1$x,v,1);# totales de Trat
## Warning in matrix(T1$x, v, 1): data length exceeds size of matrix
T2<-aggregate(DF$resp, by<-list(lat<-DF$lat),FUN<-sum);
Tr<-matrix(T2$x,k,1);# totales filas
T3<-aggregate(DF$resp, by<-list(long<-DF$long),FUN<-sum);
Tc<-matrix(T3$x,b,1)#totales Columna
i<-1:k
j<-1:b
if((b==k)&&(N[i,j]==1)){
print("dado el diseño cuadrado latino");
#si es un DCL uno corre el código antes considerado.
}else{
x<-0;z<-0;
if(v>=2 && k<v)
{
A<-N%*%t(N);
for(i in 2:v){
x1<-A[1,1]-A[i,i];
x<-x+abs(x1);
}
sum1<-sum(x);sum1
for(i in 1:v){
for(j in 1:v){
if(i!=j){
x2<-A[1,2]-A[i,j];
z<-z+abs(x2)}
}}
sum2<-sum(z);
if(sum1==0 && sum2==0){
r<-A[1,1];
lambda<-A[1,2];
cat("dado el diseño cuadrado de Youden \n con r y lambda respectivamente")
print(r);
print(lambda);
#se define el vector columna de k entradas todas en 1
ek<-c(matrix(rep(1,k),k,1));
Dk<-diag(k)-(ek%*%t(ek))/v;
Q<-Tt-(N%*%Tc)/k;
alpha_hat<-(k/(lambda*v))*Q;
beta_hat<-(Tc/k)-(t(N)%*%Q)/(lambda*v);
gamma_hat<-Tr/v;
print("Las estimaciones son");
print("mu_hat");
print("0");
print("alpha_hat");
print(alpha_hat);
print("beta_hat")
print(beta_hat)
print("gamma_hat")
print(gamma_hat);
#probando hipótesis H_alpha, H_beta y H_gamma
myfit <- lm(resp~trat+lat+long, DF);
anova(myfit);
}}}
ya que presenta un error en el tama;o de la matriz se corre solo el analisis de varianza
mod1 = lm(resp~trat+lat+long, DF)
anova(mod1)
## Analysis of Variance Table
##
## Response: resp
## Df Sum Sq Mean Sq F value Pr(>F)
## trat 7 44.137 6.3053 13.2943 3.205e-08 ***
## lat 6 3.827 0.6378 1.3448 0.26402
## long 7 9.542 1.3631 2.8740 0.01763 *
## Residuals 35 16.600 0.4743
## ---
## Signif. codes: 0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
de acuerdo con el resultado obtenido en el analisis de varianza los datos dan evidencia con un nivel de significancia menor que 0.05 en contra de la hipotesis nula entonces se procede a hacer el test de duncan y de tukey con el objetivo de comparar los tratamientos por pares
library(agricolae)
agricolae::duncan.test(mod1,'trat', console = T)
##
## Study: mod1 ~ "trat"
##
## Duncan's new multiple range test
## for resp
##
## Mean Square Error: 0.4742857
##
## trat, means
##
## resp std r Min Max
## a 18.18571 1.20336829 7 16.9 20.3
## b 17.51429 0.44131837 7 17.0 18.3
## c 17.70000 0.68799225 7 16.8 18.9
## d 17.01429 0.41403934 7 16.6 17.8
## e 16.90000 1.05198226 7 15.8 18.4
## f 16.18571 0.71514234 7 15.8 17.8
## g 15.80000 0.08164966 7 15.7 15.9
## h 18.57143 1.04037539 7 16.9 19.6
##
## Alpha: 0.05 ; DF Error: 35
##
## Critical Range
## 2 3 4 5 6 7 8
## 0.7473175 0.7855956 0.8105396 0.8284457 0.8420478 0.8527707 0.8614466
##
## Means with the same letter are not significantly different.
##
## resp groups
## h 18.57143 a
## a 18.18571 ab
## c 17.70000 bc
## b 17.51429 bc
## d 17.01429 c
## e 16.90000 cd
## f 16.18571 de
## g 15.80000 e
se establece entonces el tratamiento g como el mas efectivo en la reduccion del da;o foliar causado por la plaga
MOD= aov(resp~ trat+lat+long , DF)
summary(MOD)
## Df Sum Sq Mean Sq F value Pr(>F)
## trat 7 44.14 6.305 13.294 3.21e-08 ***
## lat 6 3.83 0.638 1.345 0.2640
## long 7 9.54 1.363 2.874 0.0176 *
## Residuals 35 16.60 0.474
## ---
## Signif. codes: 0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
TukeyHSD(MOD,'trat')
## Tukey multiple comparisons of means
## 95% family-wise confidence level
##
## Fit: aov(formula = resp ~ trat + lat + long, data = DF)
##
## $trat
## diff lwr upr p adj
## b-a -0.6714286 -1.8570921 0.51423497 0.6088571
## c-a -0.4857143 -1.6713778 0.69994925 0.8852514
## d-a -1.1714286 -2.3570921 0.01423497 0.0547690
## e-a -1.2857143 -2.4713778 -0.10005075 0.0257245
## f-a -2.0000000 -3.1856635 -0.81433646 0.0001081
## g-a -2.3857143 -3.5713778 -1.20005075 0.0000047
## h-a 0.3857143 -0.7999493 1.57137783 0.9632174
## c-b 0.1857143 -0.9999493 1.37137783 0.9995643
## d-b -0.5000000 -1.6856635 0.68566354 0.8694297
## e-b -0.6142857 -1.7999493 0.57137783 0.7063155
## f-b -1.3285714 -2.5142350 -0.14290789 0.0191256
## g-b -1.7142857 -2.8999493 -0.52862217 0.0010634
## h-b 1.0571429 -0.1285207 2.24280640 0.1097877
## d-c -0.6857143 -1.8713778 0.49994925 0.5839231
## e-c -0.8000000 -1.9856635 0.38566354 0.3914267
## f-c -1.5142857 -2.6999493 -0.32862217 0.0049599
## g-c -1.9000000 -3.0856635 -0.71433646 0.0002424
## h-c 0.8714286 -0.3142350 2.05709211 0.2883566
## e-d -0.1142857 -1.2999493 1.07137783 0.9999833
## f-d -0.8285714 -2.0142350 0.35709211 0.3480778
## g-d -1.2142857 -2.3999493 -0.02862217 0.0415179
## h-d 1.5571429 0.3714793 2.74280640 0.0035881
## f-e -0.7142857 -1.8999493 0.47137783 0.5340963
## g-e -1.1000000 -2.2856635 0.08566354 0.0852560
## h-e 1.6714286 0.4857650 2.85709211 0.0014874
## g-f -0.3857143 -1.5713778 0.79994925 0.9632174
## h-f 2.3857143 1.2000507 3.57137783 0.0000047
## h-g 2.7714286 1.5857650 3.95709211 0.0000002
se considera nuevamente el tratamiento g como el de menor media y por lo tanto el mas efectivo en la reduccion del da;o
#normalidad de los residuales
residuals=MOD$residuals
shapiro.test(residuals)
##
## Shapiro-Wilk normality test
##
## data: residuals
## W = 0.98005, p-value = 0.478
plot(residuals)
hist(residuals)
se cumple el primer supuesto de normalidad lo cual se puede observar en el histograma y grafico de dispersion #igualdad de varianzas
bartlett.test(residuals~ DF$trat)
##
## Bartlett test of homogeneity of variances
##
## data: residuals by DF$trat
## Bartlett's K-squared = 6.8811, df = 7, p-value = 0.4414
#conclusion una ves confirmados los dos supuestos necesarios para la validez del analisis de varianza se concluye; que el insecticida ‘g’ presenta entonces la mayor efectividad en la reduccion de da;o foliar para el cultivo tambien es importante concluir que teniendo en cuenta los valores F value para los factores de bloqueo, los dos factores de bloqueo tuvieron eficiencia positiva aunque como fue observado en las graficas la eficiencia del factor de bloqueo latitud fue muy cercana a 1 porlo tanto aunque positiva, fue muy leve