Diseños Agricolae
DISEÑO CUADRADO LATINO
En este diseño se controlan dos factores de bloque y se estudia un factor de tratamientos, por lo que se tienen cuatro fuentes de variabilidad que pueden afectar la respuesta observada;éstas son: los tratamientos,el factor de bloque I (columnas),el factor de bloque II (renglones) y el error aleatorio.
Los siguientes datos corresponden a los rendimientos en ton/ha de cuatro líneas endogámicas de maíz
library(readxl)
Datos_lsd <- read_excel("C:/Users/PERSONAL/Downloads/Datos lsd.xlsx")
datos1<-Datos_lsd
datos1
## # A tibble: 16 x 5
## Rep. Hilera Columna Trat Rend
## <dbl> <dbl> <dbl> <chr> <dbl>
## 1 1 1 1 B 1.64
## 2 1 2 1 C 1.48
## 3 1 3 1 A 1.67
## 4 1 4 1 D 1.56
## 5 2 1 2 D 1.21
## 6 2 2 2 A 1.18
## 7 2 3 2 C 0.71
## 8 2 4 2 B 1.29
## 9 3 1 3 C 1.42
## 10 3 2 3 D 1.4
## 11 3 3 3 B 1.66
## 12 3 4 3 A 1.66
## 13 4 1 4 A 1.34
## 14 4 2 4 B 1.29
## 15 4 3 4 D 1.18
## 16 4 4 4 C 0.66
Factor: líneas endogámicas de maíz Niveles T1 = A T2 = B T3 = C T4 = D fila= Gradiente de fertilidad de norte a sur columna= Gradiente de fertilidad de oeste a este variable= Rendimiento en Toneladas
trata<-factor(datos1$Trat)
f_oes_es<-factor(datos1$Columna)
f_nor_sur<-factor(datos1$Hilera)
Análisis de varianza
mod1<-lm(datos1$Rend~trata+f_nor_sur+f_oes_es)
anova_1<-aov(mod1)
summary(anova_1)
## Df Sum Sq Mean Sq F value Pr(>F)
## trata 3 0.4268 0.14228 6.588 0.02509 *
## f_nor_sur 3 0.0302 0.01005 0.465 0.71697
## f_oes_es 3 0.8273 0.27578 12.769 0.00515 **
## Residuals 6 0.1296 0.02160
## ---
## Signif. codes: 0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
Se puede decir no existe evidencia estadistica que diga el gradiente de fertilidad de norte a sur genera diferentes valores en el rendimiento Mientras que el gradiente de fertilidad de oeste a este y el tratamiento hay diferencia significativa, además de que en ambos casos el valor F>1 indica que la variabilidad de los trtamientos es mayor que la de las repeticiones lo cual es un buen indicador
Se analizan las diferencias por medio de latin square design f_oes_es
library(agricolae)
## Warning: package 'agricolae' was built under R version 4.0.3
LSD_f_oes_es<-LSD.test(y=anova_1,trt = "trata",group = T, console = T)
##
## Study: anova_1 ~ "trata"
##
## LSD t Test for datos1$Rend
##
## Mean Square Error: 0.0215974
##
## trata, means and individual ( 95 %) CI
##
## datos1.Rend std r LCL UCL Min Max
## A 1.46375 0.2386900 4 1.2839503 1.64355 1.185 1.670
## B 1.47125 0.2095382 4 1.2914503 1.65105 1.290 1.665
## C 1.06750 0.4426153 4 0.8877003 1.24730 0.660 1.475
## D 1.33875 0.1795538 4 1.1589503 1.51855 1.180 1.565
##
## Alpha: 0.05 ; DF Error: 6
## Critical Value of t: 2.446912
##
## least Significant Difference: 0.2542752
##
## Treatments with the same letter are not significantly different.
##
## datos1$Rend groups
## B 1.47125 a
## A 1.46375 a
## D 1.33875 a
## C 1.06750 b
LSD_f_oes_es
## $statistics
## MSerror Df Mean CV t.value LSD
## 0.0215974 6 1.335312 11.0057 2.446912 0.2542752
##
## $parameters
## test p.ajusted name.t ntr alpha
## Fisher-LSD none trata 4 0.05
##
## $means
## datos1$Rend std r LCL UCL Min Max Q25 Q50 Q75
## A 1.46375 0.2386900 4 1.2839503 1.64355 1.185 1.670 1.3050 1.5000 1.65875
## B 1.47125 0.2095382 4 1.2914503 1.65105 1.290 1.665 1.2900 1.4650 1.64625
## C 1.06750 0.4426153 4 0.8877003 1.24730 0.660 1.475 0.6975 1.0675 1.43750
## D 1.33875 0.1795538 4 1.1589503 1.51855 1.180 1.565 1.2025 1.3050 1.44125
##
## $comparison
## NULL
##
## $groups
## datos1$Rend groups
## B 1.47125 a
## A 1.46375 a
## D 1.33875 a
## C 1.06750 b
##
## attr(,"class")
## [1] "group"
El tratamiento C es diferente a los tratamientos A,B y D que se encuentran dentro de un mismo grupo y generan el mismo nivel de rendimiento, es decir estadisticamente presentan la misma media, entonces para escoger cuál es mejor para sembrar se podrían considerar otros factores como su adaptación a determina do clima, respuesta a plagas, enfermedades determinadas etc, y que generen menos costos de manejo en el cultivo.
library(agricolae)
bar.group(x=LSD_f_oes_es$groups, horiz = T, col="orange", xlab="rendimiento ton/ha", ylab="tratamientos")
library(agricolae)
LSD_trt<-LSD.test(y=anova_1, trt="f_oes_es",group= T, console=T)
##
## Study: anova_1 ~ "f_oes_es"
##
## LSD t Test for datos1$Rend
##
## Mean Square Error: 0.0215974
##
## f_oes_es, means and individual ( 95 %) CI
##
## datos1.Rend std r LCL UCL Min Max
## 1 1.58750 0.08703448 4 1.4077003 1.76730 1.475 1.670
## 2 1.09875 0.26300745 4 0.9189503 1.27855 0.710 1.290
## 3 1.53625 0.14331637 4 1.3564503 1.71605 1.400 1.665
## 4 1.11875 0.31343194 4 0.9389503 1.29855 0.660 1.345
##
## Alpha: 0.05 ; DF Error: 6
## Critical Value of t: 2.446912
##
## least Significant Difference: 0.2542752
##
## Treatments with the same letter are not significantly different.
##
## datos1$Rend groups
## 1 1.58750 a
## 3 1.53625 a
## 4 1.11875 b
## 2 1.09875 b
LSD_trt
## $statistics
## MSerror Df Mean CV t.value LSD
## 0.0215974 6 1.335312 11.0057 2.446912 0.2542752
##
## $parameters
## test p.ajusted name.t ntr alpha
## Fisher-LSD none f_oes_es 4 0.05
##
## $means
## datos1$Rend std r LCL UCL Min Max Q25 Q50 Q75
## 1 1.58750 0.08703448 4 1.4077003 1.76730 1.475 1.670 1.54250 1.6025 1.64750
## 2 1.09875 0.26300745 4 0.9189503 1.27855 0.710 1.290 1.06625 1.1975 1.23000
## 3 1.53625 0.14331637 4 1.3564503 1.71605 1.400 1.665 1.41875 1.5400 1.65750
## 4 1.11875 0.31343194 4 0.9389503 1.29855 0.660 1.345 1.05000 1.2350 1.30375
##
## $comparison
## NULL
##
## $groups
## datos1$Rend groups
## 1 1.58750 a
## 3 1.53625 a
## 4 1.11875 b
## 2 1.09875 b
##
## attr(,"class")
## [1] "group"
ANÁLISIS DE VARIANZA NO PARAMÉTRICA KRUSKAL WALLIS TEST
La prueba de Kruskal-Wallis es una prueba no paramétrica para comparar tres o más muestras. Se utiliza para probar la hipótesis nula de que todas las poblaciones tienen las mismas funciones de distribución en contra de la hipótesis alternativa de que al menos dos de las muestras, sólo se diferencian con respecto a la ubicación (mediana). Es el análogo a la prueba de F utilizada en el análisis de la varianza. Si bien el análisis de la varianza depende de la suposición de que todas las poblaciones que se comparan tienen una distribución normal, la prueba de Kruskal-Wallis no impone ninguna restricción en la comparación. Esta prueba es una extensión de la prueba de WilcoxonMann-Whitney ya que en lugar de dos muestras es posible usar tres o más muestras en la prueba.
se recogen los datos de un experimento en el que plantas jóvenes de olivo cultivadas en macetas de 2 L de capacidad en condiciones de invernadero, se sometieron durante un período de tiempo a la aplicación de 0, 50, 100 o 150 ppm de nitrógeno en el agua de riego, junto a una solución con los demás elementos nutritivos. Transcurrido un tiempo el contenido en nitrógeno de las plantas varió según el tratamiento recibido y, cuando esto sucedió, todas las plantas recibieron una aplicación adicional de nitrógeno vía foliar al objeto de estudiar si la eficiencia del uso del nitrógeno depende o no del estado nutritivo de las plantas. Se utilizaron 10 plantas por tratamiento.
a)Los datos son independientes
library(readxl)
Datos_kruskal <- read_excel("C:/Users/PERSONAL/Downloads/Datos kruskal.xlsx")
dataf_kw<-Datos_kruskal
dataf_kw
## # A tibble: 10 x 4
## `cero ppm` `cincuenta ppm` `cien ppm` `ciencincuenta ppm`
## <dbl> <dbl> <dbl> <dbl>
## 1 200 100 250 150
## 2 200 400 700 280
## 3 300 200 400 200
## 4 100 100 400 200
## 5 100 100 200 200
## 6 200 150 400 250
## 7 200 100 300 200
## 8 100 50 430 200
## 9 230 130 430 330
## 10 300 280 400 400
plotkw<-boxplot(dataf_kw,xlab= "Tratamiento",ylab="Contenido de N(mg/planta)", main = "Contenido de nitrógeno en plantas jóvenes de olivo después de la aplicación adicional de nitrógeno vía foliar",col = c("orange3", "yellow3", "green3", "blue"))
Por lo visto con el tercer tratamiento las plantas presentan más nitrogeno
b)A continuación se evidencia que los datos tomados no siguen una distribución normal
norm_0<-qqnorm(dataf_kw$`cero ppm`,main="Distribución 0ppm")
norm_0
## $x
## [1] -0.3754618 -0.1225808 1.0004905 -1.5466353 -1.0004905 0.1225808
## [7] 0.3754618 -0.6554235 0.6554235 1.5466353
##
## $y
## [1] 200 200 300 100 100 200 200 100 230 300
norm1_0<-qqline(dataf_kw$`cero ppm`, col="blue")
norm1_0
## NULL
norm_50<-qqnorm(dataf_kw$`cincuenta ppm`,main="Normalidad 50ppm")
norm_50
## $x
## [1] -1.0004905 1.5466353 0.6554235 -0.6554235 -0.3754618 0.3754618
## [7] -0.1225808 -1.5466353 0.1225808 1.0004905
##
## $y
## [1] 100 400 200 100 100 150 100 50 130 280
norm1_50<-qqline(dataf_kw$`cincuenta ppm`,col="red")
norm1_50
## NULL
norm_100<-qqnorm(dataf_kw$`cien ppm`,main="Normalidad 100ppm")
norm_100
## $x
## [1] -1.0004905 1.5466353 -0.3754618 -0.1225808 -1.5466353 0.1225808
## [7] -0.6554235 0.6554235 1.0004905 0.3754618
##
## $y
## [1] 250 700 400 400 200 400 300 430 430 400
norm1_100<-qqline(dataf_kw$`cien ppm`,col="yellow")
norm1_100
## NULL
norm_150<-qqnorm(dataf_kw$`ciencincuenta ppm`,main="Normalidad 150ppm")
norm_150
## $x
## [1] -1.5466353 0.6554235 -1.0004905 -0.6554235 -0.3754618 0.3754618
## [7] -0.1225808 0.1225808 1.0004905 1.5466353
##
## $y
## [1] 150 280 200 200 200 250 200 200 330 400
norm1_150<-qqline(dataf_kw$`ciencincuenta ppm`,col="green")
norm1_150
## NULL
library(readxl)
Datos_kruskal1 <- read_excel("C:/Users/PERSONAL/Downloads/Datos kruskal1.xlsx")
dataf1_kw<-Datos_kruskal1
dataf1_kw
## # A tibble: 40 x 2
## `Contenido N (mg/planta)` Tratamiento
## <dbl> <chr>
## 1 200 0ppm
## 2 200 0ppm
## 3 300 0ppm
## 4 100 0ppm
## 5 100 0ppm
## 6 200 0ppm
## 7 200 0ppm
## 8 100 0ppm
## 9 230 0ppm
## 10 300 0ppm
## # ... with 30 more rows
kruswtest<-kruskal.test(dataf1_kw$`Contenido N (mg/planta)`~dataf1_kw$Tratamiento)
kruswtest
##
## Kruskal-Wallis rank sum test
##
## data: dataf1_kw$`Contenido N (mg/planta)` by dataf1_kw$Tratamiento
## Kruskal-Wallis chi-squared = 17.901, df = 3, p-value = 0.000461
Teniendo en cuenta el p-valor<0.05 se rechaza la hipotesis nula,concluyendo que existen diferencias significativas entre los tratamientos, la variable dependiente (que puede entenderse como la eficiencia en toma de N en las plantas) cambia con la variación de los tratamientos.
DISEÑO GRECOLATINO
Con este diseño se controlan tres factores de bloque, además del factor de tratamientos. Las letras latinas denotan los tratamientos y las griegas para nombrar los niveles del tercer factor de bloque. Para este caso, las letras griegas van a ser denotadas con los números: 1,2,3 y 4 respectivamente.
Para comprobar el rendimiento en ton/ha de un cultivo de maíz en cinco tiempos, se consideran cinco variedades de maiz a las que se les aplica cinco concentraciones de fertilizante a cinco temperaturas distintas, de manera que cada variedad de maíz con cada concentración de fertilizante y cada temperatura se evaluan a un tiempo. Tanto la asignación de los tiempos a las variedades de maiz, como las concentraciones de fertilizante, y las temperaturas, se hizo de forma aleatoria. En este estudio el científico considera que tanto las variedades de maíz, las concentraciones y las temperaturas pueden influir en el rendimiento del proceso, por lo que los considera como variables de bloque cada una con cinco niveles y decide plantear un diseño por cuadrados greco-latinos.
library(readxl)
Datos_graeco <- read_excel("C:/Users/PERSONAL/Downloads/Datos graeco.xlsx")
View(Datos_graeco)
datosg_2<-Datos_graeco
datosg_2
## # A tibble: 25 x 5
## rendimiento variedad concentraciones tiemp_evaluación temperatura
## <dbl> <dbl> <chr> <chr> <chr>
## 1 26 1 1 A Z
## 2 21 1 2 B Y
## 3 19 1 3 C X
## 4 13 1 4 D W
## 5 21 1 5 E V
## 6 22 2 1 B X
## 7 26 2 2 C W
## 8 24 2 3 D V
## 9 16 2 4 E Z
## 10 20 2 5 A Y
## # ... with 15 more rows
Variable respuesta: Rendimiento Factor: Tiempos de evaluación que tiene cinco niveles. Es un factor de efectos fijos ya que viene decidido que niveles concretos se van a utilizar. Bloques: variedades, Concentraciones y Temperaturas, cada uno con cinco niveles y de efectos fijos. Tamaño del experimento: Número total de observaciones (25).
Factores
vari <- factor(Datos_graeco$variedad)
temp <- factor(Datos_graeco$temperatura)
tiemp_eva <- factor(Datos_graeco$tiemp_evaluación)
concen <- factor(Datos_graeco$concentraciones)
#Analisis de varianza
mod2 <- aov(datosg_2$rendimiento~ vari + concen + tiemp_eva + temp, data=datosg_2)
summary(mod2)
## Df Sum Sq Mean Sq F value Pr(>F)
## vari 4 9.76 2.44 0.374 0.82060
## concen 5 250.66 50.13 7.683 0.00921 **
## tiemp_eva 4 204.67 51.17 7.842 0.01002 *
## temp 4 59.79 14.95 2.291 0.15952
## Residuals 7 45.67 6.52
## ---
## Signif. codes: 0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
No hay diferencia estadistica entre la temperatura y variables, por lo tanto estas no inciden en el rendimiento del cultivo. La concentracion y el tiempo de evaluación presentan significancia por lo que se puede afirmar que inciden en el rendimiento.
Test de Duncan para la concentración
dungre<-duncan.test(mod2, "concen" , group = T)
dungre
## $statistics
## MSerror Df Mean CV
## 6.525 7 21.24 12.0264
##
## $parameters
## test name.t ntr alpha
## Duncan concen 6 0.05
##
## $duncan
## NULL
##
## $means
## datosg_2$rendimiento std r Min Max Q25 Q50 Q75
## 1 26.8 3.834058 5 22 32 25.0 26.0 29.0
## 2 21.2 4.868265 5 15 26 18.0 21.0 26.0
## 3 19.0 3.535534 5 14 24 19.0 19.0 19.0
## 4 13.0 NA 1 13 13 13.0 13.0 13.0
## 4 19.5 3.872983 4 16 25 17.5 18.5 20.5
## 5 21.0 3.937004 5 16 27 20.0 21.0 21.0
##
## $comparison
## NULL
##
## $groups
## datosg_2$rendimiento groups
## 1 26.8 a
## 2 21.2 b
## 5 21.0 b
## 4 19.5 b
## 3 19.0 b
## 4 13.0 c
##
## attr(,"class")
## [1] "group"
El mayor rendimiento se presenta con la concentración 1 de fertilizante
Tukey para los tiempos de evaluación
tukey<- TukeyHSD(mod2,"tiemp_eva", ordered=T)
tukey
## Tukey multiple comparisons of means
## 95% family-wise confidence level
## factor levels have been ordered
##
## Fit: aov(formula = datosg_2$rendimiento ~ vari + concen + tiemp_eva + temp, data = datosg_2)
##
## $tiemp_eva
## diff lwr upr p adj
## E -A 3.552714e-15 -5.78045654 5.780457 1.0000000
## B -A 2.000000e-01 -5.58045654 5.980457 0.9999323
## D -A 5.237500e+00 -0.54295654 11.017957 0.0761548
## C -A 6.000000e+00 0.21954346 11.780457 0.0422770
## B -E 2.000000e-01 -5.58045654 5.980457 0.9999323
## D -E 5.237500e+00 -0.54295654 11.017957 0.0761548
## C -E 6.000000e+00 0.21954346 11.780457 0.0422770
## D -B 5.037500e+00 -0.74295654 10.817957 0.0890546
## C -B 5.800000e+00 0.01954346 11.580457 0.0492557
## C -D 7.625000e-01 -5.01795654 6.542957 0.9876658
Hay diferencias entre las temperaturas C-A(pvalor=0.042), C-A(pvalor=0.042) y C-B(p-valor=0.049)
#1.Analisis de varianza para diseño de bloques incompletos balanceados ##1.1 Ejemplo: Vinilacion de metilglucosido ##La adicion de acetileno a un metilglucosido en presencia de una base, a alta presion produce varios eteres monovinilicos ##
##Objetivo: Informacion sobre el efecto de la presion en el porcentaje de conversion del metilglucosido en isomeros de monovinil
##Diseño de tratamientos: Se escogen 5 presiones dentro del intervalo que producia la conversion maxima (250,325,400,475 y 550 psi): 5 tratamientos
library(agricolae)
run<-gl(10,3)
## En el diseño se presentan 10 corridas, cada uno con 3 tres unidades experimentales (camaras presurizadas)
psi<-c(250,325,475,250,475,550,325,400,550,400,475,550,325,475,550,
250,400,475,250,325,400,250,400,550,250,325,550,325,400,475)
## Variable presion, presenta las presiones en el orden que se presentan los porcentajes de conversion (monovinyl), entonces se presentan 30 datos (6 replicas por los 5 tratamientos)
monovinyl<-c(16,18,32,19,46,45,26,39,61,21,35,55,19,47,48,20,33,31,13,13,34,21,
30,52,24,10,50,24,31,37)
##Para la prueba BIB se tienen 10 bloqueos, 5 tratamientos, 30 para un total de observaciones. ##Para el analisis de varianza se presentan los grados de libertad ((10-1),(5-1),(30-5-10+1)), suma de cuadrados para (bloqueo, tratamientos y residuales o error), cuadrados medios (suma de cuadrados/grados de libertad), valor F sobre las medias de tratamientos donde 29.90 es el resultado de (cuadrado medio de tratamiento/cuadrado medio de residuales o error). El coeficiente de variacion fue de 17.5 % el cual representa la razon entre la desviacion estandar y la media de los datos
##En esta grafica se presentan las medias de conversion segun las presiones con sus barras de error respectivas. Claramente se evidencia que a mayor presion hay mayor conversion del metilglucosido en isomeros de monovinil
out<-BIB.test(run,psi,monovinyl,test="waller",group=FALSE)
bar.err(out$means,variation="range",ylim=c(0,60),bar=FALSE,col=0)
##En los data.frame se presentan las medias porcentuales de conversiones segun la presion,los minimos cuadrados de las medias(mean.adj), el error estandar para estimar la media de tratamiento la cual es igual para todos los tratamientos, cantidad de replicas por tratamiento (r), desviaciones estandar por presion y las valores maximo y minimo de conversion.
out<-BIB.test(run,psi,monovinyl,test="waller",group=TRUE)
out<-BIB.test(run,psi,monovinyl,test="tukey",group=TRUE,console=TRUE)
##
## ANALYSIS BIB: monovinyl
## Class level information
##
## Block: 1 2 3 4 5 6 7 8 9 10
## Trt : 250 325 475 550 400
##
## Number of observations: 30
##
## Analysis of Variance Table
##
## Response: monovinyl
## Df Sum Sq Mean Sq F value Pr(>F)
## block.unadj 9 1394.7 154.96 5.0249 0.002529 **
## trt.adj 4 3688.6 922.14 29.9020 3.026e-07 ***
## Residuals 16 493.4 30.84
## ---
## Signif. codes: 0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
##
## coefficient of variation: 17.5 %
## monovinyl Means: 31.66667
##
## psi, statistics
##
## monovinyl mean.adj SE r std Min Max
## 250 18.83333 20.46667 2.441759 6 3.868678 13 24
## 325 18.33333 17.53333 2.441759 6 6.153590 10 26
## 400 31.33333 30.86667 2.441759 6 5.955390 21 39
## 475 38.00000 38.80000 2.441759 6 6.928203 31 47
## 550 51.83333 50.66667 2.441759 6 5.636193 45 61
##
## Tukey
## Alpha : 0.05
## Std.err : 2.483501
## HSD : 10.76024
## Parameters BIB
## Lambda : 3
## treatmeans : 5
## Block size : 3
## Blocks : 10
## Replication: 6
##
## Efficiency factor 0.8333333
##
## <<< Book >>>
##
## Comparison between treatments means
## Difference pvalue sig.
## 250 - 325 2.933333 0.9157
## 250 - 400 -10.400000 0.0607 .
## 250 - 475 -18.333333 0.0007 ***
## 250 - 550 -30.200000 0.0000 ***
## 325 - 400 -13.333333 0.0118 *
## 325 - 475 -21.266667 0.0001 ***
## 325 - 550 -33.133333 0.0000 ***
## 400 - 475 -7.933333 0.2087
## 400 - 550 -19.800000 0.0003 ***
## 475 - 550 -11.866667 0.0272 *
##
## Treatments with the same letter are not significantly different.
##
## monovinyl groups
## 550 50.66667 a
## 475 38.80000 b
## 400 30.86667 bc
## 250 20.46667 cd
## 325 17.53333 d
out<-BIB.test(run,psi,monovinyl,test="tukey",group=FALSE,console=TRUE)
##
## ANALYSIS BIB: monovinyl
## Class level information
##
## Block: 1 2 3 4 5 6 7 8 9 10
## Trt : 250 325 475 550 400
##
## Number of observations: 30
##
## Analysis of Variance Table
##
## Response: monovinyl
## Df Sum Sq Mean Sq F value Pr(>F)
## block.unadj 9 1394.7 154.96 5.0249 0.002529 **
## trt.adj 4 3688.6 922.14 29.9020 3.026e-07 ***
## Residuals 16 493.4 30.84
## ---
## Signif. codes: 0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
##
## coefficient of variation: 17.5 %
## monovinyl Means: 31.66667
##
## psi, statistics
##
## monovinyl mean.adj SE r std Min Max
## 250 18.83333 20.46667 2.441759 6 3.868678 13 24
## 325 18.33333 17.53333 2.441759 6 6.153590 10 26
## 400 31.33333 30.86667 2.441759 6 5.955390 21 39
## 475 38.00000 38.80000 2.441759 6 6.928203 31 47
## 550 51.83333 50.66667 2.441759 6 5.636193 45 61
##
## Tukey
## Alpha : 0.05
## Std.err : 2.483501
## HSD : 10.76024
## Parameters BIB
## Lambda : 3
## treatmeans : 5
## Block size : 3
## Blocks : 10
## Replication: 6
##
## Efficiency factor 0.8333333
##
## <<< Book >>>
##
## Comparison between treatments means
## Difference pvalue sig.
## 250 - 325 2.933333 0.9157
## 250 - 400 -10.400000 0.0607 .
## 250 - 475 -18.333333 0.0007 ***
## 250 - 550 -30.200000 0.0000 ***
## 325 - 400 -13.333333 0.0118 *
## 325 - 475 -21.266667 0.0001 ***
## 325 - 550 -33.133333 0.0000 ***
## 400 - 475 -7.933333 0.2087
## 400 - 550 -19.800000 0.0003 ***
## 475 - 550 -11.866667 0.0272 *
rm(run,psi,monovinyl,out)
##Hipotesis nula: #No nay diferencias entre las medias de tratamiento. #Para calcular el valor Fo se calcula la razon entre (los cuadrados medios de los tratamientos/cuadrados medios residuales), esto fue igual 29.90. El valor critico para un nivel de confianza del 95 % con 4 grados de libertad de tratamiento y 16 grados de libertad de residuos o error es igual a :3.01. Como F valor critico es menor que Fo se rechaza la hipotesis nula. Entonces hay diferencias significativas entre las presiones con respecto a la conversion de de metilglucosidos en productos de la vinilacion.
#9. Diseño de bloques completos aleatorizados ## Ejemplo: Fertilizacion de trigo con nitrogeno ##Aplicacion de cantidades especificas en etapas establecidas del crecimiento de la planta. Se realiza un analisis periodico del contenido de nitratos en los tejidos de la espiga el cual se usa de base para predecir el nitrogeno necesario para una produccion optima
##Objetivo: Evaluar el efecto de varios programas de fertilizacion sobre cantidades de nitrogeno y produccion de trigo.
##Diseño de tratamientos: Hay 6 programas diferentes de aplicacion de nitrogeno.Para la comparacion se incluyo un tratamiento sin nitrogeno
##Diseño de experimento: Las parcelas se agruparon en grupos de 6 con el mismo gradiente de agua. El diseño de bloques completos aleatorizados, con 4 bloques de 6 parcelas a los que se le asignaron al azar los tratamientos de nitrogeno.
library(agricolae)
# 6 tratamientos y 4 bloques
ntr<-c(40.89,37.99,37.18,34.98,34.89,42.07,41.22,49.42,45.85,50.15,41.99,46.69,44.57,52.68,37.61,36.94,46.65,40.23,41.90,39.20,43.29,40.45,42.91,39.97)
trt<-c("A","B","C","D","E","F")
outdesign <-design.rcbd(trt,4,serie=2,986,"Wichmann-Hill")
book <-outdesign$book
fieldbook <- zigzag(outdesign)
print(outdesign$sketch)
## [,1] [,2] [,3] [,4] [,5] [,6]
## [1,] "A" "F" "D" "C" "B" "E"
## [2,] "B" "C" "A" "E" "F" "D"
## [3,] "D" "C" "F" "A" "E" "B"
## [4,] "F" "C" "B" "E" "D" "A"
print(matrix(fieldbook[,1],byrow=TRUE,ncol=6))
## [,1] [,2] [,3] [,4] [,5] [,6]
## [1,] 101 102 103 104 105 106
## [2,] 206 205 204 203 202 201
## [3,] 301 302 303 304 305 306
## [4,] 406 405 404 403 402 401
outdesign <-design.rcbd(trt,6,serie=0,continue=TRUE)
head(outdesign$book)
## plots block trt
## 1 1 1 F
## 2 2 1 A
## 3 3 1 D
## 4 4 1 E
## 5 5 1 C
## 6 6 1 B
##En las graficas se observa que los datos tienen una distribucion normal y se evidencia que el modelo se ajusta favorablemente en funcion de su horizontalidad.
##Para el analisis de varianza anova con el valor F que supera el valor critico se concluye que hay diferencias significativas entre los tratamientos y repeticiones de nitrogeno, por lo tanto se rechaza la hipotesis nula en la que no hay diferencias entre tratamientos. Finalmente estos 6 tratamientos demostraran su efecto sobre cantidades de nitrogeno y crecimiento de trigo.
## Analisis:
# 6 tratamientos y 4 bloques
trt<-rep(c("A","B","C","D","E","F"), times=4)
repet<-rep(c("1","2","3","4"), each=6)
ntr<-c(40.89,37.99,37.18,34.98,34.89,42.07,41.22,49.42,45.85,50.15,41.99,46.69,44.57,52.68,37.61,36.94,46.65,40.23,41.90,39.20,43.29,40.45,42.91,39.97)
df=data.frame(trt,repet,ntr)
df
## trt repet ntr
## 1 A 1 40.89
## 2 B 1 37.99
## 3 C 1 37.18
## 4 D 1 34.98
## 5 E 1 34.89
## 6 F 1 42.07
## 7 A 2 41.22
## 8 B 2 49.42
## 9 C 2 45.85
## 10 D 2 50.15
## 11 E 2 41.99
## 12 F 2 46.69
## 13 A 3 44.57
## 14 B 3 52.68
## 15 C 3 37.61
## 16 D 3 36.94
## 17 E 3 46.65
## 18 F 3 40.23
## 19 A 4 41.90
## 20 B 4 39.20
## 21 C 4 43.29
## 22 D 4 40.45
## 23 E 4 42.91
## 24 F 4 39.97
mod2=lm(df$ntr~df$repet+df$trt)
anova=anova(mod2)
anova
## Analysis of Variance Table
##
## Response: df$ntr
## Df Sum Sq Mean Sq F value Pr(>F)
## df$repet 3 197.004 65.668 3.7169 0.03519 *
## df$trt 5 44.314 8.863 0.5017 0.77045
## Residuals 15 265.010 17.667
## ---
## Signif. codes: 0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
plot(mod2)
## hat values (leverages) are all = 0.375
## and there are no factor predictors; no plot no. 5
#10. Diseño split-plot ##Ejemplo: rendimiento de cereales cultivado con tres tasas de nitrogeno ##Aplicacion de tres tasas de nitrogeno a cereales de arroz de seis variedades sembrados al aire
##Objetivo: Evaluar el rendimiento de cereales de 6 variedades de arroz aplicando tres tasas de nitrogeno.
##Diseño de tratamientos: tres tratamientos de nitrogeno (0,60,120), cuyas unidades son kg/ha y se nombran (N1,N2 y N3) respectivamente. Tambien 6 tratamiento de variedades (IR8(V1),IR127-80(V2),IR305-4-12(V3),IR400-2-5(V4),IR665-58(V5) y Peta(v6))
##Diseño de experimento: Diseño strip-plot con 6 variedades (v1,v2,v3,v4,v5 y v6) como tratamientos horizontales y tres tasas de nitrogeno (n1,n2 y n3) como tratamientos verticales, en tres repeticiones.
Para comenzar se importan los datos desde excel
library(readxl)
data = read_excel("C:/Users/PERSONAL/Desktop/datosss.xlsx")
Observamos los datos en la tabla y con la funcion str se indica el formato de cada columna
View(data)
library(agricolae)
str(data)
## tibble [54 x 4] (S3: tbl_df/tbl/data.frame)
## $ repeticiones: num [1:54] 1 1 1 2 2 2 3 3 3 1 ...
## $ variedades : chr [1:54] "V1" "V1" "V1" "V1" ...
## $ nitrogeno : chr [1:54] "N1" "N2" "N3" "N1" ...
## $ rendimiento : num [1:54] 2.37 4.08 7.25 3.96 6.43 ...
Con la funcion as.factor se cambia el formato a factores
data$variedades = as.factor(data$variedades)
data$nitrogeno = as.factor(data$nitrogeno)
str(data)
## tibble [54 x 4] (S3: tbl_df/tbl/data.frame)
## $ repeticiones: num [1:54] 1 1 1 2 2 2 3 3 3 1 ...
## $ variedades : Factor w/ 6 levels "V1","V2","V3",..: 1 1 1 1 1 1 1 1 1 2 ...
## $ nitrogeno : Factor w/ 3 levels "N1","N2","N3": 1 2 3 1 2 3 1 2 3 1 ...
## $ rendimiento : num [1:54] 2.37 4.08 7.25 3.96 6.43 ...
El analisis de la variable respuesta de la tabla de varianza indica que el termino de interaccion es significativo a un nivel de probabilidad del 5 %, entonces no se debe discutir el efecto individual cuando la interaccion nitrogeno:variedades es significativo
Analizando los coeficientes de variacion: En el caso de cv(a) indica el grado de precision relacionado con el factor horizontal (variedades) y cv(b) con el factor vertical (nitrogeno) y el cv(c) relacionado a la interaccion entre ambos factores. El menor valor fue de cv(c) por la interaccion entre los dos factores.
model = with(data, strip.plot(repeticiones, variedades, nitrogeno, rendimiento))
##
## ANALYSIS STRIP PLOT: rendimiento
## Class level information
##
## variedades : V1 V2 V3 V4 V5 V6
## nitrogeno : N1 N2 N3
## repeticiones : 1 2 3
##
## Number of observations: 54
##
## model Y: rendimiento ~ repeticiones + variedades + Ea + nitrogeno + Eb + nitrogeno:variedades + Ec
##
## Analysis of Variance Table
##
## Response: rendimiento
## Df Sum Sq Mean Sq F value Pr(>F)
## repeticiones 2 9.221 4.6105 11.2001 0.0005453 ***
## variedades 5 57.100 11.4200 7.6528 0.0033722 **
## Ea 10 14.923 1.4923 3.6251 0.0068604 **
## nitrogeno 2 50.676 25.3380 34.0690 0.0030746 **
## Eb 4 2.975 0.7437 1.8067 0.1671590
## nitrogeno:variedades 10 23.878 2.3878 5.8006 0.0004271 ***
## Ec 20 8.233 0.4116
## ---
## Signif. codes: 0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
##
## cv(a) = 23.1 %, cv(b) = 16.3 %, cv(c) = 12.1 %, Mean = 5.289944
Para el analisis de manera individual
gla = model$gl.a
glb = model$gl.b
glc = model$gl.c
Ea = model$Ea
Eb = model$Eb
Ec = model$Ec
salida1 = with(data, LSD.test(rendimiento, variedades, gla, Ea))
salida1
## $statistics
## MSerror Df Mean CV t.value LSD
## 1.492262 10 5.289944 23.09252 2.228139 1.283094
##
## $parameters
## test p.ajusted name.t ntr alpha
## Fisher-LSD none variedades 6 0.05
##
## $means
## rendimiento std r LCL UCL Min Max Q25 Q50 Q75
## V1 5.417222 1.9651222 9 4.509938 6.324507 2.373 8.582 4.076 4.889 6.808
## V2 6.286444 1.3223596 9 5.379160 7.193729 4.007 8.284 5.630 6.297 7.177
## V3 6.080111 1.8820111 9 5.172827 6.987396 2.620 8.611 4.676 6.672 7.328
## V4 5.569000 1.6556567 9 4.661715 6.476285 2.726 7.735 4.816 5.630 6.881
## V5 5.249000 1.0625675 9 4.341715 6.156285 3.276 6.880 4.582 5.340 6.011
## V6 3.137889 0.8459469 9 2.230604 4.045173 1.556 4.425 2.706 3.214 3.724
##
## $comparison
## NULL
##
## $groups
## rendimiento groups
## V2 6.286444 a
## V3 6.080111 a
## V4 5.569000 a
## V1 5.417222 a
## V5 5.249000 a
## V6 3.137889 b
##
## attr(,"class")
## [1] "group"
salida2 = with(data, LSD.test(rendimiento, nitrogeno, glb, Eb))
salida2
## $statistics
## MSerror Df Mean CV t.value LSD
## 0.743727 4 5.289944 16.30255 2.776445 0.7981318
##
## $parameters
## test p.ajusted name.t ntr alpha
## Fisher-LSD none nitrogeno 3 0.05
##
## $means
## rendimiento std r LCL UCL Min Max Q25 Q50 Q75
## N1 4.020611 1.077777 18 3.456247 4.584976 2.373 5.795 3.28850 3.9825 4.56350
## N2 5.478222 1.287460 18 4.913858 6.042587 2.822 7.334 4.71100 5.4445 6.61175
## N3 6.371000 2.005931 18 5.806636 6.935364 1.556 8.611 6.13125 6.8805 7.58150
##
## $comparison
## NULL
##
## $groups
## rendimiento groups
## N3 6.371000 a
## N2 5.478222 b
## N1 4.020611 c
##
## attr(,"class")
## [1] "group"
Para el analisis de la interaccion
salida3 = with(data, LSD.test(rendimiento, nitrogeno:variedades, glc, Ec))
salida3
## $statistics
## MSerror Df Mean CV t.value LSD
## 0.4116459 20 5.289944 12.1286 2.085963 1.092755
##
## $parameters
## test p.ajusted name.t ntr alpha
## Fisher-LSD none nitrogeno:variedades 18 0.05
##
## $means
## rendimiento std r LCL UCL Min Max Q25 Q50 Q75
## N1:V1 3.571667 1.0597029 3 2.798972 4.344361 2.373 4.384 3.1655 3.958 4.1710
## N1:V2 4.934333 0.8958623 3 4.161639 5.707028 4.007 5.795 4.5040 5.001 5.3980
## N1:V3 4.249667 1.5170868 3 3.476972 5.022361 2.620 5.621 3.5640 4.508 5.0645
## N1:V4 4.059000 1.4665562 3 3.286305 4.831695 2.726 5.630 3.2735 3.821 4.7255
## N1:V5 4.101667 0.7182272 3 3.328972 4.874361 3.276 4.582 3.8615 4.447 4.5145
## N1:V6 3.207333 0.5850960 3 2.434639 3.980028 2.572 3.724 2.9490 3.326 3.5250
## N2:V1 5.132000 1.1961576 3 4.359305 5.904695 4.076 6.431 4.4825 4.889 5.6600
## N2:V2 6.713667 0.9417602 3 5.940972 7.486361 5.630 7.334 6.4035 7.177 7.2555
## N2:V3 6.122333 1.2645206 3 5.349639 6.895028 4.676 7.019 5.6740 6.672 6.8455
## N2:V4 5.553667 1.2586717 3 4.780972 6.326361 4.816 7.007 4.8270 4.838 5.9225
## N2:V5 5.633333 0.3433574 3 4.860639 6.406028 5.340 6.011 5.4445 5.549 5.7800
## N2:V6 3.714333 0.8167952 3 2.941639 4.487028 2.822 4.425 3.3590 3.896 4.1605
## N3:V1 7.548000 0.9228196 3 6.775305 8.320695 6.808 8.582 7.0310 7.254 7.9180
## N3:V2 7.211333 1.0029179 3 6.438639 7.984028 6.297 8.284 6.6750 7.053 7.6685
## N3:V3 7.868333 0.6650010 3 7.095639 8.641028 7.328 8.611 7.4970 7.666 8.1385
## N3:V4 7.094333 0.5650569 3 6.321639 7.867028 6.667 7.735 6.7740 6.881 7.3080
## N3:V5 6.012000 0.9017051 3 5.239305 6.784695 5.080 6.880 5.5780 6.076 6.4780
## N3:V6 2.492000 0.8494634 3 1.719305 3.264695 1.556 3.214 2.1310 2.706 2.9600
##
## $comparison
## NULL
##
## $groups
## rendimiento groups
## N3:V3 7.868333 a
## N3:V1 7.548000 ab
## N3:V2 7.211333 abc
## N3:V4 7.094333 abcd
## N2:V2 6.713667 bcde
## N2:V3 6.122333 cdef
## N3:V5 6.012000 defg
## N2:V5 5.633333 efg
## N2:V4 5.553667 fg
## N2:V1 5.132000 fgh
## N1:V2 4.934333 gh
## N1:V3 4.249667 hi
## N1:V5 4.101667 hi
## N1:V4 4.059000 hi
## N2:V6 3.714333 i
## N1:V1 3.571667 ij
## N1:V6 3.207333 ij
## N3:V6 2.492000 j
##
## attr(,"class")
## [1] "group"
Graficando los datos de rendimiento para ambos factores de tratamiento y termino de interaccion Primero se observa la relacion con sus barras de error respectivas para grafica de rendimiento en funcion de las variedades
bar.err(salida1$means, variation = "SE", ylim = c(0,15), )
title(cex.main = 0.8, main = "Rendimiento segun la variedad", xlab = "Variedades de Cereal", ylab = "Rendimiento (kg/ha)")
Segundo se observa la relacion con sus barras de error respectivas para grafica de rendimiento en funcion de las tasas de nitrogeno
bar.err(salida2$means, variation = "SE", ylim = c(0,15))
title(cex.main = 0.8, main = "Rendimiento segun la tasa de nitrogeno (kg/ha)", xlab = "Tasas de nitrogeno", ylab = "Rendimiento (kg/ha)")
Tercero se observa la relacion con sus barras de error respectivas para grafica de rendimiento en funcion de nitrogeno/variedades
bar.err(salida3$means, variation = "SE", ylim = c(0,15), xlab = "Nitrogeno kg/ha", ylab = "Rendimiento")
Analizando medias de interaccion
x = aov(rendimiento~nitrogeno:variedades, data = data)
model.tables(x, "mean")
## Tables of means
## Grand mean
##
## 5.289944
##
## nitrogeno:variedades
## variedades
## nitrogeno V1 V2 V3 V4 V5 V6
## N1 3.572 4.934 4.250 4.059 4.102 3.207
## N2 5.132 6.714 6.122 5.554 5.633 3.714
## N3 7.548 7.211 7.868 7.094 6.012 2.492
input = ("nitrogeno V1 V2 V3 V4 V5 V6
N1 3.572 4.934 4.250 4.059 4.102 3.207
N2 5.132 6.714 6.122 5.554 5.633 3.714
N3 7.548 7.211 7.868 7.094 6.012 2.492")
Means = as.matrix(read.table(textConnection(input), header = TRUE, row.names = 1))
Means
## V1 V2 V3 V4 V5 V6
## N1 3.572 4.934 4.250 4.059 4.102 3.207
## N2 5.132 6.714 6.122 5.554 5.633 3.714
## N3 7.548 7.211 7.868 7.094 6.012 2.492
barplot(Means, beside = TRUE, legend = TRUE, ylim = c(0,10), xlab = "Nitrogeno:Variedades", ylab ="Rendimiento (kg/ha)")
Finalmente se concluye que en los dos valores de F uno que representa el efecto de la variedad y el otro la interaccion entre variedad:nitrogeno presentan diferencias significativas por los valores obtenidos.