Parcial1

Diseños Agricolae

DISEÑO CUADRADO LATINO

En este diseño se controlan dos factores de bloque y se estudia un factor de tratamientos, por lo que se tienen cuatro fuentes de variabilidad que pueden afectar la respuesta observada;éstas son: los tratamientos,el factor de bloque I (columnas),el factor de bloque II (renglones) y el error aleatorio.

Los siguientes datos corresponden a los rendimientos en ton/ha de cuatro líneas endogámicas de maíz

library(readxl)
Datos_lsd <- read_excel("C:/Users/PERSONAL/Downloads/Datos lsd.xlsx")
datos1<-Datos_lsd
datos1

## # A tibble: 16 x 5
##     Rep. Hilera Columna Trat   Rend
##    <dbl>  <dbl>   <dbl> <chr> <dbl>
##  1     1      1       1 B      1.64
##  2     1      2       1 C      1.48
##  3     1      3       1 A      1.67
##  4     1      4       1 D      1.56
##  5     2      1       2 D      1.21
##  6     2      2       2 A      1.18
##  7     2      3       2 C      0.71
##  8     2      4       2 B      1.29
##  9     3      1       3 C      1.42
## 10     3      2       3 D      1.4 
## 11     3      3       3 B      1.66
## 12     3      4       3 A      1.66
## 13     4      1       4 A      1.34
## 14     4      2       4 B      1.29
## 15     4      3       4 D      1.18
## 16     4      4       4 C      0.66

Factor: líneas endogámicas de maíz Niveles T1 = A T2 = B T3 = C T4 = D fila= Gradiente de fertilidad de norte a sur columna= Gradiente de fertilidad de oeste a este variable= Rendimiento en Toneladas

trata<-factor(datos1$Trat)
f_oes_es<-factor(datos1$Columna)
f_nor_sur<-factor(datos1$Hilera)

Análisis de varianza

mod1<-lm(datos1$Rend~trata+f_nor_sur+f_oes_es)
anova_1<-aov(mod1)
summary(anova_1)

##             Df Sum Sq Mean Sq F value  Pr(>F)   
## trata        3 0.4268 0.14228   6.588 0.02509 * 
## f_nor_sur    3 0.0302 0.01005   0.465 0.71697   
## f_oes_es     3 0.8273 0.27578  12.769 0.00515 **
## Residuals    6 0.1296 0.02160                   
## ---
## Signif. codes:  0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1

Se puede decir no existe evidencia estadistica que diga el gradiente de fertilidad de norte a sur genera diferentes valores en el rendimiento Mientras que el gradiente de fertilidad de oeste a este y el tratamiento hay diferencia significativa, además de que en ambos casos el valor F>1 indica que la variabilidad de los trtamientos es mayor que la de las repeticiones lo cual es un buen indicador

Se analizan las diferencias por medio de latin square design f_oes_es

library(agricolae)

## Warning: package 'agricolae' was built under R version 4.0.3

LSD_f_oes_es<-LSD.test(y=anova_1,trt = "trata",group = T, console = T)

## 
## Study: anova_1 ~ "trata"
## 
## LSD t Test for datos1$Rend 
## 
## Mean Square Error:  0.0215974 
## 
## trata,  means and individual ( 95 %) CI
## 
##   datos1.Rend       std r       LCL     UCL   Min   Max
## A     1.46375 0.2386900 4 1.2839503 1.64355 1.185 1.670
## B     1.47125 0.2095382 4 1.2914503 1.65105 1.290 1.665
## C     1.06750 0.4426153 4 0.8877003 1.24730 0.660 1.475
## D     1.33875 0.1795538 4 1.1589503 1.51855 1.180 1.565
## 
## Alpha: 0.05 ; DF Error: 6
## Critical Value of t: 2.446912 
## 
## least Significant Difference: 0.2542752 
## 
## Treatments with the same letter are not significantly different.
## 
##   datos1$Rend groups
## B     1.47125      a
## A     1.46375      a
## D     1.33875      a
## C     1.06750      b

LSD_f_oes_es

## $statistics
##     MSerror Df     Mean      CV  t.value       LSD
##   0.0215974  6 1.335312 11.0057 2.446912 0.2542752
## 
## $parameters
##         test p.ajusted name.t ntr alpha
##   Fisher-LSD      none  trata   4  0.05
## 
## $means
##   datos1$Rend       std r       LCL     UCL   Min   Max    Q25    Q50     Q75
## A     1.46375 0.2386900 4 1.2839503 1.64355 1.185 1.670 1.3050 1.5000 1.65875
## B     1.47125 0.2095382 4 1.2914503 1.65105 1.290 1.665 1.2900 1.4650 1.64625
## C     1.06750 0.4426153 4 0.8877003 1.24730 0.660 1.475 0.6975 1.0675 1.43750
## D     1.33875 0.1795538 4 1.1589503 1.51855 1.180 1.565 1.2025 1.3050 1.44125
## 
## $comparison
## NULL
## 
## $groups
##   datos1$Rend groups
## B     1.47125      a
## A     1.46375      a
## D     1.33875      a
## C     1.06750      b
## 
## attr(,"class")
## [1] "group"

El tratamiento C es diferente a los tratamientos A,B y D que se encuentran dentro de un mismo grupo y generan el mismo nivel de rendimiento, es decir estadisticamente presentan la misma media, entonces para escoger cuál es mejor para sembrar se podrían considerar otros factores como su adaptación a determina do clima, respuesta a plagas, enfermedades determinadas etc, y que generen menos costos de manejo en el cultivo.

library(agricolae)
bar.group(x=LSD_f_oes_es$groups, horiz = T, col="orange", xlab="rendimiento ton/ha", ylab="tratamientos")

library(agricolae)
LSD_trt<-LSD.test(y=anova_1, trt="f_oes_es",group= T, console=T)

## 
## Study: anova_1 ~ "f_oes_es"
## 
## LSD t Test for datos1$Rend 
## 
## Mean Square Error:  0.0215974 
## 
## f_oes_es,  means and individual ( 95 %) CI
## 
##   datos1.Rend        std r       LCL     UCL   Min   Max
## 1     1.58750 0.08703448 4 1.4077003 1.76730 1.475 1.670
## 2     1.09875 0.26300745 4 0.9189503 1.27855 0.710 1.290
## 3     1.53625 0.14331637 4 1.3564503 1.71605 1.400 1.665
## 4     1.11875 0.31343194 4 0.9389503 1.29855 0.660 1.345
## 
## Alpha: 0.05 ; DF Error: 6
## Critical Value of t: 2.446912 
## 
## least Significant Difference: 0.2542752 
## 
## Treatments with the same letter are not significantly different.
## 
##   datos1$Rend groups
## 1     1.58750      a
## 3     1.53625      a
## 4     1.11875      b
## 2     1.09875      b

LSD_trt

## $statistics
##     MSerror Df     Mean      CV  t.value       LSD
##   0.0215974  6 1.335312 11.0057 2.446912 0.2542752
## 
## $parameters
##         test p.ajusted   name.t ntr alpha
##   Fisher-LSD      none f_oes_es   4  0.05
## 
## $means
##   datos1$Rend        std r       LCL     UCL   Min   Max     Q25    Q50     Q75
## 1     1.58750 0.08703448 4 1.4077003 1.76730 1.475 1.670 1.54250 1.6025 1.64750
## 2     1.09875 0.26300745 4 0.9189503 1.27855 0.710 1.290 1.06625 1.1975 1.23000
## 3     1.53625 0.14331637 4 1.3564503 1.71605 1.400 1.665 1.41875 1.5400 1.65750
## 4     1.11875 0.31343194 4 0.9389503 1.29855 0.660 1.345 1.05000 1.2350 1.30375
## 
## $comparison
## NULL
## 
## $groups
##   datos1$Rend groups
## 1     1.58750      a
## 3     1.53625      a
## 4     1.11875      b
## 2     1.09875      b
## 
## attr(,"class")
## [1] "group"

Las columnas 1 y 3 son las que presentan el mayor rendimiento y se encuentran dentro del mismo grupo.

ANÁLISIS DE VARIANZA NO PARAMÉTRICA KRUSKAL WALLIS TEST

La prueba de Kruskal-Wallis es una prueba no paramétrica para comparar tres o más muestras. Se utiliza para probar la hipótesis nula de que todas las poblaciones tienen las mismas funciones de distribución en contra de la hipótesis alternativa de que al menos dos de las muestras, sólo se diferencian con respecto a la ubicación (mediana). Es el análogo a la prueba de F utilizada en el análisis de la varianza. Si bien el análisis de la varianza depende de la suposición de que todas las poblaciones que se comparan tienen una distribución normal, la prueba de Kruskal-Wallis no impone ninguna restricción en la comparación. Esta prueba es una extensión de la prueba de WilcoxonMann-Whitney ya que en lugar de dos muestras es posible usar tres o más muestras en la prueba.

se recogen los datos de un experimento en el que plantas jóvenes de olivo cultivadas en macetas de 2 L de capacidad en condiciones de invernadero, se sometieron durante un período de tiempo a la aplicación de 0, 50, 100 o 150 ppm de nitrógeno en el agua de riego, junto a una solución con los demás elementos nutritivos. Transcurrido un tiempo el contenido en nitrógeno de las plantas varió según el tratamiento recibido y, cuando esto sucedió, todas las plantas recibieron una aplicación adicional de nitrógeno vía foliar al objeto de estudiar si la eficiencia del uso del nitrógeno depende o no del estado nutritivo de las plantas. Se utilizaron 10 plantas por tratamiento.

a)Los datos son independientes

library(readxl)
Datos_kruskal <- read_excel("C:/Users/PERSONAL/Downloads/Datos kruskal.xlsx")
dataf_kw<-Datos_kruskal
dataf_kw

## # A tibble: 10 x 4
##    `cero ppm` `cincuenta ppm` `cien ppm` `ciencincuenta ppm`
##         <dbl>           <dbl>      <dbl>               <dbl>
##  1        200             100        250                 150
##  2        200             400        700                 280
##  3        300             200        400                 200
##  4        100             100        400                 200
##  5        100             100        200                 200
##  6        200             150        400                 250
##  7        200             100        300                 200
##  8        100              50        430                 200
##  9        230             130        430                 330
## 10        300             280        400                 400

plotkw<-boxplot(dataf_kw,xlab= "Tratamiento",ylab="Contenido de N(mg/planta)", main = "Contenido de nitrógeno en plantas jóvenes de olivo después de la aplicación adicional de nitrógeno vía foliar",col = c("orange3", "yellow3", "green3", "blue"))

Por lo visto con el tercer tratamiento las plantas presentan más nitrogeno

b)A continuación se evidencia que los datos tomados no siguen una distribución normal

norm_0<-qqnorm(dataf_kw$`cero ppm`,main="Distribución 0ppm")
norm_0

## $x
##  [1] -0.3754618 -0.1225808  1.0004905 -1.5466353 -1.0004905  0.1225808
##  [7]  0.3754618 -0.6554235  0.6554235  1.5466353
## 
## $y
##  [1] 200 200 300 100 100 200 200 100 230 300

norm1_0<-qqline(dataf_kw$`cero ppm`, col="blue")

norm1_0

## NULL

norm_50<-qqnorm(dataf_kw$`cincuenta ppm`,main="Normalidad 50ppm")
norm_50

## $x
##  [1] -1.0004905  1.5466353  0.6554235 -0.6554235 -0.3754618  0.3754618
##  [7] -0.1225808 -1.5466353  0.1225808  1.0004905
## 
## $y
##  [1] 100 400 200 100 100 150 100  50 130 280

norm1_50<-qqline(dataf_kw$`cincuenta ppm`,col="red")

norm1_50

## NULL

norm_100<-qqnorm(dataf_kw$`cien ppm`,main="Normalidad 100ppm")
norm_100

## $x
##  [1] -1.0004905  1.5466353 -0.3754618 -0.1225808 -1.5466353  0.1225808
##  [7] -0.6554235  0.6554235  1.0004905  0.3754618
## 
## $y
##  [1] 250 700 400 400 200 400 300 430 430 400

norm1_100<-qqline(dataf_kw$`cien ppm`,col="yellow")

norm1_100

## NULL

norm_150<-qqnorm(dataf_kw$`ciencincuenta ppm`,main="Normalidad 150ppm")
norm_150

## $x
##  [1] -1.5466353  0.6554235 -1.0004905 -0.6554235 -0.3754618  0.3754618
##  [7] -0.1225808  0.1225808  1.0004905  1.5466353
## 
## $y
##  [1] 150 280 200 200 200 250 200 200 330 400

norm1_150<-qqline(dataf_kw$`ciencincuenta ppm`,col="green")

norm1_150

## NULL

Prueba de Kruskal Wallis, se organizan los datos El tratamiento es la concentración de N en el agua de riego

library(readxl)
Datos_kruskal1 <- read_excel("C:/Users/PERSONAL/Downloads/Datos kruskal1.xlsx")
dataf1_kw<-Datos_kruskal1
dataf1_kw

## # A tibble: 40 x 2
##    `Contenido N (mg/planta)` Tratamiento
##                        <dbl> <chr>      
##  1                       200 0ppm       
##  2                       200 0ppm       
##  3                       300 0ppm       
##  4                       100 0ppm       
##  5                       100 0ppm       
##  6                       200 0ppm       
##  7                       200 0ppm       
##  8                       100 0ppm       
##  9                       230 0ppm       
## 10                       300 0ppm       
## # ... with 30 more rows

kruswtest<-kruskal.test(dataf1_kw$`Contenido N (mg/planta)`~dataf1_kw$Tratamiento)
kruswtest

## 
##  Kruskal-Wallis rank sum test
## 
## data:  dataf1_kw$`Contenido N (mg/planta)` by dataf1_kw$Tratamiento
## Kruskal-Wallis chi-squared = 17.901, df = 3, p-value = 0.000461

Teniendo en cuenta el p-valor<0.05 se rechaza la hipotesis nula,concluyendo que existen diferencias significativas entre los tratamientos, la variable dependiente (que puede entenderse como la eficiencia en toma de N en las plantas) cambia con la variación de los tratamientos.

DISEÑO GRECOLATINO

Con este diseño se controlan tres factores de bloque, además del factor de tratamientos. Las letras latinas denotan los tratamientos y las griegas para nombrar los niveles del tercer factor de bloque. Para este caso, las letras griegas van a ser denotadas con los números: 1,2,3 y 4 respectivamente.

Para comprobar el rendimiento en ton/ha de un cultivo de maíz en cinco tiempos, se consideran cinco variedades de maiz a las que se les aplica cinco concentraciones de fertilizante a cinco temperaturas distintas, de manera que cada variedad de maíz con cada concentración de fertilizante y cada temperatura se evaluan a un tiempo. Tanto la asignación de los tiempos a las variedades de maiz, como las concentraciones de fertilizante, y las temperaturas, se hizo de forma aleatoria. En este estudio el científico considera que tanto las variedades de maíz, las concentraciones y las temperaturas pueden influir en el rendimiento del proceso, por lo que los considera como variables de bloque cada una con cinco niveles y decide plantear un diseño por cuadrados greco-latinos.

library(readxl)
Datos_graeco <- read_excel("C:/Users/PERSONAL/Downloads/Datos graeco.xlsx")
View(Datos_graeco)
datosg_2<-Datos_graeco
datosg_2

## # A tibble: 25 x 5
##    rendimiento variedad concentraciones  tiemp_evaluación temperatura
##          <dbl>    <dbl> <chr>            <chr>            <chr>      
##  1          26        1 1                A                Z          
##  2          21        1 2                B                Y          
##  3          19        1 3                C                X          
##  4          13        1 4                D                W          
##  5          21        1 5                E                V          
##  6          22        2 1                B                X          
##  7          26        2 2                C                W          
##  8          24        2 3                D                V          
##  9          16        2 4                E                Z          
## 10          20        2 5                A                Y          
## # ... with 15 more rows

Variable respuesta: Rendimiento Factor: Tiempos de evaluación que tiene cinco niveles. Es un factor de efectos fijos ya que viene decidido que niveles concretos se van a utilizar. Bloques: variedades, Concentraciones y Temperaturas, cada uno con cinco niveles y de efectos fijos. Tamaño del experimento: Número total de observaciones (25).

Factores

vari <- factor(Datos_graeco$variedad)
temp <- factor(Datos_graeco$temperatura)
tiemp_eva <- factor(Datos_graeco$tiemp_evaluación)
concen <- factor(Datos_graeco$concentraciones)

#Analisis de varianza
mod2 <- aov(datosg_2$rendimiento~ vari + concen + tiemp_eva + temp, data=datosg_2)
summary(mod2)

##             Df Sum Sq Mean Sq F value  Pr(>F)   
## vari         4   9.76    2.44   0.374 0.82060   
## concen       5 250.66   50.13   7.683 0.00921 **
## tiemp_eva    4 204.67   51.17   7.842 0.01002 * 
## temp         4  59.79   14.95   2.291 0.15952   
## Residuals    7  45.67    6.52                   
## ---
## Signif. codes:  0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1

No hay diferencia estadistica entre la temperatura y variables, por lo tanto estas no inciden en el rendimiento del cultivo. La concentracion y el tiempo de evaluación presentan significancia por lo que se puede afirmar que inciden en el rendimiento.

Test de Duncan para la concentración

dungre<-duncan.test(mod2, "concen" , group = T)
dungre

## $statistics
##   MSerror Df  Mean      CV
##     6.525  7 21.24 12.0264
## 
## $parameters
##     test name.t ntr alpha
##   Duncan concen   6  0.05
## 
## $duncan
## NULL
## 
## $means
##                  datosg_2$rendimiento      std r Min Max  Q25  Q50  Q75
## 1                                26.8 3.834058 5  22  32 25.0 26.0 29.0
## 2                                21.2 4.868265 5  15  26 18.0 21.0 26.0
## 3                                19.0 3.535534 5  14  24 19.0 19.0 19.0
## 4                                13.0       NA 1  13  13 13.0 13.0 13.0
## 4                                19.5 3.872983 4  16  25 17.5 18.5 20.5
## 5                                21.0 3.937004 5  16  27 20.0 21.0 21.0
## 
## $comparison
## NULL
## 
## $groups
##                  datosg_2$rendimiento groups
## 1                                26.8      a
## 2                                21.2      b
## 5                                21.0      b
## 4                                19.5      b
## 3                                19.0      b
## 4                                13.0      c
## 
## attr(,"class")
## [1] "group"

El mayor rendimiento se presenta con la concentración 1 de fertilizante

Tukey para los tiempos de evaluación

tukey<- TukeyHSD(mod2,"tiemp_eva", ordered=T)
tukey

##   Tukey multiple comparisons of means
##     95% family-wise confidence level
##     factor levels have been ordered
## 
## Fit: aov(formula = datosg_2$rendimiento ~ vari + concen + tiemp_eva + temp, data = datosg_2)
## 
## $tiemp_eva
##                                   diff         lwr       upr     p adj
## E           -A            3.552714e-15 -5.78045654  5.780457 1.0000000
## B           -A            2.000000e-01 -5.58045654  5.980457 0.9999323
## D           -A            5.237500e+00 -0.54295654 11.017957 0.0761548
## C           -A            6.000000e+00  0.21954346 11.780457 0.0422770
## B           -E            2.000000e-01 -5.58045654  5.980457 0.9999323
## D           -E            5.237500e+00 -0.54295654 11.017957 0.0761548
## C           -E            6.000000e+00  0.21954346 11.780457 0.0422770
## D           -B            5.037500e+00 -0.74295654 10.817957 0.0890546
## C           -B            5.800000e+00  0.01954346 11.580457 0.0492557
## C           -D            7.625000e-01 -5.01795654  6.542957 0.9876658

Hay diferencias entre las temperaturas C-A(pvalor=0.042), C-A(pvalor=0.042) y C-B(p-valor=0.049)

#1.Analisis de varianza para diseño de bloques incompletos balanceados ##1.1 Ejemplo: Vinilacion de metilglucosido ##La adicion de acetileno a un metilglucosido en presencia de una base, a alta presion produce varios eteres monovinilicos ##

##Objetivo: Informacion sobre el efecto de la presion en el porcentaje de conversion del metilglucosido en isomeros de monovinil

##Diseño de tratamientos: Se escogen 5 presiones dentro del intervalo que producia la conversion maxima (250,325,400,475 y 550 psi): 5 tratamientos

Diseño de experimento: Se usan solo tres camaras, entonces fue necesario bloquizar las corridas (se escoge diseño de bloques incompletos balanceados), cada uno con tres unidades experimentales (camaras presurizadas) y tres presiones diferentes en cada corrida, finalmente el diseño tenia 6 replicas de cada tratamiento de presion

library(agricolae)

run<-gl(10,3)
## En el diseño se presentan 10 corridas, cada uno con 3 tres unidades experimentales (camaras presurizadas)
psi<-c(250,325,475,250,475,550,325,400,550,400,475,550,325,475,550,
250,400,475,250,325,400,250,400,550,250,325,550,325,400,475)
## Variable presion, presenta las presiones en el orden que se presentan los porcentajes de conversion (monovinyl), entonces se presentan 30 datos (6 replicas por los 5 tratamientos) 
monovinyl<-c(16,18,32,19,46,45,26,39,61,21,35,55,19,47,48,20,33,31,13,13,34,21,
30,52,24,10,50,24,31,37)

##Para la prueba BIB se tienen 10 bloqueos, 5 tratamientos, 30 para un total de observaciones. ##Para el analisis de varianza se presentan los grados de libertad ((10-1),(5-1),(30-5-10+1)), suma de cuadrados para (bloqueo, tratamientos y residuales o error), cuadrados medios (suma de cuadrados/grados de libertad), valor F sobre las medias de tratamientos donde 29.90 es el resultado de (cuadrado medio de tratamiento/cuadrado medio de residuales o error). El coeficiente de variacion fue de 17.5 % el cual representa la razon entre la desviacion estandar y la media de los datos

##En esta grafica se presentan las medias de conversion segun las presiones con sus barras de error respectivas. Claramente se evidencia que a mayor presion hay mayor conversion del metilglucosido en isomeros de monovinil

out<-BIB.test(run,psi,monovinyl,test="waller",group=FALSE)

bar.err(out$means,variation="range",ylim=c(0,60),bar=FALSE,col=0)

##En los data.frame se presentan las medias porcentuales de conversiones segun la presion,los minimos cuadrados de las medias(mean.adj), el error estandar para estimar la media de tratamiento la cual es igual para todos los tratamientos, cantidad de replicas por tratamiento (r), desviaciones estandar por presion y las valores maximo y minimo de conversion.

out<-BIB.test(run,psi,monovinyl,test="waller",group=TRUE)
out<-BIB.test(run,psi,monovinyl,test="tukey",group=TRUE,console=TRUE)

## 
## ANALYSIS BIB:  monovinyl 
## Class level information
## 
## Block:  1 2 3 4 5 6 7 8 9 10
## Trt  :  250 325 475 550 400
## 
## Number of observations:  30 
## 
## Analysis of Variance Table
## 
## Response: monovinyl
##             Df Sum Sq Mean Sq F value    Pr(>F)    
## block.unadj  9 1394.7  154.96  5.0249  0.002529 ** 
## trt.adj      4 3688.6  922.14 29.9020 3.026e-07 ***
## Residuals   16  493.4   30.84                      
## ---
## Signif. codes:  0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
## 
## coefficient of variation: 17.5 %
## monovinyl Means: 31.66667 
## 
## psi,  statistics
## 
##     monovinyl mean.adj       SE r      std Min Max
## 250  18.83333 20.46667 2.441759 6 3.868678  13  24
## 325  18.33333 17.53333 2.441759 6 6.153590  10  26
## 400  31.33333 30.86667 2.441759 6 5.955390  21  39
## 475  38.00000 38.80000 2.441759 6 6.928203  31  47
## 550  51.83333 50.66667 2.441759 6 5.636193  45  61
## 
## Tukey
## Alpha      : 0.05
## Std.err    : 2.483501
## HSD        : 10.76024
## Parameters BIB
## Lambda     : 3
## treatmeans : 5
## Block size : 3
## Blocks     : 10
## Replication: 6 
## 
## Efficiency factor 0.8333333 
## 
## <<< Book >>>
## 
## Comparison between treatments means
##           Difference pvalue sig.
## 250 - 325   2.933333 0.9157     
## 250 - 400 -10.400000 0.0607    .
## 250 - 475 -18.333333 0.0007  ***
## 250 - 550 -30.200000 0.0000  ***
## 325 - 400 -13.333333 0.0118    *
## 325 - 475 -21.266667 0.0001  ***
## 325 - 550 -33.133333 0.0000  ***
## 400 - 475  -7.933333 0.2087     
## 400 - 550 -19.800000 0.0003  ***
## 475 - 550 -11.866667 0.0272    *
## 
## Treatments with the same letter are not significantly different.
## 
##     monovinyl groups
## 550  50.66667      a
## 475  38.80000      b
## 400  30.86667     bc
## 250  20.46667     cd
## 325  17.53333      d

out<-BIB.test(run,psi,monovinyl,test="tukey",group=FALSE,console=TRUE)

## 
## ANALYSIS BIB:  monovinyl 
## Class level information
## 
## Block:  1 2 3 4 5 6 7 8 9 10
## Trt  :  250 325 475 550 400
## 
## Number of observations:  30 
## 
## Analysis of Variance Table
## 
## Response: monovinyl
##             Df Sum Sq Mean Sq F value    Pr(>F)    
## block.unadj  9 1394.7  154.96  5.0249  0.002529 ** 
## trt.adj      4 3688.6  922.14 29.9020 3.026e-07 ***
## Residuals   16  493.4   30.84                      
## ---
## Signif. codes:  0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
## 
## coefficient of variation: 17.5 %
## monovinyl Means: 31.66667 
## 
## psi,  statistics
## 
##     monovinyl mean.adj       SE r      std Min Max
## 250  18.83333 20.46667 2.441759 6 3.868678  13  24
## 325  18.33333 17.53333 2.441759 6 6.153590  10  26
## 400  31.33333 30.86667 2.441759 6 5.955390  21  39
## 475  38.00000 38.80000 2.441759 6 6.928203  31  47
## 550  51.83333 50.66667 2.441759 6 5.636193  45  61
## 
## Tukey
## Alpha      : 0.05
## Std.err    : 2.483501
## HSD        : 10.76024
## Parameters BIB
## Lambda     : 3
## treatmeans : 5
## Block size : 3
## Blocks     : 10
## Replication: 6 
## 
## Efficiency factor 0.8333333 
## 
## <<< Book >>>
## 
## Comparison between treatments means
##           Difference pvalue sig.
## 250 - 325   2.933333 0.9157     
## 250 - 400 -10.400000 0.0607    .
## 250 - 475 -18.333333 0.0007  ***
## 250 - 550 -30.200000 0.0000  ***
## 325 - 400 -13.333333 0.0118    *
## 325 - 475 -21.266667 0.0001  ***
## 325 - 550 -33.133333 0.0000  ***
## 400 - 475  -7.933333 0.2087     
## 400 - 550 -19.800000 0.0003  ***
## 475 - 550 -11.866667 0.0272    *

rm(run,psi,monovinyl,out)

##Hipotesis nula: #No nay diferencias entre las medias de tratamiento. #Para calcular el valor Fo se calcula la razon entre (los cuadrados medios de los tratamientos/cuadrados medios residuales), esto fue igual 29.90. El valor critico para un nivel de confianza del 95 % con 4 grados de libertad de tratamiento y 16 grados de libertad de residuos o error es igual a :3.01. Como F valor critico es menor que Fo se rechaza la hipotesis nula. Entonces hay diferencias significativas entre las presiones con respecto a la conversion de de metilglucosidos en productos de la vinilacion.

#9. Diseño de bloques completos aleatorizados ## Ejemplo: Fertilizacion de trigo con nitrogeno ##Aplicacion de cantidades especificas en etapas establecidas del crecimiento de la planta. Se realiza un analisis periodico del contenido de nitratos en los tejidos de la espiga el cual se usa de base para predecir el nitrogeno necesario para una produccion optima

##Objetivo: Evaluar el efecto de varios programas de fertilizacion sobre cantidades de nitrogeno y produccion de trigo.

##Diseño de tratamientos: Hay 6 programas diferentes de aplicacion de nitrogeno.Para la comparacion se incluyo un tratamiento sin nitrogeno

##Diseño de experimento: Las parcelas se agruparon en grupos de 6 con el mismo gradiente de agua. El diseño de bloques completos aleatorizados, con 4 bloques de 6 parcelas a los que se le asignaron al azar los tratamientos de nitrogeno.

library(agricolae)
# 6 tratamientos y 4 bloques
ntr<-c(40.89,37.99,37.18,34.98,34.89,42.07,41.22,49.42,45.85,50.15,41.99,46.69,44.57,52.68,37.61,36.94,46.65,40.23,41.90,39.20,43.29,40.45,42.91,39.97)
trt<-c("A","B","C","D","E","F")
outdesign <-design.rcbd(trt,4,serie=2,986,"Wichmann-Hill") 
book <-outdesign$book 

fieldbook <- zigzag(outdesign)
print(outdesign$sketch)

##      [,1] [,2] [,3] [,4] [,5] [,6]
## [1,] "A"  "F"  "D"  "C"  "B"  "E" 
## [2,] "B"  "C"  "A"  "E"  "F"  "D" 
## [3,] "D"  "C"  "F"  "A"  "E"  "B" 
## [4,] "F"  "C"  "B"  "E"  "D"  "A"

print(matrix(fieldbook[,1],byrow=TRUE,ncol=6))

##      [,1] [,2] [,3] [,4] [,5] [,6]
## [1,]  101  102  103  104  105  106
## [2,]  206  205  204  203  202  201
## [3,]  301  302  303  304  305  306
## [4,]  406  405  404  403  402  401

outdesign <-design.rcbd(trt,6,serie=0,continue=TRUE)
head(outdesign$book)

##   plots block trt
## 1     1     1   F
## 2     2     1   A
## 3     3     1   D
## 4     4     1   E
## 5     5     1   C
## 6     6     1   B

Se aleteorizan los 6 programas (A,B,C,D,E,F) de aplicacion de nitrogeno en las 4 repiticiones o bloqueos

Los tratamientos son 24 concentraciones diferentes de nitrogeno (ppm * 10-2) asignadas al azar

##En las graficas se observa que los datos tienen una distribucion normal y se evidencia que el modelo se ajusta favorablemente en funcion de su horizontalidad.

##Para el analisis de varianza anova con el valor F que supera el valor critico se concluye que hay diferencias significativas entre los tratamientos y repeticiones de nitrogeno, por lo tanto se rechaza la hipotesis nula en la que no hay diferencias entre tratamientos. Finalmente estos 6 tratamientos demostraran su efecto sobre cantidades de nitrogeno y crecimiento de trigo.

## Analisis:
# 6 tratamientos y 4 bloques

trt<-rep(c("A","B","C","D","E","F"), times=4)
repet<-rep(c("1","2","3","4"), each=6)
ntr<-c(40.89,37.99,37.18,34.98,34.89,42.07,41.22,49.42,45.85,50.15,41.99,46.69,44.57,52.68,37.61,36.94,46.65,40.23,41.90,39.20,43.29,40.45,42.91,39.97)

df=data.frame(trt,repet,ntr)
df

##    trt repet   ntr
## 1    A     1 40.89
## 2    B     1 37.99
## 3    C     1 37.18
## 4    D     1 34.98
## 5    E     1 34.89
## 6    F     1 42.07
## 7    A     2 41.22
## 8    B     2 49.42
## 9    C     2 45.85
## 10   D     2 50.15
## 11   E     2 41.99
## 12   F     2 46.69
## 13   A     3 44.57
## 14   B     3 52.68
## 15   C     3 37.61
## 16   D     3 36.94
## 17   E     3 46.65
## 18   F     3 40.23
## 19   A     4 41.90
## 20   B     4 39.20
## 21   C     4 43.29
## 22   D     4 40.45
## 23   E     4 42.91
## 24   F     4 39.97

mod2=lm(df$ntr~df$repet+df$trt)
anova=anova(mod2)
anova

## Analysis of Variance Table
## 
## Response: df$ntr
##           Df  Sum Sq Mean Sq F value  Pr(>F)  
## df$repet   3 197.004  65.668  3.7169 0.03519 *
## df$trt     5  44.314   8.863  0.5017 0.77045  
## Residuals 15 265.010  17.667                  
## ---
## Signif. codes:  0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1

plot(mod2)

## hat values (leverages) are all = 0.375
##  and there are no factor predictors; no plot no. 5

#10. Diseño split-plot ##Ejemplo: rendimiento de cereales cultivado con tres tasas de nitrogeno ##Aplicacion de tres tasas de nitrogeno a cereales de arroz de seis variedades sembrados al aire

##Objetivo: Evaluar el rendimiento de cereales de 6 variedades de arroz aplicando tres tasas de nitrogeno.

##Diseño de tratamientos: tres tratamientos de nitrogeno (0,60,120), cuyas unidades son kg/ha y se nombran (N1,N2 y N3) respectivamente. Tambien 6 tratamiento de variedades (IR8(V1),IR127-80(V2),IR305-4-12(V3),IR400-2-5(V4),IR665-58(V5) y Peta(v6))

##Diseño de experimento: Diseño strip-plot con 6 variedades (v1,v2,v3,v4,v5 y v6) como tratamientos horizontales y tres tasas de nitrogeno (n1,n2 y n3) como tratamientos verticales, en tres repeticiones.

Para comenzar se importan los datos desde excel

library(readxl)
data = read_excel("C:/Users/PERSONAL/Desktop/datosss.xlsx")

Observamos los datos en la tabla y con la funcion str se indica el formato de cada columna

View(data)
library(agricolae)

str(data)

## tibble [54 x 4] (S3: tbl_df/tbl/data.frame)
##  $ repeticiones: num [1:54] 1 1 1 2 2 2 3 3 3 1 ...
##  $ variedades  : chr [1:54] "V1" "V1" "V1" "V1" ...
##  $ nitrogeno   : chr [1:54] "N1" "N2" "N3" "N1" ...
##  $ rendimiento : num [1:54] 2.37 4.08 7.25 3.96 6.43 ...

Con la funcion as.factor se cambia el formato a factores

data$variedades = as.factor(data$variedades)
data$nitrogeno = as.factor(data$nitrogeno)
str(data)

## tibble [54 x 4] (S3: tbl_df/tbl/data.frame)
##  $ repeticiones: num [1:54] 1 1 1 2 2 2 3 3 3 1 ...
##  $ variedades  : Factor w/ 6 levels "V1","V2","V3",..: 1 1 1 1 1 1 1 1 1 2 ...
##  $ nitrogeno   : Factor w/ 3 levels "N1","N2","N3": 1 2 3 1 2 3 1 2 3 1 ...
##  $ rendimiento : num [1:54] 2.37 4.08 7.25 3.96 6.43 ...

El analisis de la variable respuesta de la tabla de varianza indica que el termino de interaccion es significativo a un nivel de probabilidad del 5 %, entonces no se debe discutir el efecto individual cuando la interaccion nitrogeno:variedades es significativo

Analizando los coeficientes de variacion: En el caso de cv(a) indica el grado de precision relacionado con el factor horizontal (variedades) y cv(b) con el factor vertical (nitrogeno) y el cv(c) relacionado a la interaccion entre ambos factores. El menor valor fue de cv(c) por la interaccion entre los dos factores.

model = with(data, strip.plot(repeticiones, variedades, nitrogeno, rendimiento))

## 
## ANALYSIS STRIP PLOT:  rendimiento 
## Class level information
## 
## variedades   :  V1 V2 V3 V4 V5 V6 
## nitrogeno    :  N1 N2 N3 
## repeticiones     :  1 2 3 
## 
## Number of observations:  54 
## 
## model Y: rendimiento ~ repeticiones + variedades + Ea + nitrogeno + Eb + nitrogeno:variedades + Ec 
## 
## Analysis of Variance Table
## 
## Response: rendimiento
##                      Df Sum Sq Mean Sq F value    Pr(>F)    
## repeticiones          2  9.221  4.6105 11.2001 0.0005453 ***
## variedades            5 57.100 11.4200  7.6528 0.0033722 ** 
## Ea                   10 14.923  1.4923  3.6251 0.0068604 ** 
## nitrogeno             2 50.676 25.3380 34.0690 0.0030746 ** 
## Eb                    4  2.975  0.7437  1.8067 0.1671590    
## nitrogeno:variedades 10 23.878  2.3878  5.8006 0.0004271 ***
## Ec                   20  8.233  0.4116                      
## ---
## Signif. codes:  0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
## 
## cv(a) = 23.1 %, cv(b) = 16.3 %, cv(c) = 12.1 %, Mean = 5.289944

Para el analisis de manera individual

gla = model$gl.a
glb = model$gl.b
glc = model$gl.c
Ea = model$Ea
Eb = model$Eb
Ec = model$Ec
salida1 = with(data, LSD.test(rendimiento, variedades, gla, Ea))
salida1

## $statistics
##    MSerror Df     Mean       CV  t.value      LSD
##   1.492262 10 5.289944 23.09252 2.228139 1.283094
## 
## $parameters
##         test p.ajusted     name.t ntr alpha
##   Fisher-LSD      none variedades   6  0.05
## 
## $means
##    rendimiento       std r      LCL      UCL   Min   Max   Q25   Q50   Q75
## V1    5.417222 1.9651222 9 4.509938 6.324507 2.373 8.582 4.076 4.889 6.808
## V2    6.286444 1.3223596 9 5.379160 7.193729 4.007 8.284 5.630 6.297 7.177
## V3    6.080111 1.8820111 9 5.172827 6.987396 2.620 8.611 4.676 6.672 7.328
## V4    5.569000 1.6556567 9 4.661715 6.476285 2.726 7.735 4.816 5.630 6.881
## V5    5.249000 1.0625675 9 4.341715 6.156285 3.276 6.880 4.582 5.340 6.011
## V6    3.137889 0.8459469 9 2.230604 4.045173 1.556 4.425 2.706 3.214 3.724
## 
## $comparison
## NULL
## 
## $groups
##    rendimiento groups
## V2    6.286444      a
## V3    6.080111      a
## V4    5.569000      a
## V1    5.417222      a
## V5    5.249000      a
## V6    3.137889      b
## 
## attr(,"class")
## [1] "group"

salida2 = with(data, LSD.test(rendimiento, nitrogeno, glb, Eb))
salida2

## $statistics
##    MSerror Df     Mean       CV  t.value       LSD
##   0.743727  4 5.289944 16.30255 2.776445 0.7981318
## 
## $parameters
##         test p.ajusted    name.t ntr alpha
##   Fisher-LSD      none nitrogeno   3  0.05
## 
## $means
##    rendimiento      std  r      LCL      UCL   Min   Max     Q25    Q50     Q75
## N1    4.020611 1.077777 18 3.456247 4.584976 2.373 5.795 3.28850 3.9825 4.56350
## N2    5.478222 1.287460 18 4.913858 6.042587 2.822 7.334 4.71100 5.4445 6.61175
## N3    6.371000 2.005931 18 5.806636 6.935364 1.556 8.611 6.13125 6.8805 7.58150
## 
## $comparison
## NULL
## 
## $groups
##    rendimiento groups
## N3    6.371000      a
## N2    5.478222      b
## N1    4.020611      c
## 
## attr(,"class")
## [1] "group"

Para el analisis de la interaccion

salida3 = with(data, LSD.test(rendimiento, nitrogeno:variedades, glc, Ec))
salida3

## $statistics
##     MSerror Df     Mean      CV  t.value      LSD
##   0.4116459 20 5.289944 12.1286 2.085963 1.092755
## 
## $parameters
##         test p.ajusted               name.t ntr alpha
##   Fisher-LSD      none nitrogeno:variedades  18  0.05
## 
## $means
##       rendimiento       std r      LCL      UCL   Min   Max    Q25   Q50    Q75
## N1:V1    3.571667 1.0597029 3 2.798972 4.344361 2.373 4.384 3.1655 3.958 4.1710
## N1:V2    4.934333 0.8958623 3 4.161639 5.707028 4.007 5.795 4.5040 5.001 5.3980
## N1:V3    4.249667 1.5170868 3 3.476972 5.022361 2.620 5.621 3.5640 4.508 5.0645
## N1:V4    4.059000 1.4665562 3 3.286305 4.831695 2.726 5.630 3.2735 3.821 4.7255
## N1:V5    4.101667 0.7182272 3 3.328972 4.874361 3.276 4.582 3.8615 4.447 4.5145
## N1:V6    3.207333 0.5850960 3 2.434639 3.980028 2.572 3.724 2.9490 3.326 3.5250
## N2:V1    5.132000 1.1961576 3 4.359305 5.904695 4.076 6.431 4.4825 4.889 5.6600
## N2:V2    6.713667 0.9417602 3 5.940972 7.486361 5.630 7.334 6.4035 7.177 7.2555
## N2:V3    6.122333 1.2645206 3 5.349639 6.895028 4.676 7.019 5.6740 6.672 6.8455
## N2:V4    5.553667 1.2586717 3 4.780972 6.326361 4.816 7.007 4.8270 4.838 5.9225
## N2:V5    5.633333 0.3433574 3 4.860639 6.406028 5.340 6.011 5.4445 5.549 5.7800
## N2:V6    3.714333 0.8167952 3 2.941639 4.487028 2.822 4.425 3.3590 3.896 4.1605
## N3:V1    7.548000 0.9228196 3 6.775305 8.320695 6.808 8.582 7.0310 7.254 7.9180
## N3:V2    7.211333 1.0029179 3 6.438639 7.984028 6.297 8.284 6.6750 7.053 7.6685
## N3:V3    7.868333 0.6650010 3 7.095639 8.641028 7.328 8.611 7.4970 7.666 8.1385
## N3:V4    7.094333 0.5650569 3 6.321639 7.867028 6.667 7.735 6.7740 6.881 7.3080
## N3:V5    6.012000 0.9017051 3 5.239305 6.784695 5.080 6.880 5.5780 6.076 6.4780
## N3:V6    2.492000 0.8494634 3 1.719305 3.264695 1.556 3.214 2.1310 2.706 2.9600
## 
## $comparison
## NULL
## 
## $groups
##       rendimiento groups
## N3:V3    7.868333      a
## N3:V1    7.548000     ab
## N3:V2    7.211333    abc
## N3:V4    7.094333   abcd
## N2:V2    6.713667   bcde
## N2:V3    6.122333   cdef
## N3:V5    6.012000   defg
## N2:V5    5.633333    efg
## N2:V4    5.553667     fg
## N2:V1    5.132000    fgh
## N1:V2    4.934333     gh
## N1:V3    4.249667     hi
## N1:V5    4.101667     hi
## N1:V4    4.059000     hi
## N2:V6    3.714333      i
## N1:V1    3.571667     ij
## N1:V6    3.207333     ij
## N3:V6    2.492000      j
## 
## attr(,"class")
## [1] "group"

Graficando los datos de rendimiento para ambos factores de tratamiento y termino de interaccion Primero se observa la relacion con sus barras de error respectivas para grafica de rendimiento en funcion de las variedades

bar.err(salida1$means, variation = "SE", ylim = c(0,15), )
title(cex.main = 0.8, main = "Rendimiento segun la variedad", xlab = "Variedades de Cereal", ylab = "Rendimiento (kg/ha)")

Segundo se observa la relacion con sus barras de error respectivas para grafica de rendimiento en funcion de las tasas de nitrogeno

 bar.err(salida2$means, variation = "SE", ylim = c(0,15))

title(cex.main = 0.8, main = "Rendimiento segun la tasa de nitrogeno (kg/ha)", xlab = "Tasas de nitrogeno", ylab = "Rendimiento (kg/ha)")

Tercero se observa la relacion con sus barras de error respectivas para grafica de rendimiento en funcion de nitrogeno/variedades

bar.err(salida3$means, variation = "SE", ylim = c(0,15), xlab = "Nitrogeno kg/ha", ylab = "Rendimiento")

Analizando medias de interaccion

x = aov(rendimiento~nitrogeno:variedades, data = data)
model.tables(x, "mean")

## Tables of means
## Grand mean
##          
## 5.289944 
## 
##  nitrogeno:variedades 
##          variedades
## nitrogeno V1    V2    V3    V4    V5    V6   
##        N1 3.572 4.934 4.250 4.059 4.102 3.207
##        N2 5.132 6.714 6.122 5.554 5.633 3.714
##        N3 7.548 7.211 7.868 7.094 6.012 2.492

input = ("nitrogeno V1    V2    V3    V4    V5    V6   
       N1 3.572 4.934 4.250 4.059 4.102 3.207
       N2 5.132 6.714 6.122 5.554 5.633 3.714
       N3 7.548 7.211 7.868 7.094 6.012 2.492")
Means = as.matrix(read.table(textConnection(input), header = TRUE, row.names = 1))
Means

##       V1    V2    V3    V4    V5    V6
## N1 3.572 4.934 4.250 4.059 4.102 3.207
## N2 5.132 6.714 6.122 5.554 5.633 3.714
## N3 7.548 7.211 7.868 7.094 6.012 2.492

barplot(Means, beside = TRUE, legend = TRUE, ylim = c(0,10), xlab = "Nitrogeno:Variedades", ylab ="Rendimiento (kg/ha)")

Finalmente se concluye que en los dos valores de F uno que representa el efecto de la variedad y el otro la interaccion entre variedad:nitrogeno presentan diferencias significativas por los valores obtenidos.

Parcial1

Tatiana Pérez F y Dana Moreno B

10/11/2020

Las columnas 1 y 3 son las que presentan el mayor rendimiento y se encuentran dentro del mismo grupo.

Se aleteorizan los 6 programas (A,B,C,D,E,F) de aplicacion de nitrogeno en las 4 repiticiones o bloqueos

Los tratamientos son 24 concentraciones diferentes de nitrogeno (ppm * 10-2) asignadas al azar