Datos de Diseno Experimental Irrigación

require(faraway)
## Loading required package: faraway
require(ggplot2)
## Loading required package: ggplot2
require(plotly)
## Loading required package: plotly
## 
## Attaching package: 'plotly'
## The following object is masked from 'package:ggplot2':
## 
##     last_plot
## The following object is masked from 'package:stats':
## 
##     filter
## The following object is masked from 'package:graphics':
## 
##     layout
require(agricolae)
## Loading required package: agricolae
## Warning: package 'agricolae' was built under R version 4.0.3
head(irrigation,3)
##   field irrigation variety yield
## 1    f1         i1      v1  35.4
## 2    f1         i1      v2  37.9
## 3    f2         i2      v1  36.7
irrigation
##    field irrigation variety yield
## 1     f1         i1      v1  35.4
## 2     f1         i1      v2  37.9
## 3     f2         i2      v1  36.7
## 4     f2         i2      v2  38.2
## 5     f3         i3      v1  34.8
## 6     f3         i3      v2  36.4
## 7     f4         i4      v1  39.5
## 8     f4         i4      v2  40.0
## 9     f5         i1      v1  41.6
## 10    f5         i1      v2  40.3
## 11    f6         i2      v1  42.7
## 12    f6         i2      v2  41.6
## 13    f7         i3      v1  43.6
## 14    f7         i3      v2  42.8
## 15    f8         i4      v1  44.5
## 16    f8         i4      v2  47.6

Esta base de datos se compone de 4 variables: field= campo, irrigation= irrigación, variety=variedad y yield=rendimiento. Se hicieron 16 observaciones para determinar los efectos de los metodos de irrigación sobre dos variedades de cultivos distintos.

#y= yield - rendimiento #x1= irrigation - irrigación #x2= variety - variedad(tratamiento)

irrigation$irrigation=as.factor(irrigation$irrigation)
irrigation$variety=as.factor(irrigation$variety)

grafica1=ggplot(irrigation,aes(x=yield))+geom_histogram()+theme_bw()+ylab("Frecuencia")+xlab("Rendimiento")+ggtitle("Gráfica 1")
grafica1
## `stat_bin()` using `bins = 30`. Pick better value with `binwidth`.

Primero, se deben pasar las variables irrigación y variedad que son numericos a factores para poderlos manipular.

Gráfica 1 El histograma indica que hay variabilidad en los datos, incluso, el rango de rendimiento que presenta mayor frecuencia (2.0) es entre 40-43 aproximadamente, mientras que los demás intervalos sólo alcanzan frecuencias de 1.0 y otras 0.

ggplot(irrigation,aes(y=yield,x=variety,fill=variety))+geom_boxplot()+theme_bw()+ylab("Rendimiento")+xlab("Variedad")+ggtitle("Gráfica 2")

Gráfica 2 El diagrama de cajas muestra que ambas variedades de cultivo presentan datos con distintos rangos de rendimiento. Además, ambas medias de variedad son aproximadas a 40% de rendimiento, sin embargo, la variedad dos presenta un dato atípico.

ggplot(irrigation,aes(y=yield,x=irrigation,fill=irrigation))+geom_boxplot()+theme_bw()+ylab("Rendimiento")+xlab("Irrigación")+ggtitle("Gráfica 3")

Gráfica 3 Este diagrama de cajas nos ayuda a identificar que método de irrigación podría ser más favorable para el cultivo, según este caso, el mejor método es la Irrigación 4 (i4), mientra que Irrigación 1 (i1) es el que tiene menor rendimiento en comparación a los otros métodos.

##Modelo para comparar la irrigación con el rendimiento

Mod1=lm(yield~irrigation,data=irrigation )
anova(Mod1)
## Analysis of Variance Table
## 
## Response: yield
##            Df Sum Sq Mean Sq F value Pr(>F)
## irrigation  3  40.19  13.397  1.0699 0.3984
## Residuals  12 150.26  12.522
summary(Mod1)
## 
## Call:
## lm(formula = yield ~ irrigation, data = irrigation)
## 
## Residuals:
##    Min     1Q Median     3Q    Max 
## -4.600 -3.025  0.300  2.825  4.700 
## 
## Coefficients:
##              Estimate Std. Error t value Pr(>|t|)    
## (Intercept)    38.800      1.769  21.930 4.75e-11 ***
## irrigationi2    1.000      2.502   0.400    0.696    
## irrigationi3    0.600      2.502   0.240    0.815    
## irrigationi4    4.100      2.502   1.639    0.127    
## ---
## Signif. codes:  0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
## 
## Residual standard error: 3.539 on 12 degrees of freedom
## Multiple R-squared:  0.211,  Adjusted R-squared:  0.01378 
## F-statistic:  1.07 on 3 and 12 DF,  p-value: 0.3984

Tabla 1. ANOVA (Irrigación) evidencia que no hay diferencias significativas entre los distintos métodos de irrigación con respecto al rendimiento.

PostANOVA_1=LSD.test(Mod1,"irrigation")
PostANOVA_1
## $statistics
##    MSerror Df   Mean       CV  t.value      LSD
##   12.52167 12 40.225 8.797009 2.178813 5.451751
## 
## $parameters
##         test p.ajusted     name.t ntr alpha
##   Fisher-LSD      none irrigation   4  0.05
## 
## $means
##    yield      std r      LCL      UCL  Min  Max    Q25   Q50    Q75
## i1  38.8 2.736177 4 34.94503 42.65497 35.4 41.6 37.275 39.10 40.625
## i2  39.8 2.817801 4 35.94503 43.65497 36.7 42.7 37.825 39.90 41.875
## i3  39.4 4.448221 4 35.54503 43.25497 34.8 43.6 36.000 39.60 43.000
## i4  42.9 3.856596 4 39.04503 46.75497 39.5 47.6 39.875 42.25 45.275
## 
## $comparison
## NULL
## 
## $groups
##    yield groups
## i4  42.9      a
## i2  39.8      a
## i3  39.4      a
## i1  38.8      a
## 
## attr(,"class")
## [1] "group"

Tabla 1. PostANOVA_1 (Irrigación) En $statistics la media general de los datos de irrigación es 40.225. En $means se observan los intervalos de confianza de cada método de irrigación (i1, i2, i3, i4). En $comparison dice que es nulo, por lo que no hay diferencias significativas entre los mismos tipos de irrigación. En $groups se confirma de que no hay diferencia de medias en los métodos de irrigación con respecto al rendimiento porque todos los métodos están clasificados con la misma letra “a”.

bar.group(PostANOVA_1$groups,ylim=c(0,60))

Diagrama de barras de los métodos de irrigación vs. el rendimiento Con este diagrama se vizualizan los resultados del PostANOVA_1 realizado anterior a este código. Que como bien confirma que no hay diferencias entre los distintos métodos de irrigación con respecto al rendimiento, por lo tanto, se encuentran en la misma categoria “a”.

##Modelo para comparar la irrigación vs. Variedad con el rendimiento

Mod2=lm(yield~irrigation+variety,data = irrigation)
anova(Mod2)
## Analysis of Variance Table
## 
## Response: yield
##            Df Sum Sq Mean Sq F value Pr(>F)
## irrigation  3  40.19  13.397  0.9956 0.4308
## variety     1   2.25   2.250  0.1672 0.6904
## Residuals  11 148.01  13.456

Tabla 2. ANOVA (Irrigación vs.Variedad) Ninguna de las variables (irrigación y variedad) en la tabla muestran valores significativos con respecto al rendimiento.

PostANOVA_2=LSD.test(Mod2,"variety")
PostANOVA_2
## $statistics
##    MSerror Df   Mean       CV  t.value      LSD
##   13.45545 11 40.225 9.119124 2.200985 4.036791
## 
## $parameters
##         test p.ajusted  name.t ntr alpha
##   Fisher-LSD      none variety   2  0.05
## 
## $means
##    yield      std r      LCL      UCL  Min  Max    Q25   Q50    Q75
## v1 39.85 3.821368 8 36.99556 42.70444 34.8 44.5 36.375 40.55 42.925
## v2 40.60 3.504691 8 37.74556 43.45444 36.4 47.6 38.125 40.15 41.900
## 
## $comparison
## NULL
## 
## $groups
##    yield groups
## v2 40.60      a
## v1 39.85      a
## 
## attr(,"class")
## [1] "group"

Tabla 1. PostANOVA_2 (Variedad) En $statistics la media general para todos los datos sigue siendo la misma (40.255). En $means se observan los intervalos de confianza de las dos variedades de cultivos (v1 y v2). En $comparison dice que no hay diferencia entre los dos tipos de variedad de cultivo. En $group confirma que no hay diferencia de medias para las variedades con respecto al rendimiento.

bar.group(PostANOVA_2$groups,xlim=c(0,50),horiz = T,las=2)

Diagrama de barras de la variedad vs. el rendimiento La variedad 1 (v1) tiene una media de 39.85, mientras que la variedad 2 (v2) tiene una media de 40.60. Según el análisis de PostANOVA_2 ambas medias no son significativamente diferentes como para causar efectos sobre el rendimiento de los cultivos.

En conclusión, ni los distintos tipos de variedades (v1 y v2) ni métodos de irrigación (i1, i2, i3 e i4) afectan al rendimiento de los cultivos.