Irrigation and Yield

Este documento tiene como finalidad mostrar el procesamiento de datos de irrigacion y rendimiento de semillas en la base de “Irrigation” de la libreria de faraway.

Datos Univariados

require(faraway)
## Loading required package: faraway
data("irrigation")
head(irrigation)
##   field irrigation variety yield
## 1    f1         i1      v1  35.4
## 2    f1         i1      v2  37.9
## 3    f2         i2      v1  36.7
## 4    f2         i2      v2  38.2
## 5    f3         i3      v1  34.8
## 6    f3         i3      v2  36.4

El primer paso consta de realizar el llamado a la libreria y despues a la base de datos.

Como se puede observar, la tabla consta de 4 variables; la primera variable es campo(field), refiriendose al lugar de muestreo, la segunda variable es de irrigacion (irrigation), la cual nos especifica de que tipo, la tercera es de la variedad(variety) y la cuarta del rendimiento(yield) obtenido para cada tratamiento.

require(ggplot2)
## Loading required package: ggplot2
ggplot(irrigation,aes(x=variety,fill=variety))+geom_bar()+ ggtitle("Cantidad de variedades")+ylab("Cantidad")+xlab("Variedad")

summary(irrigation$variety)
## v1 v2 
##  8  8

En este grafico de barras se evidencian 2 tipos de variedades para los tratamientos. Cada tipo de variedad contiene las mismas cantidades de tratamientos siendo 8 para cada una de las variedades siendo este un muestreo balanceado.

ggplot(irrigation,aes(y=yield,x=variety,fill=variety))+geom_boxplot()+ ggtitle("Rendimiento por variedades")+ylab("Rendimiento")+xlab("Variedad")

summary(irrigation$yield)
##    Min. 1st Qu.  Median    Mean 3rd Qu.    Max. 
##   34.80   37.60   40.15   40.23   42.73   47.60

Se realizo un diagrama de cajas para poder evidenciar la relacion entre la variedad y el rendimiento, los valosre son muy parecidos, solo se presenta diferencia en un dato atipico perteneciente a la variedad 2, Se evidencia que se ha separado la informacion por cuertiles siendo la variedad 1 la que tiene un rendimiento mas efectivo devido al mayor tamaño de su caja.

Analisis bivariado

ggplot(irrigation,aes(y=yield,x=irrigation,fill=variety))+geom_boxplot()  +  ggtitle("Rendimiento por cada tipo de irriagcion")+ylab("Rendimiento")+xlab("Irrigacion")

summary(irrigation$irrigation)
## i1 i2 i3 i4 
##  4  4  4  4

En este diagrama de cajas se puede observar la efectividad de cada tratamiento dependiendo de la irrigacion y la variedad, podemos observar que el tratamiento de irrigacion 4 es el mas efectivo para ambas variedades, mas que todo para la variedad 2, el tratamiento 3 es inestable para la variedad 1 debido a su margen de error presente en las cuerdad de la caja.