Irrigation and Yield
Este documento tiene como finalidad mostrar el procesamiento de datos de irrigacion y rendimiento de semillas en la base de “Irrigation” de la libreria de faraway.
Datos Univariados
require(faraway)
## Loading required package: faraway
data("irrigation")
head(irrigation)
## field irrigation variety yield
## 1 f1 i1 v1 35.4
## 2 f1 i1 v2 37.9
## 3 f2 i2 v1 36.7
## 4 f2 i2 v2 38.2
## 5 f3 i3 v1 34.8
## 6 f3 i3 v2 36.4
El primer paso consta de realizar el llamado a la libreria y despues a la base de datos.
Como se puede observar, la tabla consta de 4 variables; la primera variable es campo(field), refiriendose al lugar de muestreo, la segunda variable es de irrigacion (irrigation), la cual nos especifica de que tipo, la tercera es de la variedad(variety) y la cuarta del rendimiento(yield) obtenido para cada tratamiento.
require(ggplot2)
## Loading required package: ggplot2
ggplot(irrigation,aes(x=variety,fill=variety))+geom_bar()+ ggtitle("Cantidad de variedades")+ylab("Cantidad")+xlab("Variedad")
summary(irrigation$variety)
## v1 v2
## 8 8
En este grafico de barras se evidencian 2 tipos de variedades para los tratamientos. Cada tipo de variedad contiene las mismas cantidades de tratamientos siendo 8 para cada una de las variedades siendo este un muestreo balanceado.
ggplot(irrigation,aes(y=yield,x=variety,fill=variety))+geom_boxplot()+ ggtitle("Rendimiento por variedades")+ylab("Rendimiento")+xlab("Variedad")
summary(irrigation$yield)
## Min. 1st Qu. Median Mean 3rd Qu. Max.
## 34.80 37.60 40.15 40.23 42.73 47.60
Se realizo un diagrama de cajas para poder evidenciar la relacion entre la variedad y el rendimiento, los valosre son muy parecidos, solo se presenta diferencia en un dato atipico perteneciente a la variedad 2, Se evidencia que se ha separado la informacion por cuertiles siendo la variedad 1 la que tiene un rendimiento mas efectivo devido al mayor tamaño de su caja.
Analisis bivariado
ggplot(irrigation,aes(y=yield,x=irrigation,fill=variety))+geom_boxplot() + ggtitle("Rendimiento por cada tipo de irriagcion")+ylab("Rendimiento")+xlab("Irrigacion")
summary(irrigation$irrigation)
## i1 i2 i3 i4
## 4 4 4 4
En este diagrama de cajas se puede observar la efectividad de cada tratamiento dependiendo de la irrigacion y la variedad, podemos observar que el tratamiento de irrigacion 4 es el mas efectivo para ambas variedades, mas que todo para la variedad 2, el tratamiento 3 es inestable para la variedad 1 debido a su margen de error presente en las cuerdad de la caja.