En este informe se realiza una exploración de los datos del experimento que evalua el efecto de la humedad en el suelo (moisture) sobre la germinación de las semillas (germ). Los datos se muestran a continuación:
library(faraway)
data(seeds)
head(seeds)
## germ moisture covered
## 1 22 1 no
## 2 41 3 no
## 3 66 5 no
## 4 82 7 no
## 5 79 9 no
## 6 0 11 no
Se observa que la base de datos contiene un total de 48 registros con 3 variables: germ, moisture y covered.
hist(seeds$germ,col="yellow",main="% de germinación",ylab="Frecuencia",xlab="% de germinación")
summary(seeds$germ)
## Min. 1st Qu. Median Mean 3rd Qu. Max. NA's
## 0.00 29.00 51.00 47.81 73.00 84.00 1
Se observa en el histograma una gran variación en los porcentajes de germinación indicando que algunas cajas presentaron o% de germinación, mientras que otras lograron alcanzar un 84% de germinación. El promedio de germinación es del 47% y la mediana del 51%.
table(seeds$moisture,seeds$covered)
##
## no yes
## 1 4 4
## 3 4 4
## 5 4 4
## 7 4 4
## 9 4 4
## 11 4 4
Se observa que la variable moisture tiene 6 niveles (1%,3%,5%,7%,9% y 11%) mientras que covered tiene 2 (yes y no). El diseño se encuentra balanceado con un total de 4 replicas.
tapply(seeds$germ,seeds$moisture,mean,na.rm=TRUE)
## 1 3 5 7 9 11
## 33.50000 60.62500 71.37500 65.00000 57.57143 0.00000
boxplot(seeds$germ~seeds$moisture,col="yellow",main="Relación entre el % de germinación y el % de humedad en el suelo",ylab="% de germinación",xlab="% de humedad")
Se observa que el % de germinación promedio más alto se logra cuando el % de humedad del suelo es de 5% (71%), adicionalmente el gráfico de cajas muestra que es el más estable en terminos de variación si lo comparamos con 3% y 7% que en general presentan buenos niveles de germinación pero con mucha variación. Definitivamente 11% resulta letal para la germinación ya que en todos los ensayos el % de germinación fue de cero.
tapply(seeds$germ,seeds$covered,mean,na.rm=TRUE)
## no yes
## 47.95833 47.65217
boxplot(seeds$germ~seeds$covered,col="yellow",main="Efecto de covered sobre el % de germinación",ylab="% de germinación",xlab="Covered")
Se observa que el % de germinación no se altera significativamente dependiendo de si las cajas de semillas están cubiertas o no. El promedio de germinación más alto se logra cuando las cajas no están cubiertas (47.95%). Adicionalmente, cuando las cajas no están cubiertas el % de germinación es mucho más estable que el % de germinación de las semillas que se encuentran en las cajas cubiertas
seeds$moisture==5&seeds$covered=="yes"
## [1] FALSE FALSE FALSE FALSE FALSE FALSE FALSE FALSE FALSE FALSE FALSE FALSE
## [13] FALSE FALSE FALSE FALSE FALSE FALSE FALSE FALSE FALSE FALSE FALSE FALSE
## [25] FALSE FALSE TRUE FALSE FALSE FALSE FALSE FALSE TRUE FALSE FALSE FALSE
## [37] FALSE FALSE TRUE FALSE FALSE FALSE FALSE FALSE TRUE FALSE FALSE FALSE
consulta=seeds$moisture==5&seeds$covered=="yes"
boxplot(seeds$germ~consulta,col="yellow",main="Germinación de semillas con humedad óptima (5%) con respecto a covered (yes)",ylab="% de germinación",xlab="Covered yes")
seeds$moisture==5&seeds$covered=="no"
## [1] FALSE FALSE TRUE FALSE FALSE FALSE FALSE FALSE TRUE FALSE FALSE FALSE
## [13] FALSE FALSE TRUE FALSE FALSE FALSE FALSE FALSE TRUE FALSE FALSE FALSE
## [25] FALSE FALSE FALSE FALSE FALSE FALSE FALSE FALSE FALSE FALSE FALSE FALSE
## [37] FALSE FALSE FALSE FALSE FALSE FALSE FALSE FALSE FALSE FALSE FALSE FALSE
consulta2=seeds$moisture==5&seeds$covered=="no"
boxplot(seeds$germ~consulta2,col="yellow",main="Germinación de semillas con humedad óptima (5%) con respecto a covered (no)",ylab="% de germinación",xlab="Covered no")
Los resultados de germinación de las semillas con el % de humedad óptimo (5%) efectivamente cambian dependiendo de si las cajas de semillas se encuentran cubiertas o no. Teniendo en cuenta las dos gráficas de cajas anteriores se puede observar que cuando las cajas están cubiertas el % de germinación es menos variable. Por otro lado, cuando las cajas no están cuebiertas el % de germinación varía dentro de un rango más amplio (entre el 60%-80%). Sin embargo, cabe resaltar que los % de germinación en los dos casos continuan tomando valores altos.
require(ggplot2)
## Loading required package: ggplot2
require(plotly)
## Loading required package: plotly
##
## Attaching package: 'plotly'
## The following object is masked from 'package:ggplot2':
##
## last_plot
## The following object is masked from 'package:stats':
##
## filter
## The following object is masked from 'package:graphics':
##
## layout
seeds$moisture=as.factor(seeds$moisture)
g1=ggplot(seeds,aes(y=germ,x=moisture, fill=moisture))
g2=g1+geom_boxplot()+theme_bw()+xlab("Moisture")+ylab("Germinación")+ggtitle("Germ vs Moisture")+facet_grid(~covered)
ggplotly(g2)
## Warning: Removed 1 rows containing non-finite values (stat_boxplot).
Se puede evidenciar que el nivel de humedad óptimo para la germinación de las semillas cambia dependiendo de si las cajas de semillas están cubiertas o no. En la gráfica de la derecha (cajas cubiertas) se puede observar que el nivel óptimo de humedad no solo se encuentra en el 5%, el 3% de humedad también resulta ser un nivel funcional para la germinación de las semillas cuando estas se encuentran en cajas cubiertas. Por otro lado, en la gráfica de la izquierda (cajas no cubiertas) los resultados cambian totalmente. Cuando las cajas no están cubiertas los niveles de humedad deben ser mayores para asegurar la germinación de las semillas, el 7% de humedad resulta ser el nivel de humedad óptimo para las semillas que se encuentran en cajas no cubiertas.