En este informe se realiza una exploración de los datos del experimento que evalúa el efecto de la humedad en el suelo (moisture) sobre la germinación de las semillas (germ). Los datos se muestran acontinuación:
library(faraway)
data(seeds)
head(seeds)
## germ moisture covered
## 1 22 1 no
## 2 41 3 no
## 3 66 5 no
## 4 82 7 no
## 5 79 9 no
## 6 0 11 no
Se observa que la base de datos contiene un total de 48 registros con 3 variables: germ, moisture y covered.
hist(seeds$germ, col = "gray", main="% de Germinación", ylab="Frecuencia", xlab= "Germinación")
summary(seeds$germ)
## Min. 1st Qu. Median Mean 3rd Qu. Max. NA's
## 0.00 29.00 51.00 47.81 73.00 84.00 1
Se observa en el histograma una gran variación en los porcentajes de germinación indicando que algunas cajas presentaron 0% de germinación, mientras que otras lograron alcanzar un 84%. El promedio de germinación es de 47% y la mediana del 51%.
table(seeds$moisture,seeds$covered)
##
## no yes
## 1 4 4
## 3 4 4
## 5 4 4
## 7 4 4
## 9 4 4
## 11 4 4
Se observa que la variable moisture tiene 6 niveles de humedad (1, 3, 5, 7, 9 ,11 %), mientras que covered tiene 2 (yes or no). El diseño se encuentra balanceado con un total de 4 replicas.
tapply(seeds$germ, seeds$moisture, mean,na.rm=TRUE)
## 1 3 5 7 9 11
## 33.50000 60.62500 71.37500 65.00000 57.57143 0.00000
boxplot(seeds$germ~seeds$moisture, col= "gray")
Se observa que el % de germinación promedio más alto se logra cuando el % de humedad del suelo es de 5% (71%) adicionalmente, el gráfico de cajas nos muestra que es el más estable en términos de variación si lo comparamos con 3 y 7% que en general presentan buenos niveles de germinación pero con mucha variación. Definitivamente 11% resulta letal para la germinación ya que en todos los ensayos el % de germinación fue de cero.
Opciones: Filtrar la base
head(table(seeds$germ, seeds$covered))
##
## no yes
## 0 4 4
## 22 1 0
## 23 1 0
## 25 1 0
## 27 1 0
## 31 0 1
tapply(seeds$germ, seeds$covered, mean, na.rm=TRUE)
## no yes
## 47.95833 47.65217
boxplot(seeds$germ~seeds$covered, col= c("blue","gray"), ylab = "Germinación", xlab = "Cubierta")
Se observa que el porcentaje de germinación es más alto cuando la semilla se encuentra en la caja descubierta (47.95%) y es menor la germinación de la semilla cuando la caja se encuentra cubierta (47.65%).
tapply(seeds$germ, list(seeds$covered,seeds$moisture) , mean, na.rm=TRUE)
## 1 3 5 7 9 11
## no 24.25 46.00 66.75 78 72.75000 0
## yes 42.75 75.25 76.00 52 37.33333 0
A = seeds[seeds$moisture == 5, ]
boxplot(A$germ~A$covered, col= c("gray","blue"), xlab = "Humedad del suelo 5%", ylab = "Porcentaje de germinación")
B = seeds[seeds$moisture == 7, ]
boxplot(B$germ~B$covered, col= c("blue","gray"), xlab = "Humedad del suelo 7%", ylab = "Porcentaje de germinación")
Se observa que para una mejor germinación de las semillas, el porcentaje de humedad optimo depende si las cajas se encuentran cubiertas o no. Cuando la semilla se encuentra en una caja cubierta, el porcentaje optimo de humedad para su germinación debe ser del 5% (76% de germinación) de lo contrario, cuando la caja se encuentra sin la cubierta, el pocentaje optimo de humedad para su germinación debe ser del 7% (78% de germinación). El tener que cubrir las cajas de las semillas puede ser un gasto de material innecesario ya que se puede tener una humedad del 7% con una mayor germinación.
library(ggplot2)
require(plotly)
## Loading required package: plotly
##
## Attaching package: 'plotly'
## The following object is masked from 'package:ggplot2':
##
## last_plot
## The following object is masked from 'package:stats':
##
## filter
## The following object is masked from 'package:graphics':
##
## layout
seeds$moisture=as.factor(seeds$moisture)
g1=ggplot(seeds, aes (y=germ, x=moisture, fill= moisture))
g2=g1+geom_boxplot()+xlab("Moisture")+ylab("Germ")+ ggtitle("Germ vs Moisture")+facet_grid(~covered)
ggplotly(g2)
## Warning: Removed 1 rows containing non-finite values (stat_boxplot).
Estos gráficos como su título lo dice, son bastantes interactivos e informativos. Podemos observar los resultados de cualquiera de las 3 variables que lleguemos a necesitar (germinación, % de humedad y cobertura). Con el nivel de humedad del 11%, no se va a alcanzar ninguna germinación de las semillas así la caja se encuentre cubierta o no. Una mayor germinación de las semillas es cuando se encuentran con un 7% de humedad, descubierta y cuando la caja está cubierta, con un porcentaje de humedad del 3 y 5 porciento, su germinación también se dará con buenos resultados.