En el siguiente documento se muestra cómo realizar análisis exploratorio de los datos de la germinación de semillas con base en los datos de Julian Faraway.
require(faraway)
## Loading required package: faraway
## Warning: package 'faraway' was built under R version 4.0.5
data(seeds)
head(seeds,5)
## germ moisture covered
## 1 22 1 no
## 2 41 3 no
## 3 66 5 no
## 4 82 7 no
## 5 79 9 no
La base de datos contiene un total de 48 observaciones con 3 variables que corresponden al % de germinación (germ), la humedad del suelo (moisture) y si se cubre o no la caja (covered).
cat("La media del % de germinación es ", mean(seeds$germ,na.rm = TRUE))
## La media del % de germinación es 47.80851
cat("La mediana del % de germinación es ", median(seeds$germ,na.rm = TRUE))
## La mediana del % de germinación es 51
cat("La desviación estándar del % de germinación es ", sd(seeds$germ,na.rm = TRUE))
## La desviación estándar del % de germinación es 28.04316
cat("El valor mínimo del % de germinación es ", min(seeds$germ,na.rm = TRUE))
## El valor mínimo del % de germinación es 0
cat("El valor máximo del % de germinación es ", max(seeds$germ,na.rm = TRUE))
## El valor máximo del % de germinación es 84
cat("El tamaño de muestra del % de germinación es ", length(seeds$germ))
## El tamaño de muestra del % de germinación es 48
hist(seeds$germ, col="red", main = "Histograma del % de germinación", xlab = "% de germinación")
boxplot(seeds$germ, col="blue", main="Boxplot del % de germinación")
A partir del histograma se evidencia que, aunque la mayoría de semillas tuvieron un porcentaje de germinación mayor al 20%, hay una parte que no tuvo una germinación adecuada, lo cual posiblemente es causado por algún cambio en el nivel de humedad del suelo, el cual fue desfavorable y, por lo tanto, provocó que el desarrollo y germinación de las semillas no fuese el adecuado.
tapply(seeds$germ, seeds$moisture, mean, na.rm=TRUE)
## 1 3 5 7 9 11
## 33.50000 60.62500 71.37500 65.00000 57.57143 0.00000
boxplot(seeds$germ~seeds$moisture, col="gray", xlab = "Humedad del suelo", ylab = "% de Germinación")
Al contrastar los datos del porcentaje de germinación y el nivel de humedad del suelo, se confirma que esta última variable es la que interviene directamente en el crecimiento de las semillas, puesto que si la humedad es excesiva (11) entonces la semilla no germina y si el nivel es muy bajo (1) la germinación no será muy alta. Con base en estos resultados, se recomienda que el nivel de humedad sea alrededor de 5 para un mayor rendimiento en la germinación de las semillas.