En el siguiente documento se muestra como realizar análisis exploratorio de los datos de la germinación de semillas con base en los datos de Julian Faraway.
require(faraway)
## Loading required package: faraway
## Warning: package 'faraway' was built under R version 4.0.5
data("seeds")
head(seeds,5)
## germ moisture covered
## 1 22 1 no
## 2 41 3 no
## 3 66 5 no
## 4 82 7 no
## 5 79 9 no
La base de datos contiene un total de 48 observaciones con 3 variables que corresponden a el porcentaje de germinación (germ), la humedad del suelo (moisture) y si se cubre o no la caja (covered).
#Explorar la Germinación
mean(seeds$germ,na.rm = TRUE)##Promedio ## Se puede usar también seeds[,1]
## [1] 47.80851
median(seeds$germ,na.rm = TRUE)##Mediana
## [1] 51
sd(seeds$germ,na.rm = TRUE)##Desviación estándar
## [1] 28.04316
min(seeds$germ,na.rm = TRUE)##Mínimo
## [1] 0
max(seeds$germ,na.rm = TRUE)##Máximo
## [1] 84
length(seeds$germ)##Total
## [1] 48
hist(seeds$germ,col = "gray")
hist(seeds$germ,col = "gray",xlab = "Germinación",ylab = "Número de plantas",main = "Gráfica de germinación")
boxplot(seeds$germ,col = "blue",main = "Cajas y bigotes germinación")
Teniendo en cuenta los valores del tendencia y el histograma, vemos que las semillas plantadas generalmente tienen un porcentaje de germinación del 47.8% , sin embargo la mayor cantidad de plantas se ubican en un porcentaje de crecimiento entre 70% y 80% con un total de 12 plantas, esta gran diferencia de entre estas dos variables es causada debido a la gran oscilación que existe entre los datos, también por la aparición de 8 plantas que presentaron una germinación del 0%.
#Exploratorio Bivariado
tapply(seeds$germ,seeds$moisture,mean,na.rm= TRUE)
## 1 3 5 7 9 11
## 33.50000 60.62500 71.37500 65.00000 57.57143 0.00000
boxplot(seeds$germ~seeds$moisture,col= "red")
boxplot(seeds$germ~seeds$moisture,col= "red",xlab = "Humedad del suelo", ylab = "Germinación", main ="Relación entre crecimiento y la humedad del suelo")
Teniendo en cuenta la gráfica de cajas y bigotes entre la variable humedad del suelo y la germinación se puede observar que los mejores resultados de germinación se obtuvieron con una humedad entre el 5% y el 7%, humedades inferiores al 3% presentan crecimiento pero con inconsistencias y humedades superiores al 11% no son recomendadas, pues genera fatalidad en las plantas.