Explorar datos de semillas

En el siguiente documento se muestra como realizar análisis exploratorio de los datos de la germinación de semillas con base en los datos de Julian Faraway.

require(faraway)
## Loading required package: faraway
## Warning: package 'faraway' was built under R version 4.0.5
data("seeds")
head(seeds,5)
##   germ moisture covered
## 1   22        1      no
## 2   41        3      no
## 3   66        5      no
## 4   82        7      no
## 5   79        9      no

La base de datos contiene un total de 48 observaciones con 3 variables que corresponden a el porcentaje de germinación (germ), la humedad del suelo (moisture) y si se cubre o no la caja (covered).

#Explorar la Germinación
mean(seeds$germ,na.rm = TRUE)##Promedio  ## Se puede usar también seeds[,1]
## [1] 47.80851
median(seeds$germ,na.rm = TRUE)##Mediana
## [1] 51
sd(seeds$germ,na.rm = TRUE)##Desviación estándar
## [1] 28.04316
min(seeds$germ,na.rm = TRUE)##Mínimo
## [1] 0
max(seeds$germ,na.rm = TRUE)##Máximo
## [1] 84
length(seeds$germ)##Total
## [1] 48
hist(seeds$germ,col = "gray")

hist(seeds$germ,col = "gray",xlab = "Germinación",ylab = "Número de plantas",main = "Gráfica de germinación")

boxplot(seeds$germ,col = "blue",main = "Cajas y bigotes germinación")

Teniendo en cuenta los valores del tendencia y el histograma, vemos que las semillas plantadas generalmente tienen un porcentaje de germinación del 47.8% , sin embargo la mayor cantidad de plantas se ubican en un porcentaje de crecimiento entre 70% y 80% con un total de 12 plantas, esta gran diferencia de entre estas dos variables es causada debido a la gran oscilación que existe entre los datos, también por la aparición de 8 plantas que presentaron una germinación del 0%.

#Exploratorio Bivariado

tapply(seeds$germ,seeds$moisture,mean,na.rm= TRUE)
##        1        3        5        7        9       11 
## 33.50000 60.62500 71.37500 65.00000 57.57143  0.00000
boxplot(seeds$germ~seeds$moisture,col= "red")

boxplot(seeds$germ~seeds$moisture,col= "red",xlab = "Humedad del suelo", ylab = "Germinación", main ="Relación entre crecimiento y la humedad del suelo")

Teniendo en cuenta la gráfica de cajas y bigotes entre la variable humedad del suelo y la germinación se puede observar que los mejores resultados de germinación se obtuvieron con una humedad entre el 5% y el 7%, humedades inferiores al 3% presentan crecimiento pero con inconsistencias y humedades superiores al 11% no son recomendadas, pues genera fatalidad en las plantas.