En el siguiente documento se muestra como realizar a. exploratorio de los datos de la germinación de semillas con base en los datos de Julian Faraway.
require(faraway)
## Loading required package: faraway
data(seeds)
head(seeds,5)
## germ moisture covered
## 1 22 1 no
## 2 41 3 no
## 3 66 5 no
## 4 82 7 no
## 5 79 9 no
La base de datos contiene un total de 48 observaciones con 3 variables que correponden a el porcentaje de germinación (germ), la humedad del suelo (moisture) y si se cubre o no la caja (covered).
#Explorar la Germinación
mean(seeds$germ,na.rm=TRUE) #promedio
## [1] 47.80851
median(seeds$germ,na.rm=TRUE) #mediana
## [1] 51
sd(seeds$germ,na.rm=TRUE) #desviación estandar
## [1] 28.04316
min(seeds$germ,na.rm=TRUE) #minimo
## [1] 0
max(seeds$germ,na.rm=TRUE) #maximo
## [1] 84
length(seeds$germ) #total
## [1] 48
hist(seeds$germ,col="gray")
boxplot(seeds$germ,col="blue")
La interpretación de cada un@.
#Exploratorio Bivariado
tapply(seeds$germ, seeds$moisture, mean,na.rm=TRUE)
## 1 3 5 7 9 11
## 33.50000 60.62500 71.37500 65.00000 57.57143 0.00000
boxplot(seeds$germ~seeds$moisture,col="red",xlab="Humedad del Suelo",ylab="Germinación",main="Cajas")