El presente documento muestra la exploración de los datos de germinación de la base ā€œseedsā€ que se encuentra en la libreria ā€œfarawayā€.

require(faraway)
require(ggplot2)
data(seeds)
head(seeds)
##   germ moisture covered
## 1   22        1      no
## 2   41        3      no
## 3   66        5      no
## 4   82        7      no
## 5   79        9      no
## 6    0       11      no

Como se observa en la Tabla la base contiene 3 variables que corresponde al porcentaje de germinación (germ), la humedad del suelo (moisture) y si esta tapado (covered).

Exploratorio Univariado (Caracterizar)

#Germinación
summary(seeds$germ)
##    Min. 1st Qu.  Median    Mean 3rd Qu.    Max.    NA's 
##    0.00   29.00   51.00   47.81   73.00   84.00       1
ggplot(seeds,aes(x=germ))+geom_histogram()+theme_bw()

Como se observa en los indicadores, el promedio de germinación de las plantas es del 47.81%, sin embargo la variación es muy alta desde 0% hasta 84%, lo cual se observa tambien en el grafico de histograma. Este resultado indica que posiblemente esta variación en el % de germinación se deba a los tratamientos, en este caso al tratamiento principal que es la humedad del suelo.

Exploratorio Bivariado (Relacionar)

seeds$moisture=as.factor(seeds$moisture)
tapply(seeds$germ,seeds$moisture,mean,na.rm=TRUE)
##        1        3        5        7        9       11 
## 33.50000 60.62500 71.37500 65.00000 57.57143  0.00000
ggplot(seeds,aes(x=moisture,y=germ,fill=moisture))+geom_boxplot()+theme_bw()+scale_fill_brewer()

El resultado de la figura muestra una relación entre humedad del suelo y el % germinación indicando que el nivel 5% de humedad del suelo se destaca como el que mejor % germinación presenta en promedio y con una menor varianza que los demas. Por otro lado el 11% de humedad del suelo se considera como un nivel letal para el % de germinación.

tapply(seeds$germ,seeds$covered,mean,na.rm=TRUE)
##       no      yes 
## 47.95833 47.65217
ggplot(seeds,aes(x=moisture,y=germ,fill=moisture))+geom_boxplot()+theme_bw()+scale_fill_brewer()+facet_grid(~covered)

Se observa en la figura que la variable covered presenta un efecto sobre la relación entre % de germinación y humedad del suelo, modificando el pico en el cual se alcanza la mayor efectividad de germinación.

seeds$moisture=as.numeric(seeds$moisture)
ggplot(seeds,aes(x=moisture,y=germ))+geom_point()+geom_smooth()+theme_bw()

ggplot(seeds,aes(x=moisture,y=germ,col=covered))+geom_smooth()+theme_bw()

g1=ggplot(seeds,aes(x=moisture,y=germ,col=covered))+geom_smooth()+theme_bw()
require(plotly)
ggplotly(g1)