Ejemplo de datos con semillas (libreria faraway)

Este documento muestra el procedimiento de los datos de un experimento en semillas con la base de seeds en la libreria faraway.

require(faraway)
data("seeds")
head(seeds)
##   germ moisture covered
## 1   22        1      no
## 2   41        3      no
## 3   66        5      no
## 4   82        7      no
## 5   79        9      no
## 6    0       11      no

La tabla anterior se compone por 3 variables: el porcentaje de germinación (germ), nivel de humedad (moisture) y un factor con nivel no/si (covered).

Explorar los datos semillas

require(ggplot2)
grafica_1=ggplot(seeds,aes(x=germ))+geom_histogram()+theme_bw()
grafica_1

summary(seeds$germ)
##    Min. 1st Qu.  Median    Mean 3rd Qu.    Max.    NA's 
##    0.00   29.00   51.00   47.81   73.00   84.00       1

En el histograma se observa el porcentaje de germinación (germ) de las semillas. Este presenta un rango entre 0% y 84% y un promedio de 43.81%.

grafica_2=ggplot(seeds,aes(y=germ, x=moisture,fill=moisture))+geom_boxplot()+theme_bw()
grafica_2

El diagrama de cajas muestra que la mitad de las semillas (50%) tienen un porcentaje de germinación de 51% con respecto al nivel de humedad. El porcentaje de germinación no presenta variabilidad ya que las cajas son homogéneas.

grafica_3=ggplot(seeds,aes(y=germ, x=moisture,fill=covered))+geom_boxplot()+theme_bw()
grafica_3

Ambos diagramas de cajas presentan una asimetría. La primera que no está cubierta presenta una asimetría negativa, mientras que la que está cubierta presenta una asimetría positiva.

El diagrama que no tiene las semillas cubiertas presenta mayor variabilidad de los datos en comparación con la que está cubierta.

Hay mayor niveles de humedad si las semillas están cubierta.