Bioestadistica

Explorar datos de germinacion de semillas

require(faraway)
## Loading required package: faraway
data(seeds)
seeds
##    germ moisture covered
## 1    22        1      no
## 2    41        3      no
## 3    66        5      no
## 4    82        7      no
## 5    79        9      no
## 6     0       11      no
## 7    25        1      no
## 8    46        3      no
## 9    72        5      no
## 10   73        7      no
## 11   68        9      no
## 12    0       11      no
## 13   27        1      no
## 14   59        3      no
## 15   51        5      no
## 16   73        7      no
## 17   74        9      no
## 18    0       11      no
## 19   23        1      no
## 20   38        3      no
## 21   78        5      no
## 22   84        7      no
## 23   70        9      no
## 24    0       11      no
## 25   45        1     yes
## 26   65        3     yes
## 27   81        5     yes
## 28   55        7     yes
## 29   31        9     yes
## 30    0       11     yes
## 31   41        1     yes
## 32   80        3     yes
## 33   73        5     yes
## 34   51        7     yes
## 35   36        9     yes
## 36    0       11     yes
## 37   42        1     yes
## 38   79        3     yes
## 39   74        5     yes
## 40   40        7     yes
## 41   45        9     yes
## 42    0       11     yes
## 43   43        1     yes
## 44   77        3     yes
## 45   76        5     yes
## 46   62        7     yes
## 47   NA        9     yes
## 48    0       11     yes
head(seeds,5)
##   germ moisture covered
## 1   22        1      no
## 2   41        3      no
## 3   66        5      no
## 4   82        7      no
## 5   79        9      no

La base de datos contiene 48 observaciones con tres variables que recopilan info del % de germinación (germ), la humedad del suelo (moisture), y si se cubre o no la caja (covered).

mean(seeds$germ, na.rm=T)
## [1] 47.80851
sd(seeds$germ, na.rm=T)
## [1] 28.04316
min(seeds$germ, na.rm = T)
## [1] 0
max(seeds$germ, na.rm=T)
## [1] 84
hist(seeds$germ)

Estos datos nos muestran que en la frecuencia 8 el porcentaje de germinacion fue 0, es decir, el menor frecuencia de germinacion; mientras que la mayor frecuencia de germinacion fue 12 con un 80%, lo que indica que una mayoria de las semillas lograron germinar de forma optima.

boxplot(seeds$germ, col = "green")

En el boxplot podemos observar un sesgo negativo de los datos, puesto que los datos se encuentran ubicados en su mayoria hacia porcentajes altos. Asi que la germinacion de las semillas es segun esto, favorable.

#Bivariado

tapply(seeds$germ, seeds$moisture, mean, na.rm=T)
##        1        3        5        7        9       11 
## 33.50000 60.62500 71.37500 65.00000 57.57143  0.00000
boxplot(seeds$germ~seeds$moisture, col="blue",
        xlab = "Nivel de humedad" , ylab = "% germinación semillas",
        main= "Germinación de semillas de acuerdo a la humedad")

Los graficos obtenidos nos indican el porcentaje de germinacion de las semillas segun la humedad a la que se encuentran sometidas. Asi el nivel de humedad mas adecuado para su germinacion es en 5, mientras que el nivel 11 es el menos indicado.