Exploración experimento semillas.

En este informe se realiza un experimento que evalúa el efecto de la humedad del suelo sobre la germinación de las semillas. Los datos se muestran a continuación.

library(faraway)
data(seeds)
head(seeds)
##   germ moisture covered
## 1   22        1      no
## 2   41        3      no
## 3   66        5      no
## 4   82        7      no
## 5   79        9      no
## 6    0       11      no

Se observa que la base tiene un total de 48 registros con 3 variables: germ, moistured y covered.

hist(seeds$germ, col = "pink", main= "% de germinación", ylab="Frecuencia", xlab = "Germinación")

summary(seeds$germ)
##    Min. 1st Qu.  Median    Mean 3rd Qu.    Max.    NA's 
##    0.00   29.00   51.00   47.81   73.00   84.00       1

Se observa en la figura en el histograma una gran variación en los porcentajes de germinación, indicando que algunas semillas presentaron 0% de germinación, mientras que otras lograron alcanzar un 84%. El promedio de germinación es del 47% y la mediana del 51%.

table(seeds$moisture, seeds$covered)
##     
##      no yes
##   1   4   4
##   3   4   4
##   5   4   4
##   7   4   4
##   9   4   4
##   11  4   4

Se observa que la variable moisture tiene 6 niveles de humedad (1, 3, 5, 7, 9 ,11 %), mientras que covered tiene 2 (yes or no). El diseño se encuentra balanceado con un total de 4 replicas.

tapply(seeds$germ, seeds$moisture, mean,na.rm=TRUE)
##        1        3        5        7        9       11 
## 33.50000 60.62500 71.37500 65.00000 57.57143  0.00000
boxplot(seeds$germ~seeds$moisture, col="pink", xlab= "Humedad", ylab="Germinación")

Las cajas mas grandes significan mayor variación en los resultados. Se observa que el porcentaje de germinación promedio más alto se logra cuando el porcentaje de humedad del suelo es del 5%. Adicionalmente el gráfico de cajas nos muestra que es el más estable en términos de variación, si lo comparamos con 3 y 7%, que en general presentan buenos niveles de germinación pero con mucha variación. Definitivamente el 11% resulta letal para la germación ya que en todos los ensayos el % de germinación fue 0.

TAREA cual es el efecto de covered sobre el porcentaje de germinación? cambian los resultados del % de humedad optimo (mayor germinación) dependiendo si la varibale covered es (yes o no)

OPCIONES: Filtrar la base.

tapply(seeds$germ, seeds$covered, mean, na.rm= TRUE)
##       no      yes 
## 47.95833 47.65217
boxplot(seeds$germ~seeds$covered, col ="pink", xlab="Covered", ylab= "Germinación")

Para las semillas cubiertas el porcentaje de germinación es del 47,6% mientras que para aquellas que no están cubierta es del 47,9%. Observamos en el gráfico que el porcentaje de germinación de las semillas no varía mucho con la cobertura, sin embargo, la caja de las que no están cubiertas representa una mayor variación en los resultados, mostrando que la germinación de las semillas no cubiertas es menos estable.

tapply(seeds$germ, list(seeds$covered, seeds$moisture), mean,na.rm=TRUE)
##         1     3     5  7        9 11
## no  24.25 46.00 66.75 78 72.75000  0
## yes 42.75 75.25 76.00 52 37.33333  0
X2 = seeds[seeds$moisture == 5, ]
boxplot(X2$germ~X2$covered,col="pink",ylab = "Tasa de germinaci?n", xlab = "5% la humedad del suelo", main = "Pregunta 2")

X2 = seeds[seeds$moisture == 7, ]
boxplot(X2$germ~X2$covered,col="pink",ylab = "Tasa de germinaci?n", xlab = "7% la humedad del suelo", main = "Pregunta 2")

Mediante los datos anteriores podemos inferir que el 11% de humedad continúa siendo letal para la semilla, y que los datos de germinación respecto a la humedad varían significativamente dependiendo de si la semilla ha sido cubierta o no. Cuando ha sido cubierta, el porcentaje de humedad óptimo corresponde al 7%, con un 78% de germinación. Cuando la semilla no ha sido cubierta, el porcentaje de humedad óptimo es entre el 3 y 5%, con un 75% y un 76% de germinación respectivamente.

require(ggplot2)
## Loading required package: ggplot2
require(plotly)
## Loading required package: plotly
## 
## Attaching package: 'plotly'
## The following object is masked from 'package:ggplot2':
## 
##     last_plot
## The following object is masked from 'package:stats':
## 
##     filter
## The following object is masked from 'package:graphics':
## 
##     layout
seeds$moisture=as.factor(seeds$moisture)
g4=ggplot(seeds, aes(y=germ, x=moisture, fill=moisture))

g5=g4+geom_boxplot()+xlab("Moisture")+ylab("germ")+ggtitle("germs vs moisture")+facet_grid(~covered)

ggplotly(g5)
## Warning: Removed 1 rows containing non-finite values (stat_boxplot).

En el gráfico podemos observar como el hecho de que las semillas estén cubiertas o no afectan la germinación en cuanto a la humedad. Al estar cubiertas evidenciamos que requieren menos humedad para germinar, siendo el 3 y 5% valores aptos. Cuando no están cubiertas, retienen menos humedad, por lo tanto requieren un porcentaje un poco mayor (7%).