Un biólogo analizó un experimento para determinar el efecto del contenido de humedad en la germinación de semillas. Se trataron ocho cajas de 100 semillas cada una con el mismo nivel de humedad. Se taparon 4 cajas y se dejaron 4 sin tapar. El proceso se repitió a 6 niveles de humedad diferentes (escala no lineal). El objetivo de este informe es realizar un análisis que permita identificar los niveles de humedad que sean más favorables a la germinación, además de identificar si influye el que estén cubiertos o no.
ggplot(seeds,aes(x=germ))+geom_histogram()+theme_bw()+ggtitle("Gráfico 1")
ggplot(seeds,aes(y=germ,x=covered,fill=covered))+geom_boxplot()+theme_bw()+ggtitle("Gráfico 2")
ggplot(seeds,aes(y=germ,x=moisture))+geom_point()+theme_bw()+geom_smooth()+ggtitle("Gráfico 3")
En el gráfico 1 se logra observar que existe una variabilidad muy grande en el porcentaje de germinación. Por ejemplo, 8 de las cajas en las que se sembraron las semillas no germinaron y otras si se observa que germinaron con mucho éxito. En el gráfico 2 se observa en el diagrama de cajas que no existe mucha diferencia en cuanto a que la semilla esté cubierta o no, es decir, no influye de manera significativa en la germinación. En el gráfico 3 se observa una variación fuerte de la germinación frente a la variable humedad. Se puede decir que existen valores que le favorecen más a la germinación.
class(seeds$moisture)
[1] "numeric"
seeds$moisture2=as.factor(seeds$moisture)
class(seeds$moisture2)
[1] "factor"
mod1=lm(germ~moisture2+covered,data=seeds)
anova(mod1)
Analysis of Variance Table
Response: germ
Df Sum Sq Mean Sq F value Pr(>F)
moisture2 5 28711.8 5742.4 30.7764 1.036e-12 ***
covered 1 0.1 0.1 0.0008 0.9782
Residuals 40 7463.3 186.6
---
Signif. codes: 0 ‘***’ 0.001 ‘**’ 0.01 ‘*’ 0.05 ‘.’ 0.1 ‘ ’ 1
postanova1=LSD.test(mod1,"moisture2")
postanova1
$statistics
MSerror Df Mean CV
186.5831 40 47.80851 28.57136
$parameters
test p.ajusted name.t ntr alpha
Fisher-LSD none moisture2 6 0.05
$means
germ std r LCL UCL Min Max Q25 Q50 Q75
1 33.50000 10.05698 8 23.739464 43.260536 22 45 24.50 34.0 42.25
11 0.00000 0.00000 8 -9.760536 9.760536 0 0 0.00 0.0 0.00
3 60.62500 17.37763 8 50.864464 70.385536 38 80 44.75 62.0 77.50
5 71.37500 9.34937 8 61.614464 81.135536 51 81 70.50 73.5 76.50
7 65.00000 15.62050 8 55.239464 74.760536 40 84 54.00 67.5 75.25
9 57.57143 19.67111 7 47.136977 68.005880 31 79 40.50 68.0 72.00
$comparison
NULL
$groups
germ groups
5 71.37500 a
7 65.00000 a
3 60.62500 a
9 57.57143 a
1 33.50000 b
11 0.00000 c
attr(,"class")
[1] "group"
Con base a los resultados obtenidos en la anova anterior, se logra observar en primer lugar que la humedad si influye de manera significativa en el porcentaje de germinación, mientras que el estar cubierta o no, no influye de manera significativa. Posteriormente en los valores obtenidos en la “postanova1” se observan con mayor detalle los factores que influyen en el porcentaje de germinación. Por ejemplo, se observa que al aplicarle un 5% de humedad a las semillas se obtiene un 71.375% de germinación, aunque no existe una diferencia significativa con los porcentajes 7,3 y 9 de humedad, por lo que se pueden usar cualquiera de los 4 porcentajes para obetener una considerable germinación. Mientras que en 1% si reduce de manera significativa la germinación y en 11% de humedad no se observa porcentaje de germinación, por lo que es recomendable no usar porcentajes muy bajos o muy altos de germinación.
ggplot(seeds,aes(y=germ,x=moisture,color=covered))+geom_point()+theme_bw()+geom_smooth()+facet_grid(~covered)+ggtitle("Gráfico 4")
mod2=lm(germ~moisture2+covered+moisture2:covered,data=seeds)
anova(mod2)
Analysis of Variance Table
Response: germ
Df Sum Sq Mean Sq F value Pr(>F)
moisture2 5 28711.8 5742.4 144.1339 < 2.2e-16 ***
covered 1 0.1 0.1 0.0035 0.9529
moisture2:covered 5 6068.9 1213.8 30.4660 8.122e-12 ***
Residuals 35 1394.4 39.8
---
Signif. codes: 0 ‘***’ 0.001 ‘**’ 0.01 ‘*’ 0.05 ‘.’ 0.1 ‘ ’ 1
postanova2=LSD.test(mod2,list("moisture2","covered"))
postanova2
$statistics
MSerror Df Mean CV
39.84048 35 47.80851 13.20253
$parameters
test p.ajusted name.t ntr alpha
Fisher-LSD none moisture2:covered 12 0.05
$means
germ std r LCL UCL Min Max Q25 Q50 Q75
1:no 24.25000 2.217356 4 17.843049 30.656951 22 27 22.75 24.0 25.50
1:yes 42.75000 1.707825 4 36.343049 49.156951 41 45 41.75 42.5 43.50
11:no 0.00000 0.000000 4 -6.406951 6.406951 0 0 0.00 0.0 0.00
11:yes 0.00000 0.000000 4 -6.406951 6.406951 0 0 0.00 0.0 0.00
3:no 46.00000 9.273618 4 39.593049 52.406951 38 59 40.25 43.5 49.25
3:yes 75.25000 6.946222 4 68.843049 81.656951 65 80 74.00 78.0 79.25
5:no 66.75000 11.586630 4 60.343049 73.156951 51 78 62.25 69.0 73.50
5:yes 76.00000 3.559026 4 69.593049 82.406951 73 81 73.75 75.0 77.25
7:no 78.00000 5.830952 4 71.593049 84.406951 73 84 73.00 77.5 82.50
7:yes 52.00000 9.201449 4 45.593049 58.406951 40 62 48.25 53.0 56.75
9:no 72.75000 4.856267 4 66.343049 79.156951 68 79 69.50 72.0 75.25
9:yes 37.33333 7.094599 3 29.935224 44.731443 31 45 33.50 36.0 40.50
$comparison
NULL
$groups
germ groups
7:no 78.00000 a
5:yes 76.00000 a
3:yes 75.25000 ab
9:no 72.75000 ab
5:no 66.75000 b
7:yes 52.00000 c
3:no 46.00000 cd
1:yes 42.75000 d
9:yes 37.33333 d
1:no 24.25000 e
11:no 0.00000 f
11:yes 0.00000 f
attr(,"class")
[1] "group"
En los valores obtenidos de la segunda anova se observa una diferencia en la en la interacción, es decir, los niveles de humedad dependiendo de si está cubierta o no va a tener una notable diferencia en el porcentaje de germinación.Posteriormente en los valores obtenidos en la “postanova2” se observan los factores de la interacción que mejor influyen en el porcentaje de germinación, obteniendo así que en un porcentaje de humedad del 7% y no estar cubierto influyen en un 78% la germinación al igual que un porcentaje de humedad del 5% y si estar cubiertas, ya que no presentan una diferencia significativa.