#Diseno Experimental P1
Para el siguiente ejercicio se deberán descargar las siguientes librerias:
require(faraway)
require(ggplot2)
require(agricolae)
data(seeds)
seeds
## germ moisture covered
## 1 22 1 no
## 2 41 3 no
## 3 66 5 no
## 4 82 7 no
## 5 79 9 no
## 6 0 11 no
## 7 25 1 no
## 8 46 3 no
## 9 72 5 no
## 10 73 7 no
## 11 68 9 no
## 12 0 11 no
## 13 27 1 no
## 14 59 3 no
## 15 51 5 no
## 16 73 7 no
## 17 74 9 no
## 18 0 11 no
## 19 23 1 no
## 20 38 3 no
## 21 78 5 no
## 22 84 7 no
## 23 70 9 no
## 24 0 11 no
## 25 45 1 yes
## 26 65 3 yes
## 27 81 5 yes
## 28 55 7 yes
## 29 31 9 yes
## 30 0 11 yes
## 31 41 1 yes
## 32 80 3 yes
## 33 73 5 yes
## 34 51 7 yes
## 35 36 9 yes
## 36 0 11 yes
## 37 42 1 yes
## 38 79 3 yes
## 39 74 5 yes
## 40 40 7 yes
## 41 45 9 yes
## 42 0 11 yes
## 43 43 1 yes
## 44 77 3 yes
## 45 76 5 yes
## 46 62 7 yes
## 47 NA 9 yes
## 48 0 11 yes
La información anterior son los resultados de un experimento que consiste en determinar los efectos de humedad sobre la germinación de semillas. Ocho cajas de 100 semillas fueron tratadas con el mismo nivel de humedad, 4 cajas estaban cubiertas y 4 descubiertaS. Este proceso se repitió con 6 niveles de humedad diferentes.
Esta base de datos se compone de 3 variables: Porcentaje de germinación (germ), niveles de humedad (moisture) y el factor si estan cubiertas o no (covered).
##Exploración de los Datos
ggplot(seeds,aes(x=germ))+geom_histogram()+theme_bw()+ylab("Frecuencia")+xlab("Porcentaje de Germinación (%)")+ggtitle("Grafica 1")
Grafica 1 Histograma del porcentaje de germinación. En el histograma se observa que hay una variabilidad muy grande en el porcentaje de germinación. Hay algunas semillas que germinaron y otras no. El rango de germinanción va desde 0% hasta superior a 75%. En el experimento hubo mayor frecuencia en las semillas que no germinaron.
ggplot(seeds,aes(y=germ,x=covered,fill=covered))+geom_boxplot()+theme_bw()+ylab("Porcentaje de germinación (%)")+xlab("Cubierto (factor)")+ggtitle("Grafica 2")
Grafica 2 Diagrama de Cajas para el porgentaje de germinación y el factor “Cubierta”. Esta relación no es sufierinte para saber qué factor influye específicamente en el procentaje de germinación (%) de las semillas. En el diagrama, ambas cajas tienen un quartil 3 (Q3) que es igual al 75% de las semillas que han germinado entonces, no es considerado como un cambio tan evidente para hacer una comparación.
ggplot(seeds,aes(y=germ,x=moisture))+geom_point()+theme_bw()+geom_smooth()+ylab("Porcentaje de germinación (%)")+xlab("Nivel de Humedad")+ggtitle("Grafica 3")
Grafica 3 Diagrama de Puntos: Porcentaje de Germinación(%) vs. Nivel de Humedad
La linea graficada muestra que los datos toman la forma de una parábola cóncava. Hay niveles de humedad que perjudican o favorecen la geminanción. El nivel 5 de humedad muestra mejores resultados para la germinación de la semilla (Aprox. 70%), mientras que el nivel 1 y 11 no tanto, antes evitan que la semilla germine.
##Modelo de Diseño - V1
class(seeds$moisture)
## [1] "numeric"
seeds$moisture2=as.factor(seeds$moisture)
class(seeds$moisture2)
## [1] "factor"
mod1=lm(germ~moisture2+covered,data=seeds)
anova(mod1)
## Analysis of Variance Table
##
## Response: germ
## Df Sum Sq Mean Sq F value Pr(>F)
## moisture2 5 28711.8 5742.4 30.7764 1.036e-12 ***
## covered 1 0.1 0.1 0.0008 0.9782
## Residuals 40 7463.3 186.6
## ---
## Signif. codes: 0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
Primero se pasa el nivel de humedad (moisture) de variable numerica a variable categórica (factor=moisture 2). Luego, hacemos un análisis(ANOVA) para saber que variables ingluyen directamente sobre la germinación. En la tabla superior, vemos que el P-value para el nivel de humedad (moisture 2) es muy significativa, por lo tanto, estaría relacionada con el porcentaje de germinación (%), mientras que el factor (cubierto) no lo es, que respalda a la interpretación del gráfico 2.
##Exploración de los Datos II Una vez que se sabe que el nivel de humedad (moisture 2) es significativa es necesario saber que niveles son los que dan mejor repuesta al porcentaje de germianación (%).
postanova1=LSD.test(mod1,"moisture2")
postanova1
## $statistics
## MSerror Df Mean CV
## 186.5831 40 47.80851 28.57136
##
## $parameters
## test p.ajusted name.t ntr alpha
## Fisher-LSD none moisture2 6 0.05
##
## $means
## germ std r LCL UCL Min Max Q25 Q50 Q75
## 1 33.50000 10.05698 8 23.739464 43.260536 22 45 24.50 34.0 42.25
## 11 0.00000 0.00000 8 -9.760536 9.760536 0 0 0.00 0.0 0.00
## 3 60.62500 17.37763 8 50.864464 70.385536 38 80 44.75 62.0 77.50
## 5 71.37500 9.34937 8 61.614464 81.135536 51 81 70.50 73.5 76.50
## 7 65.00000 15.62050 8 55.239464 74.760536 40 84 54.00 67.5 75.25
## 9 57.57143 19.67111 7 47.136977 68.005880 31 79 40.50 68.0 72.00
##
## $comparison
## NULL
##
## $groups
## germ groups
## 5 71.37500 a
## 7 65.00000 a
## 3 60.62500 a
## 9 57.57143 a
## 1 33.50000 b
## 11 0.00000 c
##
## attr(,"class")
## [1] "group"
Tabla:postanova1 En $statistics nos muestra que la media es 47.808
En $means nos arroja los intervalos de confianza y los cuartiles que hay para cada nivel de humedad.
En $groups se hace una comparación multiple (diferencia de medias) entre el porcentaje de germinación (%) y los niveles de humedad. La letra “a” agrupa los niveles con mejor porcentaje de germinación (sin ser significativamente distintos entre ellos), estos siendo 5,7,3 Y 9. Y sucecivamente no se recomienda que los niveles de humedad sean 1 y 11 porque pueden perjudicar la germinación de las plantas.
##Interación entre Factores
ggplot(seeds,aes(y=germ,x=moisture,color=covered))+geom_point()+theme_bw()+geom_smooth()+facet_grid(~covered)+ggtitle("Grafica 4")
Gráfica 4 Diagrama de puntos (Porcentaje de germinación (%) vs. Nivel de humedad y factor (cubierta))
En la gráfica 4 podemos observar que no cambia el porcentaje de germinación según el factor (cubierta), el porcentaje de germinación (germ) para ambos no varia, siempre está en 75% aproximadamente. El nivel de humedad (moisture) sí está relacionada con el factor (cubierta) y se forma una intercacción entre ellos. Cuando la tampa de la caja está Cubierta el nivel de humedad están alrededor de 3-5, mientras que si la caja está decubierta los niveles de humedad están alrededor de 6-7.
mod2=lm(germ~moisture2+covered+moisture2:covered,data=seeds)
anova(mod2)
## Analysis of Variance Table
##
## Response: germ
## Df Sum Sq Mean Sq F value Pr(>F)
## moisture2 5 28711.8 5742.4 144.1339 < 2.2e-16 ***
## covered 1 0.1 0.1 0.0035 0.9529
## moisture2:covered 5 6068.9 1213.8 30.4660 8.122e-12 ***
## Residuals 35 1394.4 39.8
## ---
## Signif. codes: 0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
En esta tabla se puede observar que tanto “moisture 2” como “moisture2:covered” son significativos y están muy relacionados con el porcentaje de germinación (%: Varaible Respuesta).
postanova2=LSD.test(mod2,list("moisture2","covered"))
postanova2
## $statistics
## MSerror Df Mean CV
## 39.84048 35 47.80851 13.20253
##
## $parameters
## test p.ajusted name.t ntr alpha
## Fisher-LSD none moisture2:covered 12 0.05
##
## $means
## germ std r LCL UCL Min Max Q25 Q50 Q75
## 1:no 24.25000 2.217356 4 17.843049 30.656951 22 27 22.75 24.0 25.50
## 1:yes 42.75000 1.707825 4 36.343049 49.156951 41 45 41.75 42.5 43.50
## 11:no 0.00000 0.000000 4 -6.406951 6.406951 0 0 0.00 0.0 0.00
## 11:yes 0.00000 0.000000 4 -6.406951 6.406951 0 0 0.00 0.0 0.00
## 3:no 46.00000 9.273618 4 39.593049 52.406951 38 59 40.25 43.5 49.25
## 3:yes 75.25000 6.946222 4 68.843049 81.656951 65 80 74.00 78.0 79.25
## 5:no 66.75000 11.586630 4 60.343049 73.156951 51 78 62.25 69.0 73.50
## 5:yes 76.00000 3.559026 4 69.593049 82.406951 73 81 73.75 75.0 77.25
## 7:no 78.00000 5.830952 4 71.593049 84.406951 73 84 73.00 77.5 82.50
## 7:yes 52.00000 9.201449 4 45.593049 58.406951 40 62 48.25 53.0 56.75
## 9:no 72.75000 4.856267 4 66.343049 79.156951 68 79 69.50 72.0 75.25
## 9:yes 37.33333 7.094599 3 29.935224 44.731443 31 45 33.50 36.0 40.50
##
## $comparison
## NULL
##
## $groups
## germ groups
## 7:no 78.00000 a
## 5:yes 76.00000 a
## 3:yes 75.25000 ab
## 9:no 72.75000 ab
## 5:no 66.75000 b
## 7:yes 52.00000 c
## 3:no 46.00000 cd
## 1:yes 42.75000 d
## 9:yes 37.33333 d
## 1:no 24.25000 e
## 11:no 0.00000 f
## 11:yes 0.00000 f
##
## attr(,"class")
## [1] "group"
Tabla:postanova2
En $statistics la media sigue siendo igual (47.808) En $means nos arroja los intervalos de confianza y los cuartiles que hay para cada nivel de humedad y factor (cubierto).
En $groups se hace una comparación multiple (diferencia de medias) entre el porcentaje de germinación (%),los niveles de humedad (moisture) y factor (cubierto). La letra “a” agrupa a los mejores niveles de humedad según el factor(cuierto). Las condiciones optimas para que las plantas germinen son:
1.Si se desea cubrir la caja de semillas es recomendable un nivel de humedad de 5. 2.Si se desea dejar la caja de semillas decubierta se recomienda un nivel de humedad de 7.
Todo va a depender de las decisiones que tome el investigador con su experimento.