#Diseno Experimental P1

Para el siguiente ejercicio se deberán descargar las siguientes librerias:

require(faraway)
require(ggplot2)
require(agricolae)
data(seeds)
seeds
##    germ moisture covered
## 1    22        1      no
## 2    41        3      no
## 3    66        5      no
## 4    82        7      no
## 5    79        9      no
## 6     0       11      no
## 7    25        1      no
## 8    46        3      no
## 9    72        5      no
## 10   73        7      no
## 11   68        9      no
## 12    0       11      no
## 13   27        1      no
## 14   59        3      no
## 15   51        5      no
## 16   73        7      no
## 17   74        9      no
## 18    0       11      no
## 19   23        1      no
## 20   38        3      no
## 21   78        5      no
## 22   84        7      no
## 23   70        9      no
## 24    0       11      no
## 25   45        1     yes
## 26   65        3     yes
## 27   81        5     yes
## 28   55        7     yes
## 29   31        9     yes
## 30    0       11     yes
## 31   41        1     yes
## 32   80        3     yes
## 33   73        5     yes
## 34   51        7     yes
## 35   36        9     yes
## 36    0       11     yes
## 37   42        1     yes
## 38   79        3     yes
## 39   74        5     yes
## 40   40        7     yes
## 41   45        9     yes
## 42    0       11     yes
## 43   43        1     yes
## 44   77        3     yes
## 45   76        5     yes
## 46   62        7     yes
## 47   NA        9     yes
## 48    0       11     yes

La información anterior son los resultados de un experimento que consiste en determinar los efectos de humedad sobre la germinación de semillas. Ocho cajas de 100 semillas fueron tratadas con el mismo nivel de humedad, 4 cajas estaban cubiertas y 4 descubiertaS. Este proceso se repitió con 6 niveles de humedad diferentes.

Esta base de datos se compone de 3 variables: Porcentaje de germinación (germ), niveles de humedad (moisture) y el factor si estan cubiertas o no (covered).

##Exploración de los Datos

ggplot(seeds,aes(x=germ))+geom_histogram()+theme_bw()+ylab("Frecuencia")+xlab("Porcentaje de Germinación (%)")+ggtitle("Grafica 1")

Grafica 1 Histograma del porcentaje de germinación. En el histograma se observa que hay una variabilidad muy grande en el porcentaje de germinación. Hay algunas semillas que germinaron y otras no. El rango de germinanción va desde 0% hasta superior a 75%. En el experimento hubo mayor frecuencia en las semillas que no germinaron.

ggplot(seeds,aes(y=germ,x=covered,fill=covered))+geom_boxplot()+theme_bw()+ylab("Porcentaje de germinación (%)")+xlab("Cubierto (factor)")+ggtitle("Grafica 2")

Grafica 2 Diagrama de Cajas para el porgentaje de germinación y el factor “Cubierta”. Esta relación no es sufierinte para saber qué factor influye específicamente en el procentaje de germinación (%) de las semillas. En el diagrama, ambas cajas tienen un quartil 3 (Q3) que es igual al 75% de las semillas que han germinado entonces, no es considerado como un cambio tan evidente para hacer una comparación.

ggplot(seeds,aes(y=germ,x=moisture))+geom_point()+theme_bw()+geom_smooth()+ylab("Porcentaje de germinación (%)")+xlab("Nivel de Humedad")+ggtitle("Grafica 3")

Grafica 3 Diagrama de Puntos: Porcentaje de Germinación(%) vs. Nivel de Humedad

La linea graficada muestra que los datos toman la forma de una parábola cóncava. Hay niveles de humedad que perjudican o favorecen la geminanción. El nivel 5 de humedad muestra mejores resultados para la germinación de la semilla (Aprox. 70%), mientras que el nivel 1 y 11 no tanto, antes evitan que la semilla germine.

##Modelo de Diseño - V1

class(seeds$moisture)
## [1] "numeric"
seeds$moisture2=as.factor(seeds$moisture)
class(seeds$moisture2)
## [1] "factor"
mod1=lm(germ~moisture2+covered,data=seeds)
anova(mod1)
## Analysis of Variance Table
## 
## Response: germ
##           Df  Sum Sq Mean Sq F value    Pr(>F)    
## moisture2  5 28711.8  5742.4 30.7764 1.036e-12 ***
## covered    1     0.1     0.1  0.0008    0.9782    
## Residuals 40  7463.3   186.6                      
## ---
## Signif. codes:  0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1

Primero se pasa el nivel de humedad (moisture) de variable numerica a variable categórica (factor=moisture 2). Luego, hacemos un análisis(ANOVA) para saber que variables ingluyen directamente sobre la germinación. En la tabla superior, vemos que el P-value para el nivel de humedad (moisture 2) es muy significativa, por lo tanto, estaría relacionada con el porcentaje de germinación (%), mientras que el factor (cubierto) no lo es, que respalda a la interpretación del gráfico 2.

##Exploración de los Datos II Una vez que se sabe que el nivel de humedad (moisture 2) es significativa es necesario saber que niveles son los que dan mejor repuesta al porcentaje de germianación (%).

postanova1=LSD.test(mod1,"moisture2")
postanova1
## $statistics
##    MSerror Df     Mean       CV
##   186.5831 40 47.80851 28.57136
## 
## $parameters
##         test p.ajusted    name.t ntr alpha
##   Fisher-LSD      none moisture2   6  0.05
## 
## $means
##        germ      std r       LCL       UCL Min Max   Q25  Q50   Q75
## 1  33.50000 10.05698 8 23.739464 43.260536  22  45 24.50 34.0 42.25
## 11  0.00000  0.00000 8 -9.760536  9.760536   0   0  0.00  0.0  0.00
## 3  60.62500 17.37763 8 50.864464 70.385536  38  80 44.75 62.0 77.50
## 5  71.37500  9.34937 8 61.614464 81.135536  51  81 70.50 73.5 76.50
## 7  65.00000 15.62050 8 55.239464 74.760536  40  84 54.00 67.5 75.25
## 9  57.57143 19.67111 7 47.136977 68.005880  31  79 40.50 68.0 72.00
## 
## $comparison
## NULL
## 
## $groups
##        germ groups
## 5  71.37500      a
## 7  65.00000      a
## 3  60.62500      a
## 9  57.57143      a
## 1  33.50000      b
## 11  0.00000      c
## 
## attr(,"class")
## [1] "group"

Tabla:postanova1 En $statistics nos muestra que la media es 47.808

En $means nos arroja los intervalos de confianza y los cuartiles que hay para cada nivel de humedad.

En $groups se hace una comparación multiple (diferencia de medias) entre el porcentaje de germinación (%) y los niveles de humedad. La letra “a” agrupa los niveles con mejor porcentaje de germinación (sin ser significativamente distintos entre ellos), estos siendo 5,7,3 Y 9. Y sucecivamente no se recomienda que los niveles de humedad sean 1 y 11 porque pueden perjudicar la germinación de las plantas.

##Interación entre Factores

ggplot(seeds,aes(y=germ,x=moisture,color=covered))+geom_point()+theme_bw()+geom_smooth()+facet_grid(~covered)+ggtitle("Grafica 4")

Gráfica 4 Diagrama de puntos (Porcentaje de germinación (%) vs. Nivel de humedad y factor (cubierta))

En la gráfica 4 podemos observar que no cambia el porcentaje de germinación según el factor (cubierta), el porcentaje de germinación (germ) para ambos no varia, siempre está en 75% aproximadamente. El nivel de humedad (moisture) sí está relacionada con el factor (cubierta) y se forma una intercacción entre ellos. Cuando la tampa de la caja está Cubierta el nivel de humedad están alrededor de 3-5, mientras que si la caja está decubierta los niveles de humedad están alrededor de 6-7.

mod2=lm(germ~moisture2+covered+moisture2:covered,data=seeds)
anova(mod2)
## Analysis of Variance Table
## 
## Response: germ
##                   Df  Sum Sq Mean Sq  F value    Pr(>F)    
## moisture2          5 28711.8  5742.4 144.1339 < 2.2e-16 ***
## covered            1     0.1     0.1   0.0035    0.9529    
## moisture2:covered  5  6068.9  1213.8  30.4660 8.122e-12 ***
## Residuals         35  1394.4    39.8                       
## ---
## Signif. codes:  0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1

En esta tabla se puede observar que tanto “moisture 2” como “moisture2:covered” son significativos y están muy relacionados con el porcentaje de germinación (%: Varaible Respuesta).

postanova2=LSD.test(mod2,list("moisture2","covered"))
postanova2
## $statistics
##    MSerror Df     Mean       CV
##   39.84048 35 47.80851 13.20253
## 
## $parameters
##         test p.ajusted            name.t ntr alpha
##   Fisher-LSD      none moisture2:covered  12  0.05
## 
## $means
##            germ       std r       LCL       UCL Min Max   Q25  Q50   Q75
## 1:no   24.25000  2.217356 4 17.843049 30.656951  22  27 22.75 24.0 25.50
## 1:yes  42.75000  1.707825 4 36.343049 49.156951  41  45 41.75 42.5 43.50
## 11:no   0.00000  0.000000 4 -6.406951  6.406951   0   0  0.00  0.0  0.00
## 11:yes  0.00000  0.000000 4 -6.406951  6.406951   0   0  0.00  0.0  0.00
## 3:no   46.00000  9.273618 4 39.593049 52.406951  38  59 40.25 43.5 49.25
## 3:yes  75.25000  6.946222 4 68.843049 81.656951  65  80 74.00 78.0 79.25
## 5:no   66.75000 11.586630 4 60.343049 73.156951  51  78 62.25 69.0 73.50
## 5:yes  76.00000  3.559026 4 69.593049 82.406951  73  81 73.75 75.0 77.25
## 7:no   78.00000  5.830952 4 71.593049 84.406951  73  84 73.00 77.5 82.50
## 7:yes  52.00000  9.201449 4 45.593049 58.406951  40  62 48.25 53.0 56.75
## 9:no   72.75000  4.856267 4 66.343049 79.156951  68  79 69.50 72.0 75.25
## 9:yes  37.33333  7.094599 3 29.935224 44.731443  31  45 33.50 36.0 40.50
## 
## $comparison
## NULL
## 
## $groups
##            germ groups
## 7:no   78.00000      a
## 5:yes  76.00000      a
## 3:yes  75.25000     ab
## 9:no   72.75000     ab
## 5:no   66.75000      b
## 7:yes  52.00000      c
## 3:no   46.00000     cd
## 1:yes  42.75000      d
## 9:yes  37.33333      d
## 1:no   24.25000      e
## 11:no   0.00000      f
## 11:yes  0.00000      f
## 
## attr(,"class")
## [1] "group"

Tabla:postanova2

En $statistics la media sigue siendo igual (47.808) En $means nos arroja los intervalos de confianza y los cuartiles que hay para cada nivel de humedad y factor (cubierto).

En $groups se hace una comparación multiple (diferencia de medias) entre el porcentaje de germinación (%),los niveles de humedad (moisture) y factor (cubierto). La letra “a” agrupa a los mejores niveles de humedad según el factor(cuierto). Las condiciones optimas para que las plantas germinen son:

1.Si se desea cubrir la caja de semillas es recomendable un nivel de humedad de 5. 2.Si se desea dejar la caja de semillas decubierta se recomienda un nivel de humedad de 7.

Todo va a depender de las decisiones que tome el investigador con su experimento.