DISEÑO FACTORIALES

Este tipo de diseño se utiliza para experimentos con dos o más factores (más de un efecto de interés), dado que en general son los más eficientes para ello. En este diseño se investiga todas las combinaciones posibles entre los niveles de los factores.

Tipos de Diseño Factorial

Ejemplo: Queremos evaluar el efecto del medio de cultivo (Factor A:) y el efecto del tipo de inoculo (Factor B) sobre la producción de biomasa (Y1) y la actividad enzimativa (Y2). El factor A tiene dos niveles M1 y M2 (medios de cultivo líquidos con diferente composición química ) y el factor B tiene dos niveles (Ic=Bacteria 1 y 2; Id=Bacteria 3 y 4). hay que aclarar que para este caso se utilizará una concentración en [10^6 UFC/mL] del inoculo al inicio de la fermentación.
Para este caso, tendríamos 3 valores p::
1. Efecto principal del medio de cultivo, que me diría si hay diferencias en la biomasa y en la actividad enzimatica entre M1 y M2.
2. Efecto principal del tipo de inoculo, que me dice si hay diferencias en la actividad enzimatica entre los inoculos compuestos Bacteria 1-2 y el inoculo de Bacteria 3-4.
3. Interacción entre medio de cultivo y el tipo de inoculo, que me dice si la biomasa por ejemplo, depende simultáneamente del medio de cultivo y el tipo de inoculo. Por ejemplo, si entre el medio M1 crece más la biomasa con el Ic, pero en el M2 crece más la biomasa con Id. Dado que para detectar cada uno de esos efectos hay un poder estadístico distinto, la mayoría de los programas para análisis de poder solamente permiten analizar un efecto a la vez.

Paquete Superpower en R

Permite hacer análisis, no solo para diseños más complejos, sino calculando simultáneamente el poder para cada efecto, y para posibles comparaciones post-hoc. El objetivo de Superpower es simular fácilmente un solo factor y diseños factoriales y cálculo empírico de potencia mediante una simulación. Actualmente, el paquete solo puede calcular la potencia para ANOVA. Esta aplicación está destinada a ser utilizada para el poder prospectivo a través de un análisis (a priori). En otras palabras, Superpower simula una base de datos para el diseño propuesto (con base en una serie de características de cada variable y su relación con las demás), y empíricamente estima el poder, a partir de hacer muchas iteraciones (repeticiones aleatorias) de esta simulación.
## Instalación y carga de Superpower
Para esto lo realizaremos con las siguientes funciones practicadas en R con la instalación del paquete (panel inferior derecho: Packages/Install/Superpower)

#install.packages("Superpower") #no es necesario si ya ha sido instalado.
library(Superpower) #para cargar el paquete una vez instalado.
## Warning: package 'Superpower' was built under R version 4.2.3

Funciones para ANOVA factorial de medidas independientes

  1. ANOVA_design: permite especificar las características del diseño.
  2. Una función para obtener el análisis de potencia:
    ANOVA_power
    plot_power
    Actualmente la función ANOVA_design puede crear diseños de hasta tres factores y requiere los siguientes argumentos de entrada para el uso de esta función.
  3. Tipo de diseño: en nuestro caso es un diseño 2 × 2, donde ambos factores son de medidas independientes, luego se codifica como “2b*2b”, donde los números representan el número de niveles en cada factor, la letra b (between-subjects) que ese factor en de medidas independientes.
  4. n: el tamaño de la muestra o experimento que espero tener por combinación de niveles entre mis factores. Por ejemplo, fermentaciones en medio líquido en reactor de tanque agitado con el M1 y Ic; fermentaciones con el M2 y Id etc.Tenga en cuenta que a diferencia de otros paquetes, Superpower no calcula el valor de n, lo que permite es cambiar el n hasta lograr el poder estadístico deseado.
  5. mu: las medias para cada interacción entre los niveles de mis factores.
  6. sd: la desviación estándar para la población en este caso, la desviación estándar de las producciones de biomasa y otra desviación para la actividad enzimática.
  7. labelnames (Opcional): las etiquetas (nombres) de los factores y sus niveles.
  8. plot si incluyo plot = TRUE esta función creará además una figura (plot) mostrando las medias y sus intervalos de confianza.
  9. r: la correlación para dentro de los diseños (o 0 para entre diseños).

Estructura del diseño 2x2

Supongamos que tenemos 32 fermentaciones(UE) en cada combinación de medio de cultivo y de tipo de inoculo (128 en total), si los los valores promedio de biomasa (esperados mu) fuesen:4.2 M1,Ic; 4.9 M1,Id; 7.5 M2,Ic; 6.2 M2,Ic. con una desviación estándar (sd) de 1.4.

diseI <- ANOVA_design (design = "2b*2b",n = 32,
                          mu = c(4.2, 4.9, 7.5, 6.2),
                          sd = 1.4,
                        labelnames = c("medio", "m1","m2","inoculo", "Ic","Id"),
                         plot = TRUE)

diseI
## The design is specified as: 2b*2b
## Summary of means (mu) and standard deviations (SD)
##    mu  SD medio inoculo
## 1 4.2 1.4    m1      Ic
## 2 4.9 1.4    m1      Id
## 3 7.5 1.4    m2      Ic
## 4 6.2 1.4    m2      Id
## 
## Correlation Matrix
##       m1_Ic m1_Id m2_Ic m2_Id
## m1_Ic     1     0     0     0
## m1_Id     0     1     0     0
## m2_Ic     0     0     1     0
## m2_Id     0     0     0     1

Como podemos ver en la figura de distribución de medias y sus intervalos de confianza para el diseño definido 2b*2b con la función ANOVA_design, es muy útil para estar seguro de que las medias fueron concatenadas en el orden correcto.
Ahora podemos determinar con este paquete el poder estadístico que obtendría con esos 32 UE, por cada combinación de medio de cultivo y tipo de inoculo, con la función: ANOVA_power. Para hacer uso de esta función se requerire como argumento el objeto creado anteriormente (diseI), alpha_level: α (nivel de significación) deseado. Típicamente 0.05. 2. p.adjust: si se debe hacer un ajuste para comparaciones post-hoc, por ejemplo, si se va a realizar una corrección de “holm”, que se refiere a la corrección de Holm-Bonferroni (Holm, 1979).
3. nsim: número de simulaciones hechas para determinar el poder, los autores del paquete recomiendan usar mínimo 100 simulaciones (Lakens & Caldwell, 2020).
4. seed (opcional): se puede usar este argumento para que las simulaciones den siempre el mismo resultado.

ANOVA_power(diseI,
              alpha_level = 0.05,
              p_adjust = "holm",
              seed = 2019,
              nsims = 1000)
## Power and Effect sizes for ANOVA tests
##                     power effect_size
## anova_medio         100.0     0.40923
## anova_inoculo        22.4     0.01954
## anova_medio:inoculo  95.5     0.11983
## 
## Power and Effect sizes for pairwise comparisons (t-tests)
##                                           power effect_size
## p_medio_m1_inoculo_Ic_medio_m1_inoculo_Id  46.5      0.4984
## p_medio_m1_inoculo_Ic_medio_m2_inoculo_Ic 100.0      2.3785
## p_medio_m1_inoculo_Ic_medio_m2_inoculo_Id  99.8      1.4349
## p_medio_m1_inoculo_Id_medio_m2_inoculo_Ic 100.0      1.8819
## p_medio_m1_inoculo_Id_medio_m2_inoculo_Id  93.5      0.9398
## p_medio_m2_inoculo_Ic_medio_m2_inoculo_Id  92.4     -0.9350
## Power and Effect sizes for ANOVA tests
##                     power effect_size
## anova_medio         100.0     0.40923
## anova_inoculo        22.4     0.01954
## anova_medio:inoculo  95.5     0.11983
## 
## Power and Effect sizes for pairwise comparisons (t-tests)
##                                           power effect_size
## p_medio_m1_inoculo_Ic_medio_m1_inoculo_Id  46.5      0.4984
## p_medio_m1_inoculo_Ic_medio_m2_inoculo_Ic 100.0      2.3785
## p_medio_m1_inoculo_Ic_medio_m2_inoculo_Id  99.8      1.4349
## p_medio_m1_inoculo_Id_medio_m2_inoculo_Ic 100.0      1.8819
## p_medio_m1_inoculo_Id_medio_m2_inoculo_Id  93.5      0.9398
## p_medio_m2_inoculo_Ic_medio_m2_inoculo_Id  92.4     -0.9350

Entonces, obtenemos dos tablas, la primera “Power and Effect sizes for ANOVA tests” para los efectos principales e interacciones del ANOVA con una columna con el poder estadístico obtenido con el tamaño de muestra propuesto (32 para cada combinación) y el tamaño del efecto, .La segunda tabla denominada “Power and Effect sizes for pairwise comparisons (t-tests)” que muestra las comparaciones con la potencia estimada y el tamaño efecto. Para ver gráficamente la asociación entre el tamaño de la muestra y el poder estadístico para un ANOVA 2 × 2, producida con la función plot_power del paquete Superpowerel

plot_power(diseI,min_n = 3,max_n = 32,plot = TRUE)
## Warning in plot_power(diseI, min_n = 3, max_n = 32, plot = TRUE): min_n <= the product of the factors; therefore min_n changed to 5
##  Set exact2 to TRUE to include this min_n

## Achieved Power and Sample Size for ANOVA-level effects
##        variable                     label  n achieved_power desired_power
## 1         medio    Desired Power Achieved  5          93.13            90
## 2       inoculo Desired Power Not Reached 32          22.53            90
## 3 medio:inoculo    Desired Power Achieved 22          91.18            90

Entonces, si el interes es ver el efecto de la interacción el tamaño de muestra para alcanzar 91% aproximadamente es de 22 UE para cada una de las 4 opciones en total 88 UE.