En Biología, los fenómenos experimentales suelen depender de varias condiciones simultáneamente. El crecimiento de una planta, la germinación de una semilla, la tasa de supervivencia, la actividad enzimática o la respuesta a un tratamiento no suelen explicarse por una sola causa. Por el contrario, la respuesta observada suele ser el resultado de la acción conjunta de varios factores.
Por ejemplo:
Cuando el investigador analiza solo un factor por vez, puede identificar algunos efectos importantes, pero deja por fuera una pregunta crucial:
Esta pregunta es central en Biología, porque muchas respuestas de los organismos están moduladas por el entorno. Por esta razón, los experimentos factoriales son especialmente útiles, ya que permiten estudiar simultáneamente dos o más factores y, además, detectar si existe interacción entre ellos.
Supongamos que se desea estudiar la altura de una planta de frijol después de 30 días de crecimiento. El investigador considera que dos condiciones pueden afectar dicha altura:
Si se analizan estos factores de forma conjunta, el investigador puede responder preguntas como:
Estas preguntas no son equivalentes. Las dos primeras se refieren a efectos principales; las dos últimas se refieren a interacción.
Idea clave. La gran riqueza de un experimento factorial es que no solo permite saber si un factor influye, sino también si el efecto de un factor cambia cuando cambia el otro.
Un experimento factorial es aquel en el que se estudian dos o más factores de manera simultánea, considerando todas las combinaciones posibles de sus niveles.
Si un factor A tiene \(a\) niveles y un factor B tiene \(b\) niveles, el número de tratamientos es:
\[ ab \]
Si cada tratamiento se replica \(r\) veces, entonces el número total de observaciones es:
\[ N = abr \]
Si:
entonces el diseño es:
\[ 2\times 3 \]
y el número de tratamientos es:
\[ 2\times 3 = 6 \]
Un es una característica controlada por el investigador que puede influir en la variable respuesta.
Ejemplos:
Un es cada una de las categorías o valores posibles de un factor.
Ejemplos:
En un experimento factorial, un es la combinación de niveles de todos los factores.
\[ \text{Tratamiento} = \text{combinación de niveles de los factores} \]
Es la unidad mínima a la que se aplica un tratamiento de manera independiente.
Es la característica medida para evaluar el efecto de los tratamientos.
Considérese el siguiente experimento:
La variable respuesta será la altura de la planta al cabo de 30 días.
Las combinaciones posibles son:
| Tratamiento | Fertilizante | Agua |
|---|---|---|
| 1 | \(A_1\) | \(B_1\) |
| 2 | \(A_1\) | \(B_2\) |
| 3 | \(A_1\) | \(B_3\) |
| 4 | \(A_2\) | \(B_1\) |
| 5 | \(A_2\) | \(B_2\) |
| 6 | \(A_2\) | \(B_3\) |
Si se realizan 4 repeticiones por tratamiento:
\[ N = 2\times 3\times 4 = 24 \]
Si el investigador analiza por separado el fertilizante y el agua:
En cambio, el experimento factorial:
Los efectos principales muestran el cambio promedio en la respuesta al variar uno de los factores, promediando sobre los niveles del otro.
\[ \bar{Y}_{A_1\cdot} \quad \text{vs} \quad \bar{Y}_{A_2\cdot} \]
\[ \bar{Y}_{\cdot B_1},\quad \bar{Y}_{\cdot B_2},\quad \bar{Y}_{\cdot B_3} \]
La interacción ocurre cuando el efecto de un factor depende del nivel del otro.
Si el fertilizante orgánico produce mejores resultados con poca agua, pero el fertilizante químico produce mejores resultados con mucha agua, entonces el efecto del fertilizante depende del nivel de agua. Esto indica interacción.
La interacción tiene un significado muy importante, porque muestra que la respuesta del organismo no depende solo de un factor aislado, sino de la combinación de condiciones.
Lectura biológica de la interacción. Cuando existe interacción, no es correcto hablar de un tratamiento “mejor” en términos absolutos sin especificar el contexto del otro factor.
| Agua baja | Agua media | Agua alta | |
|---|---|---|---|
| Orgánico | 15 | 20 | 25 |
| Químico | 18 | 22 | 24 |
Cuando las líneas son aproximadamente paralelas, la interacción suele ser pequeña o inexistente.
| Agua baja | Agua media | Agua alta | |
|---|---|---|---|
| Orgánico | 25 | 20 | 15 |
| Químico | 15 | 20 | 25 |
Cuando las líneas se cruzan o presentan pendientes muy diferentes, se interpreta que existe interacción.
Para un experimento factorial de dos factores con replicación, el modelo es:
\[ Y_{ijk}=\mu+\alpha_i+\beta_j+(\alpha\beta)_{ij}+\varepsilon_{ijk} \]
donde:
Cada observación se descompone en:
Se asume que:
\[ \varepsilon_{ijk}\sim N(0,\sigma^2) \]
además de independencia y homogeneidad de varianzas.
\[ H_0:\alpha_1=\alpha_2=\cdots=\alpha_a=0 \]
\[ H_1:\text{al menos uno de los efectos del factor A es diferente de cero} \]
\[ H_0:\beta_1=\beta_2=\cdots=\beta_b=0 \]
\[ H_1:\text{al menos uno de los efectos del factor B es diferente de cero} \]
\[ H_0:(\alpha\beta)_{ij}=0 \quad \text{para todo } i,j \]
\[ H_1:\text{existe al menos una interacción distinta de cero} \]
La tabla ANOVA para un diseño factorial de dos factores con replicación es:
| Fuente de variación | Grados de libertad |
|---|---|
| Factor A | \(a-1\) |
| Factor B | \(b-1\) |
| Interacción \(A\times B\) | \((a-1)(b-1)\) |
| Error | \(ab(r-1)\) |
| Total | \(abr-1\) |
La variabilidad total se reparte en cuatro componentes principales:
\[ SC_A = br\sum_{i=1}^{a}\left(\bar{Y}_{i\cdot\cdot}-\bar{Y}_{\cdot\cdot\cdot}\right)^2 \]
\[ SC_B = ar\sum_{j=1}^{b}\left(\bar{Y}_{\cdot j\cdot}-\bar{Y}_{\cdot\cdot\cdot}\right)^2 \]
\[ SC_{AB}=r\sum_{i=1}^{a}\sum_{j=1}^{b} \left(\bar{Y}_{ij\cdot}-\bar{Y}_{i\cdot\cdot}-\bar{Y}_{\cdot j\cdot}+\bar{Y}_{\cdot\cdot\cdot}\right)^2 \]
\[ SC_E = SC_T - SC_A - SC_B - SC_{AB} \]
\[ CM_A=\frac{SC_A}{a-1}, \qquad CM_B=\frac{SC_B}{b-1}, \qquad CM_{AB}=\frac{SC_{AB}}{(a-1)(b-1)}, \qquad CM_E=\frac{SC_E}{ab(r-1)} \]
y los estadísticos F son:
\[ F_A=\frac{CM_A}{CM_E}, \qquad F_B=\frac{CM_B}{CM_E}, \qquad F_{AB}=\frac{CM_{AB}}{CM_E} \]
En esta sección se desarrolla la lógica algebraica básica para un diseño factorial \(2\times 3\) con \(r\) repeticiones por celda.
Puede representarse mediante la siguiente tabla:
| \(B_1\) | \(B_2\) | \(B_3\) | Promedio por A | |
|---|---|---|---|---|
| \(A_1\) | \(\bar{Y}_{11\cdot}\) | \(\bar{Y}_{12\cdot}\) | \(\bar{Y}_{13\cdot}\) | \(\bar{Y}_{1\cdot\cdot}\) |
| \(A_2\) | \(\bar{Y}_{21\cdot}\) | \(\bar{Y}_{22\cdot}\) | \(\bar{Y}_{23\cdot}\) | \(\bar{Y}_{2\cdot\cdot}\) |
| Promedio por B | \(\bar{Y}_{\cdot1\cdot}\) | \(\bar{Y}_{\cdot2\cdot}\) | \(\bar{Y}_{\cdot3\cdot}\) | \(\bar{Y}_{\cdot\cdot\cdot}\) |
Si \(a=2\) y \(b=3\), entonces:
Por tanto, la tabla ANOVA queda:
| Fuente | GL |
|---|---|
| Factor A | 1 |
| Factor B | 2 |
| Interacción \(A\times B\) | 2 |
| Error | \(6(r-1)\) |
| Total | \(6r-1\) |
Para \(a=2\), \(b=3\):
\[ SC_A = 3r\sum_{i=1}^{2}\left(\bar{Y}_{i\cdot\cdot}-\bar{Y}_{\cdot\cdot\cdot}\right)^2 \]
\[ SC_B = 2r\sum_{j=1}^{3}\left(\bar{Y}_{\cdot j\cdot}-\bar{Y}_{\cdot\cdot\cdot}\right)^2 \]
\[ SC_{AB}=r\sum_{i=1}^{2}\sum_{j=1}^{3} \left(\bar{Y}_{ij\cdot}-\bar{Y}_{i\cdot\cdot}-\bar{Y}_{\cdot j\cdot}+\bar{Y}_{\cdot\cdot\cdot}\right)^2 \]
Considérese la siguiente tabla de medias por tratamiento:
| Agua baja | Agua media | Agua alta | |
|---|---|---|---|
| Orgánico | 15 | 20 | 25 |
| Químico | 18 | 22 | 24 |
Supóngase que se tienen \(r=4\) repeticiones por tratamiento.
Promedios por fertilizante:
\[ \bar{Y}_{1\cdot\cdot}=\frac{15+20+25}{3}=20 \]
\[ \bar{Y}_{2\cdot\cdot}=\frac{18+22+24}{3}=\frac{64}{3}\approx 21.33 \]
Promedios por agua:
\[ \bar{Y}_{\cdot1\cdot}=\frac{15+18}{2}=16.5 \]
\[ \bar{Y}_{\cdot2\cdot}=\frac{20+22}{2}=21 \]
\[ \bar{Y}_{\cdot3\cdot}=\frac{25+24}{2}=24.5 \]
Media general:
\[ \bar{Y}_{\cdot\cdot\cdot}=\frac{15+20+25+18+22+24}{6}=\frac{124}{6}\approx 20.67 \]
Esto sugiere efectos principales, pero poca interacción.
La inspección del gráfico sugiere ausencia de una interacción fuerte.
Cuando existe interacción, una estrategia útil es estudiar los efectos simples.
Un efecto simple es el efecto de un factor dentro de un nivel específico del otro.
Por ejemplo:
O también:
Los efectos simples son especialmente importantes cuando la interacción resulta significativa, porque permiten describir con mayor detalle cómo cambia la respuesta dentro de cada contexto.
Interpretación Si hay interacción, los efectos simples ayudan a responder preguntas del tipo: “¿qué ocurre con el factor A cuando el factor B permanece fijo en un nivel determinado?”
A continuación se presenta un conjunto de datos simulados.
Para ajustar un experimento factorial de dos factores en
R, se utiliza la función aov()
modelo <- aov(altura ~ fertilizante * agua, data = datos)
summary(modelo)
## Df Sum Sq Mean Sq F value Pr(>F)
## fertilizante 1 5.16 5.16 5.404 0.031985 *
## agua 2 217.51 108.76 113.841 0.0000000000608 ***
## fertilizante:agua 2 26.76 13.38 14.004 0.000215 ***
## Residuals 18 17.20 0.96
## ---
## Signif. codes: 0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
aggregate(altura ~ fertilizante + agua, data = datos, mean)
interaction.plot(
x.factor = datos$agua,
trace.factor = datos$fertilizante,
response = datos$altura,
fun = mean,
type = "b",
pch = c(16,17),
lty = c(1,2),
lwd = 2,
xlab = "Cantidad de agua",
ylab = "Altura promedio (cm)",
trace.label = "Fertilizante",
main = "Gráfico de interacción con datos simulados"
)
En R, el término fertilizante * agua incluye
automáticamente:
fertilizante,agua,fertilizante:agua.Por tanto, este ajuste corresponde exactamente al modelo factorial de dos factores con interacción.
Supóngase que el ANOVA arroja:
La conclusión sería que ambos factores influyen sobre la altura, pero que lo hacen de forma relativamente independiente.
En cambio, si la interacción fuera significativa, la conclusión correcta sería que el comportamiento de un factor depende del otro. En tal caso no tendría sentido hablar de un fertilizante “mejor” sin especificar el nivel de agua.
Entre los errores más comunes en este tema se encuentran:
Se estudia el efecto de dos tipos de suelo (\(A_1\): arenoso, \(A_2\): arcilloso) y tres niveles de luz (\(B_1\): baja, \(B_2\): media, \(B_3\): alta).
¿Cuántos tratamientos hay?
Si se usan 5 repeticiones por tratamiento, ¿cuántas observaciones se requieren?
Considere la siguiente tabla de medias:
| Luz baja | Luz media | Luz alta | |
|---|---|---|---|
| Arenoso | 10 | 15 | 20 |
| Arcilloso | 14 | 18 | 22 |
¿Se aprecia interacción?
Considere ahora la tabla:
| Luz baja | Luz media | Luz alta | |
|---|---|---|---|
| Arenoso | 22 | 16 | 10 |
| Arcilloso | 10 | 16 | 24 |
¿Existe interacción?