Introducción

En Biología, los fenómenos experimentales suelen depender de varias condiciones simultáneamente. El crecimiento de una planta, la germinación de una semilla, la tasa de supervivencia, la actividad enzimática o la respuesta a un tratamiento no suelen explicarse por una sola causa. Por el contrario, la respuesta observada suele ser el resultado de la acción conjunta de varios factores.

Por ejemplo:

Cuando el investigador analiza solo un factor por vez, puede identificar algunos efectos importantes, pero deja por fuera una pregunta crucial:

Esta pregunta es central en Biología, porque muchas respuestas de los organismos están moduladas por el entorno. Por esta razón, los experimentos factoriales son especialmente útiles, ya que permiten estudiar simultáneamente dos o más factores y, además, detectar si existe interacción entre ellos.

Motivación biológica

Supongamos que se desea estudiar la altura de una planta de frijol después de 30 días de crecimiento. El investigador considera que dos condiciones pueden afectar dicha altura:

Si se analizan estos factores de forma conjunta, el investigador puede responder preguntas como:

Estas preguntas no son equivalentes. Las dos primeras se refieren a efectos principales; las dos últimas se refieren a interacción.

Idea clave. La gran riqueza de un experimento factorial es que no solo permite saber si un factor influye, sino también si el efecto de un factor cambia cuando cambia el otro.

Definición de experimento factorial

Un experimento factorial es aquel en el que se estudian dos o más factores de manera simultánea, considerando todas las combinaciones posibles de sus niveles.

Si un factor A tiene \(a\) niveles y un factor B tiene \(b\) niveles, el número de tratamientos es:

\[ ab \]

Si cada tratamiento se replica \(r\) veces, entonces el número total de observaciones es:

\[ N = abr \]

Ejemplo

Si:

  • el factor A tiene 2 niveles,
  • el factor B tiene 3 niveles,

entonces el diseño es:

\[ 2\times 3 \]

y el número de tratamientos es:

\[ 2\times 3 = 6 \]

Conceptos fundamentales

Factor

Un es una característica controlada por el investigador que puede influir en la variable respuesta.

Ejemplos:

  • tipo de fertilizante,
  • tipo de suelo,
  • temperatura,
  • intensidad de luz,
  • dosis de fármaco,
  • tiempo de exposición.

Nivel

Un es cada una de las categorías o valores posibles de un factor.

Ejemplos:

  • fertilizante: orgánico, químico;
  • agua: baja, media, alta.

Tratamiento

En un experimento factorial, un es la combinación de niveles de todos los factores.

\[ \text{Tratamiento} = \text{combinación de niveles de los factores} \]

Unidad experimental

Es la unidad mínima a la que se aplica un tratamiento de manera independiente.

Variable respuesta

Es la característica medida para evaluar el efecto de los tratamientos.

Ejemplo factorial \(2\times 3\)

Considérese el siguiente experimento:

La variable respuesta será la altura de la planta al cabo de 30 días.

Las combinaciones posibles son:

Tratamiento Fertilizante Agua
1 \(A_1\) \(B_1\)
2 \(A_1\) \(B_2\)
3 \(A_1\) \(B_3\)
4 \(A_2\) \(B_1\)
5 \(A_2\) \(B_2\)
6 \(A_2\) \(B_3\)

Si se realizan 4 repeticiones por tratamiento:

\[ N = 2\times 3\times 4 = 24 \]

Ventaja frente a estudiar un factor a la vez

Si el investigador analiza por separado el fertilizante y el agua:

En cambio, el experimento factorial:

Efectos principales

Los efectos principales muestran el cambio promedio en la respuesta al variar uno de los factores, promediando sobre los niveles del otro.

Efecto principal del factor A

\[ \bar{Y}_{A_1\cdot} \quad \text{vs} \quad \bar{Y}_{A_2\cdot} \]

Efecto principal del factor B

\[ \bar{Y}_{\cdot B_1},\quad \bar{Y}_{\cdot B_2},\quad \bar{Y}_{\cdot B_3} \]

Interacción

La interacción ocurre cuando el efecto de un factor depende del nivel del otro.

Interpretación conceptual

Si el fertilizante orgánico produce mejores resultados con poca agua, pero el fertilizante químico produce mejores resultados con mucha agua, entonces el efecto del fertilizante depende del nivel de agua. Esto indica interacción.

Significado biológico

La interacción tiene un significado muy importante, porque muestra que la respuesta del organismo no depende solo de un factor aislado, sino de la combinación de condiciones.

Lectura biológica de la interacción. Cuando existe interacción, no es correcto hablar de un tratamiento “mejor” en términos absolutos sin especificar el contexto del otro factor.

Tablas de medias y gráficos de interacción

Caso sin interacción importante

Agua baja Agua media Agua alta
Orgánico 15 20 25
Químico 18 22 24

Cuando las líneas son aproximadamente paralelas, la interacción suele ser pequeña o inexistente.

Caso con interacción

Agua baja Agua media Agua alta
Orgánico 25 20 15
Químico 15 20 25

Cuando las líneas se cruzan o presentan pendientes muy diferentes, se interpreta que existe interacción.

Modelo estadístico

Para un experimento factorial de dos factores con replicación, el modelo es:

\[ Y_{ijk}=\mu+\alpha_i+\beta_j+(\alpha\beta)_{ij}+\varepsilon_{ijk} \]

donde:

Interpretación del modelo

Cada observación se descompone en:

  1. una media general;
  2. un efecto del factor A;
  3. un efecto del factor B;
  4. un efecto conjunto de ambos factores;
  5. un componente aleatorio.

Supuestos

Se asume que:

\[ \varepsilon_{ijk}\sim N(0,\sigma^2) \]

además de independencia y homogeneidad de varianzas.

Hipótesis

Para el factor A

\[ H_0:\alpha_1=\alpha_2=\cdots=\alpha_a=0 \]

\[ H_1:\text{al menos uno de los efectos del factor A es diferente de cero} \]

Para el factor B

\[ H_0:\beta_1=\beta_2=\cdots=\beta_b=0 \]

\[ H_1:\text{al menos uno de los efectos del factor B es diferente de cero} \]

Para la interacción

\[ H_0:(\alpha\beta)_{ij}=0 \quad \text{para todo } i,j \]

\[ H_1:\text{existe al menos una interacción distinta de cero} \]

Estructura del ANOVA factorial

La tabla ANOVA para un diseño factorial de dos factores con replicación es:

Fuente de variación Grados de libertad
Factor A \(a-1\)
Factor B \(b-1\)
Interacción \(A\times B\) \((a-1)(b-1)\)
Error \(ab(r-1)\)
Total \(abr-1\)

Comentario

La variabilidad total se reparte en cuatro componentes principales:

  • variabilidad debida al factor A;
  • variabilidad debida al factor B;
  • variabilidad debida a la interacción;
  • variabilidad residual o error.

Sumas de cuadrados

Suma de cuadrados del factor A

\[ SC_A = br\sum_{i=1}^{a}\left(\bar{Y}_{i\cdot\cdot}-\bar{Y}_{\cdot\cdot\cdot}\right)^2 \]

Suma de cuadrados del factor B

\[ SC_B = ar\sum_{j=1}^{b}\left(\bar{Y}_{\cdot j\cdot}-\bar{Y}_{\cdot\cdot\cdot}\right)^2 \]

Suma de cuadrados de la interacción

\[ SC_{AB}=r\sum_{i=1}^{a}\sum_{j=1}^{b} \left(\bar{Y}_{ij\cdot}-\bar{Y}_{i\cdot\cdot}-\bar{Y}_{\cdot j\cdot}+\bar{Y}_{\cdot\cdot\cdot}\right)^2 \]

Suma de cuadrados del error

\[ SC_E = SC_T - SC_A - SC_B - SC_{AB} \]

Cuadrados medios y pruebas F

\[ CM_A=\frac{SC_A}{a-1}, \qquad CM_B=\frac{SC_B}{b-1}, \qquad CM_{AB}=\frac{SC_{AB}}{(a-1)(b-1)}, \qquad CM_E=\frac{SC_E}{ab(r-1)} \]

y los estadísticos F son:

\[ F_A=\frac{CM_A}{CM_E}, \qquad F_B=\frac{CM_B}{CM_E}, \qquad F_{AB}=\frac{CM_{AB}}{CM_E} \]

Desarrollo paso a paso para un factorial \(2\times 3\)

En esta sección se desarrolla la lógica algebraica básica para un diseño factorial \(2\times 3\) con \(r\) repeticiones por celda.

Estructura de medias

Puede representarse mediante la siguiente tabla:

\(B_1\) \(B_2\) \(B_3\) Promedio por A
\(A_1\) \(\bar{Y}_{11\cdot}\) \(\bar{Y}_{12\cdot}\) \(\bar{Y}_{13\cdot}\) \(\bar{Y}_{1\cdot\cdot}\)
\(A_2\) \(\bar{Y}_{21\cdot}\) \(\bar{Y}_{22\cdot}\) \(\bar{Y}_{23\cdot}\) \(\bar{Y}_{2\cdot\cdot}\)
Promedio por B \(\bar{Y}_{\cdot1\cdot}\) \(\bar{Y}_{\cdot2\cdot}\) \(\bar{Y}_{\cdot3\cdot}\) \(\bar{Y}_{\cdot\cdot\cdot}\)

Grados de libertad para \(2\times 3\)

Si \(a=2\) y \(b=3\), entonces:

  • factor A: \(a-1=1\),
  • factor B: \(b-1=2\),
  • interacción: \((a-1)(b-1)=2\),
  • error: \(ab(r-1)=6(r-1)\),
  • total: \(abr-1=6r-1\).

Por tanto, la tabla ANOVA queda:

Fuente GL
Factor A 1
Factor B 2
Interacción \(A\times B\) 2
Error \(6(r-1)\)
Total \(6r-1\)

Fórmulas particulares

Para \(a=2\), \(b=3\):

\[ SC_A = 3r\sum_{i=1}^{2}\left(\bar{Y}_{i\cdot\cdot}-\bar{Y}_{\cdot\cdot\cdot}\right)^2 \]

\[ SC_B = 2r\sum_{j=1}^{3}\left(\bar{Y}_{\cdot j\cdot}-\bar{Y}_{\cdot\cdot\cdot}\right)^2 \]

\[ SC_{AB}=r\sum_{i=1}^{2}\sum_{j=1}^{3} \left(\bar{Y}_{ij\cdot}-\bar{Y}_{i\cdot\cdot}-\bar{Y}_{\cdot j\cdot}+\bar{Y}_{\cdot\cdot\cdot}\right)^2 \]

Ejemplo numérico ilustrativo paso a paso

Considérese la siguiente tabla de medias por tratamiento:

Agua baja Agua media Agua alta
Orgánico 15 20 25
Químico 18 22 24

Supóngase que se tienen \(r=4\) repeticiones por tratamiento.

Paso 1: calcular medias marginales

Promedios por fertilizante:

\[ \bar{Y}_{1\cdot\cdot}=\frac{15+20+25}{3}=20 \]

\[ \bar{Y}_{2\cdot\cdot}=\frac{18+22+24}{3}=\frac{64}{3}\approx 21.33 \]

Promedios por agua:

\[ \bar{Y}_{\cdot1\cdot}=\frac{15+18}{2}=16.5 \]

\[ \bar{Y}_{\cdot2\cdot}=\frac{20+22}{2}=21 \]

\[ \bar{Y}_{\cdot3\cdot}=\frac{25+24}{2}=24.5 \]

Media general:

\[ \bar{Y}_{\cdot\cdot\cdot}=\frac{15+20+25+18+22+24}{6}=\frac{124}{6}\approx 20.67 \]

Paso 2: interpretar a partir de las medias

  • El fertilizante químico tiene una media ligeramente superior.
  • A medida que aumenta el agua, aumenta la respuesta promedio.
  • Las diferencias entre fertilizantes son relativamente estables a través de los niveles de agua.

Esto sugiere efectos principales, pero poca interacción.

Paso 3: evaluar visualmente la interacción

La inspección del gráfico sugiere ausencia de una interacción fuerte.

Efectos simples

Cuando existe interacción, una estrategia útil es estudiar los efectos simples.

¿Qué es un efecto simple?

Un efecto simple es el efecto de un factor dentro de un nivel específico del otro.

Por ejemplo:

  • comparar fertilizantes solo cuando el agua es baja;
  • comparar fertilizantes solo cuando el agua es media;
  • comparar fertilizantes solo cuando el agua es alta.

O también:

  • comparar niveles de agua solo para el fertilizante orgánico;
  • comparar niveles de agua solo para el fertilizante químico.

¿Cuándo se analizan?

Los efectos simples son especialmente importantes cuando la interacción resulta significativa, porque permiten describir con mayor detalle cómo cambia la respuesta dentro de cada contexto.

Interpretación Si hay interacción, los efectos simples ayudan a responder preguntas del tipo: “¿qué ocurre con el factor A cuando el factor B permanece fijo en un nivel determinado?”

Ejemplo de análisis en R

A continuación se presenta un conjunto de datos simulados.

Ajuste del modelo

Para ajustar un experimento factorial de dos factores en R, se utiliza la función aov()

modelo <- aov(altura ~ fertilizante * agua, data = datos)
summary(modelo)
##                   Df Sum Sq Mean Sq F value          Pr(>F)    
## fertilizante       1   5.16    5.16   5.404        0.031985 *  
## agua               2 217.51  108.76 113.841 0.0000000000608 ***
## fertilizante:agua  2  26.76   13.38  14.004        0.000215 ***
## Residuals         18  17.20    0.96                            
## ---
## Signif. codes:  0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1

Medias por tratamiento

aggregate(altura ~ fertilizante + agua, data = datos, mean)

Gráfico de interacción

interaction.plot(
  x.factor = datos$agua,
  trace.factor = datos$fertilizante,
  response = datos$altura,
  fun = mean,
  type = "b",
  pch = c(16,17),
  lty = c(1,2),
  lwd = 2,
  xlab = "Cantidad de agua",
  ylab = "Altura promedio (cm)",
  trace.label = "Fertilizante",
  main = "Gráfico de interacción con datos simulados"
)

Comentario de interpretación

En R, el término fertilizante * agua incluye automáticamente:

  • el efecto principal de fertilizante,
  • el efecto principal de agua,
  • la interacción fertilizante:agua.

Por tanto, este ajuste corresponde exactamente al modelo factorial de dos factores con interacción.

Interpretación biológica de resultados

Supóngase que el ANOVA arroja:

La conclusión sería que ambos factores influyen sobre la altura, pero que lo hacen de forma relativamente independiente.

En cambio, si la interacción fuera significativa, la conclusión correcta sería que el comportamiento de un factor depende del otro. En tal caso no tendría sentido hablar de un fertilizante “mejor” sin especificar el nivel de agua.

Errores frecuentes

Entre los errores más comunes en este tema se encuentran:

  1. confundir factor con tratamiento;
  2. pensar que nivel y tratamiento son lo mismo;
  3. interpretar efectos principales antes de revisar la interacción;
  4. creer que la interacción solo existe si las líneas se cruzan exactamente;
  5. olvidar que la interacción tiene significado biológico.

Ejercicio 1

Pregunta 1

Se estudia el efecto de dos tipos de suelo (\(A_1\): arenoso, \(A_2\): arcilloso) y tres niveles de luz (\(B_1\): baja, \(B_2\): media, \(B_3\): alta).

¿Cuántos tratamientos hay?

Pregunta 2

Si se usan 5 repeticiones por tratamiento, ¿cuántas observaciones se requieren?

Ejercicio 2

Considere la siguiente tabla de medias:

Luz baja Luz media Luz alta
Arenoso 10 15 20
Arcilloso 14 18 22

¿Se aprecia interacción?

Ejercicio 3

Considere ahora la tabla:

Luz baja Luz media Luz alta
Arenoso 22 16 10
Arcilloso 10 16 24

¿Existe interacción?

Actividad propuesta

  1. Defina con sus palabras qué es un experimento factorial.
  2. Explique la diferencia entre factor, nivel y tratamiento.
  3. Justifique por qué en Biología es útil estudiar dos factores simultáneamente.
  4. Para un factorial \(2\times 4\) con 3 repeticiones, determine:
    • número de tratamientos,
    • número total de observaciones,
    • grados de libertad de cada fuente en la tabla ANOVA.
  5. Construya una tabla de medias donde no exista interacción.
  6. Construya otra tabla donde sí exista interacción.
  7. Escriba el modelo estadístico para un factorial de dos factores.
  8. Explique por qué la interacción se interpreta antes que los efectos principales.
  9. Describa qué son los efectos simples.
  10. Proponga un ejemplo biológico real donde podría aplicarse un diseño factorial.