1 Introducción

Un experimento factorial en un Diseño Completamente al Azar (DCA) consiste en la combinación de dos o más factores, cada uno con varios niveles, de modo que se evalúan todas las posibles combinaciones de tratamientos. Este tipo de diseño se utiliza cuando las unidades experimentales son homogéneas y no se requiere controlar variabilidad adicional mediante el bloqueo. El análisis factorial en un DCA permite estimar los efectos principales de cada factor y sus interacciones, es decir, examinar si la respuesta de un factor depende de los niveles del otro. Gracias a su simplicidad y eficiencia, el experimento factorial en DCA resulta especialmente útil en situaciones donde las condiciones experimentales se mantienen relativamente uniformes y el interés se centra en comprender la influencia conjunta de los factores en estudio.

2 Experimento factorial sin interacción

Abordaremos en primer lugar la situación que se presenta cuando no existe interacción entre dos factores puestos a prueba en un experimento sin estructura de parcela (DCA).

3 El ensayo experimental

La base de datos nematodos.xlsx muestra los resultados de un experimento montado según un diseño completamente aleatorizado con cuatro repeticiones, en el que, nemátidos de género Pratylenchus fueron criados en cuatro condiciones de tempertatura y discriminados según sexo para evaluar el efecto del sexo y la temperatura sobre la expresión fenotípica de diversos caracteres morfométricos. Los resultados presentados corresponden al largo promedio de la cola en unidades experimentales conformadas por 5 individuos.

Factores:

  • Factor A: Temperatura
    • 16°C
    • 21°C
    • 25°C
    • 28°C


  • Factor B: Sexo
    • Hembra
    • Macho


Objetivo del experimento

Evaluar el efecto del sexo y de la temperatura, así como su posible interacción, sobre el largo promedio de cola de los nemátodos.


Preguntas a responder

  • ¿Cual es la mejor combinación de factores que determina mayores diferencias en el largo de cola?

  • ¿La temperatura influye significativamente en el largo promedio de cola?

  • ¿El sexo influye significamente en el largo promedio de cola?


4 El Modelo Matemático

El modelo factorial en un Diseño Completamente al Azar (DCA) es:

\[Y_{ijk} = \mu + \alpha_i + \beta_j + (\alpha\beta)_{ij} + \varepsilon_{ijk}\]

donde:

  • \(Y_{ijk}\): respuesta observada (largo promedio de cola) en la \(k\)-ésima repetición del factor sexo \(j\) en la temperatura \(i\).
  • \(\mu\) es la media general.
  • \(\alpha_i\) es el efecto del \(i\)-ésimo nivel del factor Temperatura (\(i=1,2,..,4\)).
  • \(\beta_j\) es el efecto del \(j\)-ésimo nivel del factor Sexo (\(j=1,2\)).
  • \((\alpha\beta)_{ij}\) efecto de la interacción entre el nivel \(i\) de Temperatura y el nivel \(j\) de Sexo.
  • \(\varepsilon_{ijk}\) es el término de error aleatorio asociado a la observación \(ijk\).

5 Hipótesis estadísticas

5.1 Interacción Temperatura × Sexo (A × B)

H0: (⍺𝜷) = 0 (No hay interacción: el efecto de un factor es independiente del otro)

H1: (⍺𝜷) ≠ 0 (Existe interacción entre los factores)

5.2 Efecto del factor Temperatura (A)

H0 ⍺ = 0 (La temperatura no tiene efecto sobre el largo promedio de cola)

H1 ⍺ ≠ 0 (Al menos una temperatura tiene efecto sobre el largo promedio de cola)

5.3 Efecto del factor Sexo (B)

H0: 𝜷 = 0 (el largo promedio de cola no presenta diferencias respecto del Sexo).

H1: 𝜷 ≠ 0 (el largo promedio de cola presenta diferencias respecto del Sexo).

6 Instalamos y cargamos paquetes

# Instalamos los paquetes que vamos a usar en el análisis estadístico
# install.packages("tidyverse")
# install.packages("readxl")
# install.packages("car")
# install.packages("agricolae")
# install.packages("emmeans")
# install.packages("summarytools")
library(tidyverse)
library(readxl)
library(car)
library(agricolae)
library(emmeans)
library(summarytools)

7 Cargamos la base de datos “nematodos”

NEMATODOS <- read_excel("nematodos.xlsx")

Responder:

  • ¿Cuál es la unidad experimental?

  • ¿Cuáles son los factores y sus niveles?

  • ¿Cuál es la variable respuesta?

  • Indique cantidad de tratamientos y repeticiones

8 Transformación de variables

str(NEMATODOS)
## tibble [32 × 4] (S3: tbl_df/tbl/data.frame)
##  $ TEMPERATURA           : num [1:32] 16 16 16 16 16 16 16 16 21 21 ...
##  $ SEXO                  : chr [1:32] "hembra" "hembra" "hembra" "hembra" ...
##  $ TRATAMIENTOS_NEMATODOS: chr [1:32] "16_hembra" "16_hembra" "16_hembra" "16_hembra" ...
##  $ LARGO_COLA            : chr [1:32] "29.2" "32.5" "34.6" "32.6" ...
# Cambiar las variables a factores
NEMATODOS <- NEMATODOS %>% 
  mutate(
    TEMPERATURA = factor(TEMPERATURA),
    SEXO = factor(SEXO),
    TRATAMIENTOS_NEMATODOS = factor(TRATAMIENTOS_NEMATODOS),
    LARGO_COLA = as.numeric(LARGO_COLA))
str(NEMATODOS)
## tibble [32 × 4] (S3: tbl_df/tbl/data.frame)
##  $ TEMPERATURA           : Factor w/ 4 levels "16","21","25",..: 1 1 1 1 1 1 1 1 2 2 ...
##  $ SEXO                  : Factor w/ 2 levels "hembra","macho": 1 1 1 1 2 2 2 2 1 1 ...
##  $ TRATAMIENTOS_NEMATODOS: Factor w/ 8 levels "16_hembra","16_macho",..: 1 1 1 1 2 2 2 2 3 3 ...
##  $ LARGO_COLA            : num [1:32] 29.2 32.5 34.6 32.6 27.2 24.7 27.3 26.2 30.1 30.4 ...

9 Exploración de los datos

# Opción 1
ggplot(NEMATODOS, aes(TRATAMIENTOS_NEMATODOS, LARGO_COLA, fill = TRATAMIENTOS_NEMATODOS)) +
  geom_boxplot() +
  theme_minimal() +
  theme(legend.position = "none")

# Opción 2
ggplot(NEMATODOS, aes(x = TEMPERATURA, y = LARGO_COLA, fill = SEXO)) +
  geom_boxplot() +
  theme_minimal()

10 ANOVA

modelo_factorial_dca_nematodos <- aov( LARGO_COLA ~ TEMPERATURA + SEXO + TEMPERATURA:SEXO, data = NEMATODOS)
summary(modelo_factorial_dca_nematodos)
##                  Df Sum Sq Mean Sq F value   Pr(>F)    
## TEMPERATURA       3  27.51    9.17   4.582   0.0113 *  
## SEXO              1 154.88  154.88  77.392 5.64e-09 ***
## TEMPERATURA:SEXO  3   9.85    3.28   1.641   0.2063    
## Residuals        24  48.03    2.00                     
## ---
## Signif. codes:  0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1

La interacción Temperatura × Sexo no es significativa (p = 0.2063), lo que indica que el efecto de la Temperatura sobre el largo de cola promedio es similar en ambos sexos, y viceversa. En cuanto a los efectos principales, tanto la Temperatura (p = 0.0113) como el Sexo (p < 0.001) tienen un efecto significativo sobre el largo promedio de cola de los nemátodos.”

11 Supuestos del modelo

Recordar: En ANOVA los supuestos se evalúan sobre los residuos del modelo, no sobre las variables originales.

11.1 Normalidad y Homocedasticidad

# Gráfico de diagnóstico
plot(modelo_factorial_dca_nematodos, which = 1:2) 

# Prueba de normalidad de Shapiro-Wilk
shapiro.test(modelo_factorial_dca_nematodos$residuals)
## 
##  Shapiro-Wilk normality test
## 
## data:  modelo_factorial_dca_nematodos$residuals
## W = 0.93389, p-value = 0.0503
# Histograma para residuos 
hist(modelo_factorial_dca_nematodos$residuals)

#Test de Levene (car)
leveneTest(LARGO_COLA ~ TEMPERATURA * SEXO, data = NEMATODOS)
## Levene's Test for Homogeneity of Variance (center = median)
##       Df F value Pr(>F)
## group  7  0.8848 0.5331
##       24

11.2 Visualización de interacción

# Gráfico de interacción con emmeans (simple)
emmip(modelo_factorial_dca_nematodos, SEXO ~ TEMPERATURA)

12 Comparaciones múltiples

12.1 Test de Tukey (HSD)

# Factor "TEMPERATURA"
Tukey_temp_nematodos <- HSD.test(modelo_factorial_dca_nematodos, "TEMPERATURA")
Tukey_temp_nematodos
## $statistics
##   MSerror Df     Mean       CV     MSD
##   2.00125 24 28.58125 4.949593 1.95124
## 
## $parameters
##    test      name.t ntr StudentizedRange alpha
##   Tukey TEMPERATURA   4         3.901262  0.05
## 
## $means
##    LARGO_COLA      std r        se  Min  Max   Q25   Q50    Q75
## 16    29.2875 3.553846 8 0.5001562 24.7 34.6 26.95 28.25 32.525
## 21    29.4000 3.213365 8 0.5001562 26.5 35.8 27.00 28.65 30.650
## 25    28.5625 2.068082 8 0.5001562 26.2 31.6 26.45 28.85 30.050
## 28    27.0750 1.778242 8 0.5001562 24.8 29.6 25.55 27.15 28.425
## 
## $comparison
## NULL
## 
## $groups
##    LARGO_COLA groups
## 21    29.4000      a
## 16    29.2875      a
## 25    28.5625     ab
## 28    27.0750      b
## 
## attr(,"class")
## [1] "group"
plot(Tukey_temp_nematodos)

# Factor "SEXO"
Tukey_sexo_nematodos <- HSD.test(modelo_factorial_dca_nematodos, "SEXO")
Tukey_sexo_nematodos
## $statistics
##   MSerror Df     Mean       CV      MSD
##   2.00125 24 28.58125 4.949593 1.032272
## 
## $parameters
##    test name.t ntr StudentizedRange alpha
##   Tukey   SEXO   2         2.918793  0.05
## 
## $means
##        LARGO_COLA       std  r        se  Min  Max    Q25   Q50    Q75
## hembra   30.78125 2.1946051 16 0.3536639 28.1 35.8 29.425 30.15 31.825
## macho    26.38125 0.9361045 16 0.3536639 24.7 28.2 26.050 26.40 27.125
## 
## $comparison
## NULL
## 
## $groups
##        LARGO_COLA groups
## hembra   30.78125      a
## macho    26.38125      b
## 
## attr(,"class")
## [1] "group"
plot(Tukey_sexo_nematodos)

12.2 Visualización de medias de tratamientos

ggplot(NEMATODOS, aes(x = SEXO, y = LARGO_COLA, fill = TEMPERATURA)) +
  stat_summary(fun = mean,                 # calcula la media para cada tratamiento
               geom = "bar",               # usa barras para mostrar la media de cada 
               position = position_dodge(width = 0.9)) + # evita que las barras se superpongan
  labs(x = "Sexo",
       y = "Longitud de cola") + 
  theme_minimal()

12.3 Conclusión

El análisis de comparaciones múltiples mediante el test de Tukey HSD muestra que:


Factor Sexo:

Las hembras presentan un largo promedio de cola de 30,78 unidades, mientras que los machos tienen un promedio de 26,38 unidades. Las letras asignadas por el test (a para hembras y b para machos) indican que estas diferencias son estadísticamente significativas. Esto sugiere que el sexo de los nemátodos influye de manera relevante sobre el largo promedio de la cola, siendo mayor en hembras.


Factor Temperatura:

Las medias de largo de cola para las diferentes temperaturas fueron: 16°C = 29,29, 21°C = 29,40, 25°C = 28,56 y 28°C = 27,08. Según el test de Tukey, 16°C y 21°C (a) no difieren significativamente entre sí, 28°C (b) es significativamente menor que las temperaturas bajas, y 25°C (ab) se encuentra intermedia, sin diferir significativamente de ninguno de los extremos. Esto indica que las temperaturas más bajas favorecen un mayor largo de cola promedio.

13 Bibliografía

  • Di Rienzo, J. A.; Casanoves, F; Gonzalez, L. A.; Tablada, E. M.; Díaz, M.; Robledo, C. W.; Balzarini, M. G. Estadística para las Ciencias Agropecuarias. Editorial Brujas.

  • Fernández Escobar, R.; Trapero, A.; Dominguez, J. Experimentación en Agricultura. Junta de Andalucía: Consejo de Agricultura y Pesca.