Fórmulas para Análisis de Varianza (ANOVA) - Diseños Experimentales

1. ANOVA de Una Vía (One-Way ANOVA)

Fuente de Variación Suma de Cuadrados Grados de Libertad Cuadrado Medio
Entre Grupos \(SC_{entre} = \sum_{j=1}^q n_j (\overline{Y}_j - \overline{Y})^2\) \(gl_{entre} = q-1\) \(CM_{entre} = \frac{SC_{entre}}{gl_{entre}}\)
Dentro de Grupos (Error) \(SC_{intra} = \sum_{j=1}^q \sum_{i=1}^{n_j} (Y_{ij} - \overline{Y}_j)^2\) \(gl_{intra} = \sum_{j=1}^q (n_j-1) = n-q\) \(CM_{intra} = \frac{SC_{intra}}{gl_{intra}}\)
Total \(SC_{total} = \sum_{j=1}^q \sum_{i=1}^{n_j} (Y_{ij} - \overline{Y})^2\) \(n-1\)

Estadístico F: \(F = \frac{CM_{entre}}{CM_{intra}} \sim F(q-1, n-q)\)


2. ANOVA de Dos Vías (sin interacción)

Modelo: \(Y_{ijk} = \mu + \alpha_i + \beta_j + \varepsilon_{ijk}\)

Fuente de Variación Suma de Cuadrados Grados de Libertad Cuadrado Medio
Factor A \(SCA = bn\sum_{i=1}^a (\overline{Y}_{i\cdot\cdot} - \overline{Y})^2\) \(a-1\) \(CMA = \frac{SCA}{a-1}\)
Factor B \(SCB = an\sum_{j=1}^b (\overline{Y}_{\cdot j\cdot} - \overline{Y})^2\) \(b-1\) \(CMB = \frac{SCB}{b-1}\)
Error \(SCE = \sum_{i=1}^a\sum_{j=1}^b\sum_{k=1}^n (Y_{ijk} - \overline{Y}_{i\cdot\cdot} - \overline{Y}_{\cdot j\cdot} + \overline{Y})^2\) \((a-1)(b-1)\) \(CME = \frac{SCE}{(a-1)(b-1)}\)
Total \(SCT = \sum_{i=1}^a\sum_{j=1}^b\sum_{k=1}^n (Y_{ijk} - \overline{Y})^2\) \(abn-1\)

Estadísticos F: - Para Factor A: \(F_A = \frac{CMA}{CME} \sim F(a-1, (a-1)(b-1))\) - Para Factor B: \(F_B = \frac{CMB}{CME} \sim F(b-1, (a-1)(b-1))\)


3. ANOVA de Dos Vías con Interacción

Modelo: \(Y_{ijk} = \mu + \alpha_i + \beta_j + (\alpha\beta)_{ij} + \varepsilon_{ijk}\)

Fuente de Variación Suma de Cuadrados Grados de Libertad Cuadrado Medio
Factor A \(SCA = bn\sum_{i=1}^a (\overline{Y}_{i\cdot\cdot} - \overline{Y})^2\) \(a-1\) \(CMA = \frac{SCA}{a-1}\)
Factor B \(SCB = an\sum_{j=1}^b (\overline{Y}_{\cdot j\cdot} - \overline{Y})^2\) \(b-1\) \(CMB = \frac{SCB}{b-1}\)
Interacción A×B \(SCAB = n\sum_{i=1}^a\sum_{j=1}^b (\overline{Y}_{ij\cdot} - \overline{Y}_{i\cdot\cdot} - \overline{Y}_{\cdot j\cdot} + \overline{Y})^2\) \((a-1)(b-1)\) \(CMAB = \frac{SCAB}{(a-1)(b-1)}\)
Error \(SCE = \sum_{i=1}^a\sum_{j=1}^b\sum_{k=1}^n (Y_{ijk} - \overline{Y}_{ij\cdot})^2\) \(ab(n-1)\) \(CME = \frac{SCE}{ab(n-1)}\)
Total \(SCT = \sum_{i=1}^a\sum_{j=1}^b\sum_{k=1}^n (Y_{ijk} - \overline{Y})^2\) \(abn-1\)

Estadísticos F: - Para Factor A: \(F_A = \frac{CMA}{CME} \sim F(a-1, ab(n-1))\) - Para Factor B: \(F_B = \frac{CMB}{CME} \sim F(b-1, ab(n-1))\) - Para Interacción: \(F_{AB} = \frac{CMAB}{CME} \sim F((a-1)(b-1), ab(n-1))\)


4. ANOVA de Medidas Repetidas (One-Way Repeated Measures)

Modelo: \(Y_{ij} = \mu + \pi_i + \tau_j + \varepsilon_{ij}\)

Fuente de Variación Suma de Cuadrados Grados de Libertad Cuadrado Medio
Entre Sujetos \(SC_{sujetos} = k\sum_{i=1}^n (\overline{Y}_{i\cdot} - \overline{Y})^2\) \(n-1\) \(CM_{sujetos} = \frac{SC_{sujetos}}{n-1}\)
Dentro Sujetos \(SC_{dentro} = \sum_{i=1}^n\sum_{j=1}^k (Y_{ij} - \overline{Y}_{i\cdot})^2\) \(n(k-1)\)
- Tratamientos \(SC_{trat} = n\sum_{j=1}^k (\overline{Y}_{\cdot j} - \overline{Y})^2\) \(k-1\) \(CM_{trat} = \frac{SC_{trat}}{k-1}\)
- Error \(SC_{error} = SC_{dentro} - SC_{trat}\) \((n-1)(k-1)\) \(CM_{error} = \frac{SC_{error}}{(n-1)(k-1)}\)
Total \(SCT = \sum_{i=1}^n\sum_{j=1}^k (Y_{ij} - \overline{Y})^2\) \(nk-1\)

Estadístico F: \(F = \frac{CM_{trat}}{CM_{error}} \sim F(k-1, (n-1)(k-1))\)

Corrección de esfericidad: - Greenhouse-Geisser: \(\hat{\epsilon} = \frac{k^2(\bar{s}_{jj} - \bar{s}_{..})^2}{(k-1)\left[\sum\sum s_{jj'}^2 - 2k\sum\bar{s}_{j.}^2 + k^2\bar{s}_{..}^2\right]}\) - Huynh-Feldt: \(\tilde{\epsilon} = \frac{n(k-1)\hat{\epsilon} - 2}{(k-1)[n-1-(k-1)\hat{\epsilon}]}\)


5. Diseño de Bloques Completos Aleatorizados (RCBD)

Modelo: \(Y_{ij} = \mu + \tau_i + \beta_j + \varepsilon_{ij}\)

Fuente de Variación Suma de Cuadrados Grados de Libertad Cuadrado Medio
Tratamientos \(SC_{trat} = b\sum_{i=1}^t (\overline{Y}_{i\cdot} - \overline{Y})^2\) \(t-1\) \(CM_{trat} = \frac{SC_{trat}}{t-1}\)
Bloques \(SC_{bloques} = t\sum_{j=1}^b (\overline{Y}_{\cdot j} - \overline{Y})^2\) \(b-1\) \(CM_{bloques} = \frac{SC_{bloques}}{b-1}\)
Error \(SC_{error} = \sum_{i=1}^t\sum_{j=1}^b (Y_{ij} - \overline{Y}_{i\cdot} - \overline{Y}_{\cdot j} + \overline{Y})^2\) \((t-1)(b-1)\) \(CM_{error} = \frac{SC_{error}}{(t-1)(b-1)}\)
Total \(SCT = \sum_{i=1}^t\sum_{j=1}^b (Y_{ij} - \overline{Y})^2\) \(tb-1\)

Estadístico F: \(F = \frac{CM_{trat}}{CM_{error}} \sim F(t-1, (t-1)(b-1))\)

Eficiencia relativa: \(RE = \frac{CM_{error(RCBD)}}{CM_{error(CRD)}} \times 100\%\)


6. Diseño Factorial (a × b)

Modelo: \(Y_{ijk} = \mu + \alpha_i + \beta_j + (\alpha\beta)_{ij} + \varepsilon_{ijk}\)

Fuente de Variación Suma de Cuadrados Grados de Libertad Cuadrado Medio
Factor A (niveles: a) \(SCA = bn\sum_{i=1}^a (\overline{Y}_{i\cdot\cdot} - \overline{Y})^2\) \(a-1\) \(CMA = \frac{SCA}{a-1}\)
Factor B (niveles: b) \(SCB = an\sum_{j=1}^b (\overline{Y}_{\cdot j\cdot} - \overline{Y})^2\) \(b-1\) \(CMB = \frac{SCB}{b-1}\)
Interacción A×B \(SCAB = n\sum_{i=1}^a\sum_{j=1}^b (\overline{Y}_{ij\cdot} - \overline{Y}_{i\cdot\cdot} - \overline{Y}_{\cdot j\cdot} + \overline{Y})^2\) \((a-1)(b-1)\) \(CMAB = \frac{SCAB}{(a-1)(b-1)}\)
Error \(SCE = \sum_{i=1}^a\sum_{j=1}^b\sum_{k=1}^n (Y_{ijk} - \overline{Y}_{ij\cdot})^2\) \(ab(n-1)\) \(CME = \frac{SCE}{ab(n-1)}\)
Total \(SCT = \sum_{i=1}^a\sum_{j=1}^b\sum_{k=1}^n (Y_{ijk} - \overline{Y})^2\) \(abn-1\)

Estadísticos F: - \(F_A = \frac{CMA}{CME} \sim F(a-1, ab(n-1))\) - \(F_B = \frac{CMB}{CME} \sim F(b-1, ab(n-1))\) - \(F_{AB} = \frac{CMAB}{CME} \sim F((a-1)(b-1), ab(n-1))\)


7. ANOVA Multivariado (MANOVA)

Modelo: \(\mathbf{Y}_{ij} = \boldsymbol{\mu} + \boldsymbol{\tau}_i + \boldsymbol{\varepsilon}_{ij}\)

Hipótesis: \(H_0: \boldsymbol{\tau}_1 = \boldsymbol{\tau}_2 = \cdots = \boldsymbol{\tau}_k = \mathbf{0}\)

Matrices de Suma de Cuadrados y Productos Cruzados:

  1. SCP Total: \(\mathbf{T} = \sum_{i=1}^k\sum_{j=1}^{n_i} (\mathbf{Y}_{ij} - \overline{\mathbf{Y}})(\mathbf{Y}_{ij} - \overline{\mathbf{Y}})'\)
    • \(gl_{total} = N-1\)
  2. SCP Entre Grupos: \(\mathbf{H} = \sum_{i=1}^k n_i(\overline{\mathbf{Y}}_i - \overline{\mathbf{Y}})(\overline{\mathbf{Y}}_i - \overline{\mathbf{Y}})'\)
    • \(gl_{entre} = k-1\)
  3. SCP Dentro Grupos (Error): \(\mathbf{E} = \sum_{i=1}^k\sum_{j=1}^{n_i} (\mathbf{Y}_{ij} - \overline{\mathbf{Y}}_i)(\mathbf{Y}_{ij} - \overline{\mathbf{Y}}_i)'\)
    • \(gl_{error} = N-k\)

Estadísticos de Prueba Multivariados:

  1. Traza de Pillai: \(V = tr\left[\mathbf{H}(\mathbf{H}+\mathbf{E})^{-1}\right]\)
    • \(F = \frac{V/s}{(1-V/s)} \cdot \frac{ms + d}{mN}\) donde \(s = min(p, k-1)\), \(m = (|N-k-p|-1)/2\), \(d = (p-(k-1)+1)/2\)
  2. Traza de Hotelling-Lawley: \(U = tr(\mathbf{E}^{-1}\mathbf{H})\)
    • \(F = \frac{U/c}{d}\) donde \(c = \frac{p(k-1)+2}{m_1m_2-2}\), \(d = \frac{m_1U + m_2}{m_1m_2-2}\)
  3. Lambda de Wilks: \(\Lambda = \frac{|\mathbf{E}|}{|\mathbf{H}+\mathbf{E}|}\)
    • \(F = \frac{1-\Lambda^{1/s}}{\Lambda^{1/s}} \cdot \frac{ms - p(k-1)/2 + 1}{p(k-1)}\)
  4. Mayor Raíz de Roy: \(\theta = \lambda_{max}(\mathbf{E}^{-1}\mathbf{H})\)
    • \(F = \frac{\theta}{1-\theta} \cdot \frac{N-k-p+1}{p}\)

Estructura del MANOVA:

Fuente de Variación Matriz SCP Grados de Libertad
Entre Grupos \(\mathbf{H} = \sum_{i=1}^k n_i(\overline{\mathbf{Y}}_i - \overline{\mathbf{Y}})(\overline{\mathbf{Y}}_i - \overline{\mathbf{Y}})'\) \(k-1\)
Dentro Grupos (Error) \(\mathbf{E} = \sum_{i=1}^k\sum_{j=1}^{n_i} (\mathbf{Y}_{ij} - \overline{\mathbf{Y}}_i)(\mathbf{Y}_{ij} - \overline{\mathbf{Y}}_i)'\) \(N-k\)
Total \(\mathbf{T} = \mathbf{H} + \mathbf{E}\) \(N-1\)

Resumen de Notación:

  • \(Y_{ij}\): Observación del i-ésimo sujeto/tratamiento en el j-ésimo grupo/tiempo
  • \(\overline{Y}_j\): Media del grupo j
  • \(\overline{Y}\): Media general
  • \(n_j\): Tamaño del grupo j
  • \(q, k, a, b\): Número de grupos/niveles
  • \(n\): Número total de observaciones
  • \(\varepsilon_{ij}\): Error aleatorio
  • \(\mu\): Media general poblacional
  • \(\alpha_i, \beta_j\): Efectos de los factores
  • \((\alpha\beta)_{ij}\): Efecto de interacción

Este documento proporciona las fórmulas fundamentales para cada diseño experimental. Para implementación práctica en R, se recomienda usar funciones como aov(), lm(), manova(), y paquetes especializados como car, ez, y nlme.