Ejercicios Tabla ANOVA

Esta es una excelente iniciativa para que los estudiantes de Ingeniería comprendan qué sucede “bajo el capó” de los softwares que utilizan habitualmente.

A continuación, presento una propuesta de guía estructurada y didáctica, diseñada para ser trabajada paso a paso.


Guía de Aprendizaje: Cálculo Manual de la Tabla ANOVA (Un Factor)

1. Introducción

El Análisis de Varianza (ANOVA) permite determinar si existen diferencias significativas entre las medias de tres o más grupos. Para lograrlo, descomponemos la variabilidad total de los datos en dos fuentes: la variabilidad entre grupos (debida al tratamiento) y la variabilidad intra grupos (debida al error o azar).

2. Notación y Definiciones

Antes de empezar, asegúrate de identificar estos valores en tu conjunto de datos:

  • \(q\): Número de grupos o tratamientos.
  • \(n_j\): Número de observaciones en el grupo \(j\).
  • \(n\): Número total de observaciones en todo el experimento.
  • \(Y_{ij}\): El valor de la observación \(i\) en el grupo \(j\).
  • \(\bar{Y}_j\): Media aritmética del grupo \(j\).
  • \(\bar{Y}\): Media global (gran media) de todos los datos.

3. Procedimiento Paso a Paso

Paso 1: Calcular las Sumas de Cuadrados (SC)

Es el corazón del cálculo. Mide la dispersión de los datos.

  • SC Entre Grupos (\(SC_{entre}\)): Suma las diferencias al cuadrado entre la media de cada grupo y la media global, multiplicadas por el tamaño de cada grupo.

\[SC_{entre} = \sum_{j=1}^{q} n_j (\bar{Y}_j - \bar{Y})^2\]

  • SC Intra Grupos (\(SC_{intra}\)): Es la suma de las variaciones de cada dato individual respecto a la media de su propio grupo. También se conoce como Suma de Cuadrados del Error.

\[SC_{intra} = \sum_{j=1}^{q} \sum_{i=1}^{n_j} (Y_{ij} - \bar{Y}_j)^2\]

  • SC Total (\(SC_{total}\)): La variación de cada dato respecto a la media global. Debe cumplirse que: \(SC_{total} = SC_{entre} + SC_{intra}\).

Paso 2: Determinar los Grados de Libertad (G.L.)

Representan el número de piezas de información independientes.

  • \(gl_{entre} = q - 1\)
  • \(gl_{intra} = n - q\) (o la suma de \(n_j - 1\) de cada grupo)
  • \(gl_{total} = n - 1\)

Paso 3: Calcular los Cuadrados Medios (CM)

El Cuadrado Medio es simplemente la varianza estimada. Se obtiene dividiendo la Suma de Cuadrados entre sus respectivos grados de libertad.

  • \(CM_{entre} = \frac{SC_{entre}}{gl_{entre}}\)
  • \(CM_{intra} = \frac{SC_{intra}}{gl_{intra}}\)

Paso 4: Calcular la Razón F (Estadístico de Prueba)

Es el valor que compararemos con el valor crítico de la tabla F de Snedecor.

\[F = \frac{CM_{entre}}{CM_{intra}}\]


4. Estructura de la Tabla ANOVA para completar

Pide a tus alumnos que completen el siguiente formato tras realizar los cálculos:

Fuente de Variación Suma de Cuadrados (SC) Grados de Libertad (gl) Cuadrado Medio (CM) Razón F
Entre Grupos (Tratamientos) \(SC_{entre}\) \(q - 1\) \(CM_{entre}\) \(F_{calc}\)
Intra Grupos (Error) \(SC_{intra}\) \(n - q\) \(CM_{intra}\)
Total \(SC_{total}\) \(n - 1\)

5. Interpretación

  • Si \(F_{calculado} > F_{tabla}\) (para un nivel de significancia \(\alpha\)), se rechaza la hipótesis nula (\(H_0\)): Al menos una media es diferente.
  • Si se rechaza \(H_0\), se recomienda proceder con pruebas de comparaciones múltiples (Post-Hoc) como Tukey o Bonferroni.

¡Excelente elección! Dado que impartes clases a ingenieros Agrícolas y Agroindustriales, y que utilizas herramientas como Google Colab, he diseñado este ejercicio práctico enfocado en un escenario real de campo.

Esta guía está lista para que la copies en un cuaderno de Google Colab (usando celdas de texto/Markdown) o en un PDF para tus alumnos.


Guía Práctica: Análisis de Varianza (ANOVA) Manual

Contexto: Ingeniería Agrícola / Agroindustrial Objetivo: Evaluar si el tipo de fertilizante orgánico afecta significativamente el rendimiento de un cultivo.

1. El Escenario Experimental

Un ingeniero agrícola desea comparar el rendimiento (en kg por parcela) de un cultivo de tomate bajo tres tipos de fertilizantes orgánicos (\(A, B\) y \(C\)). Se seleccionaron 12 parcelas experimentales de forma aleatoria (4 parcelas por tratamiento).

Datos recolectados (Rendimiento en kg):

Fertilizante A (\(j=1\)) Fertilizante B (\(j=2\)) Fertilizante C (\(j=3\))
12 18 14
10 17 12
13 19 13
11 16 15

2. Cálculos Preliminares (Paso a Paso)

Paso A: Totales y Medias por Grupo (\(\bar{Y}_j\))

  1. Grupo A: \(\sum Y_{i1} = 46 \implies \bar{Y}_1 = 11.5\)
  2. Grupo B: \(\sum Y_{i2} = 70 \implies \bar{Y}_2 = 17.5\)
  3. Grupo C: \(\sum Y_{i3} = 54 \implies \bar{Y}_3 = 13.5\)

Paso B: Media Global (\(\bar{Y}\))

Sumamos todos los datos y dividimos entre \(n=12\):

\[\bar{Y} = \frac{46 + 70 + 54}{12} = \frac{170}{12} \approx 14.17\]


3. Aplicación de las Fórmulas (Basado en la imagen)

1. Suma de Cuadrados Entre Grupos (\(SC_{entre}\))

Mide cuánto varían las medias de los fertilizantes respecto al promedio general.

\[SC_{entre} = 4(11.5 - 14.17)^2 + 4(17.5 - 14.17)^2 + 4(13.5 - 14.17)^2\]

\[SC_{entre} = 4(-2.67)^2 + 4(3.33)^2 + 4(-0.67)^2\]

\[SC_{entre} \approx 28.52 + 44.36 + 1.80 = \mathbf{74.68}\]

2. Suma de Cuadrados Intra Grupos (\(SC_{intra}\)) - El Error

Mide la variabilidad dentro de cada parcela tratada igual. Para cada grupo, resta su media a cada dato y elévalo al cuadrado:

  • Para A: \((12-11.5)^2 + (10-11.5)^2 + (13-11.5)^2 + (11-11.5)^2 = 5\)
  • Para B: \((18-17.5)^2 + (17-17.5)^2 + (19-17.5)^2 + (16-17.5)^2 = 5\)
  • Para C: \((14-13.5)^2 + (12-13.5)^2 + (13-13.5)^2 + (15-13.5)^2 = 5\)

\[SC_{intra} = 5 + 5 + 5 = \mathbf{15}\]

3. Grados de Libertad (\(g.l.\))

  • \(gl_{entre} = q - 1 = 3 - 1 = \mathbf{2}\)
  • \(gl_{intra} = n - q = 12 - 3 = \mathbf{9}\)

4. Cuadrados Medios (\(CM\)) y Razón F

  • \(CM_{entre} = 74.68 / 2 = \mathbf{37.34}\)
  • \(CM_{intra} = 15 / 9 = \mathbf{1.67}\)
  • Razón F: \(F = 37.34 / 1.67 = \mathbf{22.36}\)

4. Tabla ANOVA Resultante

Fuente SC g.l. CM F
Entre grupos 74.68 2 37.34 22.36
Intra grupos 15.00 9 1.67
Total 89.68 11

5. Validación en Python (Para tus clases de Programación)

Como usas Google Colab, puedes pedirles que validen sus cálculos manuales con este bloque de código:

import scipy.stats as stats

# Datos de los fertilizantes
A = [12, 10, 13, 11]
B = [18, 17, 19, 16]
C = [14, 12, 13, 15]

# Ejecutar ANOVA de un factor
f_val, p_val = stats.f_oneway(A, B, C)

print(f"Resultado Manual F: 22.36")
print(f"Resultado Python F: {f_val:.2f}")
print(f"P-valor: {p_val:.5f}")

if p_val < 0.05:
    print("Conclusión: Existen diferencias significativas entre los fertilizantes.")

Sugerencia didáctica: Haz énfasis en que el \(SC_{intra}\) representa el “ruido” o error experimental (diferencias de suelo, riego, genética individual), mientras que el \(SC_{entre}\) representa la “señal” del tratamiento (el efecto real del fertilizante). Si la señal es mucho mayor que el ruido (F alto), el fertilizante funciona de manera distinta.