Guía de Uso: Auditoría Metodológica con vhmgDOE

Víctor Hugo Malavé Girón

2026-01-13

Resumen

El paquete vhmgDOE proporciona un marco formal, reproducible y auditable para el análisis de diseños clásicos de experimentos mediante Análisis de Varianza (ANOVA). A diferencia de enfoques puramente computacionales, vhmgDOE se estructura como un sistema de auditoría metodológica, cuyo propósito es garantizar que las conclusiones inferenciales estén sustentadas en el cumplimiento explícito de los supuestos estadísticos del modelo.

Esta vignette describe los fundamentos conceptuales del paquete, su flujo de trabajo, y ejemplifica su uso en los siguientes diseños experimentales:

El documento está redactado con un nivel de formalidad compatible con su uso como capítulo de tesis, manual metodológico o documentación oficial para CRAN.


1. Introducción metodológica

El Análisis de Varianza constituye una de las herramientas fundamentales de la estadística experimental. No obstante, su aplicación válida depende del cumplimiento de un conjunto de supuestos estructurales y distribucionales que con frecuencia son ignorados o evaluados de manera superficial.

El paquete vhmgDOE aborda esta problemática mediante la formalización de una auditoría metodológica, entendida como el proceso sistemático de:

  1. Exploración inicial de los datos.
  2. Ajuste explícito del modelo estadístico acorde al diseño experimental.
  3. Validación rigurosa de los supuestos del ANOVA.
  4. Evaluación de condiciones particulares del diseño.
  5. Emisión de conclusiones inferenciales trazables y defendibles.

2. Alcance y filosofía del paquete

vhmgDOE no es un paquete alternativo de ANOVA, sino una capa metodológica de control de calidad estadística. Su filosofía se fundamenta en los siguientes principios:


3. Flujo general de auditoría en vhmgDOE

Independientemente del diseño experimental, el flujo de trabajo es el siguiente:

  1. Reconocimiento de la estructura del diseño.
  2. Análisis Exploratorio de Datos (AEDA).
  3. Ajuste del modelo ANOVA correspondiente.
  4. Validación de los supuestos del modelo.
  5. Pruebas específicas del diseño (si aplican).
  6. Inferencia estadística.
  7. Declaratoria de desempeño de tratamientos.

4. Validación de los supuestos del Análisis de Varianza

4.1 Revisión de las asunciones del modelo

La validación de las asunciones subyacentes en un modelo estadístico, como aquellos utilizados en diseños de experimentos, constituye un paso esencial para garantizar la fiabilidad de las inferencias y conclusiones derivadas. Dichas asunciones aseguran que el modelo capture adecuadamente la estructura de los datos, evitando sesgos sistemáticos que comprometan la validez científica del análisis.

En vhmgDOE, la revisión de supuestos se fundamenta en el análisis de los residuos, definidos como la diferencia entre los valores observados y los valores predichos por el modelo ajustado. Este enfoque es universal y aplicable a cualquier diseño experimental, ya que los valores predichos incorporan todos los efectos especificados en el modelo (tratamientos, bloques, interacciones y covariables), permitiendo una evaluación precisa de la variabilidad no explicada.

NOTA IMPORTANTE: En diseños simples completamente aleatorizados (por ejemplo, un ANOVA de una vía sin bloques ni covariables), los valores predichos coinciden con las medias de los tratamientos, por lo que es metodológicamente válido calcular los residuos utilizando dichas medias. Sin embargo, en diseños más complejos —como bloques completos al azar, diseños factoriales con interacciones, diseños en parcelas divididas o análisis de covarianza (ANCOVA)— resulta prácticamente OBLIGATORIO emplear los valores ajustados del modelo completo, ya que las medias simples no reflejan los efectos adicionales y pueden conducir a diagnósticos sesgados.

“Como señala Montgomery (2004), la validación de los supuestos mediante el análisis de residuos debe basarse estrictamente en los valores predichos por el modelo lineal ajustado, especialmente en diseños que incorporan factores de bloqueo o covariables, para asegurar que el diagnóstico no sea contaminado por efectos sistemáticos del diseño.”

Por esta razón, el procedimiento estándar que adopta vhmgDOE es el siguiente:

  1. Ajusta el modelo estadístico correspondiente al diseño experimental mediante ANOVA (o su modelo lineal equivalente).
  2. Obtiene los valores predichos o ajustados del modelo.
  3. Genera los residuos como la diferencia entre valores observados y predichos.
  4. Evalua los supuestos del modelo utilizando dichos residuos.

Este orden lógico garantiza que la validación se realice sobre el modelo efectivamente propuesto y no sobre aproximaciones parciales o preliminares.

A continuación, se describen los cuatro supuestos fundamentales evaluados por vhmgDOE, junto con los métodos gráficos y numéricos empleados para su diagnóstico.


4.2 Normalidad de los errores

El supuesto de normalidad establece que los residuos deben seguir una distribución normal con media cero, condición necesaria para la validez de las pruebas inferenciales basadas en distribuciones paramétricas.

Método gráfico: se construyen gráficos cuantil–cuantil (Q–Q plots), en los cuales los cuantiles empíricos de los residuos se comparan con los cuantiles teóricos de una distribución normal. Una alineación aproximadamente rectilínea indica cumplimiento del supuesto; desviaciones sistemáticas (asimetría, colas pesadas) sugieren violaciones.

Método numérico: se aplican pruebas formales de normalidad, como Shapiro–Wilk o Kolmogorov–Smirnov. Valores p superiores a un umbral convencional (por ejemplo, 0.05) indican ausencia de evidencia suficiente para rechazar la normalidad.


4.3 Homocedasticidad

La homocedasticidad, o varianza constante, requiere que la dispersión de los residuos sea aproximadamente igual a lo largo de todos los niveles de los valores predichos o de los factores del modelo.

Método gráfico: se examina un gráfico de residuos versus valores predichos. La nube de puntos debe mostrar una dispersión uniforme alrededor de cero, sin patrones sistemáticos como formas de abanico o embudo.

Método numérico: se utilizan pruebas como Levene o Breusch–Pagan para evaluar formalmente la igualdad de varianzas. Valores p elevados respaldan la homocedasticidad; valores bajos sugieren la necesidad de transformaciones o modelos alternativos.


4.4 Independencia de los errores

El supuesto de independencia implica que los residuos no deben presentar correlación entre sí. Su violación es especialmente crítica, ya que invalida la estructura probabilística del modelo ANOVA.

Método gráfico: se grafican los residuos contra el orden de observación o contra variables potencialmente generadoras de dependencia (tiempo, posición espacial). La ausencia de tendencias, ciclos o agrupamientos indica independencia.

Método numérico: se emplea el estadístico de Durbin–Watson para detectar autocorrelación serial. Valores cercanos a 2 sugieren independencia; valores próximos a 0 o 4 indican correlación positiva o negativa, respectivamente.


4.5 Aditividad del modelo

La aditividad implica que el modelo describe adecuadamente la relación entre la variable respuesta y los factores, sin interacciones no modeladas ni estructuras no lineales omitidas.

Método gráfico: se analizan gráficos de residuos frente a valores predichos o frente a cada factor del modelo. La presencia de curvaturas o patrones sistemáticos indica falta de aditividad.

Método numérico: se aplica la prueba de no aditividad de Tukey o se incorporan términos adicionales (interacciones o polinomios), comparando modelos mediante pruebas F parciales. Un valor p bajo para estos términos sugiere que el modelo original no es aditivo.


En síntesis, vhmgDOE formaliza la revisión sistemática de las asunciones del ANOVA mediante el análisis de residuos derivados del MODELO AJUSTADO. Cuando se detectan violaciones, el paquete orienta hacia posibles remedios metodológicos —transformaciones, reespecificación del modelo o métodos alternativos— promoviendo una práctica estadística rigurosa, reproducible e independiente del software específico utilizado.

“En caso de incumplimiento de supuestos, el sistema activa automáticamente una ruta no paramétrica robusta (basada en Rangos Alineados), diseñada para mantener la estructura de bloques y preservar la validez de la inferencia.”


5. Tutorial de uso por diseño experimental

Las siguientes secciones presentan una estructura común para cada diseño, coherente con los estándares de una vignette de CRAN.


5.1 Diseño Completamente Aleatorizado (DCA)

Descripción

El DCA es el diseño experimental más simple, apropiado cuando las unidades experimentales son homogéneas.

Ejecución del análisis

# Carga de datos (ejemplo genérico)
data(ejemplo_dca)

vhmg_dca(data = ejemplo_dca,
         respuesta = "y",
         tratamiento = "trt")

Salida esperada e interpretación


5.2 Diseño en Bloques Completos al Azar (DBCA)

Descripción

El DBCA incorpora un factor de bloqueo para controlar una fuente conocida de variabilidad.

Ejecución del análisis

# Carga de datos (ejemplo genérico)
data(ejemplo_dbca)

vhmg_dbca(data = ejemplo_dbca,
          respuesta = "y",
          tratamiento = "trt",
          bloque = "bloque")

Salida esperada e interpretación


5.3 Diseño Factorial

Descripción

El diseño factorial permite evaluar simultáneamente los efectos principales y las interacciones entre factores.

Ejecución del análisis

# Carga de datos (ejemplo genérico)
data(ejemplo_factorial)

vhmg_factorial(data = ejemplo_factorial,
               respuesta = "y",
               factores = c("A", "B"))

Salida esperada e interpretación


5.4 Diseño de Cuadrado Latino (DCL)

Descripción

El Diseño de Cuadrado Latino controla simultáneamente dos fuentes de variabilidad sistemática (filas y columnas) y exige el cumplimiento del supuesto de aditividad.

Ejecución del análisis

# Carga de datos
data("OrchardSprays")

# Ejecución del análisis
vhmg_latino(data = OrchardSprays,
            respuesta = "decrease",
            factor = "treatment",
            bloque_fila = "rowpos",
            bloque_col = "colpos")

Salida esperada e interpretación


6. Declaratoria de desempeño

La declaratoria de desempeño constituye la síntesis final de la auditoría metodológica. En ella se establece:


7. Funciones de soporte teórico

El paquete incluye funciones documentales que explicitan la base estadística de los procedimientos:

vhmg_teoria_validar()
vhmg_teoria_latino()

Estas funciones refuerzan el carácter formativo del paquete y su idoneidad para docencia universitaria.


8. Consideraciones

vhmgDOE formaliza el análisis de diseños experimentales como un proceso auditable, alineado con las exigencias contemporáneas de reproducibilidad y rigor científico. Su uso sistemático es particularmente recomendable en tesis, informes técnicos y artículos científicos donde la validez metodológica es crítica.