El paquete vhmgDOE proporciona un marco formal, reproducible y auditable para el análisis de diseños clásicos de experimentos mediante Análisis de Varianza (ANOVA). A diferencia de enfoques puramente computacionales, vhmgDOE se estructura como un sistema de auditoría metodológica, cuyo propósito es garantizar que las conclusiones inferenciales estén sustentadas en el cumplimiento explícito de los supuestos estadísticos del modelo.
Esta vignette describe los fundamentos conceptuales del paquete, su flujo de trabajo, y ejemplifica su uso en los siguientes diseños experimentales:
El documento está redactado con un nivel de formalidad compatible con su uso como capítulo de tesis, manual metodológico o documentación oficial para CRAN.
El Análisis de Varianza constituye una de las herramientas fundamentales de la estadística experimental. No obstante, su aplicación válida depende del cumplimiento de un conjunto de supuestos estructurales y distribucionales que con frecuencia son ignorados o evaluados de manera superficial.
El paquete vhmgDOE aborda esta problemática mediante la formalización de una auditoría metodológica, entendida como el proceso sistemático de:
vhmgDOE no es un paquete alternativo de ANOVA, sino una capa metodológica de control de calidad estadística. Su filosofía se fundamenta en los siguientes principios:
Independientemente del diseño experimental, el flujo de trabajo es el siguiente:
La validación de las asunciones subyacentes en un modelo estadístico, como aquellos utilizados en diseños de experimentos, constituye un paso esencial para garantizar la fiabilidad de las inferencias y conclusiones derivadas. Dichas asunciones aseguran que el modelo capture adecuadamente la estructura de los datos, evitando sesgos sistemáticos que comprometan la validez científica del análisis.
En vhmgDOE, la revisión de supuestos se fundamenta en el análisis de los residuos, definidos como la diferencia entre los valores observados y los valores predichos por el modelo ajustado. Este enfoque es universal y aplicable a cualquier diseño experimental, ya que los valores predichos incorporan todos los efectos especificados en el modelo (tratamientos, bloques, interacciones y covariables), permitiendo una evaluación precisa de la variabilidad no explicada.
NOTA IMPORTANTE: En diseños simples completamente aleatorizados (por ejemplo, un ANOVA de una vía sin bloques ni covariables), los valores predichos coinciden con las medias de los tratamientos, por lo que es metodológicamente válido calcular los residuos utilizando dichas medias. Sin embargo, en diseños más complejos —como bloques completos al azar, diseños factoriales con interacciones, diseños en parcelas divididas o análisis de covarianza (ANCOVA)— resulta prácticamente OBLIGATORIO emplear los valores ajustados del modelo completo, ya que las medias simples no reflejan los efectos adicionales y pueden conducir a diagnósticos sesgados.
“Como señala Montgomery (2004), la validación de los supuestos mediante el análisis de residuos debe basarse estrictamente en los valores predichos por el modelo lineal ajustado, especialmente en diseños que incorporan factores de bloqueo o covariables, para asegurar que el diagnóstico no sea contaminado por efectos sistemáticos del diseño.”
Por esta razón, el procedimiento estándar que adopta vhmgDOE es el siguiente:
Este orden lógico garantiza que la validación se realice sobre el modelo efectivamente propuesto y no sobre aproximaciones parciales o preliminares.
A continuación, se describen los cuatro supuestos fundamentales evaluados por vhmgDOE, junto con los métodos gráficos y numéricos empleados para su diagnóstico.
El supuesto de normalidad establece que los residuos deben seguir una distribución normal con media cero, condición necesaria para la validez de las pruebas inferenciales basadas en distribuciones paramétricas.
Método gráfico: se construyen gráficos cuantil–cuantil (Q–Q plots), en los cuales los cuantiles empíricos de los residuos se comparan con los cuantiles teóricos de una distribución normal. Una alineación aproximadamente rectilínea indica cumplimiento del supuesto; desviaciones sistemáticas (asimetría, colas pesadas) sugieren violaciones.
Método numérico: se aplican pruebas formales de normalidad, como Shapiro–Wilk o Kolmogorov–Smirnov. Valores p superiores a un umbral convencional (por ejemplo, 0.05) indican ausencia de evidencia suficiente para rechazar la normalidad.
La homocedasticidad, o varianza constante, requiere que la dispersión de los residuos sea aproximadamente igual a lo largo de todos los niveles de los valores predichos o de los factores del modelo.
Método gráfico: se examina un gráfico de residuos versus valores predichos. La nube de puntos debe mostrar una dispersión uniforme alrededor de cero, sin patrones sistemáticos como formas de abanico o embudo.
Método numérico: se utilizan pruebas como Levene o Breusch–Pagan para evaluar formalmente la igualdad de varianzas. Valores p elevados respaldan la homocedasticidad; valores bajos sugieren la necesidad de transformaciones o modelos alternativos.
El supuesto de independencia implica que los residuos no deben presentar correlación entre sí. Su violación es especialmente crítica, ya que invalida la estructura probabilística del modelo ANOVA.
Método gráfico: se grafican los residuos contra el orden de observación o contra variables potencialmente generadoras de dependencia (tiempo, posición espacial). La ausencia de tendencias, ciclos o agrupamientos indica independencia.
Método numérico: se emplea el estadístico de Durbin–Watson para detectar autocorrelación serial. Valores cercanos a 2 sugieren independencia; valores próximos a 0 o 4 indican correlación positiva o negativa, respectivamente.
La aditividad implica que el modelo describe adecuadamente la relación entre la variable respuesta y los factores, sin interacciones no modeladas ni estructuras no lineales omitidas.
Método gráfico: se analizan gráficos de residuos frente a valores predichos o frente a cada factor del modelo. La presencia de curvaturas o patrones sistemáticos indica falta de aditividad.
Método numérico: se aplica la prueba de no aditividad de Tukey o se incorporan términos adicionales (interacciones o polinomios), comparando modelos mediante pruebas F parciales. Un valor p bajo para estos términos sugiere que el modelo original no es aditivo.
En síntesis, vhmgDOE formaliza la revisión sistemática de las asunciones del ANOVA mediante el análisis de residuos derivados del MODELO AJUSTADO. Cuando se detectan violaciones, el paquete orienta hacia posibles remedios metodológicos —transformaciones, reespecificación del modelo o métodos alternativos— promoviendo una práctica estadística rigurosa, reproducible e independiente del software específico utilizado.
“En caso de incumplimiento de supuestos, el sistema activa automáticamente una ruta no paramétrica robusta (basada en Rangos Alineados), diseñada para mantener la estructura de bloques y preservar la validez de la inferencia.”
Las siguientes secciones presentan una estructura común para cada diseño, coherente con los estándares de una vignette de CRAN.
El DCA es el diseño experimental más simple, apropiado cuando las unidades experimentales son homogéneas.
El DBCA incorpora un factor de bloqueo para controlar una fuente conocida de variabilidad.
El diseño factorial permite evaluar simultáneamente los efectos principales y las interacciones entre factores.
El Diseño de Cuadrado Latino controla simultáneamente dos fuentes de variabilidad sistemática (filas y columnas) y exige el cumplimiento del supuesto de aditividad.
La declaratoria de desempeño constituye la síntesis final de la auditoría metodológica. En ella se establece:
El paquete incluye funciones documentales que explicitan la base estadística de los procedimientos:
Estas funciones refuerzan el carácter formativo del paquete y su idoneidad para docencia universitaria.
vhmgDOE formaliza el análisis de diseños experimentales como un proceso auditable, alineado con las exigencias contemporáneas de reproducibilidad y rigor científico. Su uso sistemático es particularmente recomendable en tesis, informes técnicos y artículos científicos donde la validez metodológica es crítica.