Diseño de experimento con un solo factor - ANOVA

Docente: Delio SALGADO.

2024-02-08

Situación inicial

Un ingeniero de desarrollo de productos tiene interés en investigar la resistencia a la tensión de una fibra sintética nueva que se usará para hacer tela de camisas para caballero. El ingeniero sabe por experiencia previa que la resistencia a la tensión se afecta por el peso porcentual del algodón utilizado en la mezcla de materiales de la fibra. Además, sospecha que al aumentar el contenido de algodón se incrementará la resistencia, al menos en un principio. Sabe asimismo que el contenido de algodón deberá variar entre \(10\%\) y \(40\%\) para que el producto final tenga otras características de calidad que se desean (como la capacidad de ser sometido a un tratamiento de planchado permanente). El ingeniero decide probar ejemplares en cinco niveles del peso porcentual del algodón: \(15\%\), \(20\%\), \(25\%\), \(30\%\) Y \(35\%\) por ciento. También decide probar cinco ejemplares en cada nivel del contenido de algodón.

La situación anterior describe un experimento de un solo factor con las siguientes características:

  • Un (\(1\)) Factor: peso porcentual del algodón.
  • \(a\) Niveles del factor: \(a=5\), \(15\%,~20\%,~25\%,~30\%,~35\%,\)
  • \(n\) Réplicas: \(n=5\)
  • \(a*n\) Corridas experimentales: \(a*n=5*5=25\)

Como todo diseño experimental es necesario la aleatorización de las corridas experimentales, una forma de realizar este procedimiento es la siguiente:

  1. Supongamos que las corridas experimentales se enumeran de la siguiente manera:
Tratamiento
Número de corrida experimental
15% 1 2 3 4 5
20% 6 7 8 9 10
25% 11 12 13 14 15
30% 16 17 18 19 20
35% 21 22 23 24 25
  1. Ahora se selecciona un número aleatorio entre 1 y 25. Suponga que este número es 8. Entonces la observación número 8 (20% de algodón) se corre primero. Este proceso se repetiría hasta que las 25 observaciones tengan asignada una posición en la secuencia de prueba. Suponga la secuencia de prueba obtenida es:
Secuencia de prueba Número de corrida Peso porcentual del algodos
1 8 20%
2 18 30%
3 10 20%
4 23 35%
5 17 30%
6 5 15%
7 14 25%
8 6 20%
9 15 25%
10 20 30%
11 9 20%
12 4 15%
13 12 25%
14 7 20%
15 1 15%
16 24 35%
17 21 35%
18 11 25%
19 2 15%
20 13 25%
21 22 35%
22 16 30%
23 25 35%
24 19 30%
25 3 15%

Esta secuencia de prueba aleatorizada es necesaria para evitar que los efectos de variables perturbadoras desconocidas, las cuales quizá varíen fuera de control durante el experimento y contaminen los resultados. Para ilustrar esto, suponga que las 25 corridas de prueba tuvieran que realizarse en el orden original no aleatorizado (es decir, primero se prueban los cinco ejemplares con 15% de algodón, después se prueban los cinco ejemplares con 20% de algodón, etc.). Si la máquina empleada para probar la resistencia a la tensión presenta un efecto de calentamiento tal que entre más tiempo esté funcionando sean menores las lecturas de la resistencia a la tensión observadas, el efecto del calentamiento contaminará potencialmente los datos de la resistencia a la tensión y destruirá la validez del experimento.

Suponga que el ingeniero corre la prueba en el orden aleatorio que se ha determinado. A continuación se muestran las observaciones que obtiene para la resistencia a la tensión en \(lb/pulgada^2\):

Peso porcentual algodón 1 2 3 4 5 Total Promedio
15% 7 7 15 11 9 49 9.80
20% 12 17 12 18 18 77 15.40
25% 14 18 18 19 19 88 17.60
30% 19 25 22 19 23 108 21.60
35% 7 10 11 15 11 54 10.80
376 15.04

Podemos realizar un análisis inicial mediante algunas herramientas gráficas como los diagramas de cajas:

El gráfico indica que la resistencia a la tensión se incrementa cuando el contenido de algodón se incrementa, hasta cerca de \(30\%\) de algodón. Después de \(30\%\) de algodón, hay un marcado descenso de la resistencia a la tensión. No hay evidencia sólida que sugiera que la variabilidad de la resistencia a la tensión alrededor del promedio dependa del peso porcentual del algodón. Con base en este análisis gráfico simple, se tienen firmes sospechas de que:

  1. El contenido de algodón afecta la resistencia a la tensión y
  2. Alrededor de 30% de algodón produce la resistencia máxima.

Suponga que se quiere ser más objetivo en el análisis de los datos. Específicamente, imagine que quieren probarse las diferencias entre las resistencias a la tensión promedio con todos los niveles \(a=5\) del peso porcentual del algodón. Por lo tanto, el interés se centra en probar la igualdad de las cinco medias. El procedimiento adecuado para esto se conoce como Análisis de Varianza o ANOVA

Notación para Análisis de Varianza (ANOVA).

  • Factor: ¿Qué variable manipulamos de manera intencional?, para el ejemplo el factor es el peso porcentual del algodón

  • Niveles del factor: un experimento de un factor tendrá en total \(a~niveles\):

\[i=1,~2,~...,~a\]

Para el ejemplo Los niveles son:

\[i=1,~2,~3,~4,~5\], de la siguiente manera:

Niveles Especificación del nivel
1 15% de algodón
2 20% de algodón
3 25% de algodón
4 30% de algodón
5 35% de algodón
  • Réplicas: repetición de experimento básico

Para cada factor existen en total \(n~réplicas\):

\[j=1,~2,~...~,~n\]

Para el ejemplo las réplicas son:

\[j=~1,~2,~3,~4,~5\]

  • Variable respuesta: \(y_{ij}\)

Para el ejemplo:

\[y_{ij}:~resistencia~a~la~tensión~en~lb/pulgada^2\]

  • Corridas experimentales \(N\)

Las corridas experimentales totales \(N\) son:

\[N=a*n\]

Para el ejemplo las corridas experimentales son \(N=5*5=25\)

  • Tratamientos \(\tau_i\)

\[\tau_i~,~con~i=1,~2,~...~,~a\]

En diseños de un factor la cantidad de tratamientos es igual a la cantidad de niveles.

  • Observaciones (variables respuesta)

\(y_{ij}:~observaciones~para~el~nivel~i~de~la~réplica~j\)

  • Suma de observaciones: \(y_{i.}\)

Suma de observaciones para el \(nivel~i\) o \(tratamiento~i~(\tau_i)\)

\[y_{i.}=\sum_{j=1}^ny_{ij},~para~cada~i=1,~2,~...,~a\]

  • \(y_{..}:\)Suma de \(y_{i.}\)

\[y_{..}=\sum_{i=1}^ay_{i.}\]

  • \(\bar{y}_{i.}:\) media muestral de las observaciones del nivel o tratamiento \(i\)

\[\bar{y}_{i.}= \frac{y_{i.}}{n} \\ i=1,2,..,a\]

  • \(\bar{y}_{..}:\)media global

\[\bar{y}_{..}=\frac{y..}{N}\]

Tabla típica de un diseño de experimento de un solo factor.

Observaciones
Tratamiento o nivel 1 2 3 \(...\) n Totales Promedios
1 \(y_{11}\) \(y_{12}\) \(y_{13}\) \(...\) \(y_{1n}\) \(y_{2.}\) \(\bar{y}_{1.}\)
2 \(y_{21}\) \(y_{22}\) \(y_{23}\) \(...\) \(y_{2n}\) \(y_{3.}\) \(\bar{y}_{2.}\)
3 \(y_{31}\) \(y_{32}\) \(y_{33}\) \(...\) \(y_{3n}\) \(y_{4.}\) \(\bar{y}_{3.}\)
\(...\) \(...\) \(...\) \(...\) \(...\) \(y_{5.}\) \(\bar{y}_{4.}\)
a \(y_{a1}\) \(y_{a2}\) \(y_{a3}\) \(...\) \(y_{an}\) \(y_{6.}\) \(\bar{y}_{5.}\)
Totales \(y_{..}\) \(\bar{y}_{..}\)

Objetivo principal diseño de experimentos de un factor

El objetivo principal del diseño de experimentos de un solo factor es probar si existe evidencia estadística para determinar las diferencias en la variable respuesta promedio dado los distintos niveles del factor.

Para el ejemplo sería, probar si existe evidencia estadística entre las resistencias a la tensión promedio dado los distintos porcentajes de algodón en la fibra.

Pasos para el análisis de varianza o ANOVA

1. Supuestos del modelo

Para poder llevar a cabo el análisis de varianza de un diseño de experimento de un solo factor debemos suponer que:

\[y_{ij}\sim N(\mu+\tau_i,\sigma^2)\]

\[\epsilon_{ij}\sim N(0,\sigma^2)\]

2. Modelo de datos

Para el diseño de experimentos de un solo factor podemos plantear el modelo de datos de dos formas distintas

2.1 Modelo de las medias

\[y_{ij}=\mu_i+\epsilon_{ij}\left\{ \begin{array}{lcc} i=1,~2,~...~,~a \\ \\ j=1,~2,~...,~n \\ \end{array} \right.\]

2.2 Modelo de los efectos

\[y_{ij}=\mu+\tau_i+\epsilon_{ij}\left\{ \begin{array}{lcc} i=1,~2,~...~,~a \\ \\ j=1,~2,~...,~n \\ \end{array} \right.\]

Existen en general 2 tipos de diseños de experimentos de un factor.

  1. Diseño de experimentos de un solo factor con efectos fijos: el experimentador escoge los niveles.

  2. Diseño de experimentos de un solo factor con efectos aleatorios: niveles \(a\) son una muestra de una población de niveles.

En este curso trabajaremos Diseño de experimentos de un solo factor con efectos fijos:

Planteamiento de hipótesis

Basadas en las medias

\[\begin{gather*} H_o: \mu_1 = \mu_2 = ... = \mu_a \\ H_1: \mu_i \neq \mu_j,~para~al~menos~un~par~(i,j),~i\neq j,~i,j=1,2,...,a \end{gather*}\]

Basadas en los efectos de los tratamientos

\[\begin{gather*} H_o: \tau_1 = \tau_2 = ... = \tau_a = 0\\ H_1: \tau_i \neq 0~,~para~al~menos~un~i. \end{gather*}\]

3. Cálculos para los tratamientos

3.1 Suma de cuadrados de los tratamientos

\[SS_{tratamientos}=\left[\frac{1}{n}\sum_{i=1}^a y_{i.}^2\right]-\frac{y_{..}^2}{N}\]

3.2 Grados de libertad

\[Grados~de~libertad~tratamientos=a-1\]

3.3 Cuadrados medios de los tratamientos

\[MS_{tratamientos}=\frac{SS_{tratamientos}}{Grados~de~libertad~tratamientos}\]

4. Cálculos para el total

4.1 Suma de cuadrados del total

\[SS_{total}=\left[\sum_{i=1}^a\sum_{j=1}^ny_{ij}^2\right]-\frac{y_{..}^2}{N}\]

4.2 Grados de libertad

\[Grados~de~libertad~total=N-1\]

4.3 Cuadrados medios del total

\[MS_{total}=\frac{SS_{total}}{Grados~de~libertad~total}\]

5. Cálculos para el error

5.1 Suma de cuadrados del error

Para el cálculo de la suma de cuadrados del error nos valemos de saber que:

\[SS_{total}=SS_{tratamientos}+SS_{error}\]

Por lo tanto;

\[SS_{error}=SS_{total}-SS_{tratamientos}\]

5.2 Grados de libertad del error

\[Grados~libertad~error=N-a\]

5.3 Cuadrados medios del error

\[Ms_{error}=\frac{SSerror}{Grados~libertad~error}\]

6. Estadístico de prueba

El estadístico de prueba para este procedimiento inferencial es:

\[F_o=\frac{MS_{tratamientos}}{MS_{error}}\]

7. Estadístico de referencia

El estadístico de referencia para este procedimiento inferencial es:

\[F_{\alpha,~a-1,~N-a}\]

Recuerde que \(\alpha\) corresponde al Nivel de Significancia que es la probabilidad de cometer el Error Tipo I

Calculado el estadístico de prueba \(F_o\) y teniendo en cuenta el estadístico de referencia \(F_{\alpha,~a-1,~N-a}\), puedo Rechazar \(H_o\) si:

\[F_o>F_{\alpha,~a-1,~N-a}\]

Solución de situación inicial usando R

Para la situación inicial se quiere comprobar si existe evidencia estadística para afirmar que existe diferencia en la resistencia a la tensión de una fibra sintética dado el porcentaje de algodón, esto es:

\[H_0: \mu_1= \mu_2= \mu_3= \mu_4= \mu_5 \\ H_1: \mu_i \neq \mu_j~para~al~menos~un~(i,j),~i,j=1,2,3,4,5 \]

O

\[H_o: \tau_1 = \tau_2 = \tau_3 = \tau_4 = \tau_5 = 0\\ H_1: \tau_i \neq 0~,~para~al~menos~un~i, ~i=1,2,3,4,5\]

Para la solución del problema en R, seguimos los siguientes pasos

# Importamos los datos del experimento y se asignan a objeto Dataframe "datos"
library(readxl)
datos <-read_excel("datos_box.xlsx")

# Establecemos el factor
datos$Porcentaje <- as.factor(datos$Porcentaje)

# Plateamos modelo de datos y lo asignamos a un objeto "modelo"
modelo  <- lm(datos$Resistencia~datos$Porcentaje)

# Realizamos análisis de varianza y lo asignamos a objeto "anova"
anova <- aov(modelo)

# Observamos los resultados dela análisis de varianza
summary(anova)
##                  Df Sum Sq Mean Sq F value   Pr(>F)    
## datos$Porcentaje  4  475.8  118.94   14.76 9.13e-06 ***
## Residuals        20  161.2    8.06                     
## ---
## Signif. codes:  0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
# Buscamos cuantil de distribución de referencia con alpha = 0.05
qf(0.05,4,20, lower.tail = FALSE)
## [1] 2.866081

Del procedimiento anterior obtenemos los siguientes resultados:

  • \(F_0=14,76\)
  • \(F_{\alpha,~a-1,N-a} = F_{0.05,~4,~20}=2,866081\)

Como

\[ F_0=14,76 > F_{0.05,~4,~20}= 2,866081\]

Rechazo \(H_0\), y concluyo que existe suficiente evidencia estadística para afirmar que al menos un tratamiento tiene efecto en la resistencia a la tensión de la fibra.

Ejemplo desarrollado en clases

Durante el desarrollo de las clases de diseño de experimento se ha utilizado el siguiente problema:

Un fabricante de calzado desea mejorar la calidad de las suelas, las cuales se pueden hacer con uno de los cuatro tipos de cuero A, B, C y D disponibles en el mercado. Para ello, prueba los cueros con una máquina que hace pasar los zapatos por una superficie abrasiva; la suela de éstos se desgasta al pasarla por dicha superficie. Como criterio de desgaste se usa la pérdida de peso después de un número fijo de ciclos. Se prueban en orden aleatorio 24 zapatos, seis de cada tipo de cuero. Al hacer las pruebas en orden completamente al azar se evitan sesgos y las mediciones en un tipo de cuero resultan independientes de las demás. Los datos (en miligramos) sobre el desgaste de cada tipo de cuero se muestran en la tabla siguiente:

Observaciones
Tipo de cuero 1 2 3 4 5 6
A 264 260 258 241 262 255
B 208 220 216 200 213 206
C 220 263 219 225 230 228
D 217 226 215 227 220 222

Solución ejemplo de clases en R

# Esta vez agregaremos los datos directamente en R y no los importaremos desde un  archivo externo, para esto, los datos del factor de interés y los datos de la variable respuesta conformarán un vector cada uno.

# Vector del factor de interés
cuero <- c("A", "A","A","A","A","A", "B", "B","B","B","B","B","C","C","C","C","C","C","D","D","D","D","D","D")

# Vector variable respuesta
desgaste <- c(264,260,258,241,262,255,208,220,216,200,213,206,220,263,219,225,230,228,217,226,215,227,220,222)

# Declaro el factor de interés
cuero <- as.factor(cuero)

# Planteo el modelo de datos
modelo <- lm(desgaste~cuero)

# Realizo análisis de varianza
anova <- aov(modelo)

# Muestro los datos para el análisis de varianza
summary(anova)
##             Df Sum Sq Mean Sq F value   Pr(>F)    
## cuero        3   7019  2339.8   22.75 1.18e-06 ***
## Residuals   20   2056   102.8                     
## ---
## Signif. codes:  0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
# Encuentro el cuantil para la distribución de referencia para alpha = 0.05
qf(0.05,3,20,lower.tail = FALSE)
## [1] 3.098391

De los resultados en R tenemos:

  • \(F_0 = 22.75\)

  • \(F_{\alpha,~a-1,~N-a} = F_{0.05,~3,~20 =3.098391}\)

Se cumple la condición: \(F_0 > F_{\alpha,~a-1,~N-a}\) por lo que rechazo \(H_0\), existe evidencia estadística suficiente para afirmar que, al menos un tratamiento, tiene efecto en la variable respuesta.