1 DISEÑO FACTORIAL \(2^2\)

Con frecuencia, en la experimentación industrial, se necesita dilucidar el efecto de un gran número de factores sobre la variable respuesta.

Aunque el número de niveles de cada factor sea bajo, el número de combinaciones aumenta rápidamente (3 factores, 4 niveles cada uno, es igual a 64 combinaciones). Si, consideramos sólo 2 niveles para cada factor, solo serán los valores extremos (nivel alto, nivel bajo).

En el diseño factorial \(2^2\) se tiene dos factores(A y B) con dos niveles cada uno (+) y (-). Notación para la variable respuesta

  1. Ambos factores al nivel (-).
  2. Factor A al nivel (+) y el factor B al nivel (-).
  3. Factor B al nivel (+) y el factor A al nivel (-).
  4. Ambos factores al nivel (+).

1.1 Modelo estadistico

El modelo estadistico es el siguiente:
\(y_{ij}=\mu+\alpha_{i}+\beta_{j}+(\alpha\beta)_{ij}+e_{ij}\)

En donde:

  • \(\mu\) es la media global
  • \(\alpha_{i}\) es el efecto del nivel i del factor A
  • \(\beta_{j}\) es el efecto del nivel j del factor B
  • \((\alpha\beta)_{ij}\) es el efecto de la interacción cuando el factor A está al nivel i y el B al nivel j
  • \(e_{ij}\) es el error asociado a i,j

Para establecer la influencia de los factores analizados en la variable de respuesta será necesario probar las siguientes hipótesis de trabajo:

Para los efectos del factor A:

\(H_{0}:\alpha_{i}=\alpha_{j}=0\)
\(H_{1}:\alpha_{i}\neq\alpha_{j}\neq0\)

Para los efectos del factor B:

\(H_{0}:\beta_{i}=\beta_{j}=0\)
\(H_{1}:\beta_{i}\neq\beta_{j}\neq0\)
Para los efectos de la interacción de A y B:
\(H_{0}:\alpha\beta_{i}=\alpha\beta_{j}=0\)
\(H_{1}:\alpha\beta_{i}\neq\alpha\beta_{j}\neq0\)

Para probar las hipótesis anteriores será necesario realizar un Análisis de Varianza, cuya Tabla ANOVA se construye de la siguiente manera:

1.2 Ejemplo

Para poner en practica lo descrito anteriormente, se procede a realizar el siguiente ejercicio:
En un artículo de AT&T Technical Journal (vol. 65, pp. 39-50) se describe la aplicación de diseños factoriales de dos niveles en la fabricación de circuitos integrados. Un paso básico del procesamiento es hacer crecer una capa epitaxial sobre obleas de silicio pulidas. Las obleas se montan en un susceptor, se colocan en el interior de una campana de cristal y se introducen vapores químicos. El susceptor se hace girar y se aplica calor hasta que la capa epitaxial tiene el espesor suficiente. Se corrió un experimento utilizando dos factores: rapidez de flujo de arsénico (A) y tiempo de deposición (B). Se corrieron cuatro réplicas y se midió el la capa epitaxial (en μm). Los datos se muestran a continuación (Montgomery, 2004)

Dado lo anterior, resuelva de manera clara y ordenada los siguientes incisos:

  1. Estime los efectos de los factores
  2. Ejecute un análisis de varianza ¿Qué factores son importantes?
  3. Escriba una ecuación de regresión que podría usarse para predecir el espesor de la capa epitaxial en la región de la velocidad de flujo del arsénico y el tiempo de deposición utilizado en este experimento.
  4. Analice los residuales. ¿Se observa algún residual que debiera causar preocupación?
  5. Comentar la forma en que se podría resolver el punto atípico potencial encontrado en el inciso d. 

1.2.1 Inciso a

Como primer punto, se realizan los datos en un archivo de Microsoft Excel titulado “dataset”. Posteriormente, se ixporta, para ello, se utiliza la libreria “readxl”. Ademas, se coloca una etiqueta para poder llamar a la base de datos, asi como, otros códigos.

library(readxl)
datos=read_excel(path = "dataset.xlsx")
View(datos)
attach(datos)
Acontinuación se coloca la tabla con los datos acomodados

Para poder determinar los efectos, se colocan los siguientes códigos:

flujo_arsenico=factor(`Factor A`)
tiempo=factor(`Factor B`)
modelo=lm(Respuesta~(flujo_arsenico+tiempo+flujo_arsenico*tiempo))
summary(modelo)
## 
## Call:
## lm(formula = Respuesta ~ (flujo_arsenico + tiempo + flujo_arsenico * 
##     tiempo))
## 
## Residuals:
##      Min       1Q   Median       3Q      Max 
## -0.72575 -0.14431 -0.00563  0.10188  1.98225 
## 
## Coefficients:
##                         Estimate Std. Error t value Pr(>|t|)    
## (Intercept)              14.6328     0.3373  43.384 1.46e-14 ***
## flujo_arsenico1          -0.7113     0.4770  -1.491    0.162    
## tiempo1                   0.1920     0.4770   0.403    0.694    
## flujo_arsenico1:tiempo1   0.6755     0.6746   1.001    0.336    
## ---
## Signif. codes:  0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
## 
## Residual standard error: 0.6746 on 12 degrees of freedom
## Multiple R-squared:  0.2813, Adjusted R-squared:  0.1016 
## F-statistic: 1.565 on 3 and 12 DF,  p-value: 0.249
library(FrF2)
experimento=FrF2(nruns = 4,nfactors = 2,factor.names = list(flujo_arsenico=c(-1,1),tiempo=c(-1,1)),replications = 4,randomize = FALSE)
experimento_resp=add.response(design = experimento, response = Respuesta)
grafica1=MEPlot(experimento_resp)

grafica2=IAPlot(experimento_resp)

head(grafica1)
##   flujo_arsenico   tiempo
## -       14.72875 14.27712
## +       14.35525 14.80687
head(grafica2)
##     flujo_arsenico:tiempo
## -:-              14.63275
## +:-              13.92150
## -:+              14.82475
## +:+              14.78900

1.2.2 Inciso b

En el caso de las gráficas de efectos individuales, o de efectos principales, es de observarse que una rapidez de flujo de arsénico al 55% de su capacidad genera un grosor de la capa epitaxial de 14.72875 \(μm\) en promedio, mientras que un flujo de dicha sustancia al 59% de su capacidad genera un grosor de la capa de 14.35525 \(μm\) en promedio, para el caso del tiempo, un lapso corto de tiempo (10 min) de exposición a los vapores químicos produce en promedio un grosor de la capa epitaxial de 14.27712 \(μm\), mientras que un tiempo de exposición largo (15 min), produce un grosor promedio de la capa de 14.80687 \(μm\). Podría concluirse entonces que un tiempo de exposición a los vapores químicos largo produce un mayor grosor de la capa, inclusive mayor que un flujo al 59% de capacidad del flujo de arsénico, por lo que el tiempo se considera el factor principal. Sin embargo, es necesario observar tambíén las gráficas de interacciones, mismas que reportan una interacción importante entre los factores. Cuando el flujo de arsénico se encuentra a un 55% de su capacidad de flujo y el tiempo de exposición es corto, se produce un grosor promedio de 14.63275 \(μm\), mientras que si se mantiene el flujo de arsénico en este nivel de operación pero se opera el sistema para un tiempo largo de exposición se genera un grosor promedio de la capa de 14.82475 \(μm\), estos hechos dan evidencia de una interacción entre el flujo de arsénico y el tiempo de exposición. En el caso del flujo de arsénico en un nivel de funcionamiento de 59%, si se mantiene el sistema operando para un tiempo corto de exposición se obtiene un grosor promedio de 13.92150 \(μm\), mientras que si se mantiene operando el sistema con un flujo de arsénico al 59% de su capacidad y un tiempo largo de exposición, se obtiene un grosor promedio de la capa de 14.78900 \(μm\). Para establecer de manera definitiva cuales son los niveles de operación del sistema, es conveniente verificar la significancia tanto de los factores de manera individual como de las interacciones, para tal caso se ejecuta el Análisis de Varianza (ANOVA) correspondiente, mediante la siguiente secuencia de comandos:

tabla_anova=aov(modelo)
summary(tabla_anova)
##                       Df Sum Sq Mean Sq F value Pr(>F)
## flujo_arsenico         1  0.558  0.5580   1.226  0.290
## tiempo                 1  1.123  1.1225   2.467  0.142
## flujo_arsenico:tiempo  1  0.456  0.4563   1.003  0.336
## Residuals             12  5.461  0.4551

Como es de observarse, el Valorp para el efecto producido por el flujo de arsénico no es significativo, dado que, considerando un nivel de significancia de \(α=0.05\), Valor \(p>α\), por lo que se de acepta la hipótesis nula y se concluye que no existen diferencias significativas entre los grosores promedio producido por los niveles del factor de tratamiento considerados para el flujo de arsénico. Para el caso del factor tiempo de exposición, se concluye que no existen diferencias significativas entre los niveles probados para este factor, dado que Valor \(p>α\), por lo que se acepta la hipótesis nula para los niveles del factor en comento. Para el caso de las interacciones, se concluye que no existen diferencias significativas entre las diferentes interacciones generadas, dado que Valorp>α, lo que lleva ala conclusión de que, si bien existen interacciones evidentes, éstas no son los suficientemente fuertes para provocar cambios importantes en el grosor de la capa epitaxial resultante.

1.2.3 Inciso c

Para el caso del modelo estadístico, el resultado obtenido reporta que los coeficientes de regresión dados los datos presentados quedarían representados de la siguiente manera:

\(Espesor_{ij}=14.5420−0.1868Rapidez_i+0.2649Tiempo_j+0.1689RapidezTiempo_{ij}+ε_{ij}\)

Una vez realizado el Análisis de Varianza, es importante verificar las pruebas de adecuación del modelo, para lo cual se efectuarán las siguientes pruebas:

  1. Prueba de Normalidad de Residuos de Shapiro Wilks
  2. Prueba de Barttlet para Igualdad de Varianzas

1.2.4 Inciso d

1.2.4.1 Prueba de Normalidad de Residuos de Shapiro-Wilk

Para el caso específico de la normalidad, procederemos a utilizar la Prueba de Bondad de Ajuste a la Distribución Normal de Shapiro-Wilks, aunque cabe mencionar que puede utilizarse cualquier otra, como Kolmogorov-Smirnov o Anderson-Darlind, la prueba de Shapiro-Wilks está diseñada específicamente para la Distribución Normal (Montgomery, 2004). Para realizar esta prueba debemos plantear las siguientes hipótesis de trabajo:

\(H_0:x∈N(μ=0,σ^2=Constante)\)
\(H_1:x∉N(μ=0,σ^2=Constante)\)

La hipótesis nula de la Prueba de Shapiro-Wilks se rechaza cuando Valor \(p<0.05\), siempre es recomendable realizar una gráfica de probabilidad normal para confirmar la prueba de hipótesis, para lo cual utilizaremos la siguiente secuencia de comandos:

prueba_normalidad=shapiro.test(resid(modelo))
print(prueba_normalidad)
## 
##  Shapiro-Wilk normality test
## 
## data:  resid(modelo)
## W = 0.69647, p-value = 0.0001543
qqnorm(resid(modelo), main= "Gráfica de Probabilidad para los Residuales del Modelo", xlab="Cuantiles Teoricos", ylab = "Cuantiles de muestra")
qqline(resid(modelo))

Los resultados obtenidos para la prueba de Shapiro-Wilk dan evidencia de la falta de normalidad en los residuos, situación que se confirma mediante la Gráfica de Probabilidad para los Residuales del Modelo, esto lleva a la conclusión de que, para este caso particular, existen datos atípicos para el modelo propuesto, mismos que provocan que dicho modelo no sea el adecuado para explicar el grosor de la capa epitaxial en función del flujo de arsénico y el tiempo de exposición al baño químico al que se somenten las obleas de silicio pulido.

1.2.4.2 Prueba Igualdad de Varianzas de Bartlett

La Prueba de Homocedasticidad, o de Varianzas Iguales, se realiza mediante la Prueba de Bartlett, misma que para el caso particular, como sólo es significativo el factor de tratamiento, solo se considerará éste para la ejecución de la prueba (Pulido, De la Vara Salazar, González, Martı́nez, & Pérez, 2012). La Prueba de Bartlett tiene las siguientes hipótesis:

\(H_{0}:σ^2_i=σ^2_j=Constante\)
\(H_{1}:σ^2_i≠σ^2_j≠Constante\)

La Prueba de Bartlett se realiza con la siguiente línea de comandos, misma que se efectúa por separado para cada factor

homocedasticidad_flujo=bartlett.test(Respuesta~flujo_arsenico, data=datos)
print(homocedasticidad_flujo)
## 
##  Bartlett test of homogeneity of variances
## 
## data:  Respuesta by flujo_arsenico
## Bartlett's K-squared = 2.0048, df = 1, p-value = 0.1568
homocedasticidad_tiempo=bartlett.test(Respuesta~tiempo, data=datos)
print(homocedasticidad_tiempo)
## 
##  Bartlett test of homogeneity of variances
## 
## data:  Respuesta by tiempo
## Bartlett's K-squared = 13.934, df = 1, p-value = 0.0001893

1.2.5 Inciso e

Para el caso de los datos atípico existen varias alternativas, las cuales, se pueden observar en el siguiente apartado: Presiona aquí

Bibliografia

Montgomery, D. (2004). Diseño y análisis de experimentos. México: Compañı́a Editorial Limusa Wiley.
Pulido, H. G., De la Vara Salazar, R., González, P. G., Martı́nez, C. T., & Pérez, M. del C. T. (2012). Análisis y diseño de experimentos. McGraw-Hill New York, NY, USA: