6.12 En un artículo de AT&T Technical Journal (vol. 65, pp. 39-50) se describe la aplicación de diseños factoriales de dos niveles en la fabricación de circuitos integrados. Un paso básico del procesamiento es hacer crecer una capa epitaxial sobre obleas de silicio pulidas. Las obleas se montan en un susceptor, se colocan en el interior de una campana de cristal y se introducen vapores químicos. El susceptor se hace girar y se aplica calor hasta que la capa epitaxial tiene el espesor suficiente. Se corrió un experimento utilizando dos factores: rapidez de flujo de arsénico (A) y tiempo de deposición (B). Se corrieron cuatro réplicas y se midió el la capa epitaxial (en \(\mu\)m). Los datos se muestran a continuación(Montgomery, 2004)
Tabla de datos para el ejemplo:
| A | B | I | II | III | IV | Factor | Bajo(-) | Alto(+) |
|---|---|---|---|---|---|---|---|---|
| - | - | 14.037 | 16.165 | 13.972 | 13.907 | A | 55% | 59% |
| + | - | 13.880 | 13.860 | 14.032 | 13.914 | |||
| - | + | 14.821 | 14.757 | 14.843 | 14.878 | B | Corto | Largo |
| + | + | 14.888 | 14.921 | 14.415 | 14.932 | 10 min | 15 min |
Dado lo anterior, resuelva de manera clara y ordenada los sigientes incisos:
a) Estime los efectos de los factores.
Como primer paso debemos importar los datos desde el archivo que los contiene, ubicado en la carpeta de trabajo, que para este caso se llama dataset.txt.
library(printr)
#----------Preparación de datos--------#
library(printr)
library(FrF2)
datos=read.table("dataset.txt", header = TRUE)
str(datos)
## 'data.frame': 16 obs. of 3 variables:
## $ Respuesta : num 14 13.9 14.8 14.9 16.2 ...
## $ Flujo_arsenico: int -1 1 -1 1 -1 1 -1 1 -1 1 ...
## $ Tiempo : int -1 -1 1 1 -1 -1 1 1 -1 -1 ...
attach(datos)
Para efectos de resolver adecuadamente el ejercicio, reescribimos la tabla, de manera que sea interpretada como un conjunto de variables, quedando de la siguiente manera:
Tabla de datos reescrita:
attach(datos)
f_arsenico=factor(`Flujo_arsenico`)
f_Tiempo=factor(`Tiempo`)
head(datos, n= 16L)
| Respuesta | Flujo_arsenico | Tiempo |
|---|---|---|
| 14.037 | -1 | -1 |
| 13.880 | 1 | -1 |
| 14.821 | -1 | 1 |
| 14.888 | 1 | 1 |
| 16.165 | -1 | -1 |
| 13.860 | 1 | -1 |
| 14.757 | -1 | 1 |
| 14.921 | 1 | 1 |
| 13.972 | -1 | -1 |
| 14.032 | 1 | -1 |
| 14.843 | -1 | 1 |
| 14.415 | 1 | 1 |
| 13.907 | -1 | -1 |
| 13.914 | 1 | -1 |
| 14.878 | -1 | 1 |
| 14.932 | 1 | 1 |
Para calcular los efectos de los factores, debemos considerar que en la ejecución de un diseño factorial completo de la familia \(2^2\) es necesario considerar el factor de interacción; el modelo matemático que relaciona los efectos de los factores en la variable de salida se escribe de la siguiente manera:
\[y_{ij}=\mu+\tau_{i}+\beta_{j}+\epsilon_{ij}\]
Según Montgomery, en un diseño factorial con dos niveles, el efecto primedio de un factor puede definirse como el cambio en la respuesta producido por un cambio en el nivel de ese factor promediado para para los niveles del otro factor(Montgomery, 2004)
Dicho lo anterior, para el caso del factor A, el efecto promedio, utilizando la notación de Yates, se define como:
\[A={\frac{1}{2n}}[ab+a-b(1)]\]
Para el caso del factor B, se define de la siguiente manera:
\[B={\frac{1}{2n}}[ab+a-b(1)]\]
En el caso del efecto de interacción AB, se define como la diferencia promedio entre el efecto de A con el nivel alto de B y el efecto de A con el nivel bajo de B, por lo tanto:
\[AB={\frac{1}{2n}}[ab+(1)-a-b]\]
Para determinar los efectos, utilizamos el siguiente código:
#--------------------Modelo matemático----------------#
modelo= lm(Respuesta~(f_arsenico+f_Tiempo+f_arsenico*f_Tiempo))
summary(modelo)
##
## Call:
## lm.default(formula = Respuesta ~ (f_arsenico + f_Tiempo + f_arsenico *
## f_Tiempo))
##
## Residuals:
## Min 1Q Median 3Q Max
## -0.61325 -0.14431 -0.00563 0.10188 1.64475
##
## Coefficients:
## Estimate Std. Error t value Pr(>|t|)
## (Intercept) 14.5202 0.2824 51.414 1.93e-15 ***
## f_arsenico1 -0.5987 0.3994 -1.499 0.160
## f_Tiempo1 0.3045 0.3994 0.762 0.461
## f_arsenico1:f_Tiempo1 0.5630 0.5648 0.997 0.339
## ---
## Signif. codes: 0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
##
## Residual standard error: 0.5648 on 12 degrees of freedom
## Multiple R-squared: 0.3535, Adjusted R-squared: 0.1918
## F-statistic: 2.187 on 3 and 12 DF, p-value: 0.1425
#-----------------Análisis gráfico---------------------------#
library(FrF2)
experimento=FrF2(nruns=4, nfactors = 2, factor.names = list(f_arsenico=c(-1,1), f_tiempo=c(-1,1)),replications = 4, randomize = FALSE)
experimento_resp=add.response(design = experimento,response = Respuesta)
grafica_efectos_principales=MEPlot(experimento_resp, main= "Gráfica de Efectos Individuales")
grafica_interacciones=IAPlot(experimento_resp, main= "Gráfica de Interacciones")
head(grafica_efectos_principales)
| f_arsenico | f_tiempo | |
|---|---|---|
| - | 14.67250 | 14.22087 |
| + | 14.35525 | 14.80687 |
head(grafica_interacciones)
| f_arsenico:f_tiempo | |
|---|---|
| -:- | 14.52025 |
| +:- | 13.92150 |
| -:+ | 14.82475 |
| +:+ | 14.78900 |
Gráficas de efectos individuales.
Como se puede observar en el caso de las gráficas individuales estas tienen una rapidez de flujo de arsénico al 55% de su capacidad y genera un grosor de la capa epitaxial de 14.67250 \(\mu m\) aproximadamente, mientras que un flujo de dicha sustancia al 59% de su misma capacidad un grosor de la capa de 14.35525 \(\mu m\) en promedio.
En el caso del tiempo, en un lapso corto de 10 min de exposición a los vapores químicos produce en promedio un grosor de la capa epitaxial de 14.22087 \(\mu m\), que, a comparación de un tiempo de exposición largo de 15 min, genera un grosor promedio de la capa de 14.80687 \(\mu m\).
Por tanto, se puede decir que un tiempo de exposición largo a los vapores químicos crea un mayor grosor a la capa, aun mas grande que un flujo al 59% de capacidad del flujo de arsénico, de modo que se toma en cuenta al tiempo como un factor principal.
Gráficas de interacciones
Por su parte las gráficas de interacciones muestran una interacción entre los factores, cuando el flujo de arsénico está en un 55% de su capacidad con un tiempo de exposición corto de 10 min este produce un grosor promedio de 14.52025 \(\mu m\), pero si se mantiene el flujo de arsénico en este nivel y se opera el sistema para un tiempo largo de 15 min de exposición se genera un grosor promedio de la capa de 14.82475 \(\mu m\), por lo que muestra que dan cierta evidencia de una interacción entre el flujo de arsénico y el tiempo de exposición.
Por otro lado. en el caso del flujo de arsénico en un nivel de funcionamiento de 59%, si se mantiene el sistema operando para un tiempo corto de 10 min de exposición se obtiene un grosor promedio de 13.92150 \(\mu m\), y si se mantiene operando el sistema con un flujo de arsénico al 59% de su capacidad con un tiempo largo de 15 min de exposición, se obtiene un grosor promedio de la capa de 14.78900 \(\mu m\).
Es conveniente verificar la significancia de los factores de manera individual así como de las interacciones cuando se quiere alcanzar establecer de manera definitiva cuales son los niveles de operación del sistema, y para eso se realiza un Análisis de Varianza (ANOVA) mediante la siguiente secuencia de comandos que se realizan en el siguiente apartado.
b) Conducir un análisis de varianza. ¿Qué factores son importantes?
tabla_anova=aov(modelo)
summary(tabla_anova)
## Df Sum Sq Mean Sq F value Pr(>F)
## f_arsenico 1 0.403 0.4026 1.262 0.2833
## f_Tiempo 1 1.374 1.3736 4.305 0.0602 .
## f_arsenico:f_Tiempo 1 0.317 0.3170 0.994 0.3386
## Residuals 12 3.828 0.3190
## ---
## Signif. codes: 0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
De acuerdo con los resultados obtenidos por el análisis de varianza, se pueden concluir tres aspectos, el primero es que se puede observar que el \(Valor_{p}\) para lo que es el efecto producido por el flujo de arsénico es de 0.2833, y tomando como valor un nivel de significancia de \(\alpha=0.05\), y el \(Valor_{p}>\alpha\), se acepta la \(H_0\) (hipótesis nula), por lo que se puede concluir que no existen diferencias significativas en los grosores promedio que son producidos por los niveles de tratamiento para el flujo de arsénico.
Segundo, de acuerdo con el valor 0.0602 en lo que respecta al factor tiempo de exposición, y la consideración de que el \(Valor_{p}>\alpha\), se acepta la \(H_0\) (hipótesis nula), por lo que se puede concluir que no existen diferencias significativas entre los niveles probados para este factor.
Y tercero, en las interacciones arroja un valor de 0.3386, y siguiendo con que el \(Valor_{p}>\alpha\), se acepta la \(H_0\) (hipótesis nula), y se puede decir que no existen diferencias significativas, concluyendo que a pesar de que existen interacciones visibles, estas no son suficientes para crear cambios importantes en el grosor de la capa epitaxial resultante.
c) Escribir una ecuación de regresión que podria usarse para predecir el espesor de la capa epitaxial en la región de la velocidad de flujo del arseñico y el tiempo de deposicion utilizada en este experimento.
En la elaboración de una ecuación de regresión se puede realizar mediante el resultado obtenido de los coeficientes de regresión y con los datos quedarían de la siguiente manera:
\[Grosor_{ij}=14.5202−0.5987Porcentaje_{i}+0.3045Tiempo_{j}+0.5630PorcentajeTiempo_{ij}+ε_{ij}\]
Una vez que se hace el Análisis de Varianza (ANOVA) se realiza una verificación en las pruebas de la adecuación del modelo, por lo que se aplicaran las pruebas de Prueba de Normalidad de Residuos de Shapiro Wilks y Prueba de Barttlet para Igualdad de Varianzas.
d) Analizar los residuales. ¿Se observa algún residual que deberia causar preocupación?
Para el caso específico de la normalidad, procederemos a utilizar la Prueba de Bondad de Ajuste a la Distribución Normal de Shapiro-Wilks, aunque cabe mencionar que puede utilizarse cualquier otra, como Kolmogorov-Smirnov o Anderson-Darlind, la prueba de Shapiro-Wilks está diseñada específicamente para la Distribución Normal(Montgomery, 2004).
Para realizar esta prueba debemos plantear las siguientes hipótesis de trabajo:
\[H_{0}:x \, {\in} N\, ({\mu=0}, {\sigma^2}=Constante)\]
\[H_{1}:x \, {\notin}\, N\, ({\mu=0}, {\sigma^2}=Constante)\]
La hipótesis nula de la Prueba de Shapiro-Wilks se rechaza cuando \(Valor_{p}<0.05\), siempre es recomendable realizar una gráfica de probabilidad normal para confirmar la prueba de hipótesis, para lo cual utilizaremos la siguiente secuencia de comandos:
#----------------------Análisis residual--------------------#
prueba_normalidad=shapiro.test(resid(modelo))
print(prueba_normalidad)
##
## Shapiro-Wilk normality test
##
## data: resid(modelo)
## W = 0.71743, p-value = 0.0002643
#-------------Gráfica de Probabiliad Normal-----------------#
qqnorm(resid(modelo), main= "Gráfica de Probabilidad para los Residuales del Modelo", xlab="Cuantiles Teoricos", ylab = "Cuantiles de muestra")
qqline(resid(modelo))
La prueba de Shapiro-Wilk confirma que mediante la gráfica de probabilidad para los residuales del modelo muestra con cierta evidencia que hay una falta de normalidad en lo que respecta a los residuos, por lo que se puede decir que existen datos atípicos en el modelo propuesto, los cuales provocan que no sea idóneo para explicar el grosor de la capa epitaxial en función del flujo arsénico y el tiempo de exposición al baño químico al que se someten las obleas de silicio pulido.
La Prueba de Homocedasticidad, o de Varianzas Iguales, se realiza mediante la Prueba de Bartlett, misma que para el caso particular, como sólo es significativo el factor de tratamiento, solo se considerará éste para la ejecución de la prueba (Pulido, De la Vara Salazar, González, Martı́nez, & Pérez, 2012).
La Prueba de Bartlett tiene las siguientes hipótesis:
\[H_{0}:\sigma^{2}_{i}=\sigma^{2}_{j}=Constante\]
\[H_{1}:\sigma^{2}_{i} \neq \sigma^{2}_{j}\neq Constante\]
La Prueba de Bartlett se realiza con la siguiente línea de comandos, misma que se efectúa por separado para cada factor.
prueba_homocedasticidad_arsenico=bartlett.test(datos$Respuesta,datos$`Flujo_arsenico`)
print(prueba_homocedasticidad_arsenico)
##
## Bartlett test of homogeneity of variances
##
## data: datos$Respuesta and datos$Flujo_arsenico
## Bartlett's K-squared = 1.0199, df = 1, p-value = 0.3125
prueba_homocedasticidad_Tiempo=bartlett.test(datos$Respuesta,datos$`Tiempo`)
print(prueba_homocedasticidad_Tiempo)
##
## Bartlett test of homogeneity of variances
##
## data: datos$Respuesta and datos$Tiempo
## Bartlett's K-squared = 11.714, df = 1, p-value = 0.0006203
En el caso del factor tiempo de exposición se rechaza la hipótesis de igualdad de varianzas, ya que para que se acepte es necesario que los residuales sean homocedaticos para todos los factores y en este caso no lo es, por lo que se puede concluir que el modelo no es apropiado para explicar cambios en el grosor de la capa epitaxial en función del flujo de arsénico y el tiempo de exposición al baño químico para las obleas de silicio pulido.
e) Comentar la forma en que se podría resolver el punto atípico potencial encontrada en el inciso (d)
Cuando hay datos atípicos existen varias alternativas de solución, entre ellos están los tratamientos outliers, que en los casos atípicos pueden identificarse desde una perspectiva univariante o multivariante, por lo que en base a nuestra gráfica del inciso d) en la parte superior derecha se puede ver un caso atípico multivariado, debido a que la gran mayoría de datos se encuentran dentro del rango de la distribución y cerca de la línea, a excepción de uno que cambia completamente la forma de ver esta gráfica y poder solucionar este inciso. Por consiguiente, se puede resolver con datos atípicos multivariados.