1 Diseño factorial completo 2^2

1.1 Ejercicio

6.12 En un artículo de AT&T Technical Journal (vol. 65, pp. 39-50) se describe la aplicación de diseños factoriales de dos niveles en la fabricación de circuitos integrados. Un paso básico del procesamiento es hacer crecer una capa epitaxial sobre obleas de silicio pulidas. Las obleas se montan en un susceptor, se colocan en el interior de una campana de cristal y se introducen vapores químicos. El susceptor se hace girar y se aplica calor hasta que la capa epitaxial tiene el espesor suficiente. Se corrió un experimento utilizando dos factores: rapidez de flujo de arsénico (A) y tiempo de deposición (B). Se corrieron cuatro réplicas y se midió el la capa epitaxial (en μm). Los datos se muestran a continuación:(Montgomery, 2004)

Replica Nivelesde factores
A B I II III IV Factor Bajo_(-) Alto_(+)
- - 14.037 16.165 13.972 13.907 A 55% 59%
+ - 13.880 13.860 14.032 13.914
- + 14.821 14.757 14.843 14.878 B Corto Largo
+ + 14.888 14.921 14.415 14.932 10 min 15 min

Una vez leído el ejercicio, resuelve de manera clara y ordenada los siguientes incisos:
a) Estimar los efectos de los factores
b) Conducir un análisis de varianza ¿Qué factores son importantes?
c) Escribir una ecuación de regresión que podría usarse para predecir el espesor de la capa epitaxial en la región de la velocidad de flujo del arsénico y el tiempo de deposición utilizado en este experimento.
d) Analizar los residuales.¿Se observa algún residual que debiera causar preocupación?
e) Comentar la forma en que se podría resolver el punto atípico potencial encontrado en el inciso d. 

1.1.1 Desarrollo del ejercicio

1.1.1.1 Inciso a

#--------Preparación_de_datos----------#
library(printr)
## Warning: package 'printr' was built under R version 4.0.5
library(FrF2)
## Warning: package 'FrF2' was built under R version 4.0.5
datos=read.table("dataset.txt",header = TRUE)

str(datos)
## 'data.frame':    16 obs. of  3 variables:
##  $ Respuesta     : num  14 13.9 14.8 14.9 16.2 ...
##  $ Flujo_arcenico: int  -1 1 -1 1 -1 1 -1 1 -1 1 ...
##  $ Tiempo        : int  -1 -1 1 1 -1 -1 1 1 -1 -1 ...

Se presenta tabla de datos reescrita:

attach(datos)
head(datos, n= 16L)
Respuesta Flujo_arcenico Tiempo
14.037 -1 -1
13.880 1 -1
14.821 -1 1
14.888 1 1
16.165 -1 -1
13.860 1 -1
14.757 -1 1
14.921 1 1
13.972 -1 -1
14.032 1 -1
14.843 -1 1
14.415 1 1
13.907 -1 -1
13.914 1 -1
14.878 -1 1
14.932 1 1

A continuación se determinan los efectos

modelo=lm(Respuesta~(Flujo_arcenico+Tiempo+Flujo_arcenico*Tiempo))
summary(modelo) 
## 
## Call:
## lm.default(formula = Respuesta ~ (Flujo_arcenico + Tiempo + Flujo_arcenico * 
##     Tiempo))
## 
## Residuals:
##      Min       1Q   Median       3Q      Max 
## -0.61325 -0.14431 -0.00563  0.10188  1.64475 
## 
## Coefficients:
##                       Estimate Std. Error t value Pr(>|t|)    
## (Intercept)            14.5139     0.1412 102.783   <2e-16 ***
## Flujo_arcenico         -0.1586     0.1412  -1.123   0.2833    
## Tiempo                  0.2930     0.1412   2.075   0.0602 .  
## Flujo_arcenico:Tiempo   0.1407     0.1412   0.997   0.3386    
## ---
## Signif. codes:  0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
## 
## Residual standard error: 0.5648 on 12 degrees of freedom
## Multiple R-squared:  0.3535, Adjusted R-squared:  0.1918 
## F-statistic: 2.187 on 3 and 12 DF,  p-value: 0.1425
library(FrF2)
experimento=FrF2(nruns = 4, nfactors = 2, factor.names = list(Flujo_arcenico=c(-1,1),Tiempo=c(-1,1)),replications = 4,randomize = FALSE)
experimento_respuesta=add.response(design=experimento,response = Respuesta)
grafica_efectos_principales=MEPlot(experimento_respuesta, main= "Gráfica de Efectos Individuales")  

grafica_interacciones=IAPlot(experimento_respuesta, main= "Gráfica de Interacciones")

head(grafica_efectos_principales)
Flujo_arcenico Tiempo
- 14.67250 14.22087
+ 14.35525 14.80687
head(grafica_interacciones)
Flujo_arcenico:Tiempo
-:- 14.52025
+:- 13.92150
-:+ 14.82475
+:+ 14.78900

1.1.1.2 Incisos b y c

anova=aov(modelo)
summary(anova)
##                       Df Sum Sq Mean Sq F value Pr(>F)  
## Flujo_arcenico         1  0.403  0.4026   1.262 0.2833  
## Tiempo                 1  1.374  1.3736   4.305 0.0602 .
## Flujo_arcenico:Tiempo  1  0.317  0.3170   0.994 0.3386  
## Residuals             12  3.828  0.3190                 
## ---
## Signif. codes:  0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1

Se observa en el Valorp para el efecto ocasionado por el flujo de arsénico no es significativo debido a que, considerando un nivel de significancia de α=0.05, Valorp>α,se deberá aceptar la hipótesis nula y entonces se concluye que no existen diferencias significativas entre los grosores promedio que son producidos por los niveles del factor de tratamiento considerados para el flujo de arsénico. Para el caso del factor Tiempo de exposición, se concluye que no existen diferencias significativas entre los niveles probados para este factor, dado que Valorp>α, se deberá aceptar la hipótesis nula para los niveles del factor en comento. Para el caso de las interacciones, se concluye que no existen diferencias significativas entre las diferentes interacciones generadas, dado que Valorp>α, se concluye que si bien existen interacciones evidentes, éstas no son los suficientemente fuertes para provocar cambios importantes en el grosor de la capa epitaxial resultante.

1.1.1.3 Inciso d

Pruebas de Adecuación

Prueba de Shapiro-Wilk

normalidad=shapiro.test(resid(modelo))
print(normalidad)
## 
##  Shapiro-Wilk normality test
## 
## data:  resid(modelo)
## W = 0.71743, p-value = 0.0002643
#Gráfica de Probabiliad Normal
qqnorm(resid(modelo), main= "Gráfica de Probabilidad para los Residuales del Modelo", xlab="Cuantiles Teoricos", ylab = "Cuantiles de muestra")
qqline(resid(modelo))  

La obtención de los resultados para la prueba de Shapiro-Wilk dan evidencia de la falta de normalidad en los residuos, situación por la que se confirma mediante la Gráfica de Probabilidad para los Residuales del Modelo, lleva a la conclusión que para este caso particular, se encuentran datos atípicos para el modelo propuesto, los cuales provocan que dicho modelo no sea el más adecuado para explicar el grosor de la capa epitaxial en función del flujo de arsénico y el tiempo de exposición al baño químico al que se somenten las obleas de silicio pulido.

Prueba Igualdad de Varianzas de Bartlett

homocedasticidad_flujo=bartlett.test(Respuesta~Flujo_arcenico, data=datos)
print(homocedasticidad_flujo)
## 
##  Bartlett test of homogeneity of variances
## 
## data:  Respuesta by Flujo_arcenico
## Bartlett's K-squared = 1.0199, df = 1, p-value = 0.3125
homocedasticidad_tiempo=bartlett.test(Respuesta~Tiempo, data=datos)
print(homocedasticidad_tiempo)
## 
##  Bartlett test of homogeneity of variances
## 
## data:  Respuesta by Tiempo
## Bartlett's K-squared = 11.714, df = 1, p-value = 0.0006203

Para la aceptación de igualdad de varianzas, es necesario que los residuales sean homocedásticos para todos los factores, y para el caso de el factor Tiempo de exposición, se rechaza la hipótesis de igualdad de varianzas. Con lo anterior, se concluye que el modelo no es el adecuado para explicar los cambios en el grosor de la capa epitaxial en función del flujo arsénico y el tiempo de exposición al baño químico para las obleas de silicio pulido.

1.1.1.4 Inciso e

Datos atípicos

Para los datos atípicos están existentes diferentes soluciones posibles los cuales conyevan los atipicos univariados o multivariados, son numéricamente distante del resto de los datos. Se genera una observación que se desvía mucho de otras observaciones y despierta sospechas de ser generada por un mecanismo diferente.

Bibliografía

Montgomery, D. C. (2004). Diseño y análisis de experimentos (2nd ed.). Limusa Wiley.