Ejercicio 8-6

R.D Snee (“Exprimentacion con un numero grande de variables”, en Experiments in Industry:Desing Analysis and Interpretation of Results, de R.D, Snee, L.B Hare y J.B, Trout, editores, ASQC) describe un experimento en el que uso un diseño \(2^5\) con I=ABCDE para investigar los efectos de cinco factores sobre el color de un producto quimico. Los factores son A=solvente/reactivo, B=catalizador/reactivo, C=temperatura, D=pureza del reactivo y E= pH del reactivo. Los resultados obtenidos fueron los siguientes:

Datos
e=-0.63 d=6.79
a=2.51 ade=5.47
b=-2.68 bde=3.45
abe=1.66 abd=5.68
c=2.06 cde=5.22
ace=1.22 bcd=4.38
bce=-2.09 bcd=4.30
abc=1.93 abcde=4.05
  1. Construir una grafica de probabilidad normal de los efectos. ¿Que efectos parecen estar activos?

  2. Calcular los residuales. Construir una grafica de probabilidad normal de los residuos y graficar los residuales contra los valores ajustados. Comentar las graficas.

  3. Si alguno de los factores son insignificantes , plegar el diseo \(2^5\) a un diseño factorial completo en los factores activos. Comentar el diseño resultante e interpretar los resultados.

El primer paso es extraer los datos, con los cuales se va realizar el experimento.

library(printr)
datos=read.table("dataset.txt",header= TRUE)
str(datos)
## 'data.frame':    16 obs. of  6 variables:
##  $ A             : int  -1 1 -1 1 -1 1 -1 1 -1 1 ...
##  $ B             : int  -1 -1 1 1 -1 -1 1 1 -1 -1 ...
##  $ C             : int  -1 -1 -1 -1 1 1 1 1 -1 -1 ...
##  $ D             : int  -1 -1 -1 -1 -1 -1 -1 -1 1 1 ...
##  $ E             : int  1 -1 -1 1 -1 1 1 -1 -1 1 ...
##  $ Color_Producto: num  -0.63 2.51 -2.68 1.66 2.06 1.22 -2.09 1.93 6.79 5.47 ...
attach(datos)
head(datos,n=16L)
A B C D E Color_Producto
-1 -1 -1 -1 1 -0.63
1 -1 -1 -1 -1 2.51
-1 1 -1 -1 -1 -2.68
1 1 -1 -1 1 1.66
-1 -1 1 -1 -1 2.06
1 -1 1 -1 1 1.22
-1 1 1 -1 1 -2.09
1 1 1 -1 -1 1.93
-1 -1 -1 1 -1 6.79
1 -1 -1 1 1 5.47
-1 1 -1 1 1 3.45
1 1 -1 1 -1 5.68
-1 -1 1 1 1 5.22
1 -1 1 1 -1 4.38
-1 1 1 1 -1 4.30
1 1 1 1 1 4.05

a) Construir una grafica de probabilidad normal de los efectos. ¿Que efectos parecen estar activos?

Para verificar cuales son los datos activos se requiere obtener la grafica de pareto y la de Daniel, estas nos dan evidencia de cuales son los efectos relevantes del experimento,con base en el principio de escasez. Para ello es necesario realizar el siguiente codigo.

library(FrF2)
experimento=FrF2(nruns = 16, nfactors = 5, factor.names = list(A=c(-1,1),B=c(-1,1),C=c(-1,1),D=c(-1,1),E=c(-1,1)),generators = "ABCD",replications = 1,randomize = FALSE)
experimento_respuesta=add.response(design = experimento,response = Color_Producto)
halfnormal(experimento_respuesta, xlab = "Efectos activos")

En esta grafica se puede obsevar que los efectos activos en el diseño experimental son unicamente el factor D. Para confirmar la informacion, se procede a verificar con la grafica de Daniel, misma que se calcula con el siguiente codigo.

DanielPlot(experimento_respuesta, main= "Gráfico de Daniel para el Color de Producto Quimico")

En esta grafica se confirma la informacion obtenida en la grafica anterior y se concluye que el factor que tiene efectos activos es el factor D (Pureza del reactivo). Tambien se procede a realizar la grafica de efectos individuales para ver de que manera influyen en la variable de respuesta que es el color del producto quimico.

efectos_principales=MEPlot(experimento_respuesta)

head(efectos_principales)
A B C D E
- 2.0525 3.3775 2.78125 0.4975 3.12125
+ 3.3625 2.0375 2.63375 4.9175 2.29375

En la grafica de efectos individuales se puede observar que el factor D es el mas significativo, ya que si trabaja en un nivel de minimo a maximo se aumenta el color del producto quimico. Por otra parte el factor A aumenta el color del producto quimico si se trabaja en su nivel de minimo a maximo, el factor B disminuye el color del producto quimico si se trabaja en su nivel de minimo a maximo, el factor C disminuye ligrarmente el color del producto si se trabaja en su nivel minimo a maximo y por ultimo el factor E disminuye el color del producto quimico si se trabaja a un nivel de minimo a maximo. Y para confirmar esta informacion se presentan la diferencia de cada factor cuando se tiene el nivel minimo (-) y el nivel maximo (+), donde claramente se observa que la diferencia mas significativa de los valores corresponde al factor D con un valor de 4.42.

grafica_interacciones=IAPlot(experimento_respuesta)

head(grafica_interacciones)
A:B A:C A:D A:E B:C B:D B:E C:D C:E D:E
-:- 3.360 1.7325 -0.835 2.6175 3.5350 1.290 3.9350 0.2150 3.0750 0.9550
+:- 3.395 3.8300 1.830 3.6250 2.0275 -0.295 2.3075 0.7800 3.1675 5.2875
-:+ 0.745 2.3725 4.940 1.4875 3.2200 5.465 2.8200 5.3475 2.4875 0.0400
+:+ 3.330 2.8950 4.895 3.1000 2.0475 4.370 1.7675 4.4875 2.1000 4.5475

De la grafica anterior, podemos observar que existen interacciones fuertes entre los factores: A:D, B:D, C:D, D:E.

b) Calcular los residuales. Construir una grafica de probabilidad normal de los residuos y graficar los residuales contra los valores ajustados. Comentar las graficas.

A continuacion se prsenta una grafica de normalidad de los residuos, mediante el siguiente codigo:

lineal=lm(Color_Producto~(A+B+C+D+E)) 
summary(lineal)
## 
## Call:
## lm.default(formula = Color_Producto ~ (A + B + C + D + E))
## 
## Residuals:
##     Min      1Q  Median      3Q     Max 
## -2.3400 -0.5181  0.1988  0.8581  1.5175 
## 
## Coefficients:
##             Estimate Std. Error t value Pr(>|t|)    
## (Intercept)  2.70750    0.35061   7.722 1.60e-05 ***
## A            0.65500    0.35061   1.868   0.0913 .  
## B           -0.67000    0.35061  -1.911   0.0851 .  
## C           -0.07375    0.35061  -0.210   0.8376    
## D            2.21000    0.35061   6.303 8.87e-05 ***
## E           -0.41375    0.35061  -1.180   0.2653    
## ---
## Signif. codes:  0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
## 
## Residual standard error: 1.402 on 10 degrees of freedom
## Multiple R-squared:  0.8285, Adjusted R-squared:  0.7428 
## F-statistic: 9.662 on 5 and 10 DF,  p-value: 0.001381
residuals(lineal)
##       1       2       3       4       5       6       7       8       9      10 
## -0.8025  0.2000 -2.3400  1.5175  1.2075 -0.1150 -0.7750  1.1075  1.3700 -0.4325 
##      11      12      13      14      15      16 
##  0.1975  0.2900  0.7750 -2.2025  0.3675 -0.3650
rstandard(lineal)
##          1          2          3          4          5          6          7 
## -0.7238133  0.1803896 -2.1105586  1.3687062  1.0891023 -0.1037240 -0.6990098 
##          8          9         10         11         12         13         14 
##  0.9989075  1.2356689 -0.3900926  0.1781347  0.2615649  0.6990098 -1.9865407 
##         15         16 
##  0.3314659 -0.3292111
Estandar<-plot(rstandard(lineal), main ="Comportamiento de los residuos estandar", ylab = "Residuos Estandar")

Conclusion de la grafica: Como se puede observar el comportamiento de los residuos son muy aleatorios y dispersos, no muestran un patron de comportamieto y no siguien una distribucon normal. La comparacion entre los residuos y los residuos ajustados es casi la misma, por lo que casi no hay diferencia.

c) Si alguno de los factores son insignificantes , plegar el diseo \(2^5\) a un diseño factorial completo en los factores activos. Comentar el diseño resultante e interpretar los resultados.

Dado que el factor significativo es el factor D en este experimento, se procede a realizar un diseño factorial completo de dicho factor, para lo cual se realiza los siguiente:

modelo=lm(Color_Producto~(D),data = datos)
summary(modelo)
## 
## Call:
## lm.default(formula = Color_Producto ~ (D), data = datos)
## 
## Residuals:
##     Min      1Q  Median      3Q     Max 
## -3.1775 -0.9325  0.4275  1.2300  2.0125 
## 
## Coefficients:
##             Estimate Std. Error t value Pr(>|t|)    
## (Intercept)   2.7075     0.4039   6.704 1.00e-05 ***
## D             2.2100     0.4039   5.472 8.23e-05 ***
## ---
## Signif. codes:  0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
## 
## Residual standard error: 1.616 on 14 degrees of freedom
## Multiple R-squared:  0.6814, Adjusted R-squared:  0.6586 
## F-statistic: 29.94 on 1 and 14 DF,  p-value: 8.229e-05
anova=aov(modelo)
summary(anova)
##             Df Sum Sq Mean Sq F value   Pr(>F)    
## D            1  78.15   78.15   29.94 8.23e-05 ***
## Residuals   14  36.54    2.61                     
## ---
## Signif. codes:  0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1

Se puede observar en la tabla anova que para el factor D se obtuvo un \(Valor_p<0.05\), lo cual indica que es significativo, con un valor de \(R^2=0.6814\) y un valor de \(R^2 Ajustado=0.6586\), esto indica que el modelo es adecuado para explicar el efecto sobre la variable de respuesta, sin embargo este modelo se puede mejorar para explicar de manera mas completa los efectos.