Ejercicio 8-6

R.D Snee (“Exprimentacion con un numero grande de variables”, en Experiments in Industry:Desing Analysis and Interpretation of Results, de R.D, Snee, L.B Hare y J.B, Trout, editores, ASQC) describe un experimento en el que uso un diseño \(2^5\) con I=ABCDE para investigar los efectos de cinco factores sobre el color de un producto quimico. Los factores son A=solvente/reactivo, B=catalizador/reactivo, C=temperatura, D=pureza del reactivo y E= pH del reactivo. Los resultados obtenidos fueron los siguientes:

Resultados Obtenidos
e=-0.63 d=6.79
a=2.51 ade=5.47
b=-2.68 bde=3.45
abe=1.66 abd=5.68
c=2.06 cde=5.22
ace=1.22 bcd=4.38
bce=-2.09 bcd=4.30
abc=1.93 abcde=4.05

a) Construir una grafica de probabilidad normal de los efectos. ¿Que efectos parecen estar activos?

b) Calcular los residuales. Construir una grafica de probabilidad normal de los residuos y graficar los residuales contra los valores ajustados. Comentar las graficas.

c) Si alguno de los factores son insignificantes , plegar el diseo \(2^5\) a un diseño factorial completo en los factores activos. Comentar el diseño resultante e interpretar los resultados.

A continuacion, se extraen los datos del documento dataset:

library(printr)
datos=read.table("dataset.txt",header= TRUE)
str(datos)
## 'data.frame':    16 obs. of  6 variables:
##  $ A             : int  -1 1 -1 1 -1 1 -1 1 -1 1 ...
##  $ B             : int  -1 -1 1 1 -1 -1 1 1 -1 -1 ...
##  $ C             : int  -1 -1 -1 -1 1 1 1 1 -1 -1 ...
##  $ D             : int  -1 -1 -1 -1 -1 -1 -1 -1 1 1 ...
##  $ E             : int  1 -1 -1 1 -1 1 1 -1 -1 1 ...
##  $ Color_Producto: num  -0.63 2.51 -2.68 1.66 2.06 1.22 -2.09 1.93 6.79 5.47 ...
attach(datos)
head(datos,n=16L)
A B C D E Color_Producto
-1 -1 -1 -1 1 -0.63
1 -1 -1 -1 -1 2.51
-1 1 -1 -1 -1 -2.68
1 1 -1 -1 1 1.66
-1 -1 1 -1 -1 2.06
1 -1 1 -1 1 1.22
-1 1 1 -1 1 -2.09
1 1 1 -1 -1 1.93
-1 -1 -1 1 -1 6.79
1 -1 -1 1 1 5.47
-1 1 -1 1 1 3.45
1 1 -1 1 -1 5.68
-1 -1 1 1 1 5.22
1 -1 1 1 -1 4.38
-1 1 1 1 -1 4.30
1 1 1 1 1 4.05

a) Construir una grafica de probabilidad normal de los efectos. ¿Que efectos parecen estar activos?

Se procede a obtener la grafica de pareto y la de Daniel, ya que nos dan evidencia de cuales son los efectos activos del experimento. Para ello es necesario realizar el siguiente codigo.

library(FrF2)
experimento=FrF2(nruns = 16, nfactors = 5, factor.names = list(A=c(-1,1),B=c(-1,1),C=c(-1,1),D=c(-1,1),E=c(-1,1)),generators = "ABCD",replications = 1,randomize = FALSE)
experimento_respuesta=add.response(design = experimento,response = Color_Producto)
halfnormal(experimento_respuesta, xlab = "Efectos activos")

Se puede obsevar que los efectos activos en el diseño son unicamente el factor D. Para confirmar la informacion, se procede a verificar con la grafica de Daniel, la cual se calcula se la siguiente manera.

DanielPlot(experimento_respuesta, main= "Gráfico de Daniel para el Color de Producto Quimico")

Se concluye que el factor que tiene efectos activos es el factor D que es la Pureza del reactivo. A continuacion se realiza la grafica de efectos individuales para ver de que manera influyen los efectos sobre la ariable de respuesta.

efectos_principales=MEPlot(experimento_respuesta)

head(efectos_principales)
A B C D E
- 2.0525 3.3775 2.78125 0.4975 3.12125
+ 3.3625 2.0375 2.63375 4.9175 2.29375

Se concluye que el factor D es el mas significativo, ya que si se encuentra en un nivel de minimo y pasa a un nivel maximo aumenta el color del producto quimico.

El factor A aumenta el color del producto quimico si se encuentra en su nivel de minimo a maximo.

El factor B disminuye el color del producto quimico si se trabaja en su nivel de minimo a maximo.

El factor C disminuye muy poco el color del producto quimico si se trabaja en su nivel minimo a maximo.

Finalmente el factor E disminuye el color del producto quimico si se trabaja a un nivel de minimo a maximo.

grafica_interacciones=IAPlot(experimento_respuesta)

head(grafica_interacciones)
A:B A:C A:D A:E B:C B:D B:E C:D C:E D:E
-:- 3.360 1.7325 -0.835 2.6175 3.5350 1.290 3.9350 0.2150 3.0750 0.9550
+:- 3.395 3.8300 1.830 3.6250 2.0275 -0.295 2.3075 0.7800 3.1675 5.2875
-:+ 0.745 2.3725 4.940 1.4875 3.2200 5.465 2.8200 5.3475 2.4875 0.0400
+:+ 3.330 2.8950 4.895 3.1000 2.0475 4.370 1.7675 4.4875 2.1000 4.5475

Se puede observar que existen interacciones fuertes entre los factores: A y D, B y D, C y D, D y E. Como se observa el factor D es el responsable de esas interacciones con los demas factores, debido a que este el mas significativo y por lo tanto todos los demas presenta interaccion unicamente por el factor D, sin embargo se concluye que unicamente el factor D es el mas activo.

b) Calcular los residuales. Construir una grafica de probabilidad normal de los residuos y graficar los residuales contra los valores ajustados. Comentar las graficas.

lineal=lm(Color_Producto~(A+B+C+D+E)) 
summary(lineal)
## 
## Call:
## lm.default(formula = Color_Producto ~ (A + B + C + D + E))
## 
## Residuals:
##     Min      1Q  Median      3Q     Max 
## -2.3400 -0.5181  0.1988  0.8581  1.5175 
## 
## Coefficients:
##             Estimate Std. Error t value Pr(>|t|)    
## (Intercept)  2.70750    0.35061   7.722 1.60e-05 ***
## A            0.65500    0.35061   1.868   0.0913 .  
## B           -0.67000    0.35061  -1.911   0.0851 .  
## C           -0.07375    0.35061  -0.210   0.8376    
## D            2.21000    0.35061   6.303 8.87e-05 ***
## E           -0.41375    0.35061  -1.180   0.2653    
## ---
## Signif. codes:  0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
## 
## Residual standard error: 1.402 on 10 degrees of freedom
## Multiple R-squared:  0.8285, Adjusted R-squared:  0.7428 
## F-statistic: 9.662 on 5 and 10 DF,  p-value: 0.001381
residuals(lineal)
##       1       2       3       4       5       6       7       8       9      10 
## -0.8025  0.2000 -2.3400  1.5175  1.2075 -0.1150 -0.7750  1.1075  1.3700 -0.4325 
##      11      12      13      14      15      16 
##  0.1975  0.2900  0.7750 -2.2025  0.3675 -0.3650
rstandard(lineal)
##          1          2          3          4          5          6          7 
## -0.7238133  0.1803896 -2.1105586  1.3687062  1.0891023 -0.1037240 -0.6990098 
##          8          9         10         11         12         13         14 
##  0.9989075  1.2356689 -0.3900926  0.1781347  0.2615649  0.6990098 -1.9865407 
##         15         16 
##  0.3314659 -0.3292111
Estandar<-plot(rstandard(lineal), main ="Comportamiento de los residuos estandar", ylab = "Residuos Estandar")

En la grafica de los residuos se puede observar el comportamiento de los residuos, donde estos se encuentran muy dispersos entre si, no presentan un patron de comportamieto y no se distribuyen de una manera normal.

c) Si alguno de los factores son insignificantes , plegar el diseo \(2^5\) a un diseño factorial completo en los factores activos. Comentar el diseño resultante e interpretar los resultados.

Debido a que el factor significativo es el factor D, se procede a plegar un diseño de los factores activos en este caso es solo el factor D, para lo cual se realizan los siguientes calculos:

modelo=lm(Color_Producto~(D),data = datos)
summary(modelo)
## 
## Call:
## lm.default(formula = Color_Producto ~ (D), data = datos)
## 
## Residuals:
##     Min      1Q  Median      3Q     Max 
## -3.1775 -0.9325  0.4275  1.2300  2.0125 
## 
## Coefficients:
##             Estimate Std. Error t value Pr(>|t|)    
## (Intercept)   2.7075     0.4039   6.704 1.00e-05 ***
## D             2.2100     0.4039   5.472 8.23e-05 ***
## ---
## Signif. codes:  0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
## 
## Residual standard error: 1.616 on 14 degrees of freedom
## Multiple R-squared:  0.6814, Adjusted R-squared:  0.6586 
## F-statistic: 29.94 on 1 and 14 DF,  p-value: 8.229e-05
anova=aov(modelo)
summary(anova)
##             Df Sum Sq Mean Sq F value   Pr(>F)    
## D            1  78.15   78.15   29.94 8.23e-05 ***
## Residuals   14  36.54    2.61                     
## ---
## Signif. codes:  0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1

La tabla ANOVA presenta un \(Valor_p=8.23e-05\), por lo tanto se concluye que el factor D es significativo, nos arroja un valor de \(R^2 Ajustado=0.6586\), esto significa que el modelo es el adecuado para explicar el efecto sobre la variable de respuesta que en este caso es el color del producto quimico, cabe mencionar que este valor no es muy fuerte y quiere decir que el modelo se podria ajustar para explicar mejor los efectos significativos para tener una relacion mas fuerte.