Ejercicio 8-6

R.D Snee (“Exprimentacion con un numero grande de variables”, en Experiments in Industry:Desing Analysis and Interpretation of Results, de R.D, Snee, L.B Hare y J.B, Trout, editores, ASQC) describe un experimento en el que uso un diseño \(2^5\) con I=ABCDE para investigar los efectos de cinco factores sobre el color de un producto quimico. Los factores son A=solvente/reactivo, B=catalizador/reactivo, C=temperatura, D=pureza del reactivo y E= pH del reactivo. Los resultados obtenidos fueron los siguientes:

Datos Obtenidos
e=-0.63 d=6.79
a=2.51 ade=5.47
b=-2.68 bde=3.45
abe=1.66 abd=5.68
c=2.06 cde=5.22
ace=1.22 bcd=4.38
bce=-2.09 bcd=4.30
abc=1.93 abcde=4.05

a) Construir una gráfica de probabilidad normal de los efectos. ¿Qué efectos parecen estar activos?

b) Calcular los residuales. Construir una grafica de probabilidad normal de los residuos y graficar los residuales contra los valores ajustados. Comentar las graficas.

c) Si alguno de los factores son insignificantes , plegar el diseo \(2^5\) a un diseño factorial completo en los factores activos. Comentar el diseño resultante e interpretar los resultados.

library(printr)
datos=read.table("dataset.txt",header= TRUE)
str(datos)
## 'data.frame':    16 obs. of  6 variables:
##  $ A    : int  -1 1 -1 1 -1 1 -1 1 -1 1 ...
##  $ B    : int  -1 -1 1 1 -1 -1 1 1 -1 -1 ...
##  $ C    : int  -1 -1 -1 -1 1 1 1 1 -1 -1 ...
##  $ D    : int  -1 -1 -1 -1 -1 -1 -1 -1 1 1 ...
##  $ E    : int  1 -1 -1 1 -1 1 1 -1 -1 1 ...
##  $ Color: num  -0.63 2.51 -2.68 1.66 2.06 1.22 -2.09 1.93 6.79 5.47 ...
attach(datos)
head(datos,n=16L)
A B C D E Color
-1 -1 -1 -1 1 -0.63
1 -1 -1 -1 -1 2.51
-1 1 -1 -1 -1 -2.68
1 1 -1 -1 1 1.66
-1 -1 1 -1 -1 2.06
1 -1 1 -1 1 1.22
-1 1 1 -1 1 -2.09
1 1 1 -1 -1 1.93
-1 -1 -1 1 -1 6.79
1 -1 -1 1 1 5.47
-1 1 -1 1 1 3.45
1 1 -1 1 -1 5.68
-1 -1 1 1 1 5.22
1 -1 1 1 -1 4.38
-1 1 1 1 -1 4.30
1 1 1 1 1 4.05

a) Construir una grafica de probabilidad normal de los efectos. ¿Que efectos parecen estar activos?

Se obtiene la grafica de pareto y la de Daniel, ya que dan evidencia de cuales son los efectos activos del experimento. Para ello es necesario realizar el siguiente codigo.

library(FrF2)
experimento=FrF2(nruns = 16, nfactors = 5, factor.names = list(A=c(-1,1),B=c(-1,1),C=c(-1,1),D=c(-1,1),E=c(-1,1)),generators = "ABCD",replications = 1,randomize = FALSE)
experimento_respuesta=add.response(design = experimento,response = Color)
halfnormal(experimento_respuesta, xlab = "Efectos activos")

Con respecto a los resultados se puede visualizar que los efectos activos en dicho diseño son exclusivamente los del factor D. Por otra parte, para verificar la información obtenida se procede a comprobar con el gráfico de Daniel, dicho gráfico se calcula de la siguiente forma:

DanielPlot(experimento_respuesta, main= "Gráfico de Daniel para el Color de Producto Quimico")

Se concluye que el factor que tiene efectos activos es el factor D;Pureza del reactivo. A continuacion se realiza la grafica de efectos individuales para ver de que manera influyen los efectos sobre la variable de respuesta.

efectos_principales=MEPlot(experimento_respuesta)

head(efectos_principales)
A B C D E
- 2.0525 3.3775 2.78125 0.4975 3.12125
+ 3.3625 2.0375 2.63375 4.9175 2.29375

Se concluye que el factor D es el mas significativo, ya que si se encuentra en un nivel de minimo y pasa a un nivel maximo aumenta el color del producto quimico.

El factor A aumenta el color del producto quimico si se encuentra en su nivel de minimo a maximo.

El factor B disminuye el color del producto quimico si se trabaja en su nivel de minimo a maximo.

El factor C disminuye muy poco el color del producto quimico si se trabaja en su nivel minimo a maximo.

El factor E disminuye el color del producto quimico si se trabaja a un nivel de minimo a maximo.

b) Calcular los residuales. Construir una gráfica de probabilidad normal de los residuos y graficar los residuales contra los valores ajustados. Comentar las graficas.

lineal=lm(Color~(A+B+C+D+E)) 
summary(lineal)
## 
## Call:
## lm.default(formula = Color ~ (A + B + C + D + E))
## 
## Residuals:
##     Min      1Q  Median      3Q     Max 
## -2.3400 -0.5181  0.1988  0.8581  1.5175 
## 
## Coefficients:
##             Estimate Std. Error t value Pr(>|t|)    
## (Intercept)  2.70750    0.35061   7.722 1.60e-05 ***
## A            0.65500    0.35061   1.868   0.0913 .  
## B           -0.67000    0.35061  -1.911   0.0851 .  
## C           -0.07375    0.35061  -0.210   0.8376    
## D            2.21000    0.35061   6.303 8.87e-05 ***
## E           -0.41375    0.35061  -1.180   0.2653    
## ---
## Signif. codes:  0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
## 
## Residual standard error: 1.402 on 10 degrees of freedom
## Multiple R-squared:  0.8285, Adjusted R-squared:  0.7428 
## F-statistic: 9.662 on 5 and 10 DF,  p-value: 0.001381
residuals(lineal)
##       1       2       3       4       5       6       7       8       9      10 
## -0.8025  0.2000 -2.3400  1.5175  1.2075 -0.1150 -0.7750  1.1075  1.3700 -0.4325 
##      11      12      13      14      15      16 
##  0.1975  0.2900  0.7750 -2.2025  0.3675 -0.3650
rstandard(lineal)
##          1          2          3          4          5          6          7 
## -0.7238133  0.1803896 -2.1105586  1.3687062  1.0891023 -0.1037240 -0.6990098 
##          8          9         10         11         12         13         14 
##  0.9989075  1.2356689 -0.3900926  0.1781347  0.2615649  0.6990098 -1.9865407 
##         15         16 
##  0.3314659 -0.3292111
Estandar<-plot(rstandard(lineal), main ="Comportamiento de los residuos estandar", ylab = "Residuos Estandar")

Como se puede visualizar en la gráfica del comportamiento de los residuos, los factores se encuentran demasiado dispersos entre ellos mismo, por ende se concluye que no tienen un patrón de comportamiento y no tiene una distribución normal.

c) Si alguno de los factores son insignificantes , plegar el diseo \(2^5\) a un diseño factorial completo en los factores activos. Comentar el diseño resultante e interpretar los resultados.

El factor mas significativo es el factor D, por lo que se opta por plegar un diseño de los factores activos para este factor, para lo cual se realizan los siguientes calculos:

modelo=lm(Color~(D),data = datos)
summary(modelo)
## 
## Call:
## lm.default(formula = Color ~ (D), data = datos)
## 
## Residuals:
##     Min      1Q  Median      3Q     Max 
## -3.1775 -0.9325  0.4275  1.2300  2.0125 
## 
## Coefficients:
##             Estimate Std. Error t value Pr(>|t|)    
## (Intercept)   2.7075     0.4039   6.704 1.00e-05 ***
## D             2.2100     0.4039   5.472 8.23e-05 ***
## ---
## Signif. codes:  0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
## 
## Residual standard error: 1.616 on 14 degrees of freedom
## Multiple R-squared:  0.6814, Adjusted R-squared:  0.6586 
## F-statistic: 29.94 on 1 and 14 DF,  p-value: 8.229e-05
anova=aov(modelo)
summary(anova)
##             Df Sum Sq Mean Sq F value   Pr(>F)    
## D            1  78.15   78.15   29.94 8.23e-05 ***
## Residuals   14  36.54    2.61                     
## ---
## Signif. codes:  0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1

La tabla ANOVA presenta un \(Valor_p=8.23e-05\), por lo tanto se concluye que el factor D es significativo, el valor de \(R^2 Ajustado=0.6586\), esto significa que el modelo es el adecuado para explicar el efecto sobre la variable de respuesta que en este caso es el color del producto quimico, no opstante el modelo se podria ajustar para explicar mejor los efectos significativos para tener una relacion mas fuerte.