Ejercicio 8-6
R.D Snee (“Exprimentacion con un numero grande de variables”, en Experiments in Industry:Desing Analysis and Interpretation of Results, de R.D, Snee, L.B Hare y J.B, Trout, editores, ASQC) describe un experimento en el que uso un diseño \(2^5\) con I=ABCDE para investigar los efectos de cinco factores sobre el color de un producto quimico. Los factores son A=solvente/reactivo, B=catalizador/reactivo, C=temperatura, D=pureza del reactivo y E= pH del reactivo. Los resultados obtenidos fueron los siguientes:
| Resultados Obtenidos | |
|---|---|
| e=-0.63 | d=6.79 |
| a=2.51 | ade=5.47 |
| b=-2.68 | bde=3.45 |
| abe=1.66 | abd=5.68 |
| c=2.06 | cde=5.22 |
| ace=1.22 | bcd=4.38 |
| bce=-2.09 | bcd=4.30 |
| abc=1.93 | abcde=4.05 |
a) Construir una grafica de probabilidad normal de los efectos. ¿Que efectos parecen estar activos?
b) Calcular los residuales. Construir una grafica de probabilidad normal de los residuos y graficar los residuales contra los valores ajustados. Comentar las graficas.
c) Si alguno de los factores son insignificantes , plegar el diseo \(2^5\) a un diseño factorial completo en los factores activos. Comentar el diseño resultante e interpretar los resultados.
library(printr)
datos=read.table("dataset.txt",header= TRUE)
str(datos)
## 'data.frame': 16 obs. of 6 variables:
## $ A : int -1 1 -1 1 -1 1 -1 1 -1 1 ...
## $ B : int -1 -1 1 1 -1 -1 1 1 -1 -1 ...
## $ C : int -1 -1 -1 -1 1 1 1 1 -1 -1 ...
## $ D : int -1 -1 -1 -1 -1 -1 -1 -1 1 1 ...
## $ E : int 1 -1 -1 1 -1 1 1 -1 -1 1 ...
## $ Color: num -0.63 2.51 -2.68 1.66 2.06 1.22 -2.09 1.93 6.79 5.47 ...
attach(datos)
head(datos,n=16L)
| A | B | C | D | E | Color |
|---|---|---|---|---|---|
| -1 | -1 | -1 | -1 | 1 | -0.63 |
| 1 | -1 | -1 | -1 | -1 | 2.51 |
| -1 | 1 | -1 | -1 | -1 | -2.68 |
| 1 | 1 | -1 | -1 | 1 | 1.66 |
| -1 | -1 | 1 | -1 | -1 | 2.06 |
| 1 | -1 | 1 | -1 | 1 | 1.22 |
| -1 | 1 | 1 | -1 | 1 | -2.09 |
| 1 | 1 | 1 | -1 | -1 | 1.93 |
| -1 | -1 | -1 | 1 | -1 | 6.79 |
| 1 | -1 | -1 | 1 | 1 | 5.47 |
| -1 | 1 | -1 | 1 | 1 | 3.45 |
| 1 | 1 | -1 | 1 | -1 | 5.68 |
| -1 | -1 | 1 | 1 | 1 | 5.22 |
| 1 | -1 | 1 | 1 | -1 | 4.38 |
| -1 | 1 | 1 | 1 | -1 | 4.30 |
| 1 | 1 | 1 | 1 | 1 | 4.05 |
a) Construir una grafica de probabilidad normal de los efectos. ¿Que efectos parecen estar activos?
Se realizara la grafica de pareto y la grafica de Daniel, ya que nos dan evidencia de cuales son los efectos activos del experimento. Para lo cual se realiza el siguiente codigo.
library(FrF2)
experimento=FrF2(nruns = 16, nfactors = 5, factor.names = list(A=c(-1,1),B=c(-1,1),C=c(-1,1),D=c(-1,1),E=c(-1,1)),generators = "ABCD",replications = 1,randomize = FALSE)
experimento_respuesta=add.response(design = experimento,response = Color)
halfnormal(experimento_respuesta, xlab = "Efectos activos")
Los efectos activos en el diseño son el factor D. Ya que como se puede observa en la grafica es el inico significativo y lo demas factores no presentan gran impacto en la variable de respuesta. Para confirmarlo se procede a realizar la grafica de Daniel mediante el siguiente codigo.
DanielPlot(experimento_respuesta, main= "Gráfico de Daniel para el Color de Producto")
Nuevamente se obtiene que el factor D es el que esta activo.Para ver la magnitud de su impacto sobre la variable de respuesta se procede a realizar la grafica de efectos individuales.
efectos_principales=MEPlot(experimento_respuesta)
head(efectos_principales)
| A | B | C | D | E | |
|---|---|---|---|---|---|
| - | 2.0525 | 3.3775 | 2.78125 | 0.4975 | 3.12125 |
| + | 3.3625 | 2.0375 | 2.63375 | 4.9175 | 2.29375 |
Se concluye que el factor D es el mas significativo, ya que si se encuentra en un nivel de minimo y pasa a un nivel maximo aumenta el color del producto quimico. Tambien se puede observar que el factor C y E no impactan mucho sobre la variable de respuesta que es el color del producto quimico, y con respecto al factor A y B estos tampoco influyen de gran manera sobre el color del producto quimico. Por lo tanto solo el D es el de mayor influencia.
b) Calcular los residuales. Construir una grafica de probabilidad normal de los residuos y graficar los residuales contra los valores ajustados. Comentar las graficas.
lineal=lm(Color~(A+B+C+D+E))
summary(lineal)
##
## Call:
## lm.default(formula = Color ~ (A + B + C + D + E))
##
## Residuals:
## Min 1Q Median 3Q Max
## -2.3400 -0.5181 0.1988 0.8581 1.5175
##
## Coefficients:
## Estimate Std. Error t value Pr(>|t|)
## (Intercept) 2.70750 0.35061 7.722 1.60e-05 ***
## A 0.65500 0.35061 1.868 0.0913 .
## B -0.67000 0.35061 -1.911 0.0851 .
## C -0.07375 0.35061 -0.210 0.8376
## D 2.21000 0.35061 6.303 8.87e-05 ***
## E -0.41375 0.35061 -1.180 0.2653
## ---
## Signif. codes: 0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
##
## Residual standard error: 1.402 on 10 degrees of freedom
## Multiple R-squared: 0.8285, Adjusted R-squared: 0.7428
## F-statistic: 9.662 on 5 and 10 DF, p-value: 0.001381
residuals(lineal)
## 1 2 3 4 5 6 7 8 9 10
## -0.8025 0.2000 -2.3400 1.5175 1.2075 -0.1150 -0.7750 1.1075 1.3700 -0.4325
## 11 12 13 14 15 16
## 0.1975 0.2900 0.7750 -2.2025 0.3675 -0.3650
rstandard(lineal)
## 1 2 3 4 5 6 7
## -0.7238133 0.1803896 -2.1105586 1.3687062 1.0891023 -0.1037240 -0.6990098
## 8 9 10 11 12 13 14
## 0.9989075 1.2356689 -0.3900926 0.1781347 0.2615649 0.6990098 -1.9865407
## 15 16
## 0.3314659 -0.3292111
Estandar<-plot(rstandard(lineal), main ="Comportamiento de los residuos estandar", ylab = "Residuos estandar")
De acuerdo con la grafica obtenida de los residuos del modelo lineal, se observa que los datos estan demasiado dispersos, y no se aprecia un comportamiento claro de los residuos, ademas se encuentra muy dispersos entre si, esto nos da la evidencia de que no tienen un comportamiento normal.
c) Si alguno de los factores son insignificantes , plegar el diseo \(2^5\) a un diseño factorial completo en los factores activos. Comentar el diseño resultante e interpretar los resultados.
modelo=lm(Color~(D),data = datos)
summary(modelo)
##
## Call:
## lm.default(formula = Color ~ (D), data = datos)
##
## Residuals:
## Min 1Q Median 3Q Max
## -3.1775 -0.9325 0.4275 1.2300 2.0125
##
## Coefficients:
## Estimate Std. Error t value Pr(>|t|)
## (Intercept) 2.7075 0.4039 6.704 1.00e-05 ***
## D 2.2100 0.4039 5.472 8.23e-05 ***
## ---
## Signif. codes: 0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
##
## Residual standard error: 1.616 on 14 degrees of freedom
## Multiple R-squared: 0.6814, Adjusted R-squared: 0.6586
## F-statistic: 29.94 on 1 and 14 DF, p-value: 8.229e-05
anova=aov(modelo)
summary(anova)
## Df Sum Sq Mean Sq F value Pr(>F)
## D 1 78.15 78.15 29.94 8.23e-05 ***
## Residuals 14 36.54 2.61
## ---
## Signif. codes: 0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
se realizo el modelo del factor D, debido a que este es el unico que si influye de manera significativa en la variable de respuesta que en este caso es el color del producto quimico. Se obtiene la tabla ANOVA y se presenta un \(Valor_p<0.05\), por lo tanto se concluye que el factor D es significativo, esto significa que el modelo es el adecuado para explicar el efecto sobre la variable de respuesta que en este caso es el color del producto quimico.