R.D Snee (“Exprimentacion con un numero grande de variables”, en Experiments in Industry:Desing Analysis and Interpretation of Results, de R.D, Snee, L.B Hare y J.B, Trout, editores, ASQC) describe un experimento en el que uso un diseño \(2^5\) con I=ABCDE para investigar los efectos de cinco factores sobre el color de un producto quimico. Los factores son A=solvente/reactivo, B=catalizador/reactivo, C=temperatura, D=pureza del reactivo y E= pH del reactivo. Los resultados obtenidos fueron los siguientes:
| Resultados Obtenidos | ||||
|---|---|---|---|---|
| e=-0.63 | ||||
| a=2.51 | ||||
| b=-2.68 | ||||
| abe=1.66 | ||||
| c=2.06 | ||||
| ace=1.22 | ||||
| bce=-2.09 | ||||
| abc=1.93 | ||||
| d=6.79 | ||||
| ade=5.47 | ||||
| bde=3.45 | ||||
| abd=5.68 | ||||
| cde=5.22 | ||||
| acd=4.38 | ||||
| bcd=4.30 | ||||
| abcde=4.05 |
Construir una grafica de probabilidad normal de los efectos. ¿Que efectos parecen estar activos?
Calcular los residuales. Construir una grafica de probabilidad normal de los residuos y graficar los residuales contra los valores ajustados. Comentar las graficas.
Si alguno de los factores son insignificantes , plegar el diseño \(2^5\) a un diseño factorial completo en los factores activos. Comentar el diseño resultante e interpretar los resultados.
library(readxl)
library(FrF2)
datos=read_excel(path = "dataset.xlsx")
View(datos)
attach(datos)
a) Construir una grafica de probabilidad normal de los efectos. ¿Que efectos parecen estar activos?
a=factor(`solvente/reactivo`)
b=factor(`catalizador/reactivo`)
c=factor(temperatura)
d=factor(pureza_del_reactivo)
e=factor(ph_del_reactivo)
Se deben realizar las gráficas, las cuales se realizan con el código que se presenta a continuación.
experimento=FrF2(nruns = 16, nfactors = 5, factor.names = list(a=c(-1,1),b=c(-1,1),c=c(-1,1),d=c(-1,1),e=c(-1,1)),generators = "ABCD",replications = 1,randomize = FALSE)
experimento_respuesta=add.response(design = experimento,response = resultados)
halfnormal(experimento_respuesta, xlab = "Efectos Activos")
Como se puede visualizar los efectos activos en el diseño se presentan en el factor D y para poder confirmar esto se debe realizar la grafica de Daniel, la cual se presenta a continuación.
DanielPlot(experimento_respuesta, main= "Gráfico de Daniel ")
Por ende, al visualizar la gráfica de Daniel se concluye que tiene efectos activos en el factor D: Pureza del reactivo.
Despues se procede a realizar la gráfica de efectos individuales para ver como influyen los efectos sobre la variable respuesta.
efectos_principales=MEPlot(experimento_respuesta)
head(efectos_principales)
## a b c d e
## - 2.0525 3.3775 2.78125 0.4975 3.12125
## + 3.3625 2.0375 2.63375 4.9175 2.29375
Por ende el factor D es el más significativo como se puede visualizar debido a que se encuentra en un nivel mínimo y pasa a un nivel máximo en donde aumenta el color del producto. El Factor A aumenta su color de producto si se encuentra en su nivel minimo a máximo, por el contrario el factor B disminuye si le pasa eso, el factor C disminuye un poco el color si se encuentra en un nivel mínimo a máximo y el factor E disminuye cuando el color del producto tiene un nivel minimo a máximo.
grafica_interacciones=IAPlot(experimento_respuesta)
head(grafica_interacciones)
## a:b a:c a:d a:e b:c b:d b:e c:d c:e d:e
## -:- 3.360 1.7325 -0.835 2.6175 3.5350 1.290 3.9350 0.2150 3.0750 0.9550
## +:- 3.395 3.8300 1.830 3.6250 2.0275 -0.295 2.3075 0.7800 3.1675 5.2875
## -:+ 0.745 2.3725 4.940 1.4875 3.2200 5.465 2.8200 5.3475 2.4875 0.0400
## +:+ 3.330 2.8950 4.895 3.1000 2.0475 4.370 1.7675 4.4875 2.1000 4.5475
Hay interacciones fuertes en los factores A y D, B y D, Cy D, D y E, ademas de que se puede visualizar que el factor D es el que tiene todas las interacciones con los demas factores, por eso se puede notar que el más significativo y el más activo es el factor D.
b) Calcular los residuales. Construir una grafica de probabilidad normal de los residuos y graficar los residuales contra los valores ajustados. Comentar las graficas.
lineal=lm(resultados~(a+b+c+d+e))
summary(lineal)
##
## Call:
## lm.default(formula = resultados ~ (a + b + c + d + e))
##
## Residuals:
## Min 1Q Median 3Q Max
## -2.3400 -0.5181 0.1988 0.8581 1.5175
##
## Coefficients:
## Estimate Std. Error t value Pr(>|t|)
## (Intercept) 1.0000 0.8588 1.164 0.2713
## a1 1.3100 0.7012 1.868 0.0913 .
## b1 -1.3400 0.7012 -1.911 0.0851 .
## c1 -0.1475 0.7012 -0.210 0.8376
## d1 4.4200 0.7012 6.303 8.87e-05 ***
## e1 -0.8275 0.7012 -1.180 0.2653
## ---
## Signif. codes: 0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
##
## Residual standard error: 1.402 on 10 degrees of freedom
## Multiple R-squared: 0.8285, Adjusted R-squared: 0.7428
## F-statistic: 9.662 on 5 and 10 DF, p-value: 0.001381
residuals(lineal)
## 1 2 3 4 5 6 7 8 9 10
## -0.8025 0.2000 -2.3400 1.5175 1.2075 -0.1150 -0.7750 1.1075 1.3700 -0.4325
## 11 12 13 14 15 16
## 0.1975 0.2900 0.7750 -2.2025 0.3675 -0.3650
rstandard(lineal)
## 1 2 3 4 5 6 7
## -0.7238133 0.1803896 -2.1105586 1.3687062 1.0891023 -0.1037240 -0.6990098
## 8 9 10 11 12 13 14
## 0.9989075 1.2356689 -0.3900926 0.1781347 0.2615649 0.6990098 -1.9865407
## 15 16
## 0.3314659 -0.3292111
Estandar<-plot(rstandard(lineal), main ="Comportamiento de los residuos estandar", ylab = "Residuos Estandar")
Como se puede visualizar en la gráfica del comportamiento de los residuos, los factores se encuentran demasiado dispersos entre ellos mismo, por ende se concluye que no tienen un patrón de comportamiento y no tiene una distribución normal.
c) Si alguno de los factores son insignificantes , plegar el diseño \(2^5\) a un diseño factorial completo en los factores activos. Comentar el diseño resultante e interpretar los resultados.
modelo=lm(resultados~(d),data = datos)
summary(modelo)
##
## Call:
## lm.default(formula = resultados ~ (d), data = datos)
##
## Residuals:
## Min 1Q Median 3Q Max
## -3.1775 -0.9325 0.4275 1.2300 2.0125
##
## Coefficients:
## Estimate Std. Error t value Pr(>|t|)
## (Intercept) 0.4975 0.5712 0.871 0.398
## d1 4.4200 0.8078 5.472 8.23e-05 ***
## ---
## Signif. codes: 0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
##
## Residual standard error: 1.616 on 14 degrees of freedom
## Multiple R-squared: 0.6814, Adjusted R-squared: 0.6586
## F-statistic: 29.94 on 1 and 14 DF, p-value: 8.229e-05
anova=aov(modelo)
summary(anova)
## Df Sum Sq Mean Sq F value Pr(>F)
## d 1 78.15 78.15 29.94 8.23e-05 ***
## Residuals 14 36.54 2.61
## ---
## Signif. codes: 0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
En la tabla ANOVA se puede visualizar que se tiene un \(Valor_p=8.23_e_-0.5\), y que tiene un resultado de \(R^2Ajustado=0.6586\),por ende el modelo si es adecuado