R.D Snee (“Exprimentacion con un numero grande de variables”, en Experiments in Industry:Desing Analysis and Interpretation of Results, de R.D, Snee, L.B Hare y J.B, Trout, editores, ASQC) describe un experimento en el que uso un diseño \(2^5\) con I=ABCDE para investigar los efectos de cinco factores sobre el color de un producto quimico. Los factores son A=solvente/reactivo, B=catalizador/reactivo, C=temperatura, D=pureza del reactivo y E= pH del reactivo. Los resultados obtenidos fueron los siguientes:
| Resultados Obtenidos | ||||
|---|---|---|---|---|
| e=-0.63 | ||||
| a=2.51 | ||||
| b=-2.68 | ||||
| abe=1.66 | ||||
| c=2.06 | ||||
| ace=1.22 | ||||
| bce=-2.09 | ||||
| abc=1.93 | ||||
| d=6.79 | ||||
| ade=5.47 | ||||
| bde=3.45 | ||||
| abd=5.68 | ||||
| cde=5.22 | ||||
| acd=4.38 | ||||
| bcd=4.30 | ||||
| abcde=4.05 |
Construir una grafica de probabilidad normal de los efectos. ¿Que efectos parecen estar activos?
Calcular los residuales. Construir una grafica de probabilidad normal de los residuos y graficar los residuales contra los valores ajustados. Comentar las graficas.
Si alguno de los factores son insignificantes , plegar el diseño \(2^5\) a un diseño factorial completo en los factores activos. Comentar el diseño resultante e interpretar los resultados.
library(readxl)
library(FrF2)
datos=read_excel(path = "dataset.xlsx")
View(datos)
attach(datos)
a) Construir una grafica de probabilidad normal de los efectos. ¿Que efectos parecen estar activos?
a=factor(`solvente/reactivo`)
b=factor(`catalizador/reactivo`)
c=factor(temperatura)
d=factor(pureza_del_reactivo)
e=factor(ph_del_reactivo)
Con base a la realización de las gráficas de Pareto y la de Daniel los resultados obtenidos son de vital importancia ya que permiten visualizar cuales son los efectos activos del experimento. Por lo tanto, es preciso realizar el código que se muestra a continuación:
experimento=FrF2(nruns = 16, nfactors = 5, factor.names = list(a=c(-1,1),b=c(-1,1),c=c(-1,1),d=c(-1,1),e=c(-1,1)),generators = "ABCD",replications = 1,randomize = FALSE)
experimento_respuesta=add.response(design = experimento,response = resultados)
halfnormal(experimento_respuesta, xlab = "Efectos Activos")
Con respecto a los resultados se puede visualizar que los efectos activos en dicho diseño son exclusivamente los del factor D. Por otra parte, para verificar la información obtenida se procede a comprobar con el gráfico de Daniel, dicho gráfico se calcula de la siguiente forma:
DanielPlot(experimento_respuesta, main= "Gráfico de Daniel ")
En conclusión, los resultados obtenidos arrojan que el factor que tiene efectos activos es el factor D mismo que es la pureza del reactivo. Asimismo, se procede a realizar la gráfica de efectos individuales para determinar de que forma influyen los efectos sobre la variable de respuesta.
efectos_principales=MEPlot(experimento_respuesta)
head(efectos_principales)
## a b c d e
## - 2.0525 3.3775 2.78125 0.4975 3.12125
## + 3.3625 2.0375 2.63375 4.9175 2.29375
Con base al resultado se determina que el factor D es el más significativo debido a que si esta posicionado en un nivel mínimo y pasa a un nivel máximo tiende a aumentar el color del producto químico. Por otro lado, el factor A tiende aumentar el color del producto químico si se encuentra en un nivel de mínimo a máximo. Sin embargo el factor B disminuye el color del producto químico si se trabaja en un nivel de mínimo a máximo. Asimismo, el factor C tiende a disminuir muy poco el color del producto químico si se trabaja en un nivel de mínimo a máximo. Además, el factor E disminuye el color del producto químico si se trabaja en un nivel de mínimo a máximo.
grafica_interacciones=IAPlot(experimento_respuesta)
head(grafica_interacciones)
## a:b a:c a:d a:e b:c b:d b:e c:d c:e d:e
## -:- 3.360 1.7325 -0.835 2.6175 3.5350 1.290 3.9350 0.2150 3.0750 0.9550
## +:- 3.395 3.8300 1.830 3.6250 2.0275 -0.295 2.3075 0.7800 3.1675 5.2875
## -:+ 0.745 2.3725 4.940 1.4875 3.2200 5.465 2.8200 5.3475 2.4875 0.0400
## +:+ 3.330 2.8950 4.895 3.1000 2.0475 4.370 1.7675 4.4875 2.1000 4.5475
En conclusión, se puede determinar que existen interacciones entre los siguientes factores: A y D, B y D, C y D, D y E. Por otro lado se puede comprobar que el factor D es el responsable de dichas interacciones con base a que este es el mas significativo. Asimismo, se concluye que el factor D es el más activo.
b) Calcular los residuales. Construir una grafica de probabilidad normal de los residuos y graficar los residuales contra los valores ajustados. Comentar las graficas.
lineal=lm(resultados~(a+b+c+d+e))
summary(lineal)
##
## Call:
## lm.default(formula = resultados ~ (a + b + c + d + e))
##
## Residuals:
## Min 1Q Median 3Q Max
## -2.3400 -0.5181 0.1988 0.8581 1.5175
##
## Coefficients:
## Estimate Std. Error t value Pr(>|t|)
## (Intercept) 1.0000 0.8588 1.164 0.2713
## a1 1.3100 0.7012 1.868 0.0913 .
## b1 -1.3400 0.7012 -1.911 0.0851 .
## c1 -0.1475 0.7012 -0.210 0.8376
## d1 4.4200 0.7012 6.303 8.87e-05 ***
## e1 -0.8275 0.7012 -1.180 0.2653
## ---
## Signif. codes: 0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
##
## Residual standard error: 1.402 on 10 degrees of freedom
## Multiple R-squared: 0.8285, Adjusted R-squared: 0.7428
## F-statistic: 9.662 on 5 and 10 DF, p-value: 0.001381
residuals(lineal)
## 1 2 3 4 5 6 7 8 9 10
## -0.8025 0.2000 -2.3400 1.5175 1.2075 -0.1150 -0.7750 1.1075 1.3700 -0.4325
## 11 12 13 14 15 16
## 0.1975 0.2900 0.7750 -2.2025 0.3675 -0.3650
rstandard(lineal)
## 1 2 3 4 5 6 7
## -0.7238133 0.1803896 -2.1105586 1.3687062 1.0891023 -0.1037240 -0.6990098
## 8 9 10 11 12 13 14
## 0.9989075 1.2356689 -0.3900926 0.1781347 0.2615649 0.6990098 -1.9865407
## 15 16
## 0.3314659 -0.3292111
Estandar<-plot(rstandard(lineal), main ="Comportamiento de los residuos estandar", ylab = "Residuos Estandar")
Con base a la gráfica de los residuos estándar se puede determinar el comportamiento de dichos residuos y se logra observar que se encuentran muy dispersos entre sí, por lo tanto, no presentan un patrón de comportamiento y por ende no se distribuyen de una forma normal.
c) Si alguno de los factores son insignificantes , plegar el diseño \(2^5\) a un diseño factorial completo en los factores activos. Comentar el diseño resultante e interpretar los resultados.
El factor significativo es el D. Por lo tanto, se procede a realizar un diseño de los factores activos y se determina que solo es el factor D, con base a esto se realizan los cálculos que se muestran a continuación:
modelo=lm(resultados~(d),data = datos)
summary(modelo)
##
## Call:
## lm.default(formula = resultados ~ (d), data = datos)
##
## Residuals:
## Min 1Q Median 3Q Max
## -3.1775 -0.9325 0.4275 1.2300 2.0125
##
## Coefficients:
## Estimate Std. Error t value Pr(>|t|)
## (Intercept) 0.4975 0.5712 0.871 0.398
## d1 4.4200 0.8078 5.472 8.23e-05 ***
## ---
## Signif. codes: 0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
##
## Residual standard error: 1.616 on 14 degrees of freedom
## Multiple R-squared: 0.6814, Adjusted R-squared: 0.6586
## F-statistic: 29.94 on 1 and 14 DF, p-value: 8.229e-05
anova=aov(modelo)
summary(anova)
## Df Sum Sq Mean Sq F value Pr(>F)
## d 1 78.15 78.15 29.94 8.23e-05 ***
## Residuals 14 36.54 2.61
## ---
## Signif. codes: 0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
Los resultados obtenidos de la tabla ANOVA arrojan el resultado de que el \(Valor_p=8.23(e-05)\) por lo cual se determina que el factor D es significativo. Por lo tanto, el valor de R^2 Ajustado=0.6586, esto expresa que el modelo es el adecuado para explicar el efecto sobre la variable de respuesta que es el color del producto químico. En conclusión se logra observar que dicho valor no es muy fuerte por lo que el modelo se podría ajustar para explicar de forma precisa los efectos significativos y obtener una relación más fuerte.