R.D. Snee (“Experimentación con un número grande de variables”, en Experiments in Industry: Design, Analysis and Interpretation of Results, de R.D.Snee, L.B. Hare y J.B. Trout, editores, ASQC) describe un experimento en el que se usó un diseño \(2^5-1\) con I=ABCDE para investigar los efectos de cinco factores sobre el color de un producto químico. Los factores son A=solvente/reactivo, B=catalizador/reactivo, C=temperatura, D=pureza del reactivo y E=pH del reactivo. Los resultados obtenidos fueron los siguientes:
| e=-0.63 | d=6.79 |
| a=2.51 | ade=5.47 |
| b=-2.68 | bde=3.45 |
| abe=1.66 | abd=5.68 |
| c=2.06 | cde=5.22 |
| ace=1.22 | acd=4.38 |
| bce=-2.09 | bcd=4.30 |
| abc=1.93 | abcde=4.05 |
a) Construir una gráfica de probabilidad normal de los efectos. ¿Qué efectos parecen estar activos?
b) Calcular los residuales. Construir una gráfica de probabilidad normal de los residuales y graficar los residuales contra los valores ajustados. Comentar las gráficas.
c) Si algunos de los factores son insignificantes, plegar el diseño \(2^5−1\) a un diseño factorial completo en los factores activos. Comentar el diseño e interpretar los resultados.
Tabla de datos que se ocupara para realizar el experimento.
library(printr)
datos=read.table("dataset.txt", header = TRUE)
str(datos)
## 'data.frame': 16 obs. of 6 variables:
## $ A : int -1 1 -1 1 -1 1 -1 1 -1 1 ...
## $ B : int -1 -1 1 1 -1 -1 1 1 -1 -1 ...
## $ C : int -1 -1 -1 -1 1 1 1 1 -1 -1 ...
## $ D : int -1 -1 -1 -1 -1 -1 -1 -1 1 1 ...
## $ E : int 1 -1 -1 1 -1 1 1 -1 -1 1 ...
## $ Color: num -0.63 2.51 -2.68 1.66 2.06 1.22 -2.09 1.93 6.79 5.47 ...
attach(datos)
head(datos,n=16L)
| A | B | C | D | E | Color |
|---|---|---|---|---|---|
| -1 | -1 | -1 | -1 | 1 | -0.63 |
| 1 | -1 | -1 | -1 | -1 | 2.51 |
| -1 | 1 | -1 | -1 | -1 | -2.68 |
| 1 | 1 | -1 | -1 | 1 | 1.66 |
| -1 | -1 | 1 | -1 | -1 | 2.06 |
| 1 | -1 | 1 | -1 | 1 | 1.22 |
| -1 | 1 | 1 | -1 | 1 | -2.09 |
| 1 | 1 | 1 | -1 | -1 | 1.93 |
| -1 | -1 | -1 | 1 | -1 | 6.79 |
| 1 | -1 | -1 | 1 | 1 | 5.47 |
| -1 | 1 | -1 | 1 | 1 | 3.45 |
| 1 | 1 | -1 | 1 | -1 | 5.68 |
| -1 | -1 | 1 | 1 | 1 | 5.22 |
| 1 | -1 | 1 | 1 | -1 | 4.38 |
| -1 | 1 | 1 | 1 | -1 | 4.30 |
| 1 | 1 | 1 | 1 | 1 | 4.05 |
Construir una gráfica de probabilidad normal de los efectos. ¿Qué efectos parecen estar activos?
Para saber cuales datos son activos se requiere obtener una grafica de pareto, y asi saber cuales son los efectos mas relevantes del experimento, con base en el principio de escasez. Para obtenerla debemos correr el código siguiente:
library(FrF2)
experimento=FrF2(nruns = 16, nfactors = 5, factor.names = list(A=c(-1,1),B=c(-1,1),C=c(-1,1),D=c(-1,1),E=c(-1,1)),generators = "ABCD",replications = 1,randomize = FALSE)
experimento_respuesta=add.response(design = experimento,response = Color)
halfnormal(experimento_respuesta, xlab = "Efectos activos")
En esta gráfica se observa que los efectos activos es unicamente el factor D. Para poder confirmar la información que obtuvimos en la tabla, se verifica en el gráfico de Daniel, mismo que se calcula con el siguiente código:
DanielPlot(experimento_respuesta, main= "Gráfico de Daniel para el Color del producto")
En esta grafica se confirma la información que se obtuvo en el analisis de anterior, por lo que podemos concluir que el efecto activo es unicamente el efecto D.
Gráfica efectos principales
Se procede a realizar la grafica de efectos individuales para ver de que manera influyen en la variable de respuesta que provocan cambios en el color del producto quimico. Utilizando el siguiente codigo:
efectos_principales=MEPlot(experimento_respuesta)
head(efectos_principales)
| A | B | C | D | E | |
|---|---|---|---|---|---|
| - | 2.0525 | 3.3775 | 2.78125 | 0.4975 | 3.12125 |
| + | 3.3625 | 2.0375 | 2.63375 | 4.9175 | 2.29375 |
De la gráfica que se presento anteriormente, se puede deducir que efecto activo que genera un impacto en el color del producto quimico es el factor D, como se obtuvo en los resultados de las gráficas primeras donde muestran que el efecto D es el unico que esta activo.
Aunque el factor D es el único que esta activo se realiza un gráfica de interacciones para asi poder observar las interacciones que pueden tener con este factor.
Gráfica de interacciones
grafica_interacciones=IAPlot(experimento_respuesta)
head(grafica_interacciones)
| A:B | A:C | A:D | A:E | B:C | B:D | B:E | C:D | C:E | D:E | |
|---|---|---|---|---|---|---|---|---|---|---|
| -:- | 3.360 | 1.7325 | -0.835 | 2.6175 | 3.5350 | 1.290 | 3.9350 | 0.2150 | 3.0750 | 0.9550 |
| +:- | 3.395 | 3.8300 | 1.830 | 3.6250 | 2.0275 | -0.295 | 2.3075 | 0.7800 | 3.1675 | 5.2875 |
| -:+ | 0.745 | 2.3725 | 4.940 | 1.4875 | 3.2200 | 5.465 | 2.8200 | 5.3475 | 2.4875 | 0.0400 |
| +:+ | 3.330 | 2.8950 | 4.895 | 3.1000 | 2.0475 | 4.370 | 1.7675 | 4.4875 | 2.1000 | 4.5475 |
De acuerdo a los reultados que obtuvimos, observamos que no existen interacciones fuertes entre los factores, por lo que no es necesario realizar un ánalisis de significancia.
Calcular los residuales. Construir una gráfica de probabilidad normal de los residuales y graficar los residuales contra los valores ajustados. Comentar las gráficas.
Para poder obtener los residuales se debe correr el siguiente codigo que se presenta a contiuación.
lineal=lm(Color~(A+B+C+D+E))
summary(lineal)
##
## Call:
## lm.default(formula = Color ~ (A + B + C + D + E))
##
## Residuals:
## Min 1Q Median 3Q Max
## -2.3400 -0.5181 0.1988 0.8581 1.5175
##
## Coefficients:
## Estimate Std. Error t value Pr(>|t|)
## (Intercept) 2.70750 0.35061 7.722 1.60e-05 ***
## A 0.65500 0.35061 1.868 0.0913 .
## B -0.67000 0.35061 -1.911 0.0851 .
## C -0.07375 0.35061 -0.210 0.8376
## D 2.21000 0.35061 6.303 8.87e-05 ***
## E -0.41375 0.35061 -1.180 0.2653
## ---
## Signif. codes: 0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
##
## Residual standard error: 1.402 on 10 degrees of freedom
## Multiple R-squared: 0.8285, Adjusted R-squared: 0.7428
## F-statistic: 9.662 on 5 and 10 DF, p-value: 0.001381
Ya obtenido los resultados, confirma que el único factor de importancia es el D, para esto procedemos a obtener los residuos:
residuals(lineal)
## 1 2 3 4 5 6 7 8 9 10
## -0.8025 0.2000 -2.3400 1.5175 1.2075 -0.1150 -0.7750 1.1075 1.3700 -0.4325
## 11 12 13 14 15 16
## 0.1975 0.2900 0.7750 -2.2025 0.3675 -0.3650
rstandard(lineal)
## 1 2 3 4 5 6 7
## -0.7238133 0.1803896 -2.1105586 1.3687062 1.0891023 -0.1037240 -0.6990098
## 8 9 10 11 12 13 14
## 0.9989075 1.2356689 -0.3900926 0.1781347 0.2615649 0.6990098 -1.9865407
## 15 16
## 0.3314659 -0.3292111
Estandar<-plot(rstandard(lineal), main = "Comportamiento de los Residuos estándar", ylab = "Residuos estándar")
Se concluye que los residuos muestran un comportamiento normal ya que casi no hay diferencia entre ellos.
Si algunos de los factores son insignificantes, plegar el diseño \(2^5−1\) a un diseño factorial completo en los factores activos. Comentar el diseño e interpretar los resultados.
Se realiza con el siguiente Modelo de acuerdo al factor D
modeloD=lm(Color~(D),data = datos)
summary(modeloD)
##
## Call:
## lm.default(formula = Color ~ (D), data = datos)
##
## Residuals:
## Min 1Q Median 3Q Max
## -3.1775 -0.9325 0.4275 1.2300 2.0125
##
## Coefficients:
## Estimate Std. Error t value Pr(>|t|)
## (Intercept) 2.7075 0.4039 6.704 1.00e-05 ***
## D 2.2100 0.4039 5.472 8.23e-05 ***
## ---
## Signif. codes: 0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
##
## Residual standard error: 1.616 on 14 degrees of freedom
## Multiple R-squared: 0.6814, Adjusted R-squared: 0.6586
## F-statistic: 29.94 on 1 and 14 DF, p-value: 8.229e-05
ANOVA
anova=aov(modeloD)
summary(anova)
## Df Sum Sq Mean Sq F value Pr(>F)
## D 1 78.15 78.15 29.94 8.23e-05 ***
## Residuals 14 36.54 2.61
## ---
## Signif. codes: 0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
De acuerdo a la tabla ANOVA, se puede concluir mediante los análisis del factor activo el factor D, el modelo es adecuado para explicar el efecto sobre la variable de respuesta, de igualmanera se mantiene gran parte la pureza del reactivo de los factores que resulta insignificante de acuerdo a los niveles que se utilicen.