R.D Snee (“Expeimentación con un número grande de variables”, en Experiments in Industry: Desing, Analysis and Interpretation of Results, de R.D, snee, L.B. Hare y J.B. Trout, editores, ASQC) decribe un experimento en el que se usó un diseño \(2^{5-1}\) con I= ABCDE para investigar los efectos de cinco factores sobre el color de un producto químico. Los factores son A= solvente/reactivo, B= catalizador/reactivo, C= temperatura, D= pureza del reactivo y E= pH del reactivo. Los resultados obtenidos fueron los siguientes(Montgomery, 2004):
| Resultados | Resultados |
|---|---|
| e=-0.63 | d=6.79 |
| a=2.51 | ade=5.47 |
| b=-2.68 | bde=3.45 |
| abe=1.66 | abd=5.68 |
| c=2.06 | cde=5.22 |
| ace=1.22 | acd=4.38 |
| bce=-2.09 | bcd=4.30 |
| abc=1.93 | abcde=4.05 |
Construir una grafica de probabilidad normal de los efectos.¿Qué efectos parecen estar activos?
Calcular los residuales. Construir una gráfica de probabilidad normal de los residuales y graficar los residuales contra los valores ajustados. Comentar las gráficas.
Si algunos de los factores son significantes, plegar el diseño \(2^{5-1}\) a un diseño factorial completo en los factores activos. Comentar el diseño resultante e interpretar los resultados.
library(printr)
## Warning: package 'printr' was built under R version 4.0.5
datos=read.table("dataset.txt",header = TRUE,fill = TRUE)
str(datos)
## 'data.frame': 16 obs. of 6 variables:
## $ A : int -1 1 -1 1 -1 1 -1 1 -1 1 ...
## $ B : int -1 -1 1 1 -1 -1 1 1 -1 -1 ...
## $ C : int -1 -1 -1 -1 1 1 1 1 -1 -1 ...
## $ D : int -1 -1 -1 -1 -1 -1 -1 -1 1 1 ...
## $ E : int -1 -1 -1 -1 -1 -1 -1 -1 -1 -1 ...
## $ Resultados: num -0.63 2.51 -2.68 1.66 2.06 1.22 -2.09 1.93 6.79 5.47 ...
View(datos)
attach(datos)
head(datos,n=16L)
| A | B | C | D | E | Resultados |
|---|---|---|---|---|---|
| -1 | -1 | -1 | -1 | -1 | -0.63 |
| 1 | -1 | -1 | -1 | -1 | 2.51 |
| -1 | 1 | -1 | -1 | -1 | -2.68 |
| 1 | 1 | -1 | -1 | -1 | 1.66 |
| -1 | -1 | 1 | -1 | -1 | 2.06 |
| 1 | -1 | 1 | -1 | -1 | 1.22 |
| -1 | 1 | 1 | -1 | -1 | -2.09 |
| 1 | 1 | 1 | -1 | -1 | 1.93 |
| -1 | -1 | -1 | 1 | -1 | 6.79 |
| 1 | -1 | -1 | 1 | -1 | 5.47 |
| -1 | 1 | -1 | 1 | -1 | 3.45 |
| 1 | 1 | -1 | 1 | -1 | 5.68 |
| -1 | -1 | 1 | 1 | -1 | 5.22 |
| 1 | -1 | 1 | 1 | -1 | 4.38 |
| -1 | 1 | 1 | 1 | -1 | 4.30 |
| 1 | 1 | 1 | 1 | -1 | 4.05 |
Para este paso, se requerirá obtener la gráfica de Pareto y la de Daniel, estas gráficas darán evidencia de cuales son los efectos relevantes del experimento, con base en el Principio de Escasez. Para obtenerlas debemos correr el siguiente código:
library(FrF2)
## Warning: package 'FrF2' was built under R version 4.0.5
## Warning: package 'DoE.base' was built under R version 4.0.5
Experimento= FrF2(nruns = 16, nfactors = 5, factor.names= list(A=c(-1,1), B=c(-1,1), C=c(-1,1), D=c(-1,1), E=c(-1,1)), replications = 1, randomize = FALSE)
Experimento_respuesta=add.response(design = Experimento,response = Resultados)
halfnormal(Experimento_respuesta, xlab = "Efectos Activos")
En la gráfica se puede observar que los efectos activos en el diseño experimental es el factor D (pureza). Por lo cual para confirmar la información que arroja la tabla, se verificara el gráfico de Daniel, mismo que se despliega utilizando el siguiente código:
DanielPlot(Experimento_respuesta, main= "Gráfico de Daniel para el Alcohol Isoamílico")
En la gráfica se puede confirmar la información que se obtuvo del ánalisis anterior, por lo que se concluye que los efectos activos son: los efectos principales del factor D (pureza) de acuerdo a esto se puede comprobar el principio de jerarquia y el Principio de herencia, ya que puede observarse que solo estan activos algunos efectos principales y algunas interacciones solas y dobles y de acuerdo a los factores e interacciones dobles se puede ver que no estan activas esto hace que tengan por lo menos factores que no sean activos en los principales.
modelo=lm(Resultados~(A*B*C*D*E))
summary(modelo)
##
## Call:
## lm.default(formula = Resultados ~ (A * B * C * D * E))
##
## Residuals:
## ALL 16 residuals are 0: no residual degrees of freedom!
##
## Coefficients: (16 not defined because of singularities)
## Estimate Std. Error t value Pr(>|t|)
## (Intercept) 2.70750 NA NA NA
## A 0.65500 NA NA NA
## B -0.67000 NA NA NA
## C -0.07375 NA NA NA
## D 2.21000 NA NA NA
## E NA NA NA NA
## A:B 0.63750 NA NA NA
## A:C -0.39375 NA NA NA
## B:C 0.08375 NA NA NA
## A:D -0.67750 NA NA NA
## B:D 0.12250 NA NA NA
## C:D -0.35625 NA NA NA
## A:E NA NA NA NA
## B:E NA NA NA NA
## C:E NA NA NA NA
## D:E NA NA NA NA
## A:B:C 0.04375 NA NA NA
## A:B:D -0.12000 NA NA NA
## A:C:D 0.14375 NA NA NA
## B:C:D 0.15125 NA NA NA
## A:B:E NA NA NA NA
## A:C:E NA NA NA NA
## B:C:E NA NA NA NA
## A:D:E NA NA NA NA
## B:D:E NA NA NA NA
## C:D:E NA NA NA NA
## A:B:C:D -0.41375 NA NA NA
## A:B:C:E NA NA NA NA
## A:B:D:E NA NA NA NA
## A:C:D:E NA NA NA NA
## B:C:D:E NA NA NA NA
## A:B:C:D:E NA NA NA NA
##
## Residual standard error: NaN on 0 degrees of freedom
## Multiple R-squared: 1, Adjusted R-squared: NaN
## F-statistic: NaN on 15 and 0 DF, p-value: NA
De acuerdo a los resultados que se obtuvieron en la tabla de ANOVA para los efectos de los 5 factores sobre el color de producto químico se puede observar que el factor D (pureza) es significativo.
qqnorm(resid(modelo), main = "Gráfica de probabilidad para los Residuales del Modelo", xlab = "Cuantiles teoricos", ylab = "Cuantiles de muestra")
qqline(resid(modelo))
Con respecto a los resultados obtenidos mediante la realización del gráfico que se muestra, se puede observar que los puntos muestran un comportamiento lineal por tal motivo se llega a la conclusión que se presenta un comportamiento normal y por lo cual corresponde al supuesto de normalidad.
homocedasticidad=bartlett.test(resid(modelo),A, B, C, D, E,data=experimento_resp)
print(homocedasticidad)
##
## Bartlett test of homogeneity of variances
##
## data: resid(modelo) and A
## Bartlett's K-squared = NaN, df = 1, p-value = NA
Como de logra observar con respecto a los resultados que se obtuvieron a base del análisis de varianza, se muestra que estos presentan igualdad y por consecuencia son constantes y normales, por tal motivo se concluye que el modelo de regresión si es el adecuado.
Análisis de las interacciones mediante los gráficos correspondientes:
Grafica_interacciones=IAPlot(Experimento_respuesta)
head(Grafica_interacciones)
| A:B | A:C | A:D | A:E | B:C | B:D | B:E | C:D | C:E | D:E | |
|---|---|---|---|---|---|---|---|---|---|---|
| -:- | 3.360 | 1.7325 | -0.835 | 2.6175 | 3.5350 | 1.290 | 3.9350 | 0.2150 | 3.0750 | 0.9550 |
| +:- | 3.395 | 3.8300 | 1.830 | 3.6250 | 2.0275 | -0.295 | 2.3075 | 0.7800 | 3.1675 | 5.2875 |
| -:+ | 0.745 | 2.3725 | 4.940 | 1.4875 | 3.2200 | 5.465 | 2.8200 | 5.3475 | 2.4875 | 0.0400 |
| +:+ | 3.330 | 2.8950 | 4.895 | 3.1000 | 2.0475 | 4.370 | 1.7675 | 4.4875 | 2.1000 | 4.5475 |
Con los resultados obtenidos por medio a los calculos realizados y basándose a los resultados de la gráfica anterior se observa que existen interaciones fuertes entre los factores B:C, C:D, Y D:C. Por lo cual para afirmar que las interacciones son significativas se realiza la tabla anova del experimento, solo considerando las interacciones dobles.
modelo_Catalizador_Reactivo_B_Temperatura_C=lm(Resultados ~(B*C), data = datos)
summary(modelo_Catalizador_Reactivo_B_Temperatura_C)
##
## Call:
## lm.default(formula = Resultados ~ (B * C), data = datos)
##
## Residuals:
## Min 1Q Median 3Q Max
## -4.7075 -1.3700 0.5212 2.0006 3.6525
##
## Coefficients:
## Estimate Std. Error t value Pr(>|t|)
## (Intercept) 2.70750 0.74758 3.622 0.0035 **
## B -0.67000 0.74758 -0.896 0.3878
## C -0.07375 0.74758 -0.099 0.9230
## B:C 0.08375 0.74758 0.112 0.9127
## ---
## Signif. codes: 0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
##
## Residual standard error: 2.99 on 12 degrees of freedom
## Multiple R-squared: 0.06436, Adjusted R-squared: -0.1695
## F-statistic: 0.2752 on 3 and 12 DF, p-value: 0.8422
anova_Catalizador_Reactivo_B_Temperatura_C=aov(modelo_Catalizador_Reactivo_B_Temperatura_C)
summary(anova_Catalizador_Reactivo_B_Temperatura_C)
## Df Sum Sq Mean Sq F value Pr(>F)
## B 1 7.18 7.182 0.803 0.388
## C 1 0.09 0.087 0.010 0.923
## B:C 1 0.11 0.112 0.013 0.913
## Residuals 12 107.30 8.942
modelo_Temperatura_C_Pureza_Reactivo_D=lm(Resultados ~(C*D),data = datos)
summary(modelo_Temperatura_C_Pureza_Reactivo_D)
##
## Call:
## lm.default(formula = Resultados ~ (C * D), data = datos)
##
## Residuals:
## Min 1Q Median 3Q Max
## -2.8950 -0.5394 0.2275 1.1825 2.2950
##
## Coefficients:
## Estimate Std. Error t value Pr(>|t|)
## (Intercept) 2.70750 0.42342 6.394 3.43e-05 ***
## C -0.07375 0.42342 -0.174 0.864631
## D 2.21000 0.42342 5.219 0.000215 ***
## C:D -0.35625 0.42342 -0.841 0.416599
## ---
## Signif. codes: 0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
##
## Residual standard error: 1.694 on 12 degrees of freedom
## Multiple R-squared: 0.6999, Adjusted R-squared: 0.6248
## F-statistic: 9.327 on 3 and 12 DF, p-value: 0.001847
anova_Catalizador_Reactivo_B_Temperatura_C=aov(modelo_Catalizador_Reactivo_B_Temperatura_C)
summary(anova_Catalizador_Reactivo_B_Temperatura_C)
## Df Sum Sq Mean Sq F value Pr(>F)
## B 1 7.18 7.182 0.803 0.388
## C 1 0.09 0.087 0.010 0.923
## B:C 1 0.11 0.112 0.013 0.913
## Residuals 12 107.30 8.942
modelo_solvente_Reactivo_A_Pureza_Reactivo_D=lm(Resultados ~(A*D),data = datos)
summary(modelo_solvente_Reactivo_A_Pureza_Reactivo_D)
##
## Call:
## lm.default(formula = Resultados ~ (A * D), data = datos)
##
## Residuals:
## Min 1Q Median 3Q Max
## -1.8450 -0.6913 -0.0350 0.6012 2.8950
##
## Coefficients:
## Estimate Std. Error t value Pr(>|t|)
## (Intercept) 2.7075 0.3410 7.939 4.07e-06 ***
## A 0.6550 0.3410 1.921 0.0789 .
## D 2.2100 0.3410 6.480 3.02e-05 ***
## A:D -0.6775 0.3410 -1.987 0.0703 .
## ---
## Signif. codes: 0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
##
## Residual standard error: 1.364 on 12 degrees of freedom
## Multiple R-squared: 0.8053, Adjusted R-squared: 0.7566
## F-statistic: 16.54 on 3 and 12 DF, p-value: 0.0001459
anova_Solvente_Reactivo_A_Pureza_Reactivo_D=aov(modelo_solvente_Reactivo_A_Pureza_Reactivo_D)
summary(anova_Solvente_Reactivo_A_Pureza_Reactivo_D)
## Df Sum Sq Mean Sq F value Pr(>F)
## A 1 6.86 6.86 3.689 0.0789 .
## D 1 78.15 78.15 41.991 3.02e-05 ***
## A:D 1 7.34 7.34 3.946 0.0703 .
## Residuals 12 22.33 1.86
## ---
## Signif. codes: 0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
modelo_Pureza_Reactivo_D_PH_Reactivo_E=lm(Resultados ~(D*E),data = datos)
summary(modelo_Pureza_Reactivo_D_PH_Reactivo_E)
##
## Call:
## lm.default(formula = Resultados ~ (D * E), data = datos)
##
## Residuals:
## Min 1Q Median 3Q Max
## -3.1775 -0.9325 0.4275 1.2300 2.0125
##
## Coefficients: (2 not defined because of singularities)
## Estimate Std. Error t value Pr(>|t|)
## (Intercept) 2.7075 0.4039 6.704 1.00e-05 ***
## D 2.2100 0.4039 5.472 8.23e-05 ***
## E NA NA NA NA
## D:E NA NA NA NA
## ---
## Signif. codes: 0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
##
## Residual standard error: 1.616 on 14 degrees of freedom
## Multiple R-squared: 0.6814, Adjusted R-squared: 0.6586
## F-statistic: 29.94 on 1 and 14 DF, p-value: 8.229e-05
anova_Pureza_Reactivo_PH_Reactivo_E=aov(modelo_Pureza_Reactivo_D_PH_Reactivo_E)
summary(anova_Pureza_Reactivo_PH_Reactivo_E)
## Df Sum Sq Mean Sq F value Pr(>F)
## D 1 78.15 78.15 29.94 8.23e-05 ***
## Residuals 14 36.54 2.61
## ---
## Signif. codes: 0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
Con los resultados que se obtuvieron a través de los métodos de realización de las varianzas se puede visualizar el modelo en las reacciones e interacciones con los otros reactivos y midiendo la pureza D se muestra que en cada una de ellas la de mayor significancia es del mismo reactivo D (pureza) dado que el reactivo con las interacciones B y C, A y D en la intervención del PH del reactivo E, resultan también ser significativas por este modelo, mientras las otras intervenciones no tienen significancia, por lo cual se logra concluir que existe significancias entre la temperatura de los solventes y entre la pureza de los reactivos.
Montgomery, D. (2004). Diseño y análisis de experimentos. México: Compañı́a Editorial Limusa Wiley.