Ejemplo

R.D Snee (“Expeimentación con un número grande de variables”, en Experiments in Industry: Desing, Analysis and Interpretation of Results, de R.D, snee, L.B. Hare y J.B. Trout, editores, ASQC) decribe un experimento en el que se usó un diseño \(2^{5-1}\) con I= ABCDE para investigar los efectos de cinco factores sobre el color de un producto químico. Los factores son A= solvente/reactivo, B= catalizador/reactivo, C= temperatura, D= pureza del reactivo y E= pH del reactivo. Los resultados obtenidos fueron los siguientes(Montgomery, 2004):

Resultados	Resultados
e=-0.63	d=6.79
a=2.51	ade=5.47
b=-2.68	bde=3.45
abe=1.66	abd=5.68
c=2.06	cde=5.22
ace=1.22	acd=4.38
bce=-2.09	bcd=4.30
abc=1.93	abcde=4.05

Construir una grafica de probabilidad normal de los efectos.¿Qué efectos parecen estar activos?
Calcular los residuales. Construir una gráfica de probabilidad normal de los residuales y graficar los residuales contra los valores ajustados. Comentar las gráficas.
Si algunos de los factores son significantes, plegar el diseño \(2^{5-1}\) a un diseño factorial completo en los factores activos. Comentar el diseño resultante e interpretar los resultados.

Inciso A

library(printr)

## Warning: package 'printr' was built under R version 4.0.5

datos=read.table("dataset.txt",header = TRUE,fill = TRUE)
str(datos)

## 'data.frame':    16 obs. of  6 variables:
##  $ A         : int  -1 1 -1 1 -1 1 -1 1 -1 1 ...
##  $ B         : int  -1 -1 1 1 -1 -1 1 1 -1 -1 ...
##  $ C         : int  -1 -1 -1 -1 1 1 1 1 -1 -1 ...
##  $ D         : int  -1 -1 -1 -1 -1 -1 -1 -1 1 1 ...
##  $ E         : int  -1 -1 -1 -1 -1 -1 -1 -1 -1 -1 ...
##  $ Resultados: num  -0.63 2.51 -2.68 1.66 2.06 1.22 -2.09 1.93 6.79 5.47 ...

View(datos)

attach(datos)
head(datos,n=16L)

A	B	C	D	E	Resultados
-1	-1	-1	-1	-1	-0.63
1	-1	-1	-1	-1	2.51
-1	1	-1	-1	-1	-2.68
1	1	-1	-1	-1	1.66
-1	-1	1	-1	-1	2.06
1	-1	1	-1	-1	1.22
-1	1	1	-1	-1	-2.09
1	1	1	-1	-1	1.93
-1	-1	-1	1	-1	6.79
1	-1	-1	1	-1	5.47
-1	1	-1	1	-1	3.45
1	1	-1	1	-1	5.68
-1	-1	1	1	-1	5.22
1	-1	1	1	-1	4.38
-1	1	1	1	-1	4.30
1	1	1	1	-1	4.05

Para este paso, se requerirá obtener la gráfica de Pareto y la de Daniel, estas gráficas darán evidencia de cuales son los efectos relevantes del experimento, con base en el Principio de Escasez. Para obtenerlas debemos correr el siguiente código:

library(FrF2)

## Warning: package 'FrF2' was built under R version 4.0.5

## Warning: package 'DoE.base' was built under R version 4.0.5

Experimento= FrF2(nruns = 16, nfactors = 5, factor.names= list(A=c(-1,1), B=c(-1,1), C=c(-1,1), D=c(-1,1), E=c(-1,1)), replications = 1, randomize = FALSE)
Experimento_respuesta=add.response(design = Experimento,response = Resultados)
halfnormal(Experimento_respuesta, xlab = "Efectos Activos")

En la gráfica se puede observar que los efectos activos en el diseño experimental es el factor D (pureza). Por lo cual para confirmar la información que arroja la tabla, se verificara el gráfico de Daniel, mismo que se despliega utilizando el siguiente código:

DanielPlot(Experimento_respuesta, main= "Gráfico de Daniel para el Alcohol Isoamílico")

En la gráfica se puede confirmar la información que se obtuvo del ánalisis anterior, por lo que se concluye que los efectos activos son: los efectos principales del factor D (pureza) de acuerdo a esto se puede comprobar el principio de jerarquia y el Principio de herencia, ya que puede observarse que solo estan activos algunos efectos principales y algunas interacciones solas y dobles y de acuerdo a los factores e interacciones dobles se puede ver que no estan activas esto hace que tengan por lo menos factores que no sean activos en los principales.

Inciso B

modelo=lm(Resultados~(A*B*C*D*E))
summary(modelo)

## 
## Call:
## lm.default(formula = Resultados ~ (A * B * C * D * E))
## 
## Residuals:
## ALL 16 residuals are 0: no residual degrees of freedom!
## 
## Coefficients: (16 not defined because of singularities)
##             Estimate Std. Error t value Pr(>|t|)
## (Intercept)  2.70750         NA      NA       NA
## A            0.65500         NA      NA       NA
## B           -0.67000         NA      NA       NA
## C           -0.07375         NA      NA       NA
## D            2.21000         NA      NA       NA
## E                 NA         NA      NA       NA
## A:B          0.63750         NA      NA       NA
## A:C         -0.39375         NA      NA       NA
## B:C          0.08375         NA      NA       NA
## A:D         -0.67750         NA      NA       NA
## B:D          0.12250         NA      NA       NA
## C:D         -0.35625         NA      NA       NA
## A:E               NA         NA      NA       NA
## B:E               NA         NA      NA       NA
## C:E               NA         NA      NA       NA
## D:E               NA         NA      NA       NA
## A:B:C        0.04375         NA      NA       NA
## A:B:D       -0.12000         NA      NA       NA
## A:C:D        0.14375         NA      NA       NA
## B:C:D        0.15125         NA      NA       NA
## A:B:E             NA         NA      NA       NA
## A:C:E             NA         NA      NA       NA
## B:C:E             NA         NA      NA       NA
## A:D:E             NA         NA      NA       NA
## B:D:E             NA         NA      NA       NA
## C:D:E             NA         NA      NA       NA
## A:B:C:D     -0.41375         NA      NA       NA
## A:B:C:E           NA         NA      NA       NA
## A:B:D:E           NA         NA      NA       NA
## A:C:D:E           NA         NA      NA       NA
## B:C:D:E           NA         NA      NA       NA
## A:B:C:D:E         NA         NA      NA       NA
## 
## Residual standard error: NaN on 0 degrees of freedom
## Multiple R-squared:      1,  Adjusted R-squared:    NaN 
## F-statistic:   NaN on 15 and 0 DF,  p-value: NA

De acuerdo a los resultados que se obtuvieron en la tabla de ANOVA para los efectos de los 5 factores sobre el color de producto químico se puede observar que el factor D (pureza) es significativo.

qqnorm(resid(modelo), main = "Gráfica de probabilidad para los Residuales del Modelo", xlab = "Cuantiles teoricos", ylab = "Cuantiles de muestra")
qqline(resid(modelo))

Con respecto a los resultados obtenidos mediante la realización del gráfico que se muestra, se puede observar que los puntos muestran un comportamiento lineal por tal motivo se llega a la conclusión que se presenta un comportamiento normal y por lo cual corresponde al supuesto de normalidad.

homocedasticidad=bartlett.test(resid(modelo),A, B, C, D, E,data=experimento_resp)
print(homocedasticidad)

## 
##  Bartlett test of homogeneity of variances
## 
## data:  resid(modelo) and A
## Bartlett's K-squared = NaN, df = 1, p-value = NA

Como de logra observar con respecto a los resultados que se obtuvieron a base del análisis de varianza, se muestra que estos presentan igualdad y por consecuencia son constantes y normales, por tal motivo se concluye que el modelo de regresión si es el adecuado.

Inciso C

Análisis de las interacciones mediante los gráficos correspondientes:

Grafica_interacciones=IAPlot(Experimento_respuesta)

head(Grafica_interacciones)

	A:B	A:C	A:D	A:E	B:C	B:D	B:E	C:D	C:E	D:E
-:-	3.360	1.7325	-0.835	2.6175	3.5350	1.290	3.9350	0.2150	3.0750	0.9550
+:-	3.395	3.8300	1.830	3.6250	2.0275	-0.295	2.3075	0.7800	3.1675	5.2875
-:+	0.745	2.3725	4.940	1.4875	3.2200	5.465	2.8200	5.3475	2.4875	0.0400
+:+	3.330	2.8950	4.895	3.1000	2.0475	4.370	1.7675	4.4875	2.1000	4.5475

Con los resultados obtenidos por medio a los calculos realizados y basándose a los resultados de la gráfica anterior se observa que existen interaciones fuertes entre los factores B:C, C:D, Y D:C. Por lo cual para afirmar que las interacciones son significativas se realiza la tabla anova del experimento, solo considerando las interacciones dobles.

modelo_Catalizador_Reactivo_B_Temperatura_C=lm(Resultados ~(B*C), data = datos)
summary(modelo_Catalizador_Reactivo_B_Temperatura_C)

## 
## Call:
## lm.default(formula = Resultados ~ (B * C), data = datos)
## 
## Residuals:
##     Min      1Q  Median      3Q     Max 
## -4.7075 -1.3700  0.5212  2.0006  3.6525 
## 
## Coefficients:
##             Estimate Std. Error t value Pr(>|t|)   
## (Intercept)  2.70750    0.74758   3.622   0.0035 **
## B           -0.67000    0.74758  -0.896   0.3878   
## C           -0.07375    0.74758  -0.099   0.9230   
## B:C          0.08375    0.74758   0.112   0.9127   
## ---
## Signif. codes:  0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
## 
## Residual standard error: 2.99 on 12 degrees of freedom
## Multiple R-squared:  0.06436,    Adjusted R-squared:  -0.1695 
## F-statistic: 0.2752 on 3 and 12 DF,  p-value: 0.8422

anova_Catalizador_Reactivo_B_Temperatura_C=aov(modelo_Catalizador_Reactivo_B_Temperatura_C)
summary(anova_Catalizador_Reactivo_B_Temperatura_C)

##             Df Sum Sq Mean Sq F value Pr(>F)
## B            1   7.18   7.182   0.803  0.388
## C            1   0.09   0.087   0.010  0.923
## B:C          1   0.11   0.112   0.013  0.913
## Residuals   12 107.30   8.942

modelo_Temperatura_C_Pureza_Reactivo_D=lm(Resultados ~(C*D),data = datos)
summary(modelo_Temperatura_C_Pureza_Reactivo_D)

## 
## Call:
## lm.default(formula = Resultados ~ (C * D), data = datos)
## 
## Residuals:
##     Min      1Q  Median      3Q     Max 
## -2.8950 -0.5394  0.2275  1.1825  2.2950 
## 
## Coefficients:
##             Estimate Std. Error t value Pr(>|t|)    
## (Intercept)  2.70750    0.42342   6.394 3.43e-05 ***
## C           -0.07375    0.42342  -0.174 0.864631    
## D            2.21000    0.42342   5.219 0.000215 ***
## C:D         -0.35625    0.42342  -0.841 0.416599    
## ---
## Signif. codes:  0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
## 
## Residual standard error: 1.694 on 12 degrees of freedom
## Multiple R-squared:  0.6999, Adjusted R-squared:  0.6248 
## F-statistic: 9.327 on 3 and 12 DF,  p-value: 0.001847

anova_Catalizador_Reactivo_B_Temperatura_C=aov(modelo_Catalizador_Reactivo_B_Temperatura_C)
summary(anova_Catalizador_Reactivo_B_Temperatura_C)

##             Df Sum Sq Mean Sq F value Pr(>F)
## B            1   7.18   7.182   0.803  0.388
## C            1   0.09   0.087   0.010  0.923
## B:C          1   0.11   0.112   0.013  0.913
## Residuals   12 107.30   8.942

modelo_solvente_Reactivo_A_Pureza_Reactivo_D=lm(Resultados ~(A*D),data = datos)
summary(modelo_solvente_Reactivo_A_Pureza_Reactivo_D)

## 
## Call:
## lm.default(formula = Resultados ~ (A * D), data = datos)
## 
## Residuals:
##     Min      1Q  Median      3Q     Max 
## -1.8450 -0.6913 -0.0350  0.6012  2.8950 
## 
## Coefficients:
##             Estimate Std. Error t value Pr(>|t|)    
## (Intercept)   2.7075     0.3410   7.939 4.07e-06 ***
## A             0.6550     0.3410   1.921   0.0789 .  
## D             2.2100     0.3410   6.480 3.02e-05 ***
## A:D          -0.6775     0.3410  -1.987   0.0703 .  
## ---
## Signif. codes:  0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
## 
## Residual standard error: 1.364 on 12 degrees of freedom
## Multiple R-squared:  0.8053, Adjusted R-squared:  0.7566 
## F-statistic: 16.54 on 3 and 12 DF,  p-value: 0.0001459

anova_Solvente_Reactivo_A_Pureza_Reactivo_D=aov(modelo_solvente_Reactivo_A_Pureza_Reactivo_D)
summary(anova_Solvente_Reactivo_A_Pureza_Reactivo_D)

##             Df Sum Sq Mean Sq F value   Pr(>F)    
## A            1   6.86    6.86   3.689   0.0789 .  
## D            1  78.15   78.15  41.991 3.02e-05 ***
## A:D          1   7.34    7.34   3.946   0.0703 .  
## Residuals   12  22.33    1.86                     
## ---
## Signif. codes:  0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1

modelo_Pureza_Reactivo_D_PH_Reactivo_E=lm(Resultados ~(D*E),data = datos)
summary(modelo_Pureza_Reactivo_D_PH_Reactivo_E)

## 
## Call:
## lm.default(formula = Resultados ~ (D * E), data = datos)
## 
## Residuals:
##     Min      1Q  Median      3Q     Max 
## -3.1775 -0.9325  0.4275  1.2300  2.0125 
## 
## Coefficients: (2 not defined because of singularities)
##             Estimate Std. Error t value Pr(>|t|)    
## (Intercept)   2.7075     0.4039   6.704 1.00e-05 ***
## D             2.2100     0.4039   5.472 8.23e-05 ***
## E                 NA         NA      NA       NA    
## D:E               NA         NA      NA       NA    
## ---
## Signif. codes:  0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
## 
## Residual standard error: 1.616 on 14 degrees of freedom
## Multiple R-squared:  0.6814, Adjusted R-squared:  0.6586 
## F-statistic: 29.94 on 1 and 14 DF,  p-value: 8.229e-05

anova_Pureza_Reactivo_PH_Reactivo_E=aov(modelo_Pureza_Reactivo_D_PH_Reactivo_E)
summary(anova_Pureza_Reactivo_PH_Reactivo_E)

##             Df Sum Sq Mean Sq F value   Pr(>F)    
## D            1  78.15   78.15   29.94 8.23e-05 ***
## Residuals   14  36.54    2.61                     
## ---
## Signif. codes:  0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1

Con los resultados que se obtuvieron a través de los métodos de realización de las varianzas se puede visualizar el modelo en las reacciones e interacciones con los otros reactivos y midiendo la pureza D se muestra que en cada una de ellas la de mayor significancia es del mismo reactivo D (pureza) dado que el reactivo con las interacciones B y C, A y D en la intervención del PH del reactivo E, resultan también ser significativas por este modelo, mientras las otras intervenciones no tienen significancia, por lo cual se logra concluir que existe significancias entre la temperatura de los solventes y entre la pureza de los reactivos.

Bibliografia

Montgomery, D. (2004). Diseño y análisis de experimentos. México: Compañı́a Editorial Limusa Wiley.

Diseño Factorial Fraccionado

Fernanda López Urrutia

2021-10-18

Ejemplo

Inciso A

Inciso B

Inciso C

Bibliografia