1 Diseño Factorial \(2^3\)

1.1 Ejercicio

  1. En una empresa lechera se han tenido problemas con la viscosidad de cierta bebida de chocolate. Se cree que con tres ingredientes que se agregan en pequeñas cantidades se puede resolver este problema, por lo que es necesario explorar la situación; para ello se corre un experimento \(2^3\) con dos réplicas. A continuación se aprecian los resultados obtenidos:
Ingrediente A Ingrediente B Ingrediente C Viscosidad
-1 -1 -1 13.3
+1 -1 -1 14.7
-1 +1 -1 14.6
+1 +1 -1 14.3
-1 -1 +1 16.9
+1 -1 +1 15.5
-1 +1 +1 17.4
+1 +1 +1 18.9
-1 -1 -1 13.9
+1 -1 -1 14.4
-1 +1 -1 14.9
+1 +1 -1 14.1
-1 -1 +1 17.2
+1 -1 +1 15.1
-1 +1 +1 17.1
+1 +1 +1 19.2
  1. Estime todos los posibles efectos y diga cuáles son significativos.
  2. Realice un análisis de varianza de estos datos y obtenga conclusiones generales.
  3. Interprete a detalle los efectos significativos.
  4. ¿Hay un tratamiento ganador para minimizar?
  5. Verique residuos, ¿qué considera destacado?

1.2 Solución

a) Estime todos los posibles efectos y diga cuáles son significativos.

library(printr)
datos=read.table("dataset.txt",header = TRUE)
View(datos)
str(datos)
## 'data.frame':    16 obs. of  4 variables:
##  $ Ingrediente_A: int  -1 1 -1 1 -1 1 -1 1 -1 1 ...
##  $ Ingrediente_B: int  -1 -1 1 1 -1 -1 1 1 -1 -1 ...
##  $ Ingrediente_C: int  -1 -1 -1 -1 1 1 1 1 -1 -1 ...
##  $ Viscosidad   : num  13.3 14.7 14.6 14.3 16.9 15.5 17.4 18.9 13.9 14.4 ...
attach(datos)
f_inga=factor(`Ingrediente_A`)
f_ingb=factor(`Ingrediente_B`)
f_ingc=factor(`Ingrediente_C`)
head(datos, n= 16L)
Ingrediente_A Ingrediente_B Ingrediente_C Viscosidad
-1 -1 -1 13.3
1 -1 -1 14.7
-1 1 -1 14.6
1 1 -1 14.3
-1 -1 1 16.9
1 -1 1 15.5
-1 1 1 17.4
1 1 1 18.9
-1 -1 -1 13.9
1 -1 -1 14.4
-1 1 -1 14.9
1 1 -1 14.1
-1 -1 1 17.2
1 -1 1 15.1
-1 1 1 17.1
1 1 1 19.2

Para calcular los efectos de los factores, debemos considerar que en la ejecución de un diseño factorial completo de la familia 2^2 es necesario considerar el factor de interacción; el modelo matemático que relaciona los efectos de los factores en la variable de salida se escribe de la siguiente manera:

\[y_ij={\mu}+{\tau_i}+{\beta_j}+{\varepsilon_{ij}}\]

Según Montgomery, en un diseño factorial con dos niveles, el efecto primedio de un factor puede definirse como el cambio en la respuesta producido por un cambio en el nivel de ese factor promediado para para los niveles del otro factor(Montgomery, 2004). Dicho lo anterior, para el caso del factor A, el efecto promedio, utilizando la notación de Yates, se define como:

\[A={\frac{1}{2n}}[ab+a-a-b-(1)]\]

Para el caso del factor B, se define de la siguiente manera:

\[B={\frac{1}{2n}}[ab+b-a-(1)\]

En el caso del efecto de interacción AB, se define como la diferencia promedio entre el efecto de A con el nivel alto de B y el efecto de A con el nivel bajo de B, por lo tanto:

\[AB={\frac{1}{2n}}[ab+(1)-a-b]\] Para determinar los efectos, utilizamos el siguiente código:

modelo=lm(Viscosidad~(f_inga+f_ingb+f_ingc+f_inga*f_ingb+f_inga*f_ingc+f_ingb*f_ingc+f_inga*f_ingb*f_ingc))
summary(modelo)
## 
## Call:
## lm(formula = Viscosidad ~ (f_inga + f_ingb + f_ingc + f_inga * 
##     f_ingb + f_inga * f_ingc + f_ingb * f_ingc + f_inga * f_ingb * 
##     f_ingc))
## 
## Residuals:
##    Min     1Q Median     3Q    Max 
##  -0.30  -0.15   0.00   0.15   0.30 
## 
## Coefficients:
##                         Estimate Std. Error t value Pr(>|t|)    
## (Intercept)              13.6000     0.1777  76.551 9.45e-13 ***
## f_inga1                   0.9500     0.2512   3.781  0.00538 ** 
## f_ingb1                   1.1500     0.2512   4.577  0.00181 ** 
## f_ingc1                   3.4500     0.2512  13.732 7.63e-07 ***
## f_inga1:f_ingb1          -1.5000     0.3553  -4.222  0.00291 ** 
## f_inga1:f_ingc1          -2.7000     0.3553  -7.599 6.31e-05 ***
## f_ingb1:f_ingc1          -0.9500     0.3553  -2.674  0.02820 *  
## f_inga1:f_ingb1:f_ingc1   5.0500     0.5025  10.050 8.18e-06 ***
## ---
## Signif. codes:  0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
## 
## Residual standard error: 0.2512 on 8 degrees of freedom
## Multiple R-squared:  0.9898, Adjusted R-squared:  0.9809 
## F-statistic: 110.8 on 7 and 8 DF,  p-value: 2.493e-07
library(FrF2)
experimento=FrF2(nruns = 8,nfactors = 3,factor.names = list(f_inga=c(-1,1),f_ingb=c(-1,1),f_ingc=c(-1,1)),replications = 2,randomize = FALSE)
experimento_resp=add.response(design = experimento,response = Viscosidad)
grafica_efectos_principales=MEPlot(experimento_resp, main="Gráfica de efectos principales para viscosidad.")

grafica_interaciones=IAPlot(experimento_resp, main= "Gráfica de matriz de interacción para viscosidad")

head(grafica_efectos_principales)
f_inga f_ingb f_ingc
- 15.6625 15.1250 14.2750
+ 15.7750 16.3125 17.1625
head(grafica_interaciones)
f_inga:f_ingb f_inga:f_ingc f_ingb:f_ingc
-:- 15.325 14.175 14.075
+:- 14.925 14.375 14.475
-:+ 16.000 17.150 16.175
+:+ 16.625 17.175 18.150

con base a la evidencia experimental los valores obtenidos en los coeficientes de correlacion, se puede concluir que los datos que presenta una significación en los factores del Ingrediente C.

b) Realice un análisis de varianza de estos datos y obtenga conclusiones generales.
Para establecer de manera definitiva cuales son los niveles de operación del sistema, es conveniente verificar la significancia tanto de los factores de manera individual como de las interacciones, para tal caso se ejecuta el Análisis de Varianza (ANOVA) correspondiente, mediante la siguiente secuencia de comandos:

anova=aov(modelo)
summary(anova)
##                      Df Sum Sq Mean Sq F value   Pr(>F)    
## f_inga                1   0.05    0.05   0.802 0.396647    
## f_ingb                1   5.64    5.64  89.356 1.29e-05 ***
## f_ingc                1  33.35   33.35 528.327 1.36e-08 ***
## f_inga:f_ingb         1   1.05    1.05  16.644 0.003536 ** 
## f_inga:f_ingc         1   0.03    0.03   0.485 0.505830    
## f_ingb:f_ingc         1   2.48    2.48  39.297 0.000241 ***
## f_inga:f_ingb:f_ingc  1   6.38    6.38 101.000 8.18e-06 ***
## Residuals             8   0.50    0.06                     
## ---
## Signif. codes:  0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1

Como se puede ver que el \(valor_p\) para el efecto del Ingrediente A no es significativo, ya que, considerando un nivel de significancia de α = 0.05, \(valor_p\)>α, por lo que se acepta la hipótesis nula y se concluye que consdiderando la viscosidad producida por el efecto del tratamiento considerado para la elaboración de la leche con chocolate que es el Ingrediente A.
Para el caso del factor ingrediente B se concluye que existe una diferencia significativa entre los ingredientes probados, dado que \(valor_p\)<α, por lo tanto la hipótesis nula es rechazada para el ingrediente B.
Para el del ingrediente C, concluimos que si hay una diferencia significativa, por lo cual, interfiere con la viscosidad de la producción de leche con chocolate, dado que \(valor_p\)<α.
Para el caso de las interaciones, se concluye que si existen diferencias significativas entre las diferentes interacciones generadas dado que \(valor_p\)<α, lo que lleva a la conclusión de que, si existen interacciones, lo suficientemente fuertes como para provocar cambios significativos en la viscosidad generada en la producción de leche con chocolate.

c) Interprete a detalle los efectos significativos

Con base a la evidencia experimental y con un nivel de 95% de confianza que Inga y Ingc no es significativa, por lo que se puede concluir que no genere alteraciones de ningún tipo.

d) ¿Hay un tratamiento ganador para minimizar? Con base experimental con el 95% de nivel de confianza,se puede concluir que el tratamiento que presenta mayor efecto para minimizar es el Ingrediente c.

e) Verique residuos, ¿qué considera destacado?

Prueba de Adecuación

Prueba de Normalidad de Residuos de Shapiro-Wilk

Para realizar esta prueba debemos plantear las siguientes hipótesis de trabajo:

\[H_0:x \, {\in}\, N\, ({\mu}=0, {\sigma^2}=Constante)\] \[H_1:x \, {\notin} \, N \, ({\mu}=0,{\sigma^2}=Constante)\]

Cuando el \(valor_p\)<0.05, se rechaza la hipótesis nula de la prueba de Shapiro-Wilks.Siempre se recomienda realizar una gráfica de probabilidad normal para confirmar la prueba de hipótesis.Para ello usaremos la siguiente secuencia de comandos:

normalidad=shapiro.test(resid(modelo))
print(normalidad)
## 
##  Shapiro-Wilk normality test
## 
## data:  resid(modelo)
## W = 0.87343, p-value = 0.0307
#Gráfica de probabilidad normal
qqnorm(resid(modelo), main= "Gráfica de Probabilidad para los Residuales del Modelo", xlab="Cuantiles Teoricos", ylab = "Cuantiles de muestra")
qqline(resid(modelo))

Con base en el gráfico anterior, podemos concluir que los puntos en el gráfico no muestran un comportamiento lineal, por lo que se concluye que no muestran un comportamiento normal. No corresponde al supuesto de normalidad.

La Prueba de Bartlett tiene las siguientes hipótesis:

\[H_0:{\sigma^2}={\sigma^2_j}=Costante\]

\[H_1:{\sigma^2}\,{\neq}\,{\sigma^2_j}\,{\neq}\,Costante\] La Prueba de Bartlett se realiza con la siguiente línea de comandos, misma que se efectúa por separado para cada factor.

homocedasticidad=bartlett.test(resid(modelo),f_inga,f_ingb,f_ingc,data=experimento_resp)
print(homocedasticidad)
## 
##  Bartlett test of homogeneity of variances
## 
## data:  resid(modelo) and f_inga
## Bartlett's K-squared = 0.41308, df = 1, p-value = 0.5204

Con base en la evidencia experimental se puede comprobar con un nivel de confianza 95%, qué el valor de α es menor que al valor obtenido mediante la prueba de homogeneidad de las varianzas ya que el valor presente es igual a 0.5204, por lo tanto se acepta la hipótesis nula y se rechaza la alternativa.

Bibliografía

Montgomery, D. C. (2004). Diseño y Análisis de Experimentos (2.ª ed.). Limusa Wiley.