Ingrediente A | Ingrediente B | Ingrediente C | Viscosidad |
---|---|---|---|
-1 | -1 | -1 | 13.3 |
+1 | -1 | -1 | 14.7 |
-1 | +1 | -1 | 14.6 |
+1 | +1 | -1 | 14.3 |
-1 | -1 | +1 | 16.9 |
+1 | -1 | +1 | 15.5 |
-1 | +1 | +1 | 17.4 |
+1 | +1 | +1 | 18.9 |
-1 | -1 | -1 | 13.9 |
+1 | -1 | -1 | 14.4 |
-1 | +1 | -1 | 14.9 |
+1 | +1 | -1 | 14.1 |
-1 | -1 | +1 | 17.2 |
+1 | -1 | +1 | 15.1 |
-1 | +1 | +1 | 17.1 |
+1 | +1 | +1 | 19.2 |
a) Estime todos los posibles efectos y diga cuáles son significativos.
library(printr)
datos=read.table("dataset.txt",header = TRUE)
View(datos)
str(datos)
## 'data.frame': 16 obs. of 4 variables:
## $ Ingrediente_A: int -1 1 -1 1 -1 1 -1 1 -1 1 ...
## $ Ingrediente_B: int -1 -1 1 1 -1 -1 1 1 -1 -1 ...
## $ Ingrediente_C: int -1 -1 -1 -1 1 1 1 1 -1 -1 ...
## $ Viscosidad : num 13.3 14.7 14.6 14.3 16.9 15.5 17.4 18.9 13.9 14.4 ...
attach(datos)
f_inga=factor(`Ingrediente_A`)
f_ingb=factor(`Ingrediente_B`)
f_ingc=factor(`Ingrediente_C`)
head(datos, n= 16L)
Ingrediente_A | Ingrediente_B | Ingrediente_C | Viscosidad |
---|---|---|---|
-1 | -1 | -1 | 13.3 |
1 | -1 | -1 | 14.7 |
-1 | 1 | -1 | 14.6 |
1 | 1 | -1 | 14.3 |
-1 | -1 | 1 | 16.9 |
1 | -1 | 1 | 15.5 |
-1 | 1 | 1 | 17.4 |
1 | 1 | 1 | 18.9 |
-1 | -1 | -1 | 13.9 |
1 | -1 | -1 | 14.4 |
-1 | 1 | -1 | 14.9 |
1 | 1 | -1 | 14.1 |
-1 | -1 | 1 | 17.2 |
1 | -1 | 1 | 15.1 |
-1 | 1 | 1 | 17.1 |
1 | 1 | 1 | 19.2 |
Para calcular los efectos de los factores, debemos considerar que en la ejecución de un diseño factorial completo de la familia 2^2 es necesario considerar el factor de interacción; el modelo matemático que relaciona los efectos de los factores en la variable de salida se escribe de la siguiente manera:
\[y_ij={\mu}+{\tau_i}+{\beta_j}+{\varepsilon_{ij}}\]
Según Montgomery, en un diseño factorial con dos niveles, el efecto primedio de un factor puede definirse como el cambio en la respuesta producido por un cambio en el nivel de ese factor promediado para para los niveles del otro factor(Montgomery, 2004). Dicho lo anterior, para el caso del factor A, el efecto promedio, utilizando la notación de Yates, se define como:
\[A={\frac{1}{2n}}[ab+a-a-b-(1)]\]
Para el caso del factor B, se define de la siguiente manera:
\[B={\frac{1}{2n}}[ab+b-a-(1)\]
En el caso del efecto de interacción AB, se define como la diferencia promedio entre el efecto de A con el nivel alto de B y el efecto de A con el nivel bajo de B, por lo tanto:
\[AB={\frac{1}{2n}}[ab+(1)-a-b]\] Para determinar los efectos, utilizamos el siguiente código:
modelo=lm(Viscosidad~(f_inga+f_ingb+f_ingc+f_inga*f_ingb+f_inga*f_ingc+f_ingb*f_ingc+f_inga*f_ingb*f_ingc))
summary(modelo)
##
## Call:
## lm(formula = Viscosidad ~ (f_inga + f_ingb + f_ingc + f_inga *
## f_ingb + f_inga * f_ingc + f_ingb * f_ingc + f_inga * f_ingb *
## f_ingc))
##
## Residuals:
## Min 1Q Median 3Q Max
## -0.30 -0.15 0.00 0.15 0.30
##
## Coefficients:
## Estimate Std. Error t value Pr(>|t|)
## (Intercept) 13.6000 0.1777 76.551 9.45e-13 ***
## f_inga1 0.9500 0.2512 3.781 0.00538 **
## f_ingb1 1.1500 0.2512 4.577 0.00181 **
## f_ingc1 3.4500 0.2512 13.732 7.63e-07 ***
## f_inga1:f_ingb1 -1.5000 0.3553 -4.222 0.00291 **
## f_inga1:f_ingc1 -2.7000 0.3553 -7.599 6.31e-05 ***
## f_ingb1:f_ingc1 -0.9500 0.3553 -2.674 0.02820 *
## f_inga1:f_ingb1:f_ingc1 5.0500 0.5025 10.050 8.18e-06 ***
## ---
## Signif. codes: 0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
##
## Residual standard error: 0.2512 on 8 degrees of freedom
## Multiple R-squared: 0.9898, Adjusted R-squared: 0.9809
## F-statistic: 110.8 on 7 and 8 DF, p-value: 2.493e-07
library(FrF2)
experimento=FrF2(nruns = 8,nfactors = 3,factor.names = list(f_inga=c(-1,1),f_ingb=c(-1,1),f_ingc=c(-1,1)),replications = 2,randomize = FALSE)
experimento_resp=add.response(design = experimento,response = Viscosidad)
grafica_efectos_principales=MEPlot(experimento_resp, main="Gráfica de efectos principales para viscosidad.")
grafica_interaciones=IAPlot(experimento_resp, main= "Gráfica de matriz de interacción para viscosidad")
head(grafica_efectos_principales)
f_inga | f_ingb | f_ingc | |
---|---|---|---|
- | 15.6625 | 15.1250 | 14.2750 |
+ | 15.7750 | 16.3125 | 17.1625 |
head(grafica_interaciones)
f_inga:f_ingb | f_inga:f_ingc | f_ingb:f_ingc | |
---|---|---|---|
-:- | 15.325 | 14.175 | 14.075 |
+:- | 14.925 | 14.375 | 14.475 |
-:+ | 16.000 | 17.150 | 16.175 |
+:+ | 16.625 | 17.175 | 18.150 |
con base a la evidencia experimental los valores obtenidos en los coeficientes de correlacion, se puede concluir que los datos que presenta una significación en los factores del Ingrediente C.
b) Realice un análisis de varianza de estos datos y obtenga conclusiones generales.
Para establecer de manera definitiva cuales son los niveles de operación del sistema, es conveniente verificar la significancia tanto de los factores de manera individual como de las interacciones, para tal caso se ejecuta el Análisis de Varianza (ANOVA) correspondiente, mediante la siguiente secuencia de comandos:
anova=aov(modelo)
summary(anova)
## Df Sum Sq Mean Sq F value Pr(>F)
## f_inga 1 0.05 0.05 0.802 0.396647
## f_ingb 1 5.64 5.64 89.356 1.29e-05 ***
## f_ingc 1 33.35 33.35 528.327 1.36e-08 ***
## f_inga:f_ingb 1 1.05 1.05 16.644 0.003536 **
## f_inga:f_ingc 1 0.03 0.03 0.485 0.505830
## f_ingb:f_ingc 1 2.48 2.48 39.297 0.000241 ***
## f_inga:f_ingb:f_ingc 1 6.38 6.38 101.000 8.18e-06 ***
## Residuals 8 0.50 0.06
## ---
## Signif. codes: 0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
Como se puede ver que el \(valor_p\) para el efecto del Ingrediente A no es significativo, ya que, considerando un nivel de significancia de α = 0.05, \(valor_p\)>α, por lo que se acepta la hipótesis nula y se concluye que consdiderando la viscosidad producida por el efecto del tratamiento considerado para la elaboración de la leche con chocolate que es el Ingrediente A.
Para el caso del factor ingrediente B se concluye que existe una diferencia significativa entre los ingredientes probados, dado que \(valor_p\)<α, por lo tanto la hipótesis nula es rechazada para el ingrediente B.
Para el del ingrediente C, concluimos que si hay una diferencia significativa, por lo cual, interfiere con la viscosidad de la producción de leche con chocolate, dado que \(valor_p\)<α.
Para el caso de las interaciones, se concluye que si existen diferencias significativas entre las diferentes interacciones generadas dado que \(valor_p\)<α, lo que lleva a la conclusión de que, si existen interacciones, lo suficientemente fuertes como para provocar cambios significativos en la viscosidad generada en la producción de leche con chocolate.
c) Interprete a detalle los efectos significativos
Con base a la evidencia experimental y con un nivel de 95% de confianza que Inga y Ingc no es significativa, por lo que se puede concluir que no genere alteraciones de ningún tipo.
d) ¿Hay un tratamiento ganador para minimizar? Con base experimental con el 95% de nivel de confianza,se puede concluir que el tratamiento que presenta mayor efecto para minimizar es el Ingrediente c.
e) Verique residuos, ¿qué considera destacado?
Prueba de Adecuación
Prueba de Normalidad de Residuos de Shapiro-Wilk
Para realizar esta prueba debemos plantear las siguientes hipótesis de trabajo:
\[H_0:x \, {\in}\, N\, ({\mu}=0, {\sigma^2}=Constante)\] \[H_1:x \, {\notin} \, N \, ({\mu}=0,{\sigma^2}=Constante)\]
Cuando el \(valor_p\)<0.05, se rechaza la hipótesis nula de la prueba de Shapiro-Wilks.Siempre se recomienda realizar una gráfica de probabilidad normal para confirmar la prueba de hipótesis.Para ello usaremos la siguiente secuencia de comandos:
normalidad=shapiro.test(resid(modelo))
print(normalidad)
##
## Shapiro-Wilk normality test
##
## data: resid(modelo)
## W = 0.87343, p-value = 0.0307
#Gráfica de probabilidad normal
qqnorm(resid(modelo), main= "Gráfica de Probabilidad para los Residuales del Modelo", xlab="Cuantiles Teoricos", ylab = "Cuantiles de muestra")
qqline(resid(modelo))
Con base en el gráfico anterior, podemos concluir que los puntos en el gráfico no muestran un comportamiento lineal, por lo que se concluye que no muestran un comportamiento normal. No corresponde al supuesto de normalidad.
La Prueba de Bartlett tiene las siguientes hipótesis:
\[H_0:{\sigma^2}={\sigma^2_j}=Costante\]
\[H_1:{\sigma^2}\,{\neq}\,{\sigma^2_j}\,{\neq}\,Costante\] La Prueba de Bartlett se realiza con la siguiente línea de comandos, misma que se efectúa por separado para cada factor.
homocedasticidad=bartlett.test(resid(modelo),f_inga,f_ingb,f_ingc,data=experimento_resp)
print(homocedasticidad)
##
## Bartlett test of homogeneity of variances
##
## data: resid(modelo) and f_inga
## Bartlett's K-squared = 0.41308, df = 1, p-value = 0.5204
Con base en la evidencia experimental se puede comprobar con un nivel de confianza 95%, qué el valor de α es menor que al valor obtenido mediante la prueba de homogeneidad de las varianzas ya que el valor presente es igual a 0.5204, por lo tanto se acepta la hipótesis nula y se rechaza la alternativa.