Ejercicio 2

En una empresa lechera se han tenido problemas con la viscosidad de cierta bebida de chocolate. Se cree que con tres ingredientes que se agregan en pequeñas cantidades se puede resol ver este problema, por lo que es necesario explorar la situación; para ello se corre un experimento \(2^3\) con dos réplicas.(Pulido, De la Vara Salazar, González, Martı́nez, & Pérez, 2012)

A continuación se aprecian los resultados obtenidos:

Ingrediente A Ingrediente B Ingrediente C Viscosidad
-1 -1 -1 13.3,13.9
+1 -1 -1 14.7,14.4
-1 +1 -1 14.6,14.9
+1 +1 -1 14.3,14.1
-1 -1 +1 16.9,17.2
+1 -1 +1 15.5,15.1
-1 +1 +1 17.4,17.1
+1 +1 +1 18.9,19.2
  1. Estime todos los posibles efectos y diga cuáles son significativos.

  2. Realice un análisis de varianza de estos datos y obtenga conclusiones generales.

  3. Interprete a detalle los efectos significativos.

  4. ¿Hay un tratamiento ganador para minimizar?

  5. Verifique residuos, ¿qué considera destacado?

Para resolver los incisos anteriores, se utilizara el siguiente modelo estadistico:

\[y=u+(\alpha)i+(\beta)i+(\gamma)k+(\alpha \beta)ij+(\alpha \gamma)ik+(\beta \gamma)jk+(\alpha \beta \gamma)ijk+Eijk\]

INCISO A

Estime todos los posibles efectos y diga cuáles son significativos.

library(printr)
## Registered S3 method overwritten by 'printr':
##   method                from     
##   knit_print.data.frame rmarkdown
datos=read.table("dataset.txt",header = TRUE)
str(datos)
## 'data.frame':    16 obs. of  4 variables:
##  $ Viscosidad: num  13.3 14.7 14.6 14.3 16.9 15.5 17.4 18.9 13.9 14.4 ...
##  $ IngA      : int  -1 1 -1 1 -1 1 -1 1 -1 1 ...
##  $ IngB      : int  -1 -1 1 1 -1 -1 1 1 -1 -1 ...
##  $ IngC      : int  -1 -1 -1 -1 1 1 1 1 -1 -1 ...
attach(datos)

A continuación se muestra la tabla extraida de un excel, la cual se interpretará como un conjunto de variables:

head(datos, n= 16)
Viscosidad IngA IngB IngC
13.3 -1 -1 -1
14.7 1 -1 -1
14.6 -1 1 -1
14.3 1 1 -1
16.9 -1 -1 1
15.5 1 -1 1
17.4 -1 1 1
18.9 1 1 1
13.9 -1 -1 -1
14.4 1 -1 -1
14.9 -1 1 -1
14.1 1 1 -1
17.2 -1 -1 1
15.1 1 -1 1
17.1 -1 1 1
19.2 1 1 1

A continuación se determinaran los siguientes efectos:

modelo=lm(Viscosidad~(IngA+IngB+IngC+IngA*IngB+IngA*IngC+IngB*IngC+IngA*IngB*IngC))
summary(modelo) 
## 
## Call:
## lm(formula = Viscosidad ~ (IngA + IngB + IngC + IngA * IngB + 
##     IngA * IngC + IngB * IngC + IngA * IngB * IngC))
## 
## Residuals:
##    Min     1Q Median     3Q    Max 
##  -0.30  -0.15   0.00   0.15   0.30 
## 
## Coefficients:
##                Estimate Std. Error t value Pr(>|t|)    
## (Intercept)    15.71875    0.06281 250.252  < 2e-16 ***
## IngA            0.05625    0.06281   0.896 0.396647    
## IngB            0.59375    0.06281   9.453 1.29e-05 ***
## IngC            1.44375    0.06281  22.985 1.36e-08 ***
## IngA:IngB       0.25625    0.06281   4.080 0.003536 ** 
## IngA:IngC      -0.04375    0.06281  -0.697 0.505830    
## IngB:IngC       0.39375    0.06281   6.269 0.000241 ***
## IngA:IngB:IngC  0.63125    0.06281  10.050 8.18e-06 ***
## ---
## Signif. codes:  0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
## 
## Residual standard error: 0.2512 on 8 degrees of freedom
## Multiple R-squared:  0.9898, Adjusted R-squared:  0.9809 
## F-statistic: 110.8 on 7 and 8 DF,  p-value: 2.493e-07
library(FrF2)
experimento=FrF2(nruns = 8, nfactors = 3, factor.names = list(IngA=c(-1,1),IngB=c(-1,1),IngC=c(-1,1)),replications = 2,randomize = FALSE)
experimento_respuesta=add.response(design=experimento,response = Viscosidad)
grafica_efectos_principales=MEPlot(experimento_respuesta, main= "Gráfica de Efectos Individuales")

grafica_interacciones=IAPlot(experimento_respuesta, main= "Gráfica de Interacciones")

head(grafica_efectos_principales)
IngA IngB IngC
- 15.6625 15.1250 14.2750
+ 15.7750 16.3125 17.1625
head(grafica_interacciones)
IngA:IngB IngA:IngC IngB:IngC
-:- 15.325 14.175 14.075
+:- 14.925 14.375 14.475
-:+ 16.000 17.150 16.175
+:+ 16.625 17.175 18.150

De acuerdo a las gráficas, se observa que los ingredientes C y B son significados debido a que los efectos superan la línea del problema de la viscosidad es decir tienen mayor impacto sobre la variable respuesta en la bebida de chocolate y solo el ingrediente A no influye en la problemática, destacando de los 3 el ingrediente C con los cambios mas significativos.

INCISO B

Realice un análisis de varianza de estos datos y obtenga conclusiones generales.

anova=aov(modelo)
summary(anova)
##                Df Sum Sq Mean Sq F value   Pr(>F)    
## IngA            1   0.05    0.05   0.802 0.396647    
## IngB            1   5.64    5.64  89.356 1.29e-05 ***
## IngC            1  33.35   33.35 528.327 1.36e-08 ***
## IngA:IngB       1   1.05    1.05  16.644 0.003536 ** 
## IngA:IngC       1   0.03    0.03   0.485 0.505830    
## IngB:IngC       1   2.48    2.48  39.297 0.000241 ***
## IngA:IngB:IngC  1   6.38    6.38 101.000 8.18e-06 ***
## Residuals       8   0.50    0.06                     
## ---
## Signif. codes:  0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1

Vista la tabla anterior, se puede decir que:

El ingrediente A no es significativo, dado que, considerando un nivel de significancia del \(α=0.05\), y el \(Valor p>α\), por lo que se acepta la hipotesis nula y se concluye que no existen diferencias significativa entre la viscosidad producida por el ingrediente A.

En el ingrediente B si existe diferencia significativa entre los ingredientes probados para este factor, dado que \(Valor p<α\), por lo que se rechaza la hipotesis nula para el ingrediente B.

El ingrediente C, se concluye que si existe diferencia significativa, por lo tanto interfiere con la viscosidad de la fabricación de la leche de chocolate, dado a que \(Valor p<α\).

Y en las interacciones, se concluye que si existen diferencias significativas entre las diferentes interacciones generadas, dado que \(Valor P<α\).

Despues del análisis sobre el problema de la viscosidad sobre la bebida de chocolate y con el análisis de varianza se reafirma que los ingredientes B y C son los factores significativos debido a que Pr (>F) es menor a 0.05 y el ingrediente A no influye en la viscosidad, mientras que el ingrediente B y C si influyen en la viscosidad.

INCISO C

Interprete a detalle los efectos significativos.

Con la ayuda de la gráfica de normalidad podemos observar que los efectos no significativos son los ingredientes A y AC.

En el inciso anterior (b) se aprecia que si hay efectos significativos, puesto que con el valor \(\alpha=0.05\) el \(Valor_{p}>\alpha\) arrojan un valor menor a este, sin importar si es interaciion o ingrediente individual, entonces se puede decir que los ingredientes significativos son los ingredintes “B, C, AB, CB, ABC.”

En conclusion de este inciso, podemos decir que estos si afectan a la viscosidad en la bebida de chocolate.

INCISO D

¿Hay un tratamiento ganador para minimizar?

El ingrediente C es el que se debe escoger en base a los resultado, ya que este muestra una interacción superior a comparación de los otros, entonces se concluye que es el ingrediente que genera mayor viscosidad en las bebidas de chocolate y se debe de minimizar.

INCISO E

Verifique residuos, ¿qué considera destacado?

Prueba de Shapiro

A continuacion se utilizara la prueba de bondad y ajuste a la distribucion normal de shapiro-wilks en el caso de la normalidad.

En esta prueba primero se plantean 2 hipotesis:

\[H_0:x∈N(μ=0,σ^2=Constante)\]

\[H_1:x∉N(μ=0,σ^2=Constante)\]

Y se utilizara ademas los siguientes comandos:

normalidad=shapiro.test(resid(modelo))
print(normalidad)
## 
##  Shapiro-Wilk normality test
## 
## data:  resid(modelo)
## W = 0.87343, p-value = 0.0307
#Gráfica de Probabiliad Normal
qqnorm(resid(modelo), main= "Gráfica de Probabilidad para los Residuales del Modelo", xlab="Cuantiles Teoricos", ylab = "Cuantiles de muestra")
qqline(resid(modelo))

Una vez vistos los resultados obtenidos en la prueba de normalidad,se observa que el valor de P es menor a 0.05, entonces se rechaza la hipotesis nula y se acepta la alterna, y con ello se concluye que los datos no son normales.

Prueba de Barlett

En la Prueba de Homocedasticidad, o de Varianzas Iguales, se realiza mediante la Prueba de Bartlett, esta Prueba tiene las siguientes hipótesis:

\[H0:σ^2_i=σ^2_j=Constante\]
\[H1:σ^2_i≠σ^2_j≠Constante\]

Y se realiza con la siguiente línea de comandos, una por cada factor:

homocedasticidad=bartlett.test(resid(modelo),IngA,IngB,IngC,data=experimento_resp)
print(homocedasticidad)
## 
##  Bartlett test of homogeneity of variances
## 
## data:  resid(modelo) and IngA
## Bartlett's K-squared = 0.41308, df = 1, p-value = 0.5204

Para aceptar la igualdad de varianzas, los residuales deben ser homocedásticos para todos los factores. Por lo anterior y vistos los resultados del análisis de homocedasticidad, se concluye que el modelo si es adecuado.

En base a lo anterior se rechaza la hipotesis nula, puesto que P es mayor que 0.05, entonces los residuos tienen una distribución normal y una varianza constante.

Bibliografia

Pulido, H. G., De la Vara Salazar, R., González, P. G., Martı́nez, C. T., & Pérez, M. del C. T. (2012). Análisis y diseño de experimentos. McGraw-Hill New York, NY, USA: