Problema 5-19

Se corre un diseño factorial 3 × 2 con 10 rĂ©plicas para investigar el hinchamiento del catalizador despuĂ©s de la extrusiĂłn en la fabricaciĂłn de botellas de polietileno de alta densidad. El catalizador se utiliza en la obtenciĂłn de dicho polietileno. Los factores investigados son: molde (con dos niveles) y B: catalizador (con tres niveles). Los datos obtenidos se muestran en la siguiente tabla:

Datos

Y=c(93,92,90,91,92,91,90,91,93,90,92,94,90,91,90,91,92,92,92,91,95,94,94,94,94,97,95,96,94,96,88,88,87,87,88,87,87,87,87,88,90,88,88,88,89,90,89,88,88,89,91,90,92,90,97,89,90,91,91,91)

A=rep(1:2,each=30)
B=rep(rep(1:3,each=10),2)
df=data.frame(A,B,Y)
df$A=factor(df$A)
df$B=factor(df$B)
df
##    A B  Y
## 1  1 1 93
## 2  1 1 92
## 3  1 1 90
## 4  1 1 91
## 5  1 1 92
## 6  1 1 91
## 7  1 1 90
## 8  1 1 91
## 9  1 1 93
## 10 1 1 90
## 11 1 2 92
## 12 1 2 94
## 13 1 2 90
## 14 1 2 91
## 15 1 2 90
## 16 1 2 91
## 17 1 2 92
## 18 1 2 92
## 19 1 2 92
## 20 1 2 91
## 21 1 3 95
## 22 1 3 94
## 23 1 3 94
## 24 1 3 94
## 25 1 3 94
## 26 1 3 97
## 27 1 3 95
## 28 1 3 96
## 29 1 3 94
## 30 1 3 96
## 31 2 1 88
## 32 2 1 88
## 33 2 1 87
## 34 2 1 87
## 35 2 1 88
## 36 2 1 87
## 37 2 1 87
## 38 2 1 87
## 39 2 1 87
## 40 2 1 88
## 41 2 2 90
## 42 2 2 88
## 43 2 2 88
## 44 2 2 88
## 45 2 2 89
## 46 2 2 90
## 47 2 2 89
## 48 2 2 88
## 49 2 2 88
## 50 2 2 89
## 51 2 3 91
## 52 2 3 90
## 53 2 3 92
## 54 2 3 90
## 55 2 3 97
## 56 2 3 89
## 57 2 3 90
## 58 2 3 91
## 59 2 3 91
## 60 2 3 91
  1. Plantee las hipótesis de interés en este problema y el modelo estadístico correspondiente.

HipĂłtesis

Ho : Efecto de molde (A) = 0 Ha : Efecto de molde (A) no es igual a 0 Ho : Efecto de catalizador (B) = 0 Ha : Efecto de catalizador (B) no es igual a 0 Ho : molde × catalizador (AB) = 0 Ha : molde × catalizador (AB) no es igual a 0

Modelo estadĂ­stico

modelo=lm(Y~A*B,data=df)
  1. Construya la tabla de anĂĄlisis de varianza y determine cuĂĄles efectos estĂĄn activos.
anova=aov(modelo)
summary(anova)
##             Df Sum Sq Mean Sq F value   Pr(>F)    
## A            1 180.27  180.27 111.123 1.02e-14 ***
## B            2 153.03   76.52  47.168 1.42e-12 ***
## A:B          2   3.43    1.72   1.058    0.354    
## Residuals   54  87.60    1.62                     
## ---
## Signif. codes:  0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1

R/. Se acepta la hipĂłtesis alterna para molde y catalizador, mientras que en la interacciĂłn molde-catalizador no es significativa. Por tanto, molde (A) y catalizador (B) son los efectos activos.

  1. Dibuje las gråficas de medias para los dos efectos principales con los métodos LSD y de Tukey. Compare los resultados de ambos métodos.
tk<-TukeyHSD(anova)
tk
##   Tukey multiple comparisons of means
##     95% family-wise confidence level
## 
## Fit: aov(formula = modelo)
## 
## $A
##          diff       lwr       upr p adj
## 2-1 -3.466667 -4.125989 -2.807344     0
## 
## $B
##     diff        lwr      upr     p adj
## 2-1 0.75 -0.2206649 1.720665 0.1596217
## 3-1 3.70  2.7293351 4.670665 0.0000000
## 3-2 2.95  1.9793351 3.920665 0.0000000
## 
## $`A:B`
##         diff        lwr        upr     p adj
## 2:1-1:1 -3.9 -5.5828724 -2.2171276 0.0000001
## 1:2-1:1  0.2 -1.4828724  1.8828724 0.9992576
## 2:2-1:1 -2.6 -4.2828724 -0.9171276 0.0004042
## 1:3-1:1  3.6  1.9171276  5.2828724 0.0000008
## 2:3-1:1 -0.1 -1.7828724  1.5828724 0.9999755
## 1:2-2:1  4.1  2.4171276  5.7828724 0.0000000
## 2:2-2:1  1.3 -0.3828724  2.9828724 0.2191487
## 1:3-2:1  7.5  5.8171276  9.1828724 0.0000000
## 2:3-2:1  3.8  2.1171276  5.4828724 0.0000002
## 2:2-1:2 -2.8 -4.4828724 -1.1171276 0.0001215
## 1:3-1:2  3.4  1.7171276  5.0828724 0.0000028
## 2:3-1:2 -0.3 -1.9828724  1.3828724 0.9948564
## 1:3-2:2  6.2  4.5171276  7.8828724 0.0000000
## 2:3-2:2  2.5  0.8171276  4.1828724 0.0007262
## 2:3-1:3 -3.7 -5.3828724 -2.0171276 0.0000004
plot(tk)

library(agricolae)
LSD<-LSD.test(anova,"A",group=T,console=T)
## 
## Study: anova ~ "A"
## 
## LSD t Test for Y 
## 
## Mean Square Error:  1.622222 
## 
## A,  means and individual ( 95 %) CI
## 
##          Y      std  r      LCL      UCL Min Max
## 1 92.56667 2.011747 30 92.10046 93.03288  90  97
## 2 89.10000 2.090207 30 88.63379 89.56621  87  97
## 
## Alpha: 0.05 ; DF Error: 54
## Critical Value of t: 2.004879 
## 
## least Significant Difference: 0.6593223 
## 
## Treatments with the same letter are not significantly different.
## 
##          Y groups
## 1 92.56667      a
## 2 89.10000      b
bar.group(x=LSD$groups,horiz=T,col="red",xlim=c(0,115),
          xlab="Y",ylab="Molde")

LSD<-LSD.test(anova,"B",group=T,console=T)
## 
## Study: anova ~ "B"
## 
## LSD t Test for Y 
## 
## Mean Square Error:  1.622222 
## 
## B,  means and individual ( 95 %) CI
## 
##       Y      std  r      LCL      UCL Min Max
## 1 89.35 2.183069 20 88.77901 89.92099  87  93
## 2 90.10 1.744163 20 89.52901 90.67099  88  94
## 3 93.05 2.543826 20 92.47901 93.62099  89  97
## 
## Alpha: 0.05 ; DF Error: 54
## Critical Value of t: 2.004879 
## 
## least Significant Difference: 0.8075016 
## 
## Treatments with the same letter are not significantly different.
## 
##       Y groups
## 3 93.05      a
## 2 90.10      b
## 1 89.35      b
bar.group(x=LSD$groups,horiz=T,col="blue",xlim=c(0,115),
          xlab="Y",ylab="catalizador")

R/. En ambas pruebas no hay diferencia significativa entre los catalizadores 2 y 1; y hay diferencia significativa entre los moldes.

  1. Haga la grĂĄfica de interacciĂłn con intervalos de confianza sobrepuestos.
boxplot(Y~A*B,data=df)

  1. Determine cuĂĄl es el mejor tratamiento. ÂżCuĂĄl es el hinchamiento predicho en el mejor tratamiento?
par(mfrow=c(1,2))
interaction.plot(df$A,df$B,df$Y)
interaction.plot(df$B,df$A,df$Y)

f ) Verifique los supuestos de normalidad y varianza constante.

Normalidad

qqnorm(anova$residuals)
qqline(anova$residuals)

shapiro.test(anova$residuals)
## 
##  Shapiro-Wilk normality test
## 
## data:  anova$residuals
## W = 0.86234, p-value = 7.186e-06

R/. Debido a un valor de p menor a 0.05, los valores no poseen una distribuciĂłn normal.

Varianza

library(car)
## Loading required package: carData
leveneTest(Y~df$A)
## Levene's Test for Homogeneity of Variance (center = median)
##       Df F value Pr(>F)
## group  1  0.1322 0.7175
##       58
leveneTest(Y~df$B)
## Levene's Test for Homogeneity of Variance (center = median)
##       Df F value Pr(>F)
## group  2  2.0397 0.1394
##       57

R/. Los datos presentan homocedasticidad debido a los valores de p mayores a 0.05.

  1. Utilice la grĂĄfica de residuos contra factores para detectar posibles efectos sobre la dispersiĂłn del hinchamiento. ÂżEn cuĂĄl molde parece que es menor la dispersiĂłn?
plot(anova$residuals~A)
abline(h=0)

R/. El molde 2 presenta mayor dispersiĂłn en los datos.

Problema 5-22

En una fĂĄbrica de aceites vegetales comestibles la calidad resulta afectada por la cantidad de impurezas dentro del aceite, ya que Ă©stas causan oxidaciĂłn, y ello repercute a su vez en las caracterĂ­sticas de sabor y color del producto final. El proceso de “blanqueo” es el responsable de eliminar tales impurezas, y una forma de medir su eficacia es midiendo el color del aceite. Para generar una primera aproximaciĂłn a la soluciĂłn del problema se decide estudiar el efecto de la temperatura y el porcentaje de arcilla en el color del aceite inicialmente a nivel laboratorio. El diseño y los datos de las pruebas experimentales se muestran a continuaciĂłn.

Datos

Co=c(5.8,5.9,5,4.9,4.7,4.6,5.4,5.5,4.8,4.7,4.4,4.4,4.9,5.1,4.6,4.4,4.1,4,4.5,4.4,4.1,4.3,3.7,3.6)
Pa=rep(rep(1:4,each=2),3)
Te=rep(1:3,each=8)
df2<-data.frame(Pa,Te,Co)
df2$Pa<-factor(df2$Pa)
df2$Te<-factor(df2$Te)
df2
##    Pa Te  Co
## 1   1  1 5.8
## 2   1  1 5.9
## 3   2  1 5.0
## 4   2  1 4.9
## 5   3  1 4.7
## 6   3  1 4.6
## 7   4  1 5.4
## 8   4  1 5.5
## 9   1  2 4.8
## 10  1  2 4.7
## 11  2  2 4.4
## 12  2  2 4.4
## 13  3  2 4.9
## 14  3  2 5.1
## 15  4  2 4.6
## 16  4  2 4.4
## 17  1  3 4.1
## 18  1  3 4.0
## 19  2  3 4.5
## 20  2  3 4.4
## 21  3  3 4.1
## 22  3  3 4.3
## 23  4  3 3.7
## 24  4  3 3.6
  1. Construya el modelo estadĂ­stico y formule las hipĂłtesis pertinentes.

HipĂłtesis

Ho : Efecto de porcentaje de arcilla (Pa) = 0 Ha : Efecto de porcentaje de arcilla (Pa) no es igual a 0 Ho : Efecto de temperatura (Te) = 0 Ha : Efecto de temperatura (Te) no es igual a 0 Ho : Porcentaje de arcilla × temperatura (PaTe) = 0 Ha : Porcentaje de arcilla × temperatura (PaTe) no es igual a 0

Modelo estadĂ­stico

modelo2=lm(Co~Pa*Te,data=df2)
fit.aov<-aov(modelo2)
summary(fit.aov)
##             Df Sum Sq Mean Sq F value   Pr(>F)    
## Pa           3  0.428  0.1428   17.13 0.000123 ***
## Te           2  5.176  2.5879  310.55 4.64e-11 ***
## Pa:Te        6  2.374  0.3957   47.48 1.14e-07 ***
## Residuals   12  0.100  0.0083                     
## ---
## Signif. codes:  0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1

R/. Existe diferencia significativa, por tanto se aceptan las tres hipĂłtesis alternas.

Prueba de normalidad

qqnorm(fit.aov$residuals)
qqline(fit.aov$residuals)

shapiro.test(fit.aov$residuals)
## 
##  Shapiro-Wilk normality test
## 
## data:  fit.aov$residuals
## W = 0.8784, p-value = 0.007716

R/. Tanto en la grĂĄfica como en la prueba de shapiro, se observa que no se cumple la distribuciĂłn normal.

Prueba de varianza

library(car)
leveneTest(Co~Pa,data=df2)
## Levene's Test for Homogeneity of Variance (center = median)
##       Df F value  Pr(>F)  
## group  3  2.4137 0.09673 .
##       20                  
## ---
## Signif. codes:  0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
leveneTest(Co~Te,data=df2)
## Levene's Test for Homogeneity of Variance (center = median)
##       Df F value  Pr(>F)  
## group  2  3.4732 0.04976 *
##       21                  
## ---
## Signif. codes:  0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1

R/. No existe diferencia significativa en la varianza.

GrĂĄfica de residuales

plot(fit.aov$residuals)
abline(h=0)

R/. Los residuales parecen seguir un comportamiento dado por tanto no son aleatorios y no son independientes.

Interacciones

boxplot(Co~Pa*Te,data=df2)

par(mfrow=c(1,2))
interaction.plot(df2$Pa,df2$Te,df2$Co)
interaction.plot(df2$Te,df2$Pa,df2$Co)

Prueba de comparaciones mĂșltiples

tk<-TukeyHSD(fit.aov)
tk
##   Tukey multiple comparisons of means
##     95% family-wise confidence level
## 
## Fit: aov(formula = modelo2)
## 
## $Pa
##            diff        lwr         upr     p adj
## 2-1 -0.28333333 -0.4398082 -0.12685851 0.0008273
## 3-1 -0.26666667 -0.4231415 -0.11019184 0.0013783
## 4-1 -0.35000000 -0.5064748 -0.19352517 0.0001220
## 3-2  0.01666667 -0.1398082  0.17314149 0.9884960
## 4-2 -0.06666667 -0.2231415  0.08980816 0.6004628
## 4-3 -0.08333333 -0.2398082  0.07314149 0.4241896
## 
## $Te
##        diff        lwr        upr p adj
## 2-1 -0.5625 -0.6842708 -0.4407292 1e-07
## 3-1 -1.1375 -1.2592708 -1.0157292 0e+00
## 3-2 -0.5750 -0.6967708 -0.4532292 1e-07
## 
## $`Pa:Te`
##          diff        lwr        upr     p adj
## 2:1-1:1 -0.90 -1.2624239 -0.5375761 0.0000168
## 3:1-1:1 -1.20 -1.5624239 -0.8375761 0.0000007
## 4:1-1:1 -0.40 -0.7624239 -0.0375761 0.0260781
## 1:2-1:1 -1.10 -1.4624239 -0.7375761 0.0000019
## 2:2-1:1 -1.45 -1.8124239 -1.0875761 0.0000001
## 3:2-1:1 -0.85 -1.2124239 -0.4875761 0.0000306
## 4:2-1:1 -1.35 -1.7124239 -0.9875761 0.0000002
## 1:3-1:1 -1.80 -2.1624239 -1.4375761 0.0000000
## 2:3-1:1 -1.40 -1.7624239 -1.0375761 0.0000001
## 3:3-1:1 -1.65 -2.0124239 -1.2875761 0.0000000
## 4:3-1:1 -2.20 -2.5624239 -1.8375761 0.0000000
## 3:1-2:1 -0.30 -0.6624239  0.0624239 0.1435866
## 4:1-2:1  0.50  0.1375761  0.8624239 0.0047463
## 1:2-2:1 -0.20 -0.5624239  0.1624239 0.5810655
## 2:2-2:1 -0.55 -0.9124239 -0.1875761 0.0021008
## 3:2-2:1  0.05 -0.3124239  0.4124239 0.9999754
## 4:2-2:1 -0.45 -0.8124239 -0.0875761 0.0110198
## 1:3-2:1 -0.90 -1.2624239 -0.5375761 0.0000168
## 2:3-2:1 -0.50 -0.8624239 -0.1375761 0.0047463
## 3:3-2:1 -0.75 -1.1124239 -0.3875761 0.0001109
## 4:3-2:1 -1.30 -1.6624239 -0.9375761 0.0000003
## 4:1-3:1  0.80  0.4375761  1.1624239 0.0000575
## 1:2-3:1  0.10 -0.2624239  0.4624239 0.9888531
## 2:2-3:1 -0.25 -0.6124239  0.1124239 0.3102368
## 3:2-3:1  0.35 -0.0124239  0.7124239 0.0619315
## 4:2-3:1 -0.15 -0.5124239  0.2124239 0.8631044
## 1:3-3:1 -0.60 -0.9624239 -0.2375761 0.0009594
## 2:3-3:1 -0.20 -0.5624239  0.1624239 0.5810655
## 3:3-3:1 -0.45 -0.8124239 -0.0875761 0.0110198
## 4:3-3:1 -1.00 -1.3624239 -0.6375761 0.0000054
## 1:2-4:1 -0.70 -1.0624239 -0.3375761 0.0002206
## 2:2-4:1 -1.05 -1.4124239 -0.6875761 0.0000032
## 3:2-4:1 -0.45 -0.8124239 -0.0875761 0.0110198
## 4:2-4:1 -0.95 -1.3124239 -0.5875761 0.0000094
## 1:3-4:1 -1.40 -1.7624239 -1.0375761 0.0000001
## 2:3-4:1 -1.00 -1.3624239 -0.6375761 0.0000054
## 3:3-4:1 -1.25 -1.6124239 -0.8875761 0.0000005
## 4:3-4:1 -1.80 -2.1624239 -1.4375761 0.0000000
## 2:2-1:2 -0.35 -0.7124239  0.0124239 0.0619315
## 3:2-1:2  0.25 -0.1124239  0.6124239 0.3102368
## 4:2-1:2 -0.25 -0.6124239  0.1124239 0.3102368
## 1:3-1:2 -0.70 -1.0624239 -0.3375761 0.0002206
## 2:3-1:2 -0.30 -0.6624239  0.0624239 0.1435866
## 3:3-1:2 -0.55 -0.9124239 -0.1875761 0.0021008
## 4:3-1:2 -1.10 -1.4624239 -0.7375761 0.0000019
## 3:2-2:2  0.60  0.2375761  0.9624239 0.0009594
## 4:2-2:2  0.10 -0.2624239  0.4624239 0.9888531
## 1:3-2:2 -0.35 -0.7124239  0.0124239 0.0619315
## 2:3-2:2  0.05 -0.3124239  0.4124239 0.9999754
## 3:3-2:2 -0.20 -0.5624239  0.1624239 0.5810655
## 4:3-2:2 -0.75 -1.1124239 -0.3875761 0.0001109
## 4:2-3:2 -0.50 -0.8624239 -0.1375761 0.0047463
## 1:3-3:2 -0.95 -1.3124239 -0.5875761 0.0000094
## 2:3-3:2 -0.55 -0.9124239 -0.1875761 0.0021008
## 3:3-3:2 -0.80 -1.1624239 -0.4375761 0.0000575
## 4:3-3:2 -1.35 -1.7124239 -0.9875761 0.0000002
## 1:3-4:2 -0.45 -0.8124239 -0.0875761 0.0110198
## 2:3-4:2 -0.05 -0.4124239  0.3124239 0.9999754
## 3:3-4:2 -0.30 -0.6624239  0.0624239 0.1435866
## 4:3-4:2 -0.85 -1.2124239 -0.4875761 0.0000306
## 2:3-1:3  0.40  0.0375761  0.7624239 0.0260781
## 3:3-1:3  0.15 -0.2124239  0.5124239 0.8631044
## 4:3-1:3 -0.40 -0.7624239 -0.0375761 0.0260781
## 3:3-2:3 -0.25 -0.6124239  0.1124239 0.3102368
## 4:3-2:3 -0.80 -1.1624239 -0.4375761 0.0000575
## 4:3-3:3 -0.55 -0.9124239 -0.1875761 0.0021008
plot(tk)