El diseño en bloque completo al azar (DBCA), el cual es llamado también experimento con dos criterios de clasificación, porque tiene dos fuentes de variación; estas son tratamientos y bloques: este diseño es un modelo estadístico en el que: Los tratamientos son designados al azar a las unidades experimentales dentro de cada bloque.
Atomizador mata moscas.
Se hace un estudio sobre la efectividad de tres marcas de atomizador para matar moscas. Para ello, cada producto se aplica a un grupo de 100 moscas, y se cuenta el número de moscas muertas expresado en porcentajes. Se hicieron seis réplicas, pero en días diferentes; por ello, se sospecha que puede haber algún efecto importante debido a esta fuente de variación. Los datos obtenidos se muestran a continuación:
Cuadro c4 p10.
Hipótesis:
Ho: µ1= µ2= µ3
Ha: al menos una de las medias de las marcas sea diferente
## Marca Trat Y
## 1 1 1 72
## 2 1 2 65
## 3 1 3 67
## 4 1 4 75
## 5 1 5 62
## 6 1 6 73
## 7 2 1 55
## 8 2 2 59
## 9 2 3 68
## 10 2 4 70
## 11 2 5 53
## 12 2 6 50
## 13 3 1 64
## 14 3 2 74
## 15 3 3 61
## 16 3 4 58
## 17 3 5 51
## 18 3 6 69
## 'data.frame': 18 obs. of 3 variables:
## $ Marca: Factor w/ 3 levels "1","2","3": 1 1 1 1 1 1 2 2 2 2 ...
## $ Trat : Factor w/ 6 levels "1","2","3","4",..: 1 2 3 4 5 6 1 2 3 4 ...
## $ Y : num 72 65 67 75 62 73 55 59 68 70 ...
modelo=aov(Y~Trat+Marca,data=df)
summary(modelo)## Df Sum Sq Mean Sq F value Pr(>F)
## Trat 5 281.3 56.27 1.094 0.421
## Marca 2 296.3 148.17 2.881 0.103
## Residuals 10 514.3 51.43
a) ¿Existe diferencia entre la efectividad promedio de los atomizadores?
En la prueba ANOVA: Se obtuvo un valor-p = 0.103 > 0.05, por lo tanto se acepta Ho. No existe diferencia entre la efectividad promedio de los atomizadores.
boxplot(Y~Marca,data=df,main="Diagrama de cajas de Marca",col='pink')boxplot(Y~Trat,data=df,main="Diagrama de cajas de Tratamientos",col='orange')b)¿ Hay algún atomizador mejor? Argumente su respuesta.
En el Boxplot Marca: En este caso como los intervalos de confianza se traslapan entonces los atomizadores son estadísticamente iguales en cuanto a sus medias. Aunque se puede decir que hay una leve mejor efectividad en la marca 1.
c) Hay diferencias significativas en los resultados de diferentes días en que se realizó el experimento? Argumente su respuesta. En el Boxplot Trat: En este caso como los intervalos de confianza casi todos se traslapan entonces los resultados de diferentes días en que se realizó el experimento son estadísticamente iguales en cuanto a sus medias, excepto una leve diferencia del día 5.
qqnorm(modelo$residuals)
qqline(modelo$residuals,col='red')shapiro.test(modelo$residuals)##
## Shapiro-Wilk normality test
##
## data: modelo$residuals
## W = 0.9575, p-value = 0.5541
library(car)## Loading required package: carData
leveneTest(Y~Trat,data=df)## Levene's Test for Homogeneity of Variance (center = median)
## Df F value Pr(>F)
## group 5 0.2832 0.9134
## 12
plot(modelo$residuals)
abline(h=0,col='red')d) Verifique los supuestos de normalidad y de igual varianza entre las marcas.
En la gráfica de prueba de normalidad de los datos, se observa que estos siguen una distribución normal ya que tienden a quedar cerca a la línea.
En la gráfica de prueba de independencia de error de los datos, se observa que los puntos se distribuyen de manera aleatoria alrededor de la línea, por lo que se cumple el supuesto que los tratamientos tienen igual varianza.
Se obtuvo un valor-p = 0.103 > 0.05, por lo tanto se acepta Ho. No existe diferencia entre la efectividad promedio de los atomizadores. Los atomizadores son estadísticamente iguales en cuanto a sus medias. Aunque se puede decir que hay una leve mejor efectividad en la marca 1.
{width=30%]
Un aspecto crítico para que se conserve la leche es la temperatura de almacenamiento. De manera tradicional se han usado termómetros de mercurio (Mer) para verificar que la temperatura sea la adecuada, pero ahora se han comprado termómetros electrónicos (Rtd) para facilitar el proceso de medición. Sin embargo, se duda de las mediciones de estos nuevos dispositivos. Para aclarar dudas y diagnosticar la situación, durante cinco días se toman mediciones con ambos tipos de termómetros en varios silos (a la misma hora). Los datos para cinco silos se muestran a continuación:
Cuadro c4 p15.
## 'data.frame': 25 obs. of 3 variables:
## $ Silo: Factor w/ 5 levels "A","B","C","D",..: 1 1 1 1 1 2 2 2 2 2 ...
## $ Dia : Factor w/ 5 levels "1","2","3","4",..: 1 2 3 4 5 1 2 3 4 5 ...
## $ Y : num 2.6 2.8 5 0 2.4 6.4 6.4 2.3 4.2 4 ...
Observe los datos y establezca una conjetura acerca de la confiabilidad de las mediciones con Rtd (del termometro de mercurio no hay duda)
Es claro que el silo se puede ver como tratamiento y dias como bloque. Considere solo los datos de Rtd y establezca el modelo estadistico. Tambien haga el ANOVA correspondiente y obtenga conclusiones.
modelo=aov(Y~Silo+Dia,data=df)
summary(modelo)## Df Sum Sq Mean Sq F value Pr(>F)
## Silo 4 182.53 45.63 8.091 0.000912 ***
## Dia 4 62.01 15.50 2.749 0.064865 .
## Residuals 16 90.24 5.64
## ---
## Signif. codes: 0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
boxplot(Y~Silo,data=df,col='yellow')boxplot(Y~Dia,data=df,col='pink')Silo: Los silos no son iguales ya que presentan un valor de P<0.05:Hipotesis alternativa.
Dia:Los dias tienen temperaturas iguales ya que presentan un valor de P>0.05: Hipotesis nula.
tk=TukeyHSD(modelo)
tk## Tukey multiple comparisons of means
## 95% family-wise confidence level
##
## Fit: aov(formula = Y ~ Silo + Dia, data = df)
##
## $Silo
## diff lwr upr p adj
## B-A 2.10 -2.5016327 6.7016327 0.6374197
## C-A -3.16 -7.7616327 1.4416327 0.2656259
## D-A 2.18 -2.4216327 6.7816327 0.6057729
## E-A -4.42 -9.0216327 0.1816327 0.0628520
## C-B -5.26 -9.8616327 -0.6583673 0.0212974
## D-B 0.08 -4.5216327 4.6816327 0.9999980
## E-B -6.52 -11.1216327 -1.9183673 0.0039696
## D-C 5.34 0.7383673 9.9416327 0.0191638
## E-C -1.26 -5.8616327 3.3416327 0.9144393
## E-D -6.60 -11.2016327 -1.9983673 0.0035673
##
## $Dia
## diff lwr upr p adj
## 2-1 0.12 -4.481633 4.721633 0.9999897
## 3-1 0.18 -4.421633 4.781633 0.9999479
## 4-1 -2.88 -7.481633 1.721633 0.3478187
## 5-1 -3.32 -7.921633 1.281633 0.2254054
## 3-2 0.06 -4.541633 4.661633 0.9999994
## 4-2 -3.00 -7.601633 1.601633 0.3107739
## 5-2 -3.44 -8.041633 1.161633 0.1984234
## 4-3 -3.06 -7.661633 1.541633 0.2932674
## 5-3 -3.50 -8.101633 1.101633 0.1859252
## 5-4 -0.44 -5.041633 4.161633 0.9982140
plot(tk)Con la prueba Tukey se observa las diferencia entre Silos y Dias
qqnorm(modelo$residuals)
qqline(modelo$residuals,col='red')shapiro.test(modelo$residuals)##
## Shapiro-Wilk normality test
##
## data: modelo$residuals
## W = 0.94816, p-value = 0.2279
P>0.05 se acepta H0.
## function (x, df, ncp, log = FALSE)
modelo=aov(Y~Silo+Dia,data=df)
summary(modelo)## Df Sum Sq Mean Sq F value Pr(>F)
## Silo 4 4.46 1.115 0.690 0.609
## Dia 4 9.76 2.440 1.511 0.246
## Residuals 16 25.84 1.615
boxplot(Y~Silo,data=df,col='green')boxplot(Y~Dia,data=df,col='blue')tk=TukeyHSD(modelo)
tk## Tukey multiple comparisons of means
## 95% family-wise confidence level
##
## Fit: aov(formula = Y ~ Silo + Dia, data = df)
##
## $Silo
## diff lwr upr p adj
## B-A 0.9 -1.5624 3.3624 0.7940241
## C-A 0.1 -2.3624 2.5624 0.9999395
## D-A 1.0 -1.4624 3.4624 0.7268563
## E-A 0.2 -2.2624 2.6624 0.9990573
## C-B -0.8 -3.2624 1.6624 0.8536191
## D-B 0.1 -2.3624 2.5624 0.9999395
## E-B -0.7 -3.1624 1.7624 0.9033967
## D-C 0.9 -1.5624 3.3624 0.7940241
## E-C 0.1 -2.3624 2.5624 0.9999395
## E-D -0.8 -3.2624 1.6624 0.8536191
##
## $Dia
## diff lwr upr p adj
## 2-1 0.4 -2.0624 2.8624003 0.9864301
## 3-1 0.1 -2.3624 2.5624003 0.9999395
## 4-1 -1.4 -3.8624 1.0624003 0.4380469
## 5-1 -0.4 -2.8624 2.0624003 0.9864301
## 3-2 -0.3 -2.7624 2.1624003 0.9954349
## 4-2 -1.8 -4.2624 0.6624003 0.2152533
## 5-2 -0.8 -3.2624 1.6624003 0.8536191
## 4-3 -1.5 -3.9624 0.9624003 0.3729211
## 5-3 -0.5 -2.9624 1.9624003 0.9693357
## 5-4 1.0 -1.4624 3.4624003 0.7268563
plot(tk)qqnorm(modelo$residuals)
qqline(modelo$residuals,col='red')Analisis de lo obtenido: Silo: P>0.05: Hipotesis nula, Dias: P>0.05: Hipotesis nula
d)¿Las conclusiones obtenidas en los incisos anteriores coinciden? Comente su respuesta.
## 'data.frame': 25 obs. of 3 variables:
## $ Silo: Factor w/ 5 levels "A","B","C","D",..: 1 1 1 1 1 2 2 2 2 2 ...
## $ Dia : Factor w/ 5 levels "1","2","3","4",..: 1 2 3 4 5 1 2 3 4 5 ...
## $ Y : num 1.4 1.2 0 0.5 0.6 1.4 0.4 0.3 0.2 0 ...
modelo=aov(Y~Silo+Dia,data=df)
summary(modelo)## Df Sum Sq Mean Sq F value Pr(>F)
## Silo 4 96.81 24.203 6.660 0.00236 **
## Dia 4 41.96 10.490 2.887 0.05640 .
## Residuals 16 58.15 3.634
## ---
## Signif. codes: 0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
boxplot(Y~Silo,data=df,col='orange')boxplot(Y~Dia,data=df,col='yellow')tk=TukeyHSD(modelo)
tk## Tukey multiple comparisons of means
## 95% family-wise confidence level
##
## Fit: aov(formula = Y ~ Silo + Dia, data = df)
##
## $Silo
## diff lwr upr p adj
## B-A -0.28 -3.9738038 3.4138038 0.9992815
## C-A 3.26 -0.4338038 6.9538038 0.0975664
## D-A 0.42 -3.2738038 4.1138038 0.9965009
## E-A 4.62 0.9261962 8.3138038 0.0110343
## C-B 3.54 -0.1538038 7.2338038 0.0636394
## D-B 0.70 -2.9938038 4.3938038 0.9760870
## E-B 4.90 1.2061962 8.5938038 0.0069223
## D-C -2.84 -6.5338038 0.8538038 0.1783452
## E-C 1.36 -2.3338038 5.0538038 0.7897851
## E-D 4.20 0.5061962 7.8938038 0.0220905
##
## $Dia
## diff lwr upr p adj
## 2-1 0.04 -3.65380378 3.733804 0.9999997
## 3-1 -0.72 -4.41380378 2.973804 0.9735221
## 4-1 0.76 -2.93380378 4.453804 0.9678574
## 5-1 3.04 -0.65380378 6.733804 0.1346943
## 3-2 -0.76 -4.45380378 2.933804 0.9678574
## 4-2 0.72 -2.97380378 4.413804 0.9735221
## 5-2 3.00 -0.69380378 6.693804 0.1426179
## 4-3 1.48 -2.21380378 5.173804 0.7361905
## 5-3 3.76 0.06619622 7.453804 0.0450163
## 5-4 2.28 -1.41380378 5.973804 0.3606355
plot(tk)qqnorm(modelo$residuals)
qqline(modelo$residuals,col='red')Analisis de lo obtenido: Silo: P<0.05: Hipotesis alternativa, Dias: P>0.05: Hipotesis nula
Se comprueba el peso en gramos de un material de tres proveedo res: A, B y C, por tres diferentes inspectores: I, II y III, utilizando tres diferentes escalas: 1, 2 y 3. El experimento se lleva a cabo como el siguiente cuadro latino:
Cuadro c4p19.
## Var1 Var2 Trat Y
## 1 1 1 A 16
## 2 2 1 B 15
## 3 3 1 C 13
## 4 1 2 B 10
## 5 2 2 C 9
## 6 3 2 A 11
## 7 1 3 C 11
## 8 2 3 A 14
## 9 3 3 B 13
## Inspector Escala Trat Y
## 1 1 1 A 16
## 2 2 1 B 15
## 3 3 1 C 13
## 4 1 2 B 10
## 5 2 2 C 9
## 6 3 2 A 11
## 7 1 3 C 11
## 8 2 3 A 14
## 9 3 3 B 13
## 'data.frame': 9 obs. of 4 variables:
## $ Inspector: int 1 2 3 1 2 3 1 2 3
## $ Escala : int 1 1 1 2 2 2 3 3 3
## $ Trat : chr "A" "B" "C" "B" ...
## $ Y : num 16 15 13 10 9 11 11 14 13
## - attr(*, "out.attrs")=List of 2
## ..$ dim : int [1:2] 3 3
## ..$ dimnames:List of 2
## .. ..$ Var1: chr [1:3] "Var1=1" "Var1=2" "Var1=3"
## .. ..$ Var2: chr [1:3] "Var2=1" "Var2=2" "Var2=3"
modelo=aov(Y~Inspector+Escala+Trat,data=df)
summary(modelo)## Df Sum Sq Mean Sq F value Pr(>F)
## Inspector 2 0.22 0.111 1 0.50000
## Escala 2 32.89 16.444 148 0.00671 **
## Trat 2 10.89 5.444 49 0.02000 *
## Residuals 2 0.22 0.111
## ---
## Signif. codes: 0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
valor p = 0.50000 para los inspectores, se acepta Ho
boxplot(Y~Escala,data = df,col='green')boxplot(Y~Trat,data = df,col='blue')boxplot(Y~Inspector,data = df,col='pink')El proveedor A, es el mejor proveedor porque es el que más se acerca al peso esperado de 15g
tk=TukeyHSD(modelo)
tk## Tukey multiple comparisons of means
## 95% family-wise confidence level
##
## Fit: aov(formula = Y ~ Inspector + Escala + Trat, data = df)
##
## $Inspector
## diff lwr upr p adj
## 2-1 3.333333e-01 -1.269927 1.936593 0.548184
## 3-1 1.776357e-15 -1.603260 1.603260 1.000000
## 3-2 -3.333333e-01 -1.936593 1.269927 0.548184
##
## $Escala
## diff lwr upr p adj
## 2-1 -4.666667 -6.269927 -3.0634068 0.0061007
## 3-1 -2.000000 -3.603260 -0.3967402 0.0327189
## 3-2 2.666667 1.063407 4.2699265 0.0186734
##
## $Trat
## diff lwr upr p adj
## B-A -1.000000 -2.603260 0.60325985 0.1191149
## C-A -2.666667 -4.269927 -1.06340682 0.0186734
## C-B -1.666667 -3.269927 -0.06340682 0.0464424
plot(tk)qqnorm(modelo$residuals)
qqline(modelo$residuals,col='red')shapiro.test(modelo$residuals)##
## Shapiro-Wilk normality test
##
## data: modelo$residuals
## W = 0.61728, p-value = 0.0001526
require(car)
leveneTest(Y~Trat,data=df)## Levene's Test for Homogeneity of Variance (center = median)
## Df F value Pr(>F)
## group 2 0.0556 0.9464
## 6
leveneTest(Y~Escala,data=df)## Levene's Test for Homogeneity of Variance (center = median)
## Df F value Pr(>F)
## group 2 0.1429 0.8697
## 6
plot(modelo$residuals)
abline(h=0,col='red')En el análisis de ANOVA , con un valor p = 0.02000 * (p < 0.05) para los proveedores, se rechaza Ho, concluyendo que hay diferencia significativa en al menos 1 proveedor.
¿Hay diferencias entre los inspectores y entre las escalas? En el análisis de ANOVA , con un valor p = 0.50000 para los inspectores, se acepta Ho, concluyendo que no hay diferencia significativa entre los instructores. Entre las escalas con un valor p = 0.00671 ** (p < 0.05), se rechaza Ho, concluyendo que hay diferencias significativas en al menos 1 escala.
Si el peso debe ser 15 g, ¿cuál proveedor es mejor? El proveedor A, es el mejor proveedor porque es el que más se acerca al peso esperado de 15g.
Si algún factor de bloque es no significativo, elimínelo y haga el análisis adecuado. Se elimina el factor de bloque de los inspectores, ya que se concluyó que no tiene efecto en la variable respuesta, al tener una p < 0.05 por lo tanto no hay diferencia significativa. Al hacer los análisis nuevamente se observó que las escalas y los proveedores seguían teniendo diferencia significativa, pero con un mayor grado de significancia.
Nota: Es importante tomar en cuenta que los datos no cumplen con los supuestos de normalidad e independencia de la ANOVA, por lo que el estudio no es reproducible.
El objetivo de un diseño factorial es estudiar el efecto de varios factores sobre una o varias respuestas, cuando se tiene el mismo interés sobre todos los factores. Los factores pueden ser de tipo cualitativo (máquinas, tipos de material, operador, la presencia o ausencia de una operación previa, etc.), o de tipo cuantitativo (temperatura, humedad, velocidad, presión, etc.). Para estudiar la manera en que influye cada factor sobre la variable de respuesta es necesario elegir al menos dos niveles de prueba para cada uno de ellos. Con el diseño factorial completo se corren aleatoriamente todas las posibles combinaciones que pueden formarse con los niveles de los factores a investigar.
{width=20%}
Se corre un diseño factorial 3 × 2 con 10 réplicas para investigar el hinchamiento del catalizador después de la extrusión en la fabricación de botellas de polietileno de alta densidad. El catalizador se utiliza en la obtención de dicho polietileno. Los factores investigados son: molde (con dos niveles) y B: catalizador (con tres niveles). Los datos obtenidos se muestran en la siguiente tabla:
Cuadro c5 p19.
Hipótesis:
Ho : Efecto de Molde (A) = 0 HA : Efecto de Molde (A) ≠ 0
Ho : Efecto de Catalizador (B) = 0 HA : Efecto de Catalizador (B) ≠ 0
## Molde Catalizador Y
## 1 -1 -1 93
## 2 -1 -1 92
## 3 -1 -1 90
## 4 -1 -1 91
## 5 -1 -1 92
## 6 -1 -1 91
## 7 -1 -1 90
## 8 -1 -1 91
## 9 -1 -1 93
## 10 -1 -1 90
## 11 1 -1 88
## 12 1 -1 88
## 13 1 -1 87
## 14 1 -1 87
## 15 1 -1 88
## 16 1 -1 87
## 17 1 -1 87
## 18 1 -1 87
## 19 1 -1 87
## 20 1 -1 88
## 21 -1 0 92
## 22 -1 0 94
## 23 -1 0 90
## 24 -1 0 91
## 25 -1 0 90
## 26 -1 0 91
## 27 -1 0 92
## 28 -1 0 92
## 29 -1 0 92
## 30 -1 0 91
## 31 1 0 90
## 32 1 0 88
## 33 1 0 88
## 34 1 0 88
## 35 1 0 89
## 36 1 0 90
## 37 1 0 89
## 38 1 0 88
## 39 1 0 88
## 40 1 0 89
## 41 -1 1 95
## 42 -1 1 94
## 43 -1 1 94
## 44 -1 1 94
## 45 -1 1 94
## 46 -1 1 97
## 47 -1 1 95
## 48 -1 1 96
## 49 -1 1 94
## 50 -1 1 96
## 51 1 1 91
## 52 1 1 90
## 53 1 1 92
## 54 1 1 90
## 55 1 1 97
## 56 1 1 89
## 57 1 1 90
## 58 1 1 91
## 59 1 1 91
## 60 1 1 91
## 'data.frame': 60 obs. of 3 variables:
## $ Molde : int -1 -1 -1 -1 -1 -1 -1 -1 -1 -1 ...
## $ Catalizador: int -1 -1 -1 -1 -1 -1 -1 -1 -1 -1 ...
## $ Y : int 93 92 90 91 92 91 90 91 93 90 ...
modelo=aov(Y~Molde+Catalizador,data=df)
summary(modelo)## Df Sum Sq Mean Sq F value Pr(>F)
## Molde 1 180.27 180.27 110.89 6.79e-15 ***
## Catalizador 2 153.03 76.52 47.07 1.02e-12 ***
## Residuals 56 91.03 1.63
## ---
## Signif. codes: 0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
Ambos efectos el molde y el catalizador están activos
boxplot(Y~Molde,data=df,col='blue')boxplot(Y~Catalizador,data=df,col='orange')boxplot(Y~Molde*Catalizador,data=df,col='yellow')interaction.plot(df$Molde,df$Catalizador,df$Y,col=1:3)tk=TukeyHSD(modelo)
tk## Tukey multiple comparisons of means
## 95% family-wise confidence level
##
## Fit: aov(formula = Y ~ Molde + Catalizador, data = df)
##
## $Molde
## diff lwr upr p adj
## 1--1 -3.466667 -4.126135 -2.807199 0
##
## $Catalizador
## diff lwr upr p adj
## 0--1 0.75 -0.2206975 1.720698 0.1598613
## 1--1 3.70 2.7293025 4.670698 0.0000000
## 1-0 2.95 1.9793025 3.920698 0.0000000
plot(tk)qqnorm(modelo$residuals)
qqline(modelo$residuals,col='red')shapiro.test(modelo$residuals)##
## Shapiro-Wilk normality test
##
## data: modelo$residuals
## W = 0.87917, p-value = 2.485e-05
require(car)
leveneTest(Y~Molde,data=df)## Levene's Test for Homogeneity of Variance (center = median)
## Df F value Pr(>F)
## group 1 0.1322 0.7175
## 58
leveneTest(Y~Catalizador,data=df)## Levene's Test for Homogeneity of Variance (center = median)
## Df F value Pr(>F)
## group 2 2.0397 0.1394
## 57
ambos la p > 0.05, nos indica que hay varianzas constantes.
plot(modelo$residuals)
abline(h=0,col='red')• Ambos efectos el molde y el catalizador están activos. • El mejor tratamiento sería Molde A1 y el Catalizador B3, con un hinchamiento predicho de 94.9. • En la prueba Shapiro con un valor p = 2.485e-05 (p<0.05), se rechaza Ho, por lo que se concluye que los datos no se distribuyen de forma normal. • En el leveneTest para catalizadores y moldes, en ambos la p > 0.05, nos indica que hay varianzas constantes. • Observando la gráfica de residuos contra factores, pareciera que la dispersión es menor en el molde B.
Adhesivo.
Para mejorar la resistencia a la torsión de las adhesiones de componentes electrónicos sobre placas, se estudiaron dos tipos de pegamentos (A1 y A2) y tres temperaturas de curado (60, 80 y 100°C). En cada combinación se analizaron dos componentes y los resultados obtenidos son los siguientes:
a) Plantee las hipótesis de interés en este problema y el modelo estadístico correspondiente. b) Construya el ANOVA y decida cuáles efectos están activos. c) Dibuje las gráficas de efectos y determine con ellas el mejor tratamiento. d) Estime la resistencia a la torsión en el mejor tratamiento. e) Verifique residuos.
FACTOR A: Pegamento 𝐻0: 𝜇A1=𝜇A2 𝐻𝐴: 𝜇A1≠𝜇A2
FACTOR B: Temperatura de curado 𝐻0: 𝜇60=𝜇80 =𝜇100 𝐻𝐴: 𝜇60≠𝜇80 ≠𝜇100
INTERACCIÓN 𝐻0: 𝜇AB = 0 𝐻𝐴: 𝜇AB ≠ 0
## Pegamento Temperatura Y
## 1 A1 60 2.50
## 2 A1 80 3.80
## 3 A1 100 4.00
## 4 A1 60 2.80
## 5 A1 80 3.40
## 6 A1 100 4.20
## 7 A2 60 1.60
## 8 A2 80 3.20
## 9 A2 100 4.30
## 10 A2 60 1.22
## 11 A2 80 2.80
## 12 A2 100 4.70
## 'data.frame': 12 obs. of 3 variables:
## $ Pegamento : chr "A1" "A1" "A1" "A1" ...
## $ Temperatura: int 60 80 100 60 80 100 60 80 100 60 ...
## $ Y : num 2.5 3.8 4 2.8 3.4 4.2 1.6 3.2 4.3 1.22 ...
modelo=aov(Y~Pegamento+Temperatura,data=df)
summary(modelo)## Df Sum Sq Mean Sq F value Pr(>F)
## Pegamento 1 0.691 0.691 3.171 0.112807
## Temperatura 2 10.354 5.177 23.754 0.000431 ***
## Residuals 8 1.744 0.218
## ---
## Signif. codes: 0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
boxplot(Y~Temperatura,data=df,main="Resistencia a la torsión de las adhesiones",col='yellow')tk=TukeyHSD(modelo)
tk$Trat## NULL
qqnorm(modelo$residuals)
qqline(modelo$residuals,col='red')shapiro.test(modelo$residuals)##
## Shapiro-Wilk normality test
##
## data: modelo$residuals
## W = 0.94809, p-value = 0.6092
Se ha demostrado estadísticamente (P < 0,05) que los pegamentos tienen una influencia significativa en la resistencia a la torsión de las adhesiones componentes electrónicos sobre placas, es decir las medias son diferentes.
FACTOR B: Temperatura de curado Como en P valor < 0,05; entonces se rechaza la hipótesis nula, concluyendo que las medias de resistencia a la torsión de las adhesiones de componentes electrónicos sobre placas son diferentes.
INTERACCIÓN:
No existe interacción (AB) con un nivel de confianza del 95% sobre la media de resistencia a la torsión de las adhesiones de componentes electrónicos sobre placas.
● El factor (Pegamentos) tiene un efecto negativo en la variable de respuesta (resistencia a la torsión de componentes). ● El factor (temperaturas) tiene un efecto negativo en la variable de respuesta (resistencia a la torsión de componentes). ● La interacción AB existe.
Caucho vulcanizado.
Se desea investigar de qué manera afecta el tiempo de curado y el tipo del acelerante a la resistencia de caucho vulcanizado. Se realiza un experimento y se obtienen los siguientes datos:
Cuadro c5p21.
## ACELERANTE TIEMPO.DE.CURA Y
## 1 -1 -1 3900
## 2 -1 -1 3600
## 3 -1 0 4100
## 4 -1 0 3500
## 5 -1 1 4000
## 6 -1 1 3800
## 7 0 -1 4300
## 8 0 -1 3700
## 9 0 0 4200
## 10 0 0 3900
## 11 0 1 4300
## 12 0 1 3600
## 13 1 -1 3700
## 14 1 -1 4100
## 15 1 0 3900
## 16 1 0 4000
## 17 1 1 3600
## 18 1 1 3800
## 'data.frame': 18 obs. of 3 variables:
## $ ACELERANTE : int -1 -1 -1 -1 -1 -1 0 0 0 0 ...
## $ TIEMPO.DE.CURA: int -1 -1 0 0 1 1 -1 -1 0 0 ...
## $ Y : int 3900 3600 4100 3500 4000 3800 4300 3700 4200 3900 ...
modelo=aov(Y~ACELERANTE+TIEMPO.DE.CURA,data=df)
summary(modelo)## Df Sum Sq Mean Sq F value Pr(>F)
## ACELERANTE 2 114444 57222 0.825 0.46
## TIEMPO.DE.CURA 2 21111 10556 0.152 0.86
## Residuals 13 902222 69402
El p_valor= 0.46 y 0.86 sugiere que no hay diferencia significativa entre los acelerantes y el tiempo de curado a las resistencia de caucho volcanico.
boxplot(Y~TIEMPO.DE.CURA,data=df,col='blue')boxplot(Y~ACELERANTE,data=df,col='pink')boxplot(Y~ACELERANTE*TIEMPO.DE.CURA,data=df,col='green')interaction.plot(df$ACELERANTE,df$TIEMPO.DE.CURA,df$Y,col = 1:3)1- No existe diferencia en las graficas de tiempo de curado y acelerante -1 y 1, pero si hay diferencia significativa en el tiempo de curado y acelerante 0.
2- En la grafica de comparacion del acelerantes y tiempo de curado señala que son diferentes los valores.
3- No existe interaccion entre los experimentos 0 y -1.
tk=TukeyHSD(modelo)
tk## Tukey multiple comparisons of means
## 95% family-wise confidence level
##
## Fit: aov(formula = Y ~ ACELERANTE + TIEMPO.DE.CURA, data = df)
##
## $ACELERANTE
## diff lwr upr p adj
## 0--1 183.33333 -218.2728 584.9394 0.4708685
## 1--1 33.33333 -368.2728 434.9394 0.9739228
## 1-0 -150.00000 -551.6061 251.6061 0.5979909
##
## $TIEMPO.DE.CURA
## diff lwr upr p adj
## 0--1 50.00000 -351.6061 451.6061 0.9424302
## 1--1 -33.33333 -434.9394 368.2728 0.9739228
## 1-0 -83.33333 -484.9394 318.2728 0.8493245
Al comparar las medias de los diferentes valores obtenemos p_valores > 0.05 por lo que no existe diferencias significativas en entre las medias de los acelerantes y el tiempo de curado de los experimantos
qqnorm(modelo$residuals)
qqline(modelo$residuals, col='purple')shapiro.test(modelo$residuals)##
## Shapiro-Wilk normality test
##
## data: modelo$residuals
## W = 0.94083, p-value = 0.2994
La prueba de Shapiro Wilks arroja un valor de p=0.2994 por lo que se acepta la Ho.
require(car)
leveneTest(Y~ACELERANTE,data=df)## Levene's Test for Homogeneity of Variance (center = median)
## Df F value Pr(>F)
## group 2 1.789 0.201
## 15
leveneTest(Y~TIEMPO.DE.CURA,data=df)## Levene's Test for Homogeneity of Variance (center = median)
## Df F value Pr(>F)
## group 2 0.1373 0.8728
## 15
La prueba de levene indica que las varianzas son iguales a un nivel de significancia de 95%.
plot(modelo$residuals)
abline(h=0,col='red')En la tabla demuestra que los modelos residuales de los experiementos son diferentes a la linea 0 estan bastante dispersos..
Este problema se realizo bajo un diseño factorial 3x3 con dos factores. Las hipotesis estadisticas tanto de los acelerantes y la del tiempo de curado demostraron que existe diferencias en ambas graficas de los datos por lo que se desaprueba la Ho y se aprueba la Ha.
Se comprobo que el mejor tiempo curado a 14ºC de 60 minutos tiene un mayor afecto para aumentar la resistencia de caucho volcanico.En cuanto a los acelerante se comprobo que el acelerante B mostro un mayor efecto para el mejoramiento de la resistencia del caucho volcanico.
Se demostro que la combinacion de tiempo de curado a 14ºc de 60 minutos y acelerante B muestra una mejor resistencia al caucho vulcanizado.
Mediante la prueba de shapiro winks se obtuvo un valor p_valor de 0.2994 lo que significa que se acepta la Ho.