Diseno Experimental
diseno por bloques aleatorizados se utiliza cuando se quieren comparar ciertos tratamientos o estudiar el efecto de un factor, es deseable que las posibles diferencias se deban principalmente al factor de interés y no a otros factores que no se consideran en el estudio. Los factores de bloque son las variables adicionales al factor de interés que se incorporan de manera explicita en un experimento comparativo para no sesgar la comparación.
Detergente
Se diseña un experimento para estudiar el rendimiento de cuatro detergentes. Las siguientes lecturas de “blancura” se obtuvieron con un equipo especial diseñado para 12 cargas de lavado, distribuidas en tres modelos de lavadoras:
Experimento
## Var1 Var2 Y
## 1 A 1 45
## 2 B 1 47
## 3 C 1 50
## 4 D 1 42
## 5 A 2 43
## 6 B 2 44
## 7 C 2 49
## 8 D 2 37
## 9 A 3 51
## 10 B 3 52
## 11 C 3 57
## 12 D 3 49
## Detergente Lavadora Y
## 1 A 1 45
## 2 B 1 47
## 3 C 1 50
## 4 D 1 42
## 5 A 2 43
## 6 B 2 44
## 7 C 2 49
## 8 D 2 37
## 9 A 3 51
## 10 B 3 52
## 11 C 3 57
## 12 D 3 49
## 'data.frame': 12 obs. of 3 variables:
## $ Detergente: Factor w/ 4 levels "A","B","C","D": 1 2 3 4 1 2 3 4 1 2 ...
## $ Lavadora : Factor w/ 3 levels "1","2","3": 1 1 1 1 2 2 2 2 3 3 ...
## $ Y : num 45 47 50 42 43 44 49 37 51 52 ...
## - attr(*, "out.attrs")=List of 2
## ..$ dim : int [1:2] 4 3
## ..$ dimnames:List of 2
## .. ..$ Var1: chr [1:4] "Var1=A" "Var1=B" "Var1=C" "Var1=D"
## .. ..$ Var2: chr [1:3] "Var2=1" "Var2=2" "Var2=3"
En este experimento los datos son:
La Variable de respuesta: Blancura
El Factor controlado: Tipo de detergente
Bloque: Tipo de lavadora
Hipótesis: Ho: no hay efecto del tipo de detergente en la blancura de la ropa Ha: si hay efecto del tipo de detergente en la blancura de la ropa
modelo=aov(Y~Detergente+Lavadora,data=df)
summary(modelo)
## Df Sum Sq Mean Sq F value Pr(>F)
## Detergente 3 133.67 44.56 34.13 0.000363 ***
## Lavadora 2 170.17 85.08 65.17 8.52e-05 ***
## Residuals 6 7.83 1.31
## ---
## Signif. codes: 0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
El valor de p para el detergente es de 0.000363, el cual es menor que el alfa=0.05, nivel de confianza dado, se puede concluir que si existen diferencias significativas entre los tipos de detergentes. Se rechaza la Ho hipotesis nula.
boxplot(Y~Detergente,data=df)
boxplot(Y~Lavadora,data=df)
boxplot(Y~Detergente*Lavadora,data=df)
Se puede establecer que en promedio el detergente C es mejor, ya que presenta el mejor promedio de los 4 tipos de detergentes.
tk=TukeyHSD(modelo)
tk
## Tukey multiple comparisons of means
## 95% family-wise confidence level
##
## Fit: aov(formula = Y ~ Detergente + Lavadora, data = df)
##
## $Detergente
## diff lwr upr p adj
## B-A 1.333333 -1.896223 4.562890 0.5274327
## C-A 5.666667 2.437110 8.896223 0.0036708
## D-A -3.666667 -6.896223 -0.437110 0.0294779
## C-B 4.333333 1.103777 7.562890 0.0138544
## D-B -5.000000 -8.229557 -1.770443 0.0069284
## D-C -9.333333 -12.562890 -6.103777 0.0002417
##
## $Lavadora
## diff lwr upr p adj
## 2-1 -2.75 -5.229002 -0.270998 0.0332955
## 3-1 6.25 3.770998 8.729002 0.0005999
## 3-2 9.00 6.520998 11.479002 0.0000770
plot(tk)
Se observa en la prueba de comparaciones múltiples TukeyHSD que:
El detergente A no es diferente al detergente B
El detergente A es diferente al detergente C
Hay diferencias entre el detergente A y el detergente D
El detergente B es diferente al detergente C
El detergente B es diferente al detergente D
El detergente C es diferente al detergente D.
qqnorm(modelo$residuals)
qqline(modelo$residuals)
shapiro.test(modelo$residuals)
##
## Shapiro-Wilk normality test
##
## data: modelo$residuals
## W = 0.96851, p-value = 0.8946
En la gráfica se puede ver que la mayoría de los puntos se ajustan a la línea recta, lo que significa que los residuales si cumplen el supuesto de normalidad.
library("car")
## Loading required package: carData
leveneTest(Y~Detergente,data=df)
## Levene's Test for Homogeneity of Variance (center = median)
## Df F value Pr(>F)
## group 3 0.124 0.9433
## 8
plot(modelo$residuals)
abline(h=0)
plot(df$Detergente,modelo$residuals)
abline(h=0)
plot(modelo$fitted.values,modelo$residuals)
abline(h=0)
Si cumple el supuesto de independencia y varianza constante.
De acuerdo a los resultados anteriores podemos concluir que el detergente C es el que da mayor blancura, ya que presenta el mayor promedio que los otros tres.
Diseñado en el que se controlan dos factores de bloque y uno de tratamientos; los tres factores tienen la misma cantidad de niveles. Los tratamientos se representan por letras latinas y se distribuyen en forma adecuada en un cuadro.
Catalizadores
Se quiere estudiar el efecto de cinco diferentes catalizadores (A, B, C, D y E) sobre el tiempo de reacción de un proceso químico. Cada lote de material sólo permite cinco corridas y cada corrida requiere aproximadamente 1.5 horas, por lo que sólo se pueden realizar cinco corridas diarias. El experimentador decide correr los experimentos con un diseñadoo en cuadro latino para controlar activamente a los lotes y dáas. Los datos obtenidos son:
Experimento
## Var1 Var2 Trat Y
## 1 1 1 A 8
## 2 2 1 C 11
## 3 3 1 B 4
## 4 4 1 D 6
## 5 5 1 E 4
## 6 1 2 B 7
## 7 2 2 E 2
## 8 3 2 A 9
## 9 4 2 C 8
## 10 5 2 D 2
## 11 1 3 D 1
## 12 2 3 A 7
## 13 3 3 C 10
## 14 4 3 E 6
## 15 5 3 B 3
## 16 1 4 C 7
## 17 2 4 D 3
## 18 3 4 E 1
## 19 4 4 B 6
## 20 5 4 A 8
## 21 1 5 E 3
## 22 2 5 B 8
## 23 3 5 D 5
## 24 4 5 A 10
## 25 5 5 C 8
## Lote Dia Tratamiento Y
## 1 1 1 A 8
## 2 2 1 C 11
## 3 3 1 B 4
## 4 4 1 D 6
## 5 5 1 E 4
## 6 1 2 B 7
## 7 2 2 E 2
## 8 3 2 A 9
## 9 4 2 C 8
## 10 5 2 D 2
## 11 1 3 D 1
## 12 2 3 A 7
## 13 3 3 C 10
## 14 4 3 E 6
## 15 5 3 B 3
## 16 1 4 C 7
## 17 2 4 D 3
## 18 3 4 E 1
## 19 4 4 B 6
## 20 5 4 A 8
## 21 1 5 E 3
## 22 2 5 B 8
## 23 3 5 D 5
## 24 4 5 A 10
## 25 5 5 C 8
## 'data.frame': 25 obs. of 4 variables:
## $ Lote : Factor w/ 5 levels "1","2","3","4",..: 1 2 3 4 5 1 2 3 4 5 ...
## $ Dia : Factor w/ 5 levels "1","2","3","4",..: 1 1 1 1 1 2 2 2 2 2 ...
## $ Tratamiento: Factor w/ 5 levels "A","B","C","D",..: 1 3 2 4 5 2 5 1 3 4 ...
## $ Y : num 8 11 4 6 4 7 2 9 8 2 ...
## - attr(*, "out.attrs")=List of 2
## ..$ dim : int [1:2] 5 5
## ..$ dimnames:List of 2
## .. ..$ Var1: chr [1:5] "Var1=1" "Var1=2" "Var1=3" "Var1=4" ...
## .. ..$ Var2: chr [1:5] "Var2=1" "Var2=2" "Var2=3" "Var2=4" ...
En este experimento los datos son:
La Variable de respuesta: Tiempo de reacción
El Factor controlado: Día
Bloque: Catalizador y lote
Hipotesis H0= no existe efecto de los catalizadores sobre el tiempo de reacción del proceso químico Ha= existe efecto de los catalizadores sobre el tiempo de reacción del proceso químico
modelo=aov(Y~Lote+Dia+Tratamiento,data=df)
summary(modelo)
## Df Sum Sq Mean Sq F value Pr(>F)
## Lote 4 15.44 3.86 1.235 0.347618
## Dia 4 12.24 3.06 0.979 0.455014
## Tratamiento 4 141.44 35.36 11.309 0.000488 ***
## Residuals 12 37.52 3.13
## ---
## Signif. codes: 0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
El valor de p para el detergente es de p=0.000488***, el cual es menor que el alfa=0.05, nivel de confianza dado, se puede concluir que si existen diferencias significativas entre los catalizadores. Se rechaza la Ho hipotesis nula.
boxplot(Y~Tratamiento,data=df)
tk=TukeyHSD(modelo)
tk$Tratamiento
## diff lwr upr p adj
## B-A -2.8 -6.3646078 0.7646078 0.153943335
## C-A 0.4 -3.1646078 3.9646078 0.996001220
## D-A -5.0 -8.5646078 -1.4353922 0.005586216
## E-A -5.2 -8.7646078 -1.6353922 0.004143094
## C-B 3.2 -0.3646078 6.7646078 0.086435305
## D-B -2.2 -5.7646078 1.3646078 0.336581142
## E-B -2.4 -5.9646078 1.1646078 0.263155088
## D-C -5.4 -8.9646078 -1.8353922 0.003082228
## E-C -5.6 -9.1646078 -2.0353922 0.002300665
## E-D -0.2 -3.7646078 3.3646078 0.999734935
plot(tk)
Existe diferencia significativa entre los catalizadores D-A,E-A,D-C,E-C.
qqnorm(modelo$residuals)
qqline(modelo$residuals)
shapiro.test(modelo$residuals)
##
## Shapiro-Wilk normality test
##
## data: modelo$residuals
## W = 0.96606, p-value = 0.5476
En la gráfica se puede ver que la mayoría de los puntos se ajustan a la línea recta, lo que significa que los residuales si cumplen el supuesto de normalidad.
library("car")
leveneTest(Y~Tratamiento,data=df)
## Levene's Test for Homogeneity of Variance (center = median)
## Df F value Pr(>F)
## group 4 0.4444 0.7751
## 20
Hay igualdad de varianza p>0.05
plot(modelo$residuals)
abline(h=0)
plot(df$Tratamiento,modelo$residuals)
abline(h=0)
plot(modelo$fitted.values, modelo$residuals)
abline(h=0)
Si cumple el supuesto de independencia y varianza constante.
Desde el punto de vista estadístico, hay diferencia de media entre los catalizadores D-C,E-C; aceptamos que la distribución es normal. Gráficamente se aprecia que el catalizador E es el más efectivo, por su pronta respuesta.
Gramaje
Se comprueba el peso en gramos de un material de tres proveedores: A, B y C, por tres diferentes inspectores: I, II y III, utilizando tres diferentes escalas: 1, 2 y 3. El experimento se lleva a cabo como el siguiente cuadro latino:
### LECTURA DE DATOS
## Var1 Var2 Trat Y
## 1 1 1 A 16
## 2 2 1 B 15
## 3 3 1 C 13
## 4 1 2 B 10
## 5 2 2 C 9
## 6 3 2 A 11
## 7 1 3 C 11
## 8 2 3 A 14
## 9 3 3 B 13
## Inspector Escala Trat Y
## 1 1 1 A 16
## 2 2 1 B 15
## 3 3 1 C 13
## 4 1 2 B 10
## 5 2 2 C 9
## 6 3 2 A 11
## 7 1 3 C 11
## 8 2 3 A 14
## 9 3 3 B 13
## 'data.frame': 9 obs. of 4 variables:
## $ Inspector: int 1 2 3 1 2 3 1 2 3
## $ Escala : int 1 1 1 2 2 2 3 3 3
## $ Trat : chr "A" "B" "C" "B" ...
## $ Y : num 16 15 13 10 9 11 11 14 13
## - attr(*, "out.attrs")=List of 2
## ..$ dim : int [1:2] 3 3
## ..$ dimnames:List of 2
## .. ..$ Var1: chr [1:3] "Var1=1" "Var1=2" "Var1=3"
## .. ..$ Var2: chr [1:3] "Var2=1" "Var2=2" "Var2=3"
## 'data.frame': 9 obs. of 4 variables:
## $ Inspector: Factor w/ 3 levels "1","2","3": 1 2 3 1 2 3 1 2 3
## $ Escala : Factor w/ 3 levels "1","2","3": 1 1 1 2 2 2 3 3 3
## $ Trat : Factor w/ 3 levels "A","B","C": 1 2 3 2 3 1 3 1 2
## $ Y : num 16 15 13 10 9 11 11 14 13
## - attr(*, "out.attrs")=List of 2
## ..$ dim : int [1:2] 3 3
## ..$ dimnames:List of 2
## .. ..$ Var1: chr [1:3] "Var1=1" "Var1=2" "Var1=3"
## .. ..$ Var2: chr [1:3] "Var2=1" "Var2=2" "Var2=3"
Hipotesis H0= no existe diferencia entre los proveedores. Ha= existe diferencia entre los proveedores.
modelo=aov(Y~Inspector+Escala+Trat,data=df)
summary(modelo)
## Df Sum Sq Mean Sq F value Pr(>F)
## Inspector 2 0.22 0.111 1 0.50000
## Escala 2 32.89 16.444 148 0.00671 **
## Trat 2 10.89 5.444 49 0.02000 *
## Residuals 2 0.22 0.111
## ---
## Signif. codes: 0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
En el análisis de ANOVA , con un valor p = 0.02000 * (p < 0.05)para los proveedores, se rechaza Ho, concluyendo que hay diferencia significativa en al menos 1 proveedor.En el análisis de ANOVA , con un valor p = 0.50000 para los inspectores, se acepta Ho,concluyendo que no hay diferencia significativa entre los instructores. Entre las escalas con un valor p = 0.00671 ** (p < 0.05), se rechaza Ho, concluyendo que hay diferencias significativas en al menos 1 escala
boxplot(Y~Escala,data = df)
boxplot(Y~Trat,data = df)
boxplot(Y~Inspector,data = df)
El proveedor A, es el mejor proveedor porque es el que más se acerca al peso esperado de 15g.
tk=TukeyHSD(modelo)
tk
## Tukey multiple comparisons of means
## 95% family-wise confidence level
##
## Fit: aov(formula = Y ~ Inspector + Escala + Trat, data = df)
##
## $Inspector
## diff lwr upr p adj
## 2-1 3.333333e-01 -1.269927 1.936593 0.548184
## 3-1 1.776357e-15 -1.603260 1.603260 1.000000
## 3-2 -3.333333e-01 -1.936593 1.269927 0.548184
##
## $Escala
## diff lwr upr p adj
## 2-1 -4.666667 -6.269927 -3.0634068 0.0061007
## 3-1 -2.000000 -3.603260 -0.3967402 0.0327189
## 3-2 2.666667 1.063407 4.2699265 0.0186734
##
## $Trat
## diff lwr upr p adj
## B-A -1.000000 -2.603260 0.60325985 0.1191149
## C-A -2.666667 -4.269927 -1.06340682 0.0186734
## C-B -1.666667 -3.269927 -0.06340682 0.0464424
plot(tk)
qqnorm(modelo$residuals)
qqline(modelo$residuals)
shapiro.test(modelo$residuals)
##
## Shapiro-Wilk normality test
##
## data: modelo$residuals
## W = 0.61728, p-value = 0.0001526
library("car")
leveneTest(Y~Trat,data=df)
## Levene's Test for Homogeneity of Variance (center = median)
## Df F value Pr(>F)
## group 2 0.0556 0.9464
## 6
leveneTest(Y~Escala,data=df)
## Levene's Test for Homogeneity of Variance (center = median)
## Df F value Pr(>F)
## group 2 0.1429 0.8697
## 6
Se elimina el factor de bloque de los inspectores, ya que se concluyó que no tiene efecto en la variable respuesta, al tener una p < 0.05 por lo tanto no hay diferencia significativa. Al hacer los análisis nuevamente se observó que las escalas y los proveedores seguian teniendo diferencia significativa, pero con un mayor grado de significancia.
plot(modelo$residuals)
abline(h=0)
Es importante tomar en cuenta que los datos no cumplen con los supuestos de normalidad e independencia de la ANOVA, por lo que el estudio no es reproducible.
Diseño experimental que sirve para estudiar el efecto individual y de interacción de varios factores sobre una o varias respuestas. Efecto de un factor: es el cambio observado en la variable de respuesta debido a un cambio de nivel en el factor. Efecto de interacción: dos factores interactúan de manera significativa sobre la variable de respuesta cuando el efecto de uno depende del nivel en que está el otro.
BotellasPET
Se corre un diseñoo factorial 3 x 2 con 10 réplicas para investigar el hinchamiento del catalizador después de la extrusión en la fabricación de botellas de polietileno de alta densidad. El catalizador se utiliza en la obtención de dicho polietileno. Los factores investigados son: molde (con dos niveles) y B: catalizador (con tres niveles). Los datos obtenidos se muestran en la siguiente tabla:
Experimento
## Molde Catalizador Y
## 1 -1 -1 93
## 2 -1 -1 92
## 3 -1 -1 90
## 4 -1 -1 91
## 5 -1 -1 92
## 6 -1 -1 91
## 7 -1 -1 90
## 8 -1 -1 91
## 9 -1 -1 93
## 10 -1 -1 90
## 11 1 -1 88
## 12 1 -1 88
## 13 1 -1 87
## 14 1 -1 87
## 15 1 -1 88
## 16 1 -1 87
## 17 1 -1 87
## 18 1 -1 87
## 19 1 -1 87
## 20 1 -1 88
## 21 -1 0 92
## 22 -1 0 94
## 23 -1 0 90
## 24 -1 0 91
## 25 -1 0 90
## 26 -1 0 91
## 27 -1 0 92
## 28 -1 0 92
## 29 -1 0 92
## 30 -1 0 91
## 31 1 0 90
## 32 1 0 88
## 33 1 0 88
## 34 1 0 88
## 35 1 0 89
## 36 1 0 90
## 37 1 0 89
## 38 1 0 88
## 39 1 0 88
## 40 1 0 89
## 41 -1 1 95
## 42 -1 1 94
## 43 -1 1 94
## 44 -1 1 94
## 45 -1 1 94
## 46 -1 1 97
## 47 -1 1 95
## 48 -1 1 96
## 49 -1 1 94
## 50 -1 1 96
## 51 1 1 91
## 52 1 1 90
## 53 1 1 92
## 54 1 1 90
## 55 1 1 97
## 56 1 1 89
## 57 1 1 90
## 58 1 1 91
## 59 1 1 91
## 60 1 1 91
## 'data.frame': 60 obs. of 3 variables:
## $ Molde : int -1 -1 -1 -1 -1 -1 -1 -1 -1 -1 ...
## $ Catalizador: int -1 -1 -1 -1 -1 -1 -1 -1 -1 -1 ...
## $ Y : int 93 92 90 91 92 91 90 91 93 90 ...
## 'data.frame': 60 obs. of 3 variables:
## $ Molde : Factor w/ 2 levels "-1","1": 1 1 1 1 1 1 1 1 1 1 ...
## $ Catalizador: Factor w/ 3 levels "-1","0","1": 1 1 1 1 1 1 1 1 1 1 ...
## $ Y : int 93 92 90 91 92 91 90 91 93 90 ...
Hipótesis de este experimento Ho : Efecto de Molde (A) = 0 HA : Efecto de Molde (A) NO ES = 0
Estas hipótesis se prueban mediante la técnica de análisis de varianza (modelo estadístico: ANOVA), para un diseño factorial a 3x2 con n replicas.
modelo=aov(Y~Molde+Catalizador,data=df)
summary(modelo)
## Df Sum Sq Mean Sq F value Pr(>F)
## Molde 1 180.27 180.27 110.89 6.79e-15 ***
## Catalizador 2 153.03 76.52 47.07 1.02e-12 ***
## Residuals 56 91.03 1.63
## ---
## Signif. codes: 0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
De acuerdo valor p que es menor al nivel de significancia, ambos efectos se encuentran activos. Molde p valor 6.79e-15; Catalizador p valor 1.02e-12. Ambos efectos el molde y el catalizador están activos.
boxplot(Y~Molde,data=df)
boxplot(Y~Catalizador,data=df)
boxplot(Y~Molde*Catalizador,data=df)
interaction.plot(df$Molde,df$Catalizador,df$Y)
El mejor tratamiento será Molde A1 y el Catalizador B3, con un hinchamiento predicho de 94.9.
tk=TukeyHSD(modelo)
tk
## Tukey multiple comparisons of means
## 95% family-wise confidence level
##
## Fit: aov(formula = Y ~ Molde + Catalizador, data = df)
##
## $Molde
## diff lwr upr p adj
## 1--1 -3.466667 -4.126135 -2.807199 0
##
## $Catalizador
## diff lwr upr p adj
## 0--1 0.75 -0.2206975 1.720698 0.1598613
## 1--1 3.70 2.7293025 4.670698 0.0000000
## 1-0 2.95 1.9793025 3.920698 0.0000000
plot(tk)
qqnorm(modelo$residuals)
qqline(modelo$residuals)
shapiro.test(modelo$residuals)
##
## Shapiro-Wilk normality test
##
## data: modelo$residuals
## W = 0.87917, p-value = 2.485e-05
En la prueba Shapiro con un valor p = 2.485e-05 (p<0.05), se rechaza Ho, por lo que se concluye que los datos no se distribuyen de forma normal
require(car)
leveneTest(Y~Molde,data=df)
## Levene's Test for Homogeneity of Variance (center = median)
## Df F value Pr(>F)
## group 1 0.1322 0.7175
## 58
leveneTest(Y~Catalizador,data=df)
## Levene's Test for Homogeneity of Variance (center = median)
## Df F value Pr(>F)
## group 2 2.0397 0.1394
## 57
En el leveneTest para catalizadores y moldes, en ambos la p > 0.05, nos indica que hay varianzas constantes.
plot(modelo$residuals)
abline(h=0)
Observando la gráfica de residuos contra factores, pareciera que la dispersión es menor en el molde B.
El mejor tratamiento, es el catalizador B3 y molde A1. Ambos efectos se encuentran activos. Molde p valor 6.79e-15; Catalizador p valor 1.02e-12.De acuerdo a la gráfica el supuesto de varianza constante no se cumple ya que los puntos no se encuentran dispersos aleatoriamente sobre la línea horizontal.
Adhesivo eléctrico
Para mejorar la resistencia a la torsión de las adhesiones de componentes electrónicos sobre placas, se estudiaron dos tipos de pegamentos (A1 y A2) y tres temperaturas de curado (60, 80 y 100°C). En cada combinación se analizaron dos componentes y los resultados obtenidos son los siguientes:
Experimento
## Pegamento Temperatura Y
## 1 A1 60 2.50
## 2 A1 60 2.80
## 3 A1 80 3.80
## 4 A1 80 3.40
## 5 A1 100 4.00
## 6 A1 100 4.20
## 7 A2 60 1.60
## 8 A2 60 1.22
## 9 A2 80 3.20
## 10 A2 80 2.80
## 11 A2 100 4.30
## 12 A2 100 4.70
## 'data.frame': 12 obs. of 3 variables:
## $ Pegamento : chr "A1" "A1" "A1" "A1" ...
## $ Temperatura: int 60 60 80 80 100 100 60 60 80 80 ...
## $ Y : num 2.5 2.8 3.8 3.4 4 4.2 1.6 1.22 3.2 2.8 ...
## 'data.frame': 12 obs. of 3 variables:
## $ Pegamento : Factor w/ 2 levels "A1","A2": 1 1 1 1 1 1 2 2 2 2 ...
## $ Temperatura: Factor w/ 3 levels "60","80","100": 1 1 2 2 3 3 1 1 2 2 ...
## $ Y : num 2.5 2.8 3.8 3.4 4 4.2 1.6 1.22 3.2 2.8 ...
En este experimento la hipótesis son: * FACTOR A: Pegamento H0= la media del pegamento A1 es Igual pegamento A2 Ha= la media del pegamento A1 no es igual pegamente A2
FACTOR B: Temperatura de curado H0= la medias de la temperaturas son iguales Ha= las medias de las temperaturas no son iguales
INTERACCIÓN H0= LA TEMPERATURA Y EL TIPO DE PEGAMENT0 NO MEJORA LA RESISTENCIA DE TORSIÓN Ha= La TEMPERATUROA Y EL TIPO DE PEGAMENTO SI MEJORA LA RESISTENCIA DE TORSIÓN
modelo=aov(Y~Pegamento*Temperatura,data=df)
summary(modelo)
## Df Sum Sq Mean Sq F value Pr(>F)
## Pegamento 1 0.691 0.691 10.99 0.0161 *
## Temperatura 2 10.354 5.177 82.35 4.34e-05 ***
## Pegamento:Temperatura 2 1.366 0.683 10.87 0.0101 *
## Residuals 6 0.377 0.063
## ---
## Signif. codes: 0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
En el análisis de ANOVA , con un valor p = 4.34e-5 para la temperatura y 0.01 para el los pegamentos, se rechaza Ho, concluyendo que hay diferencia significativa.
boxplot(Y~Pegamento,data=df,main="Graficos de los pegamento")
boxplot(Y~Temperatura,data=df,main="Resistencia a la torsión de las adhesiones")
boxplot(Y~Pegamento*Temperatura,data=df,main="Graficos de las variables")
Según los graficos podemos concluir que no existe diferencia significtaivas entre los tipos de pegamentos, sin embargo si aumenta la resistencia a la torsión debido a al aumento de temperatura, siendo el pegamento A2 a temperatura de 100°C.
tk=TukeyHSD(modelo)
tk
## Tukey multiple comparisons of means
## 95% family-wise confidence level
##
## Fit: aov(formula = Y ~ Pegamento * Temperatura, data = df)
##
## $Pegamento
## diff lwr upr p adj
## A2-A1 -0.48 -0.8342158 -0.1257842 0.0160877
##
## $Temperatura
## diff lwr upr p adj
## 80-60 1.27 0.7260119 1.813988 0.0009122
## 100-60 2.27 1.7260119 2.813988 0.0000343
## 100-80 1.00 0.4560119 1.543988 0.0032134
##
## $`Pegamento:Temperatura`
## diff lwr upr p adj
## A2:60-A1:60 -1.24 -2.23787597 -0.242124 0.0188874
## A1:80-A1:60 0.95 -0.04787597 1.947876 0.0613074
## A2:80-A1:60 0.35 -0.64787597 1.347876 0.7301328
## A1:100-A1:60 1.45 0.45212403 2.447876 0.0088011
## A2:100-A1:60 1.85 0.85212403 2.847876 0.0024766
## A1:80-A2:60 2.19 1.19212403 3.187876 0.0009867
## A2:80-A2:60 1.59 0.59212403 2.587876 0.0055020
## A1:100-A2:60 2.69 1.69212403 3.687876 0.0003113
## A2:100-A2:60 3.09 2.09212403 4.087876 0.0001416
## A2:80-A1:80 -0.60 -1.59787597 0.397876 0.2878599
## A1:100-A1:80 0.50 -0.49787597 1.497876 0.4368423
## A2:100-A1:80 0.90 -0.09787597 1.897876 0.0761198
## A1:100-A2:80 1.10 0.10212403 2.097876 0.0327623
## A2:100-A2:80 1.50 0.50212403 2.497876 0.0074161
## A2:100-A1:100 0.40 -0.59787597 1.397876 0.6284243
plot(tk)
Prueba de Comparaciones Multiples: TukeyHSD: Al comparar las medias de los diferentes valores obtenemos valores En cuanto a la temperatura menores a 0,05 por lo cual debemos rechazar la H0. y podemos observar que existe difrencias significativas en los tratamientos A2:60-A1:60
A1:100-A1:60 A2:100-A1:60 A2:80-A2:60 A1:100-A2:60 A2:100-A2:60 A2:100-A2:80
qqnorm(modelo$residuals)
qqline(modelo$residuals)
shapiro.test(modelo$residuals)
##
## Shapiro-Wilk normality test
##
## data: modelo$residuals
## W = 0.77302, p-value = 0.004698
La prueba de normalidad de los datos refleja un valor de p menor a 0,05, de 0.004698, por lo cual la distribición de los datos no es normal
library(car)
leveneTest(Y~Temperatura,data=df)
## Levene's Test for Homogeneity of Variance (center = median)
## Df F value Pr(>F)
## group 2 4.4568 0.04516 *
## 9
## ---
## Signif. codes: 0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
leveneTest(Y~Pegamento,data=df)
## Levene's Test for Homogeneity of Variance (center = median)
## Df F value Pr(>F)
## group 1 2.7953 0.1255
## 10
La prueba de levene indica que las varianzas son iguales a un nivel de significancia de 95%, para el pegamento, sin embargo no son homegeneas en cuanto a la temperatura.
plot(modelo$residuals)
abline(h=0)
interaction.plot(df$Pegamento,df$Temperatura,df$Y,main="Interaccion entre las variables")
De acuerdo a la gráfica las pendientes son diferentes por lo tanto, los efectos se encuentran activos. El mejor tratamiento es el pegamento A1 a 100ºC;la resistencia estimada es de 4.5.
Se puede concluir que si se cumple el supuesto de independencia de normalidad y no varianza constante.Los efectos se encuentran activos, El mejor tratamietno es el pegamento A1 a 100ºC;la resistencia estimada es de 4.5. no cumple co el supuesto de varianza costante.
Caucho
Se desea investigar de qué manera afecta el tiempo de curado y el tipo del acelerante a la resistencia de caucho vulcanizado. Se realiza un experimento y se obtienen los siguientes dato
Experimento
## TIEMPO ACELERANTE Y
## 1 -1 -1 3900
## 2 -1 -1 3600
## 3 0 -1 4100
## 4 0 -1 3500
## 5 1 -1 4000
## 6 1 -1 3800
## 7 -1 0 4300
## 8 -1 0 3700
## 9 0 0 4200
## 10 0 0 3900
## 11 1 0 4300
## 12 1 0 3600
## 13 -1 1 3700
## 14 -1 1 4100
## 15 0 1 3900
## 16 0 1 4000
## 17 1 1 3600
## 18 1 1 3800
## 'data.frame': 18 obs. of 3 variables:
## $ TIEMPO : Factor w/ 3 levels "-1","0","1": 1 1 2 2 3 3 1 1 2 2 ...
## $ ACELERANTE: Factor w/ 3 levels "-1","0","1": 1 1 1 1 1 1 2 2 2 2 ...
## $ Y : int 3900 3600 4100 3500 4000 3800 4300 3700 4200 3900 ...
En este experimiento las hipótesis son: * H0: El tiempo de curado no afecta a la resistencia del caucho vulcanizado. * Ha : El tiempo de curado afecta a la resistencia del caucho vulcanizado. * H0: El tipo de acelerante no afecta a la resistencia del caucho vulcanizado. * Ha : El tipo de acelerante no afecta a la resistencia del caucho vulcanizado.
modelo=aov(Y~TIEMPO+ACELERANTE,data=df)
summary(modelo)
## Df Sum Sq Mean Sq F value Pr(>F)
## TIEMPO 2 21111 10556 0.152 0.86
## ACELERANTE 2 114444 57222 0.825 0.46
## Residuals 13 902222 69402
El análisis de la pruea de ANOVA, demuestra que p_valor= 0.86 y 0.46 sugiere que no hay diferencia significativa entre los acelerantes y el tiempo de curado a las resistencia de caucho vulcanico.Los valores no permite rechazar la hipótesis nula. * No existe tiempo de cura mejor ya que el análisis de ANOVA para las medias es mayor es de 0.86 siendo mayor a 0.05 donde no se rechaza la hipótesis nula * Entre los acelerantes no hay uno mejor ya que el análisis de anova para las medias es mayor es de 0.46 siendo mayor a 0.05 donde no se rechaza la hipótesis nula.
boxplot(Y~TIEMPO,data=df)
boxplot(Y~ACELERANTE,data =df)
boxplot(Y~TIEMPO+ACELERANTE,data=df)
interaction.plot(df$TIEMPO,df$ACELERANTE,df$Y)
Al realizar la gráfica de interacción podemos observar que la combinación del acelerante B con un tiempo de 60 minutos es el mejor aumentando la resistencia del caucho vulacanizado.
tk=TukeyHSD(modelo)
tk
## Tukey multiple comparisons of means
## 95% family-wise confidence level
##
## Fit: aov(formula = Y ~ TIEMPO + ACELERANTE, data = df)
##
## $TIEMPO
## diff lwr upr p adj
## 0--1 50.00000 -351.6061 451.6061 0.9424302
## 1--1 -33.33333 -434.9394 368.2728 0.9739228
## 1-0 -83.33333 -484.9394 318.2728 0.8493245
##
## $ACELERANTE
## diff lwr upr p adj
## 0--1 183.33333 -218.2728 584.9394 0.4708685
## 1--1 33.33333 -368.2728 434.9394 0.9739228
## 1-0 -150.00000 -551.6061 251.6061 0.5979909
plot(tk)
Prueba de Comparaciones Multiples: TukeyHSD: Al comparar las medias de los diferentes valores obtenemos valores > 0.05 por lo que no existe diferencias significativas en entre las medias de los acelerantes y el tiempo de curado de los experimentos.
qqnorm(modelo$residuals)
qqline(modelo$residuals)
shapiro.test(modelo$residuals)
##
## Shapiro-Wilk normality test
##
## data: modelo$residuals
## W = 0.94083, p-value = 0.2994
La prueba de Shapiro Wilks arroja un valor de p=0.2994 por lo que se acepta la Ho.
library("car")
leveneTest(Y~TIEMPO,data=df)
## Levene's Test for Homogeneity of Variance (center = median)
## Df F value Pr(>F)
## group 2 0.1373 0.8728
## 15
leveneTest(Y~ACELERANTE,data=df)
## Levene's Test for Homogeneity of Variance (center = median)
## Df F value Pr(>F)
## group 2 1.789 0.201
## 15
La prueba de levene indica que las varianzas son iguales a un nivel de significancia de 95%.
plot(modelo$residuals)
abline(h=0)
plot(df$TIEMPO,modelo$residuals)
abline(h=0)
Se puede concluir que si se cumple el supuesto de independencia normalidad y varianza constante.
El tiempo de curado a 40, 60 y 80 min no afecta al resistencia del caucho. Así como el tipo de acelerante A, B, C tampoco afecta a la resistencia del caucho. La mejor resistencia al caucho seria a un tiempo de 60 min con el acelerarte del tipo B.