En cualquier experimento, la variabilidad proveniente de un factor de ruido puede afectar los resultados. Un factor de ruido es un factor que probablemente tiene un efecto en la respuesta pero que no nos interesa estudiar.Si el factor de ruido es desconocido y no controlable, la solución es la aleatorización, que tiende a distribuir los niveles y efectos de este factor.Si el factor de ruido es conocido y no controlable, pero por lo menos podemos medir su valor en cada corrida del experimento, entonces podemos compensarlo usando análisis de varianza. Si el factor de ruido es conocido y controlable, se utilizan bloques para eliminar su efecto en la comparación estadística de los tratamientos.
Bloques al azar
El objetivo es tener comparaciones precisas entre los tratamientos bajo estudio. Utilizar bloques es una forma de dereducir y controlar la varianza del error experimental para tener mayor precisión.
Ensamble del brazo lector de disco duro
Una de las variables críticas en el proceso de ensamble del brazo lector de un disco duro es el ángulo que éste forma con el cuerpo principal de la cabeza lectora. Se corre un experimento con el objetivo de comparar dos equipos que miden dicho ángulo en unidades de radianes. Se decide utilizar como factor de bloque a los operadores de los equipos. Los resultados se muestran en la siguiente tabla:
Tabla Problema 14
Y=c(1.328,1.113,0.985,1.057,1.316,1.144,1.553,1.485,1.310,1.386,1.273,0.789,0.985,0.671,1.134,0.554,1.412,1.386,0.917,1.289,1.269,1.093,1.268,0.984,1.091,1.087,1.195,1.482,1.380,1.442,1.036,0.201,0.783,0.900,1.108,0.916,1.129,1.434,1.132,1.223,1.440,1.150,1.079,1.190,1.389,1.247,1.611,1.617,1.445,1.574,1.454,1.018,1.063,1.050,1.219,0.997,1.602,1.538,1.583,1.478)
df=expand.grid(1:10,1:2,1:3)
names(df)=c("Replica","Equipo","Operador")
df$Y=Y
df$Operador=factor(df$Operador)
df$Equipo=factor(df$Equipo)
df## Replica Equipo Operador Y
## 1 1 1 1 1.328
## 2 2 1 1 1.113
## 3 3 1 1 0.985
## 4 4 1 1 1.057
## 5 5 1 1 1.316
## 6 6 1 1 1.144
## 7 7 1 1 1.553
## 8 8 1 1 1.485
## 9 9 1 1 1.310
## 10 10 1 1 1.386
## 11 1 2 1 1.273
## 12 2 2 1 0.789
## 13 3 2 1 0.985
## 14 4 2 1 0.671
## 15 5 2 1 1.134
## 16 6 2 1 0.554
## 17 7 2 1 1.412
## 18 8 2 1 1.386
## 19 9 2 1 0.917
## 20 10 2 1 1.289
## 21 1 1 2 1.269
## 22 2 1 2 1.093
## 23 3 1 2 1.268
## 24 4 1 2 0.984
## 25 5 1 2 1.091
## 26 6 1 2 1.087
## 27 7 1 2 1.195
## 28 8 1 2 1.482
## 29 9 1 2 1.380
## 30 10 1 2 1.442
## 31 1 2 2 1.036
## 32 2 2 2 0.201
## 33 3 2 2 0.783
## 34 4 2 2 0.900
## 35 5 2 2 1.108
## 36 6 2 2 0.916
## 37 7 2 2 1.129
## 38 8 2 2 1.434
## 39 9 2 2 1.132
## 40 10 2 2 1.223
## 41 1 1 3 1.440
## 42 2 1 3 1.150
## 43 3 1 3 1.079
## 44 4 1 3 1.190
## 45 5 1 3 1.389
## 46 6 1 3 1.247
## 47 7 1 3 1.611
## 48 8 1 3 1.617
## 49 9 1 3 1.445
## 50 10 1 3 1.574
## 51 1 2 3 1.454
## 52 2 2 3 1.018
## 53 3 2 3 1.063
## 54 4 2 3 1.050
## 55 5 2 3 1.219
## 56 6 2 3 0.997
## 57 7 2 3 1.602
## 58 8 2 3 1.538
## 59 9 2 3 1.583
## 60 10 2 3 1.478
modelo=aov(Y~Equipo+Operador,data=df)
summary(modelo)## Df Sum Sq Mean Sq F value Pr(>F)
## Equipo 1 0.493 0.4925 8.090 0.00621 **
## Operador 2 0.589 0.2944 4.835 0.01156 *
## Residuals 56 3.409 0.0609
## ---
## Signif. codes: 0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
boxplot(Y~Equipo,data=df,main="Gráfica del equipo",col="pink")boxplot(Y~Operador,data=df,main="Gráfica de los Operadores",col="pink")boxplot(Y~Equipo*Operador,data=df,main="Gráfica de las Variables",col="pink")tk=TukeyHSD(modelo,col="6")
tk## Tukey multiple comparisons of means
## 95% family-wise confidence level
##
## Fit: aov(formula = Y ~ Equipo + Operador, data = df)
##
## $Equipo
## diff lwr upr p adj
## 2-1 -0.1812 -0.3088231 -0.05357689 0.0062055
##
## $Operador
## diff lwr upr p adj
## 2-1 -0.04670 -0.234553611 0.1411536 0.8214765
## 3-1 0.18285 -0.005003611 0.3707036 0.0580021
## 3-2 0.22955 0.041696389 0.4174036 0.0129494
qqnorm(modelo$residuals,main="Prueba normalidad de los Residuos",col="6")
qqline(modelo$residuals)shapiro.test(modelo$residuals)##
## Shapiro-Wilk normality test
##
## data: modelo$residuals
## W = 0.96139, p-value = 0.05502
require(car)## Loading required package: car
## Loading required package: carData
leveneTest(Y~Equipo,data=df)## Levene's Test for Homogeneity of Variance (center = median)
## Df F value Pr(>F)
## group 1 4.1246 0.04686 *
## 58
## ---
## Signif. codes: 0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
leveneTest(Y~Operador,data=df)## Levene's Test for Homogeneity of Variance (center = median)
## Df F value Pr(>F)
## group 2 0.1849 0.8316
## 57
plot(modelo$residuals,main="Gráfico de Independecia de los Residuos",col="6")
abline(h=0)a)Plantee el modelo y las hipótesis más adecuadas al problema.
Ho: μ1=μ2=μ3….μk=μ
Ha: μi≠μj para algún i ≠ j
b)¿Existen diferencias entre los equipos? Argumente estadísticamente.
Existe diferencia entre los equipos, al obtener un valor p = 0.006 (p < 0.05), se concluye que hay diferencia significativa entre ambos equipos.
c)¿Existen diferencias entre los operadores?
Existe diferencia significativa entre el operador 2 y el operador 3, con un valor p = 0.013 (p < 0.05)se rechaza Ho.
d)Dibuje los diagramas de cajas simultáneos y las gráficas de medias para ambos factores, después interprételas.
boxplot(Y~Equipo,data=df,main="Gráfica del equipo",col="pink")boxplot(Y~Operador,data=df,main="Gráfica de los Operadores",col="pink")boxplot(Y~Equipo*Operador,data=df,main="Gráfica de las Variables",col="pink") En la gráfica de las medias de los equipos y la gráfica de las medias de los operadores, todas las cajas se sobreponen lo que nos indica que no hay diferencia significativa entre ellas.
En la gráfica de cajas simultáneas se observa que todas se sobreponen, por lo que se concluye que los tratamientos son iguales.
e)Verifique los supuestos de normalidad e igualdad de varianza entre tratamientos, así como la posible presencia de puntos aberrantes.
En la prueba de Shapiro con un valor p = 0.016 se rezaha Ho, por lo que los datos no están distribuidos de manera norla. el el leveneTest para los equpos con un valor p=0.047 (p<0.05) no hay igualdad de varianzas, a diferencia de los operadores con un valor p=0.83 (p>0.05), se acepta Ho concluyendo que hay igualdad de varianza entre operadores. En las gráficas de normalidad y de independencia se puede observar que si hay puntos aberrantes.
En el ANOVA se concluye que hay diferencias significativas entre los operadores y los equipos.
Cuando se vemos la gráfica entre equipos y operador encontramos diferencias significativas en entre 3.1 esto rechaza Ho que dice que no hay diferencias significativa .
En las gráficas entre operdores y la gráfica entre equipos se observa que no hay diferencia significativa.
En la gráfica de normalidad , la mayoria de los datos siguen una distribución normal, en la prueba de Shapiro con una p=0.055 (p>0.05) se acepta Ho, por lo que los datos se distribuyen de forma normal.
En la prueba de leveneTest entre los equipos y operadores de la prueba de igualdad de varianza no hay diferencias significativas .
Tiempo de reacción de un proceso químico
Se quiere estudiar el efecto de cinco diferentes catalizadores (A, B, C, D y E) sobre el tiempo de reacción de un proceso químico. Cada lote de material sólo permite cinco corridas y cada corrida requie re aproximadamente 1.5 horas, por lo que sólo se pueden realizar cinco corridas diarias. El experimentador decide correr los ex perimentos con un diseño en cuadro latino para controlar activa mente a los lotes y días. Los datos obtenidos son:
Tabla Problema 16
setwd("C:/Users/KETSY/Desktop/Experimental/Capítulo 4")
df=read.csv("Cap4-Prob16.csv",sep=";")
df## Lote Dias Tratamiento Y
## 1 1 1 A 8
## 2 1 2 B 7
## 3 1 3 D 1
## 4 1 4 C 7
## 5 1 5 E 3
## 6 2 1 C 11
## 7 2 2 E 2
## 8 2 3 A 7
## 9 2 4 D 3
## 10 2 5 B 8
## 11 3 1 B 4
## 12 3 2 A 9
## 13 3 3 C 10
## 14 3 4 E 1
## 15 3 5 D 5
## 16 4 1 D 6
## 17 4 2 C 8
## 18 4 3 E 6
## 19 4 4 B 6
## 20 4 5 A 10
## 21 5 1 E 4
## 22 5 2 D 2
## 23 5 3 B 3
## 24 5 4 A 8
## 25 5 5 C 8
df$Lote=factor(df$Lote)
df$Dias=factor(df$Dias)
df$Tratamiento=factor(df$Tratamiento)modelo=aov(Y~Lote+Dias+Tratamiento,data=df)
summary(modelo)## Df Sum Sq Mean Sq F value Pr(>F)
## Lote 4 15.44 3.86 1.235 0.347618
## Dias 4 12.24 3.06 0.979 0.455014
## Tratamiento 4 141.44 35.36 11.309 0.000488 ***
## Residuals 12 37.52 3.13
## ---
## Signif. codes: 0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
boxplot(Y~Tratamiento,data=df,col="pink")tk=TukeyHSD(modelo)
tk## Tukey multiple comparisons of means
## 95% family-wise confidence level
##
## Fit: aov(formula = Y ~ Lote + Dias + Tratamiento, data = df)
##
## $Lote
## diff lwr upr p adj
## 2-1 1.0 -2.564608 4.564608 0.8936609
## 3-1 0.6 -2.964608 4.164608 0.9816047
## 4-1 2.0 -1.564608 5.564608 0.4225127
## 5-1 -0.2 -3.764608 3.364608 0.9997349
## 3-2 -0.4 -3.964608 3.164608 0.9960012
## 4-2 1.0 -2.564608 4.564608 0.8936609
## 5-2 -1.2 -4.764608 2.364608 0.8166339
## 4-3 1.4 -2.164608 4.964608 0.7232162
## 5-3 -0.8 -4.364608 2.764608 0.9489243
## 5-4 -2.2 -5.764608 1.364608 0.3365811
##
## $Dias
## diff lwr upr p adj
## 2-1 -1.0 -4.564608 2.564608 0.8936609
## 3-1 -1.2 -4.764608 2.364608 0.8166339
## 4-1 -1.6 -5.164608 1.964608 0.6212723
## 5-1 0.2 -3.364608 3.764608 0.9997349
## 3-2 -0.2 -3.764608 3.364608 0.9997349
## 4-2 -0.6 -4.164608 2.964608 0.9816047
## 5-2 1.2 -2.364608 4.764608 0.8166339
## 4-3 -0.4 -3.964608 3.164608 0.9960012
## 5-3 1.4 -2.164608 4.964608 0.7232162
## 5-4 1.8 -1.764608 5.364608 0.5188508
##
## $Tratamiento
## diff lwr upr p adj
## B-A -2.8 -6.3646078 0.7646078 0.1539433
## C-A 0.4 -3.1646078 3.9646078 0.9960012
## D-A -5.0 -8.5646078 -1.4353922 0.0055862
## E-A -5.2 -8.7646078 -1.6353922 0.0041431
## C-B 3.2 -0.3646078 6.7646078 0.0864353
## D-B -2.2 -5.7646078 1.3646078 0.3365811
## E-B -2.4 -5.9646078 1.1646078 0.2631551
## D-C -5.4 -8.9646078 -1.8353922 0.0030822
## E-C -5.6 -9.1646078 -2.0353922 0.0023007
## E-D -0.2 -3.7646078 3.3646078 0.9997349
plot(tk,col="6")qqnorm(modelo$residuals,main="Gráfica de Normalidad de los residuos",col="6")
qqline(modelo$residuals)shapiro.test(modelo$residuals)##
## Shapiro-Wilk normality test
##
## data: modelo$residuals
## W = 0.96606, p-value = 0.5476
library("car")
leveneTest(Y~Tratamiento,data=df)## Levene's Test for Homogeneity of Variance (center = median)
## Df F value Pr(>F)
## group 4 0.4444 0.7751
## 20
plot(modelo$residuals,col="6")
abline(h=0)plot(df$Tratamiento,modelo$residuals,col="pink")
abline(h=0)plot(modelo$fitted.values, modelo$residuals,col="6")
abline(h=0)a)¿Como se aleatorizo el experimento?
Se construye el cuadro latino estándar más sencillo, se aleatoriza el orden de las columnas y después se aleatoriza el orden de los renglones. Los tratamientos a comparar se asignan en forma aleatoria a las letras latinas. Así se cumple que cada letra debe aparecer solo una vez en cada renglón y en cada columna. De tal manera que el tiempo no se puede aleatorizar, los lotes fueron controlados por el investigador, el tratamiento, en este caso el catalizador pudo ser aleatorizado.
b)Anote la ecuación del modelo y las hipótesis estadísticas correspondientes.
Se utilizó modelo de Anova.
Ho: Efecto de los catalizadores sobre el tiempo de reacción del proceso químico = 0
Ha: Efecto de los catalizadores sobre el el tiempo de reacción del proceso químico ≠ 0
c)¿Existen diferencias entre los tratamientos? ¿Cuáles tratamietos son diferentes entre sí?
Si existe diferencia entre los tratamientos: D-A (p=0.006), E-A (p=0.004), D-C (p=0.003), E-C(p=0.002). Al tener p < 0.05 se rechaza Ho.
d)¿Los factores de ruido, lote y día afectan el tiempo de reacción del proceso?
En el análisis de ANOVA, para el factor lote al tener un valor p=0.035 y el factor días un valor p=0.46 (ambos con p>0.05) se acepta Ho, y se puede concluir que ninguno de estos factores afectan el tiempo de reacción.
e)Dibuje los gráficos de medias para los tratamientos, los lotes y los días. ¿Cuál tratamiento es mejor?
El Catalizador E tiene la media más baja respecto al tiempo de reacción del proceso, por lo que sería el mejor tratamiento.
f)Verifique los supuestos del modelo, considerando que los datos se obtuvieron columna por columna, día a día.
Los supuestos del modelo se cumplen, los datos se distribuyen de forma normal al tener un valor p=0.55 en la prueba de Shapiro, la igualdad de varianzas se comprueba con un valor p=0.78 (en ambos casos p>0.005 por lo ue se acepta Ho) y la independecia de los residuales también se cumple.
Peso en gramos
Se comprueba el peso en gramos de un material de tres proveedores: A, B y C, por tres diferentes inspectores: I, II y III, utilizando tres diferentes escalas: 1, 2 y 3. El experimento se lleva a cabo como el siguiente cuadro latino:
Tabla Problema 19
df=expand.grid (1:3,1:3)
df$Trat=c("A","B","C","B","C","A","C","A","B")
df$Y=c(16,15,13,10,9,11,11,14,13)
names(df)=c("Inspector","Escala","Trat","Y")
df## Inspector Escala Trat Y
## 1 1 1 A 16
## 2 2 1 B 15
## 3 3 1 C 13
## 4 1 2 B 10
## 5 2 2 C 9
## 6 3 2 A 11
## 7 1 3 C 11
## 8 2 3 A 14
## 9 3 3 B 13
df$Inspector=factor(df$Inspector)
df$Escala=factor(df$Escala)
df$Trat=factor(df$Trat)modelo=aov(Y~Inspector+Escala+Trat,data=df)
summary(modelo)## Df Sum Sq Mean Sq F value Pr(>F)
## Inspector 2 0.22 0.111 1 0.50000
## Escala 2 32.89 16.444 148 0.00671 **
## Trat 2 10.89 5.444 49 0.02000 *
## Residuals 2 0.22 0.111
## ---
## Signif. codes: 0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
boxplot(Y~Inspector,data=df,main="Gráfico de los Inspectores",col="pink")boxplot(Y~Escala,data=df,main="Gráfico de la Escala",col="pink")boxplot(Y~Trat,data=df,main="Gráfico Peso en gramos",col="pink")tk=TukeyHSD(modelo)
tk## Tukey multiple comparisons of means
## 95% family-wise confidence level
##
## Fit: aov(formula = Y ~ Inspector + Escala + Trat, data = df)
##
## $Inspector
## diff lwr upr p adj
## 2-1 3.333333e-01 -1.269927 1.936593 0.548184
## 3-1 1.776357e-15 -1.603260 1.603260 1.000000
## 3-2 -3.333333e-01 -1.936593 1.269927 0.548184
##
## $Escala
## diff lwr upr p adj
## 2-1 -4.666667 -6.269927 -3.0634068 0.0061007
## 3-1 -2.000000 -3.603260 -0.3967402 0.0327189
## 3-2 2.666667 1.063407 4.2699265 0.0186734
##
## $Trat
## diff lwr upr p adj
## B-A -1.000000 -2.603260 0.60325985 0.1191149
## C-A -2.666667 -4.269927 -1.06340682 0.0186734
## C-B -1.666667 -3.269927 -0.06340682 0.0464424
qqnorm(modelo$residuals,main="Gráfica de Normalidad de los Residuos",col="6")
qqline(modelo$residuals)shapiro.test(modelo$residuals)##
## Shapiro-Wilk normality test
##
## data: modelo$residuals
## W = 0.61728, p-value = 0.0001526
require(car)
leveneTest(Y~Trat,data=df)## Levene's Test for Homogeneity of Variance (center = median)
## Df F value Pr(>F)
## group 2 0.0556 0.9464
## 6
plot(modelo$residuals,main="Gráfica de Independencia de los Residuos",col="6")
abline(h=0)a)¿Hay diferencias entre los proveedores?
En el análisis de ANOVA , con un valor p = 0.02000 * (p < 0.05) para los proveedores, se rechaza Ho, concluyendo que hay diferencia significativa en al menos 1 proveedor.
b)¿Hay diferencias entre los inspectores y entre las escalas?
En el análisis de ANOVA , con un valor p = 0.50000 para los inspectores, se acepta Ho, concluyendo que no hay diferencia significativa entre los instructores. Entre las escalas con un valor p = 0.00671 ** (p < 0.05), se rechaza Ho, concluyendo que hay diferencias significativas en al menos 1 escala.
c)Si el peso debe ser 15 g, ¿cuál proveedor es mejor?
El proveedor A, es el mejor proveedor porque es el que más se acerca al peso esperado de 15g.
d)Si algún factor de bloque es no significativo, elimínelo y haga el análisis adecuado.
Se elimina el factor de bloque de los inspectores, ya que se concluyó que no tiene efecto en la variable respuesta, al tener una p < 0.05 por lo tanto no hay diferencia significativa. Al hacer los análisis nuevamente se observó que las escalas y los proveedores seguían teniendo diferencia significativa, pero con un mayor grado de significancia.
El objetivo de un diseño factorial es estudiar el efecto de varios factores sobre una o varias respuestas, cuando se tiene el mismo interés sobre todos los factores. Por ejemplo, uno de los objetivos particulares más importantes que en ocasiones tiene un diseño factorial es determinar una combinación de niveles de los factores en la que el desempeño del proceso sea mejor. Los factores pueden ser de tipo cualitativo (máquinas, tipos de material, operador, la presencia o ausencia de una operación previa, etc.), o de tipo cuantitativo (temperatura, humedad, velocidad, presión, etc.). Para estudiar la manera en que influye cada factor sobre la variable de respuesta es necesario elegir al menos dos niveles de prueba para cada uno de ellos. Con el diseño factorial completo se corren aleatoriamente todas las posibles combinaciones que pueden formarse con los niveles de los factores a investigar. Así, la matriz de diseño o arreglo factorial es el conjunto de puntos experimentales o tratamientos que pueden formarse considerando todas las posibles combinaciones de los niveles de los factores.
Fabricación de bolellas de polietileno
Se corre un diseño factorial 3 × 2 con 10 réplicas para investigar el hinchamiento del catalizador después de la extrusión en la fabricación de botellas de polietileno de alta densidad. El catalizador se utiliza en la obtención de dicho polietileno. Los factores investigados son: molde (con dos niveles) y B: catalizador (con tres niveles). Los datos obtenidos se muestran en la siguiente tabla:
Tabla problema 19
setwd("C:/Users/KETSY/Desktop/Experimental/Capítulo 5")
df=read.csv("cap5p19.csv")
df## Molde Catalizador Y
## 1 -1 -1 93
## 2 -1 -1 92
## 3 -1 -1 90
## 4 -1 -1 91
## 5 -1 -1 92
## 6 -1 -1 91
## 7 -1 -1 90
## 8 -1 -1 91
## 9 -1 -1 93
## 10 -1 -1 90
## 11 1 -1 88
## 12 1 -1 88
## 13 1 -1 87
## 14 1 -1 87
## 15 1 -1 88
## 16 1 -1 87
## 17 1 -1 87
## 18 1 -1 87
## 19 1 -1 87
## 20 1 -1 88
## 21 -1 0 92
## 22 -1 0 94
## 23 -1 0 90
## 24 -1 0 91
## 25 -1 0 90
## 26 -1 0 91
## 27 -1 0 92
## 28 -1 0 92
## 29 -1 0 92
## 30 -1 0 91
## 31 1 0 90
## 32 1 0 88
## 33 1 0 88
## 34 1 0 88
## 35 1 0 89
## 36 1 0 90
## 37 1 0 89
## 38 1 0 88
## 39 1 0 88
## 40 1 0 89
## 41 -1 1 95
## 42 -1 1 94
## 43 -1 1 94
## 44 -1 1 94
## 45 -1 1 94
## 46 -1 1 97
## 47 -1 1 95
## 48 -1 1 96
## 49 -1 1 94
## 50 -1 1 96
## 51 1 1 91
## 52 1 1 90
## 53 1 1 92
## 54 1 1 90
## 55 1 1 97
## 56 1 1 89
## 57 1 1 90
## 58 1 1 91
## 59 1 1 91
## 60 1 1 91
df$Molde=factor(df$Molde)
df$Catalizador=factor(df$Catalizador)modelo=aov(Y~Molde+Catalizador,data=df)
summary(modelo)## Df Sum Sq Mean Sq F value Pr(>F)
## Molde 1 180.27 180.27 110.89 6.79e-15 ***
## Catalizador 2 153.03 76.52 47.07 1.02e-12 ***
## Residuals 56 91.03 1.63
## ---
## Signif. codes: 0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
boxplot(Y~Molde,data=df,main="Gráfica de Moldes",col="pink")boxplot(Y~Catalizador,data=df,main="Gráfica de Catalizadores",col="pink")boxplot(Y~Molde*Catalizador,data=df,main="Gráfica de las Variables",col="pink")interaction.plot(df$Molde,df$Catalizador,df$Y,col="6")tk=TukeyHSD(modelo)
tk## Tukey multiple comparisons of means
## 95% family-wise confidence level
##
## Fit: aov(formula = Y ~ Molde + Catalizador, data = df)
##
## $Molde
## diff lwr upr p adj
## 1--1 -3.466667 -4.126135 -2.807199 0
##
## $Catalizador
## diff lwr upr p adj
## 0--1 0.75 -0.2206975 1.720698 0.1598613
## 1--1 3.70 2.7293025 4.670698 0.0000000
## 1-0 2.95 1.9793025 3.920698 0.0000000
plot(tk,col="6")qqnorm(modelo$residuals,main="Gráfica de Normalidad",col="6")
qqline(modelo$residuals)shapiro.test(modelo$residuals)##
## Shapiro-Wilk normality test
##
## data: modelo$residuals
## W = 0.87917, p-value = 2.485e-05
require(car)
leveneTest(Y~Molde,data=df)## Levene's Test for Homogeneity of Variance (center = median)
## Df F value Pr(>F)
## group 1 0.1322 0.7175
## 58
leveneTest(Y~Catalizador,data=df)## Levene's Test for Homogeneity of Variance (center = median)
## Df F value Pr(>F)
## group 2 2.0397 0.1394
## 57
plot(modelo$residuals,main="Gráfica de Independencia",col="6")
abline(h=0)a)Plantee las hipótesis de interés en este problema y el modelo estadístico correspondiente.
Ho : Efecto de Molde (A) = 0
HA : Efecto de Molde (A) ≠ 0
Ho : Efecto de Catalizador (B) = 0
HA : Efecto de Catalizador (B) ≠ 0
Estas hipótesis se prueban mediante la técnica de análisis de varianza (modelo estadístico: ANOVA), para un diseño factorial 3 × 2 con 10 réplicas.
b)Construya la tabla de análisis de varianza y determine cuáles efectos están activos.
Df Sum Sq Mean Sq F value Pr(>F)
Molde 1 180.27 180.27 110.89 6.79e-15 Catalizador 2 153.03 76.52 47.07 1.02e-12 Residuals 56 91.03 1.63
Ambos efectos el molde y el catalizador están activos.
c)Dibuje las gráficas de medias para los dos efectos de Tukey.
plot(tk,col="6")d)Haga la gráfica de interacción.
interaction.plot(df$Molde,df$Catalizador,df$Y,col="6")e)Determine cuál es el mejor tratamiento. ¿Cuál es el hinchamiento predicho en el mejor tratamiento?
El mejor tratamiento sería Molde A1 y el Catalizador B3, con un hinchamiento medio de 94.9.
f)Verifique los supuestos de normalidad y varianza constante.
En la prueba Shapiro con un valor p = 2.485e-05 (p<0.05), se rechaza Ho, por lo que se concluye que los datos no se distribuyen de forma normal.
En el leveneTest para catalizadores y moldes, en ambos la p > 0.05, nos indica que hay varianzas constantes.
g)Utilice la gráfica de residuos contra factores para detectar posibles efectos sobre la dispersión del hinchamiento. ¿En cuál molde parece que es menor la dispersión?
Observando la gráfica de residuos contra factores, pareciera que la dispersión es menor en el molde B.
Adhesiones de componentes electrónicos sobre placas
Para mejorar la resistencia a la torsión de las adhesiones de componentes electrónicos sobre placas, se estudiaron dos tipos de pegamentos (A1 y A2) y tres temperaturas de curado (60, 80 y 100°C). En cada combinación se analizaron dos componentes y los resultados obtenidos son los siguientes:
Tabla problema 20
setwd("C:/Users/KETSY/Desktop/Experimental/Capítulo 5")
df=read.csv("Cap5Prob20.csv")
df## Pegamento Temperatura Y
## 1 A1 60 2.50
## 2 A1 60 2.80
## 3 A1 80 3.80
## 4 A1 80 3.40
## 5 A1 100 4.00
## 6 A1 100 4.20
## 7 A2 60 1.60
## 8 A2 60 1.22
## 9 A2 80 3.20
## 10 A2 80 2.80
## 11 A2 100 4.30
## 12 A2 100 4.70
df$Pegamento=factor(df$Pegamento)
df$Temperatura=factor(df$Temperatura)
df$Y=as.double(df$Y)modelo=aov(Y~Pegamento*Temperatura,data=df)
summary(modelo)## Df Sum Sq Mean Sq F value Pr(>F)
## Pegamento 1 0.691 0.691 10.99 0.0161 *
## Temperatura 2 10.354 5.177 82.35 4.34e-05 ***
## Pegamento:Temperatura 2 1.366 0.683 10.87 0.0101 *
## Residuals 6 0.377 0.063
## ---
## Signif. codes: 0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
boxplot(Y~Pegamento,data=df,main="Gráficos de los pegamento",col="pink")boxplot(Y~Temperatura,data=df,main="Resistencia a la torsión de las adhesiones",col="pink")boxplot(Y~Pegamento*Temperatura,data=df,main="Gráficos de las variables",col="pink")tk=TukeyHSD(modelo)
tk## Tukey multiple comparisons of means
## 95% family-wise confidence level
##
## Fit: aov(formula = Y ~ Pegamento * Temperatura, data = df)
##
## $Pegamento
## diff lwr upr p adj
## A2-A1 -0.48 -0.8342158 -0.1257842 0.0160877
##
## $Temperatura
## diff lwr upr p adj
## 80-60 1.27 0.7260119 1.813988 0.0009122
## 100-60 2.27 1.7260119 2.813988 0.0000343
## 100-80 1.00 0.4560119 1.543988 0.0032134
##
## $`Pegamento:Temperatura`
## diff lwr upr p adj
## A2:60-A1:60 -1.24 -2.23787597 -0.242124 0.0188874
## A1:80-A1:60 0.95 -0.04787597 1.947876 0.0613074
## A2:80-A1:60 0.35 -0.64787597 1.347876 0.7301328
## A1:100-A1:60 1.45 0.45212403 2.447876 0.0088011
## A2:100-A1:60 1.85 0.85212403 2.847876 0.0024766
## A1:80-A2:60 2.19 1.19212403 3.187876 0.0009867
## A2:80-A2:60 1.59 0.59212403 2.587876 0.0055020
## A1:100-A2:60 2.69 1.69212403 3.687876 0.0003113
## A2:100-A2:60 3.09 2.09212403 4.087876 0.0001416
## A2:80-A1:80 -0.60 -1.59787597 0.397876 0.2878599
## A1:100-A1:80 0.50 -0.49787597 1.497876 0.4368423
## A2:100-A1:80 0.90 -0.09787597 1.897876 0.0761198
## A1:100-A2:80 1.10 0.10212403 2.097876 0.0327623
## A2:100-A2:80 1.50 0.50212403 2.497876 0.0074161
## A2:100-A1:100 0.40 -0.59787597 1.397876 0.6284243
qqnorm(modelo$residuals,main="Gráfica de Normalidad",col="6")
qqline(modelo$residuals)shapiro.test(modelo$residuals)##
## Shapiro-Wilk normality test
##
## data: modelo$residuals
## W = 0.77302, p-value = 0.004698
require(car)
leveneTest(Y~Temperatura,data=df)## Levene's Test for Homogeneity of Variance (center = median)
## Df F value Pr(>F)
## group 2 4.4568 0.04516 *
## 9
## ---
## Signif. codes: 0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
leveneTest(Y~Pegamento,data=df)## Levene's Test for Homogeneity of Variance (center = median)
## Df F value Pr(>F)
## group 1 2.7953 0.1255
## 10
plot(modelo$residuals,main="Gráfica de Independencia de los Residuos",col="6")
abline(h=0)a)Plantee las hipótesis de interés en este problema y el modelo estadístico correspondiente.
Ho : Efecto de Pegamento (A) = 0
HA : Efecto de Pegamento (A) ≠ 0
Ho : Efecto de Temperatura de curadp (B) = 0
HA : Efecto de Temperatura de curado (B) ≠ 0
Estas hipótesis se prueban mediante la técnica de análisis de varianza (modelo estadístico: ANOVA), para un diseño factorial 3 × 2 con 2 réplicas.
b)Construya el ANOVA y decida cuáles efectos están activos.
Al realizar el análisis de ANOVA, se observa que la variable pegamento con un valor p=0.016 y la temperatura de curado con un valor p=0.000, se obtuvo valores p<0.05, por lo tanto se rechaza Ho, y se concluye que ambos efectos están activos.
c)Dibuje las gráficas de efectos y determine con ellas el mejor tratamiento.
interaction.plot(df$Pegamento,df$Temperatura,df$Y,main="Interaccion entre las variables",col="6") En la gráfica de interacción se puede observar el Pegamento A2 a una temperatura de curado de 100°C, representan el mejor tratamiento, al lograr mayor resistencia de torsión de las adhesiones de componentes electrónicos sobre placas.
d)Estime la resistencia a la torsión en el mejor tratamiento.
La resitencia a la torción en el mejor tratamiento es de 4.5
e)Verifique residuos.
plot(modelo$residuals,main="Gráfica de Independencia de los Residuos",col="6")
abline(h=0)En el análisis de ANOVA, los pegamentos con un valor p=0.016 y la temperatura con un valor p=0.000 (ambos con 0<0.05) se puede concluir que tienen un efecto significativo en la resistencia a la torsión de las adhesiones componentes electrónicos sobre placas, es decir las medias son diferentes.
No existe interacción (AB) con un nivel de confianza del 95% sobre la media de resistencia a la torsión de las adhesiones de componentes electrónicos sobre placas.
El mejor tratamiento es el Pegamento A2 a una temperatura de curado de 100°C, logrando una resistencia media de 4.5
En este problema no se cumple con el supuesto de normalidad, pero se puede decir que cumple con la igualdad de varianzas y con la indendecia de los datos.
Resistencia de caucho vulcanizado
Se desea investigar de qué manera afecta el tiempo de curado y el tipo del acelerante a la resistencia de caucho vulcanizado. Se realiza un experimento y se obtienen los siguientes datos:
Tabla problema 22
setwd("C:/Users/KETSY/Desktop/Experimental/Capítulo 5")
df=read.csv("Cap5-Prob21.csv",sep=";")
df## ACELERANTE TIEMPO.DE.CURA Y
## 1 -1 -1 3900
## 2 -1 -1 3600
## 3 -1 0 4100
## 4 -1 0 3500
## 5 -1 1 4000
## 6 -1 1 3800
## 7 0 -1 4300
## 8 0 -1 3700
## 9 0 0 4200
## 10 0 0 3900
## 11 0 1 4300
## 12 0 1 3600
## 13 1 -1 3700
## 14 1 -1 4100
## 15 1 0 3900
## 16 1 0 4000
## 17 1 1 3600
## 18 1 1 3800
df$TIEMPO=factor(df$TIEMPO)
df$ACELERANTE=factor(df$ACELERANTE)
str(df)## 'data.frame': 18 obs. of 4 variables:
## $ ACELERANTE : Factor w/ 3 levels "-1","0","1": 1 1 1 1 1 1 2 2 2 2 ...
## $ TIEMPO.DE.CURA: int -1 -1 0 0 1 1 -1 -1 0 0 ...
## $ Y : int 3900 3600 4100 3500 4000 3800 4300 3700 4200 3900 ...
## $ TIEMPO : Factor w/ 3 levels "-1","0","1": 1 1 2 2 3 3 1 1 2 2 ...
modelo=aov(Y~TIEMPO+ACELERANTE,data=df)
summary(modelo)## Df Sum Sq Mean Sq F value Pr(>F)
## TIEMPO 2 21111 10556 0.152 0.86
## ACELERANTE 2 114444 57222 0.825 0.46
## Residuals 13 902222 69402
boxplot(Y~TIEMPO,data=df,main="Gráfica de Tiempo de cura",col="pink")boxplot(Y~ACELERANTE,data = df,main="Gráfica de tipo de acelerante",col="pink")boxplot(Y~TIEMPO+ACELERANTE,data=df,main="Gráfica de las variables",col="pink")interaction.plot(df$TIEMPO,df$ACELERANTE,df$Y,main="Gráfica de Interacción",col="pink")tk=TukeyHSD(modelo)
tk## Tukey multiple comparisons of means
## 95% family-wise confidence level
##
## Fit: aov(formula = Y ~ TIEMPO + ACELERANTE, data = df)
##
## $TIEMPO
## diff lwr upr p adj
## 0--1 50.00000 -351.6061 451.6061 0.9424302
## 1--1 -33.33333 -434.9394 368.2728 0.9739228
## 1-0 -83.33333 -484.9394 318.2728 0.8493245
##
## $ACELERANTE
## diff lwr upr p adj
## 0--1 183.33333 -218.2728 584.9394 0.4708685
## 1--1 33.33333 -368.2728 434.9394 0.9739228
## 1-0 -150.00000 -551.6061 251.6061 0.5979909
plot(tk,col="6")qqnorm(modelo$residuals,main="Gráfica de Normalidad de los residuos",col="6")
qqline(modelo$residuals)shapiro.test(modelo$residuals)##
## Shapiro-Wilk normality test
##
## data: modelo$residuals
## W = 0.94083, p-value = 0.2994
library("car")
leveneTest(Y~TIEMPO,data=df)## Levene's Test for Homogeneity of Variance (center = median)
## Df F value Pr(>F)
## group 2 0.1373 0.8728
## 15
leveneTest(Y~ACELERANTE,data=df)## Levene's Test for Homogeneity of Variance (center = median)
## Df F value Pr(>F)
## group 2 1.789 0.201
## 15
plot(modelo$residuals,col="6")
abline(h=0)plot(df$TIEMPO,modelo$residuals,col="pink")
abline(h=0)a)Señale el nombre del diseño de experimento utilizado y su modelo estadístico.
Diseño Factorial, diseño estadístico ANOVA.
b)Formule claramente todas las hipótesis que se pueden probar.
Ho= no afecta el tiempo de curado la resistencia del caucho
Ha= afecta el tiempo de curado la resistencia del caucho
Ho= No afecta el tipo de acelerante la resistencia del caucho
Ha= afecta el tipo de acelerante la resistencia del caucho
c)Realice el análisis estadístico apropiado para probar las hipótesis que formuló.
Se realizo análisis de ANOVA, en donde el tiempo con valor p=0.87 y el acelerante con un valor p=0.46 (p>0.05)se acepta Ho en ambos, concluyendoque ni el tiempo ni el tipo de acelerante afectan la resitencia del caucho.
d)¿Hay algún tiempo de cura que es mejor para aumentar la resistencia? Argumente su respuesta.
Como podemos observar en la gráfica los tres tiempos de cura serian iguales ya que hay un excelente traslape entre los tres tiempos. Y en el análisis de ANOVA para el tiempo p=0.87 (p>0.05) aceptando Ho.
e)¿Algún acelerante es mejor? Explique.
Los tres tipos de acelerantés son iguales al existir un excelente traslape entre ellos como se puede observaren la gráfica. Y en el análisis de ANOVA para el tipo de acelerante p=0.46 (p>0.05) aceptando Ho.
f)¿Hay alguna combinación de tiempo y acelerante que sea mejor?
En la gráfica de interacción podemos observar que el mejor tratamiento es la combinación del acelerante B con un tiempo de 60 minutos, al aumentar la resistencia del caucho vulacanizado.
h)Verifique que se cumplan los supuestos. En caso de que no se cumpliera el supuesto varianza constante para el tiempo de cura, ¿qué significaría eso y cómo pudiera corregirse?
Si se cumplen los 3 supuestos de la ANOVA: Normalidad, igualdad de varianza y la independencia.
Se cumplen los supuestos de la ANOVA.
Los tres tipos de acelerantés y los 3 tiempos, son iguales, no tienen un efecto significativo sobre la resitencia del caucho.
En la gráfica de interacción, se puede concluir que la combinación del acelerante B con un tiempo de 60 minutos, aumentar la resistencia del caucho vulacanizado.