Capítulo 4. Diseño de Bloques

Teoría

En cualquier experimento, la variabilidad proveniente de un factor de ruido puede afectar los resultados. Un factor de ruido es un factor que probablemente tiene un efecto en la respuesta pero que no nos interesa estudiar.Si el factor de ruido es desconocido y no controlable, la solución es la aleatorización, que tiende a distribuir los niveles y efectos de este factor.Si el factor de ruido es conocido y no controlable, pero por lo menos podemos medir su valor en cada corrida del experimento, entonces podemos compensarlo usando análisis de varianza. Si el factor de ruido es conocido y controlable, se utilizan bloques para eliminar su efecto en la comparación estadística de los tratamientos.

Bloques al azar

El objetivo es tener comparaciones precisas entre los tratamientos bajo estudio. Utilizar bloques es una forma de dereducir y controlar la varianza del error experimental para tener mayor precisión.

Problema 14

Enunciado

Ensamble del brazo lector de disco duro

Una de las variables críticas en el proceso de ensamble del brazo lector de un disco duro es el ángulo que éste forma con el cuerpo principal de la cabeza lectora. Se corre un experimento con el objetivo de comparar dos equipos que miden dicho ángulo en unidades de radianes. Se decide utilizar como factor de bloque a los operadores de los equipos. Los resultados se muestran en la siguiente tabla:

Tabla Problema 14

Lectura de dato:

Y=c(1.328,1.113,0.985,1.057,1.316,1.144,1.553,1.485,1.310,1.386,1.273,0.789,0.985,0.671,1.134,0.554,1.412,1.386,0.917,1.289,1.269,1.093,1.268,0.984,1.091,1.087,1.195,1.482,1.380,1.442,1.036,0.201,0.783,0.900,1.108,0.916,1.129,1.434,1.132,1.223,1.440,1.150,1.079,1.190,1.389,1.247,1.611,1.617,1.445,1.574,1.454,1.018,1.063,1.050,1.219,0.997,1.602,1.538,1.583,1.478)

df=expand.grid(1:10,1:2,1:3)

names(df)=c("Replica","Equipo","Operador")
df$Y=Y

df$Operador=factor(df$Operador)
df$Equipo=factor(df$Equipo)

df
##    Replica Equipo Operador     Y
## 1        1      1        1 1.328
## 2        2      1        1 1.113
## 3        3      1        1 0.985
## 4        4      1        1 1.057
## 5        5      1        1 1.316
## 6        6      1        1 1.144
## 7        7      1        1 1.553
## 8        8      1        1 1.485
## 9        9      1        1 1.310
## 10      10      1        1 1.386
## 11       1      2        1 1.273
## 12       2      2        1 0.789
## 13       3      2        1 0.985
## 14       4      2        1 0.671
## 15       5      2        1 1.134
## 16       6      2        1 0.554
## 17       7      2        1 1.412
## 18       8      2        1 1.386
## 19       9      2        1 0.917
## 20      10      2        1 1.289
## 21       1      1        2 1.269
## 22       2      1        2 1.093
## 23       3      1        2 1.268
## 24       4      1        2 0.984
## 25       5      1        2 1.091
## 26       6      1        2 1.087
## 27       7      1        2 1.195
## 28       8      1        2 1.482
## 29       9      1        2 1.380
## 30      10      1        2 1.442
## 31       1      2        2 1.036
## 32       2      2        2 0.201
## 33       3      2        2 0.783
## 34       4      2        2 0.900
## 35       5      2        2 1.108
## 36       6      2        2 0.916
## 37       7      2        2 1.129
## 38       8      2        2 1.434
## 39       9      2        2 1.132
## 40      10      2        2 1.223
## 41       1      1        3 1.440
## 42       2      1        3 1.150
## 43       3      1        3 1.079
## 44       4      1        3 1.190
## 45       5      1        3 1.389
## 46       6      1        3 1.247
## 47       7      1        3 1.611
## 48       8      1        3 1.617
## 49       9      1        3 1.445
## 50      10      1        3 1.574
## 51       1      2        3 1.454
## 52       2      2        3 1.018
## 53       3      2        3 1.063
## 54       4      2        3 1.050
## 55       5      2        3 1.219
## 56       6      2        3 0.997
## 57       7      2        3 1.602
## 58       8      2        3 1.538
## 59       9      2        3 1.583
## 60      10      2        3 1.478

Modelo Estadístico ANOVA

modelo=aov(Y~Equipo+Operador,data=df)
summary(modelo)
##             Df Sum Sq Mean Sq F value  Pr(>F)   
## Equipo       1  0.493  0.4925   8.090 0.00621 **
## Operador     2  0.589  0.2944   4.835 0.01156 * 
## Residuals   56  3.409  0.0609                   
## ---
## Signif. codes:  0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1

Boxplot: Visualización de los datos

boxplot(Y~Equipo,data=df,main="Gráfica del equipo",col="pink")

boxplot(Y~Operador,data=df,main="Gráfica de los Operadores",col="pink")

boxplot(Y~Equipo*Operador,data=df,main="Gráfica de las Variables",col="pink")

Prueba de comparación múltiple: TukeyHSD

tk=TukeyHSD(modelo,col="6")
tk
##   Tukey multiple comparisons of means
##     95% family-wise confidence level
## 
## Fit: aov(formula = Y ~ Equipo + Operador, data = df)
## 
## $Equipo
##        diff        lwr         upr     p adj
## 2-1 -0.1812 -0.3088231 -0.05357689 0.0062055
## 
## $Operador
##         diff          lwr       upr     p adj
## 2-1 -0.04670 -0.234553611 0.1411536 0.8214765
## 3-1  0.18285 -0.005003611 0.3707036 0.0580021
## 3-2  0.22955  0.041696389 0.4174036 0.0129494

Prueba de normalidad de los residuos

qqnorm(modelo$residuals,main="Prueba normalidad de los Residuos",col="6")
qqline(modelo$residuals)

shapiro.test(modelo$residuals)
## 
##  Shapiro-Wilk normality test
## 
## data:  modelo$residuals
## W = 0.96139, p-value = 0.05502

Prueba de igualdad de varianzas: Homocedasticidad

require(car)
## Loading required package: car
## Loading required package: carData
leveneTest(Y~Equipo,data=df)
## Levene's Test for Homogeneity of Variance (center = median)
##       Df F value  Pr(>F)  
## group  1  4.1246 0.04686 *
##       58                  
## ---
## Signif. codes:  0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
leveneTest(Y~Operador,data=df)
## Levene's Test for Homogeneity of Variance (center = median)
##       Df F value Pr(>F)
## group  2  0.1849 0.8316
##       57

Gráfica de independencia de los residuos

plot(modelo$residuals,main="Gráfico de Independecia de los Residuos",col="6")
abline(h=0)

Preguntas

a)Plantee el modelo y las hipótesis más adecuadas al problema.

Ho: μ1=μ2=μ3….μk=μ

Ha: μi≠μj para algún i ≠ j

b)¿Existen diferencias entre los equipos? Argumente estadísticamente.

Existe diferencia entre los equipos, al obtener un valor p = 0.006 (p < 0.05), se concluye que hay diferencia significativa entre ambos equipos.

c)¿Existen diferencias entre los operadores?

Existe diferencia significativa entre el operador 2 y el operador 3, con un valor p = 0.013 (p < 0.05)se rechaza Ho.

d)Dibuje los diagramas de cajas simultáneos y las gráficas de medias para ambos factores, después interprételas.

boxplot(Y~Equipo,data=df,main="Gráfica del equipo",col="pink")

boxplot(Y~Operador,data=df,main="Gráfica de los Operadores",col="pink")

boxplot(Y~Equipo*Operador,data=df,main="Gráfica de las Variables",col="pink")

En la gráfica de las medias de los equipos y la gráfica de las medias de los operadores, todas las cajas se sobreponen lo que nos indica que no hay diferencia significativa entre ellas.

En la gráfica de cajas simultáneas se observa que todas se sobreponen, por lo que se concluye que los tratamientos son iguales.

e)Verifique los supuestos de normalidad e igualdad de varianza entre tratamientos, así como la posible presencia de puntos aberrantes.

En la prueba de Shapiro con un valor p = 0.016 se rezaha Ho, por lo que los datos no están distribuidos de manera norla. el el leveneTest para los equpos con un valor p=0.047 (p<0.05) no hay igualdad de varianzas, a diferencia de los operadores con un valor p=0.83 (p>0.05), se acepta Ho concluyendo que hay igualdad de varianza entre operadores. En las gráficas de normalidad y de independencia se puede observar que si hay puntos aberrantes.

Conclusiones

  • En el ANOVA se concluye que hay diferencias significativas entre los operadores y los equipos.

  • Cuando se vemos la gráfica entre equipos y operador encontramos diferencias significativas en entre 3.1 esto rechaza Ho que dice que no hay diferencias significativa .

  • En las gráficas entre operdores y la gráfica entre equipos se observa que no hay diferencia significativa.

  • En la gráfica de normalidad , la mayoria de los datos siguen una distribución normal, en la prueba de Shapiro con una p=0.055 (p>0.05) se acepta Ho, por lo que los datos se distribuyen de forma normal.

  • En la prueba de leveneTest entre los equipos y operadores de la prueba de igualdad de varianza no hay diferencias significativas .

Problema 16

Enunciado

Tiempo de reacción de un proceso químico

Se quiere estudiar el efecto de cinco diferentes catalizadores (A, B, C, D y E) sobre el tiempo de reacción de un proceso químico. Cada lote de material sólo permite cinco corridas y cada corrida requie re aproximadamente 1.5 horas, por lo que sólo se pueden realizar cinco corridas diarias. El experimentador decide correr los ex perimentos con un diseño en cuadro latino para controlar activa mente a los lotes y días. Los datos obtenidos son:

Tabla Problema 16

Lectura de dato:

setwd("C:/Users/KETSY/Desktop/Experimental/Capítulo 4")
df=read.csv("Cap4-Prob16.csv",sep=";")
df
##    Lote Dias Tratamiento  Y
## 1     1    1           A  8
## 2     1    2           B  7
## 3     1    3           D  1
## 4     1    4           C  7
## 5     1    5           E  3
## 6     2    1           C 11
## 7     2    2           E  2
## 8     2    3           A  7
## 9     2    4           D  3
## 10    2    5           B  8
## 11    3    1           B  4
## 12    3    2           A  9
## 13    3    3           C 10
## 14    3    4           E  1
## 15    3    5           D  5
## 16    4    1           D  6
## 17    4    2           C  8
## 18    4    3           E  6
## 19    4    4           B  6
## 20    4    5           A 10
## 21    5    1           E  4
## 22    5    2           D  2
## 23    5    3           B  3
## 24    5    4           A  8
## 25    5    5           C  8
df$Lote=factor(df$Lote)
df$Dias=factor(df$Dias)
df$Tratamiento=factor(df$Tratamiento)

Modelo Estadístico ANOVA

modelo=aov(Y~Lote+Dias+Tratamiento,data=df)
summary(modelo)
##             Df Sum Sq Mean Sq F value   Pr(>F)    
## Lote         4  15.44    3.86   1.235 0.347618    
## Dias         4  12.24    3.06   0.979 0.455014    
## Tratamiento  4 141.44   35.36  11.309 0.000488 ***
## Residuals   12  37.52    3.13                     
## ---
## Signif. codes:  0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1

Boxplot: Visualización de los datos

boxplot(Y~Tratamiento,data=df,col="pink")

Prueba de comparación múltiple: TukeyHSD

tk=TukeyHSD(modelo)
tk
##   Tukey multiple comparisons of means
##     95% family-wise confidence level
## 
## Fit: aov(formula = Y ~ Lote + Dias + Tratamiento, data = df)
## 
## $Lote
##     diff       lwr      upr     p adj
## 2-1  1.0 -2.564608 4.564608 0.8936609
## 3-1  0.6 -2.964608 4.164608 0.9816047
## 4-1  2.0 -1.564608 5.564608 0.4225127
## 5-1 -0.2 -3.764608 3.364608 0.9997349
## 3-2 -0.4 -3.964608 3.164608 0.9960012
## 4-2  1.0 -2.564608 4.564608 0.8936609
## 5-2 -1.2 -4.764608 2.364608 0.8166339
## 4-3  1.4 -2.164608 4.964608 0.7232162
## 5-3 -0.8 -4.364608 2.764608 0.9489243
## 5-4 -2.2 -5.764608 1.364608 0.3365811
## 
## $Dias
##     diff       lwr      upr     p adj
## 2-1 -1.0 -4.564608 2.564608 0.8936609
## 3-1 -1.2 -4.764608 2.364608 0.8166339
## 4-1 -1.6 -5.164608 1.964608 0.6212723
## 5-1  0.2 -3.364608 3.764608 0.9997349
## 3-2 -0.2 -3.764608 3.364608 0.9997349
## 4-2 -0.6 -4.164608 2.964608 0.9816047
## 5-2  1.2 -2.364608 4.764608 0.8166339
## 4-3 -0.4 -3.964608 3.164608 0.9960012
## 5-3  1.4 -2.164608 4.964608 0.7232162
## 5-4  1.8 -1.764608 5.364608 0.5188508
## 
## $Tratamiento
##     diff        lwr        upr     p adj
## B-A -2.8 -6.3646078  0.7646078 0.1539433
## C-A  0.4 -3.1646078  3.9646078 0.9960012
## D-A -5.0 -8.5646078 -1.4353922 0.0055862
## E-A -5.2 -8.7646078 -1.6353922 0.0041431
## C-B  3.2 -0.3646078  6.7646078 0.0864353
## D-B -2.2 -5.7646078  1.3646078 0.3365811
## E-B -2.4 -5.9646078  1.1646078 0.2631551
## D-C -5.4 -8.9646078 -1.8353922 0.0030822
## E-C -5.6 -9.1646078 -2.0353922 0.0023007
## E-D -0.2 -3.7646078  3.3646078 0.9997349
plot(tk,col="6")

Prueba de normalidad de los residuos

qqnorm(modelo$residuals,main="Gráfica de Normalidad de los residuos",col="6")
qqline(modelo$residuals)

shapiro.test(modelo$residuals)
## 
##  Shapiro-Wilk normality test
## 
## data:  modelo$residuals
## W = 0.96606, p-value = 0.5476

Prueba de igualdad de varianzas: Homocedasticidad

library("car")
leveneTest(Y~Tratamiento,data=df)
## Levene's Test for Homogeneity of Variance (center = median)
##       Df F value Pr(>F)
## group  4  0.4444 0.7751
##       20

Gráfica de independencia de los residuos

plot(modelo$residuals,col="6")
abline(h=0)

plot(df$Tratamiento,modelo$residuals,col="pink")
abline(h=0)

plot(modelo$fitted.values, modelo$residuals,col="6")
abline(h=0)

Preguntas

a)¿Como se aleatorizo el experimento?

Se construye el cuadro latino estándar más sencillo, se aleatoriza el orden de las columnas y después se aleatoriza el orden de los renglones. Los tratamientos a comparar se asignan en forma aleatoria a las letras latinas. Así se cumple que cada letra debe aparecer solo una vez en cada renglón y en cada columna. De tal manera que el tiempo no se puede aleatorizar, los lotes fueron controlados por el investigador, el tratamiento, en este caso el catalizador pudo ser aleatorizado.

b)Anote la ecuación del modelo y las hipótesis estadísticas correspondientes.

Se utilizó modelo de Anova.

Ho: Efecto de los catalizadores sobre el tiempo de reacción del proceso químico = 0

Ha: Efecto de los catalizadores sobre el el tiempo de reacción del proceso químico ≠ 0

c)¿Existen diferencias entre los tratamientos? ¿Cuáles tratamietos son diferentes entre sí?

Si existe diferencia entre los tratamientos: D-A (p=0.006), E-A (p=0.004), D-C (p=0.003), E-C(p=0.002). Al tener p < 0.05 se rechaza Ho.

d)¿Los factores de ruido, lote y día afectan el tiempo de reacción del proceso?

En el análisis de ANOVA, para el factor lote al tener un valor p=0.035 y el factor días un valor p=0.46 (ambos con p>0.05) se acepta Ho, y se puede concluir que ninguno de estos factores afectan el tiempo de reacción.

e)Dibuje los gráficos de medias para los tratamientos, los lotes y los días. ¿Cuál tratamiento es mejor?

El Catalizador E tiene la media más baja respecto al tiempo de reacción del proceso, por lo que sería el mejor tratamiento.

f)Verifique los supuestos del modelo, considerando que los datos se obtuvieron columna por columna, día a día.

Los supuestos del modelo se cumplen, los datos se distribuyen de forma normal al tener un valor p=0.55 en la prueba de Shapiro, la igualdad de varianzas se comprueba con un valor p=0.78 (en ambos casos p>0.005 por lo ue se acepta Ho) y la independecia de los residuales también se cumple.

Conclusiones

  • Se cumplen los 3 supuestos de la ANOVA.
  • Los catalizadores con un valor p=0.0005 (p<0.05) se rechaza Ho, concluyendo que los catalizares si tiene efecto sobre el tiempo de reacción de un proceso químico.
  • El catalizador E, es el que ofrece una media menor en el tiempo de reacción del proceso químico.
  • Los días y los lotes no tienen efecto significativo sobre el tiempo de reación de los proceso químicos.

Problema 19

Enunciado

Peso en gramos

Se comprueba el peso en gramos de un material de tres proveedores: A, B y C, por tres diferentes inspectores: I, II y III, utilizando tres diferentes escalas: 1, 2 y 3. El experimento se lleva a cabo como el siguiente cuadro latino:

Tabla Problema 19

Lectura de dato:

df=expand.grid (1:3,1:3)
df$Trat=c("A","B","C","B","C","A","C","A","B")
df$Y=c(16,15,13,10,9,11,11,14,13)
names(df)=c("Inspector","Escala","Trat","Y")
df
##   Inspector Escala Trat  Y
## 1         1      1    A 16
## 2         2      1    B 15
## 3         3      1    C 13
## 4         1      2    B 10
## 5         2      2    C  9
## 6         3      2    A 11
## 7         1      3    C 11
## 8         2      3    A 14
## 9         3      3    B 13
df$Inspector=factor(df$Inspector)
df$Escala=factor(df$Escala)
df$Trat=factor(df$Trat)

Modelo Estadístico ANOVA

modelo=aov(Y~Inspector+Escala+Trat,data=df)
summary(modelo)
##             Df Sum Sq Mean Sq F value  Pr(>F)   
## Inspector    2   0.22   0.111       1 0.50000   
## Escala       2  32.89  16.444     148 0.00671 **
## Trat         2  10.89   5.444      49 0.02000 * 
## Residuals    2   0.22   0.111                   
## ---
## Signif. codes:  0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1

Boxplot: Visualización de los datos

boxplot(Y~Inspector,data=df,main="Gráfico de los Inspectores",col="pink")

boxplot(Y~Escala,data=df,main="Gráfico de la Escala",col="pink")

boxplot(Y~Trat,data=df,main="Gráfico Peso en gramos",col="pink")

Prueba de comparación múltiple: TukeyHSD

tk=TukeyHSD(modelo)
tk
##   Tukey multiple comparisons of means
##     95% family-wise confidence level
## 
## Fit: aov(formula = Y ~ Inspector + Escala + Trat, data = df)
## 
## $Inspector
##              diff       lwr      upr    p adj
## 2-1  3.333333e-01 -1.269927 1.936593 0.548184
## 3-1  1.776357e-15 -1.603260 1.603260 1.000000
## 3-2 -3.333333e-01 -1.936593 1.269927 0.548184
## 
## $Escala
##          diff       lwr        upr     p adj
## 2-1 -4.666667 -6.269927 -3.0634068 0.0061007
## 3-1 -2.000000 -3.603260 -0.3967402 0.0327189
## 3-2  2.666667  1.063407  4.2699265 0.0186734
## 
## $Trat
##          diff       lwr         upr     p adj
## B-A -1.000000 -2.603260  0.60325985 0.1191149
## C-A -2.666667 -4.269927 -1.06340682 0.0186734
## C-B -1.666667 -3.269927 -0.06340682 0.0464424

Prueba de normalidad de los residuos

qqnorm(modelo$residuals,main="Gráfica de Normalidad de los Residuos",col="6")
qqline(modelo$residuals)

shapiro.test(modelo$residuals)
## 
##  Shapiro-Wilk normality test
## 
## data:  modelo$residuals
## W = 0.61728, p-value = 0.0001526

Prueba de igualdad de varianzas: Homocedasticidad

require(car)
leveneTest(Y~Trat,data=df)
## Levene's Test for Homogeneity of Variance (center = median)
##       Df F value Pr(>F)
## group  2  0.0556 0.9464
##        6

Gráfica de independencia de los residuos

plot(modelo$residuals,main="Gráfica de Independencia de los Residuos",col="6")
abline(h=0)

Preguntas

a)¿Hay diferencias entre los proveedores?

En el análisis de ANOVA , con un valor p = 0.02000 * (p < 0.05) para los proveedores, se rechaza Ho, concluyendo que hay diferencia significativa en al menos 1 proveedor.

b)¿Hay diferencias entre los inspectores y entre las escalas?

En el análisis de ANOVA , con un valor p = 0.50000 para los inspectores, se acepta Ho, concluyendo que no hay diferencia significativa entre los instructores. Entre las escalas con un valor p = 0.00671 ** (p < 0.05), se rechaza Ho, concluyendo que hay diferencias significativas en al menos 1 escala.

c)Si el peso debe ser 15 g, ¿cuál proveedor es mejor?

El proveedor A, es el mejor proveedor porque es el que más se acerca al peso esperado de 15g.

d)Si algún factor de bloque es no significativo, elimínelo y haga el análisis adecuado.

Se elimina el factor de bloque de los inspectores, ya que se concluyó que no tiene efecto en la variable respuesta, al tener una p < 0.05 por lo tanto no hay diferencia significativa. Al hacer los análisis nuevamente se observó que las escalas y los proveedores seguían teniendo diferencia significativa, pero con un mayor grado de significancia.

Conclusiones

  • Es importante tomar en cuenta que los datos no cumplen con los supuestos de normalidad e independencia de la ANOVA, por lo que el estudio no es reproducible.
  • El factor inspectores son tiene efecto sobre la variable en estudio.
  • La escala con valor p=0.0067 y los provedores con un valor p=0.02 (ambos con p<0.05) se rechaza Ho, concluyendo que tienen diferencia significativa sobre el peso en gramos.
  • El mejor proveedor es el A, porque es el que su media se acerca más al peso esperado de 15g.

Capítulo 5. Diseños Factoriales

Teoría

El objetivo de un diseño factorial es estudiar el efecto de varios factores sobre una o varias respuestas, cuando se tiene el mismo interés sobre todos los factores. Por ejemplo, uno de los objetivos particulares más importantes que en ocasiones tiene un diseño factorial es determinar una combinación de niveles de los factores en la que el desempeño del proceso sea mejor. Los factores pueden ser de tipo cualitativo (máquinas, tipos de material, operador, la presencia o ausencia de una operación previa, etc.), o de tipo cuantitativo (temperatura, humedad, velocidad, presión, etc.). Para estudiar la manera en que influye cada factor sobre la variable de respuesta es necesario elegir al menos dos niveles de prueba para cada uno de ellos. Con el diseño factorial completo se corren aleatoriamente todas las posibles combinaciones que pueden formarse con los niveles de los factores a investigar. Así, la matriz de diseño o arreglo factorial es el conjunto de puntos experimentales o tratamientos que pueden formarse considerando todas las posibles combinaciones de los niveles de los factores.

Problema 19

Enunciado

Fabricación de bolellas de polietileno

Se corre un diseño factorial 3 × 2 con 10 réplicas para investigar el hinchamiento del catalizador después de la extrusión en la fabricación de botellas de polietileno de alta densidad. El catalizador se utiliza en la obtención de dicho polietileno. Los factores investigados son: molde (con dos niveles) y B: catalizador (con tres niveles). Los datos obtenidos se muestran en la siguiente tabla:

Tabla problema 19

Lectura de dato:

setwd("C:/Users/KETSY/Desktop/Experimental/Capítulo 5")
df=read.csv("cap5p19.csv")
df
##    Molde Catalizador  Y
## 1     -1          -1 93
## 2     -1          -1 92
## 3     -1          -1 90
## 4     -1          -1 91
## 5     -1          -1 92
## 6     -1          -1 91
## 7     -1          -1 90
## 8     -1          -1 91
## 9     -1          -1 93
## 10    -1          -1 90
## 11     1          -1 88
## 12     1          -1 88
## 13     1          -1 87
## 14     1          -1 87
## 15     1          -1 88
## 16     1          -1 87
## 17     1          -1 87
## 18     1          -1 87
## 19     1          -1 87
## 20     1          -1 88
## 21    -1           0 92
## 22    -1           0 94
## 23    -1           0 90
## 24    -1           0 91
## 25    -1           0 90
## 26    -1           0 91
## 27    -1           0 92
## 28    -1           0 92
## 29    -1           0 92
## 30    -1           0 91
## 31     1           0 90
## 32     1           0 88
## 33     1           0 88
## 34     1           0 88
## 35     1           0 89
## 36     1           0 90
## 37     1           0 89
## 38     1           0 88
## 39     1           0 88
## 40     1           0 89
## 41    -1           1 95
## 42    -1           1 94
## 43    -1           1 94
## 44    -1           1 94
## 45    -1           1 94
## 46    -1           1 97
## 47    -1           1 95
## 48    -1           1 96
## 49    -1           1 94
## 50    -1           1 96
## 51     1           1 91
## 52     1           1 90
## 53     1           1 92
## 54     1           1 90
## 55     1           1 97
## 56     1           1 89
## 57     1           1 90
## 58     1           1 91
## 59     1           1 91
## 60     1           1 91
df$Molde=factor(df$Molde)
df$Catalizador=factor(df$Catalizador)

Modelo Estadístico ANOVA

modelo=aov(Y~Molde+Catalizador,data=df)
summary(modelo)
##             Df Sum Sq Mean Sq F value   Pr(>F)    
## Molde        1 180.27  180.27  110.89 6.79e-15 ***
## Catalizador  2 153.03   76.52   47.07 1.02e-12 ***
## Residuals   56  91.03    1.63                     
## ---
## Signif. codes:  0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1

Boxplot: Visualización de los datos

boxplot(Y~Molde,data=df,main="Gráfica de Moldes",col="pink")

boxplot(Y~Catalizador,data=df,main="Gráfica de Catalizadores",col="pink")

boxplot(Y~Molde*Catalizador,data=df,main="Gráfica de las Variables",col="pink")

Gráfica de Intecciones

interaction.plot(df$Molde,df$Catalizador,df$Y,col="6")

Prueba de comparación múltiple: TukeyHSD

tk=TukeyHSD(modelo)
tk
##   Tukey multiple comparisons of means
##     95% family-wise confidence level
## 
## Fit: aov(formula = Y ~ Molde + Catalizador, data = df)
## 
## $Molde
##           diff       lwr       upr p adj
## 1--1 -3.466667 -4.126135 -2.807199     0
## 
## $Catalizador
##      diff        lwr      upr     p adj
## 0--1 0.75 -0.2206975 1.720698 0.1598613
## 1--1 3.70  2.7293025 4.670698 0.0000000
## 1-0  2.95  1.9793025 3.920698 0.0000000
plot(tk,col="6")

Prueba de normalidad de los residuos

qqnorm(modelo$residuals,main="Gráfica de Normalidad",col="6")
qqline(modelo$residuals)

shapiro.test(modelo$residuals)
## 
##  Shapiro-Wilk normality test
## 
## data:  modelo$residuals
## W = 0.87917, p-value = 2.485e-05

Prueba de igualdad de varianzas: Homocedasticidad

require(car)
leveneTest(Y~Molde,data=df)
## Levene's Test for Homogeneity of Variance (center = median)
##       Df F value Pr(>F)
## group  1  0.1322 0.7175
##       58
leveneTest(Y~Catalizador,data=df)
## Levene's Test for Homogeneity of Variance (center = median)
##       Df F value Pr(>F)
## group  2  2.0397 0.1394
##       57

Gráfica de independencia de los residuos

plot(modelo$residuals,main="Gráfica de Independencia",col="6")
abline(h=0)

Preguntas

a)Plantee las hipótesis de interés en este problema y el modelo estadístico correspondiente.

Ho : Efecto de Molde (A) = 0

HA : Efecto de Molde (A) ≠ 0

Ho : Efecto de Catalizador (B) = 0

HA : Efecto de Catalizador (B) ≠ 0

Estas hipótesis se prueban mediante la técnica de análisis de varianza (modelo estadístico: ANOVA), para un diseño factorial 3 × 2 con 10 réplicas.

b)Construya la tabla de análisis de varianza y determine cuáles efectos están activos.

                           Df        Sum Sq        Mean Sq      F value       Pr(>F)    

Molde 1 180.27 180.27 110.89 6.79e-15 Catalizador 2 153.03 76.52 47.07 1.02e-12 Residuals 56 91.03 1.63

Ambos efectos el molde y el catalizador están activos.

c)Dibuje las gráficas de medias para los dos efectos de Tukey.

plot(tk,col="6")

d)Haga la gráfica de interacción.

interaction.plot(df$Molde,df$Catalizador,df$Y,col="6")

e)Determine cuál es el mejor tratamiento. ¿Cuál es el hinchamiento predicho en el mejor tratamiento?

El mejor tratamiento sería Molde A1 y el Catalizador B3, con un hinchamiento medio de 94.9.

f)Verifique los supuestos de normalidad y varianza constante.

En la prueba Shapiro con un valor p = 2.485e-05 (p<0.05), se rechaza Ho, por lo que se concluye que los datos no se distribuyen de forma normal.

En el leveneTest para catalizadores y moldes, en ambos la p > 0.05, nos indica que hay varianzas constantes.

g)Utilice la gráfica de residuos contra factores para detectar posibles efectos sobre la dispersión del hinchamiento. ¿En cuál molde parece que es menor la dispersión?

Observando la gráfica de residuos contra factores, pareciera que la dispersión es menor en el molde B.

Conclusiones

  • En este problema no se cumple con el supuesto de normalidad, sin embargo si cumple con los supuestos de igualdad de varianzas y de independencia.
  • Los efectos molde y catalizadores con un p<0.05 se rechaza Ho, por lo que ambos efectos están activos y tiene efecto sobre el hinchamiento del catalizador.
  • El tratamiento con el Molde A1 y el catalizador B3, son el que se observa que tienen un mejor resultqado de hinchamiento del catalizador.

Problema 20

Enunciado

Adhesiones de componentes electrónicos sobre placas

Para mejorar la resistencia a la torsión de las adhesiones de componentes electrónicos sobre placas, se estudiaron dos tipos de pegamentos (A1 y A2) y tres temperaturas de curado (60, 80 y 100°C). En cada combinación se analizaron dos componentes y los resultados obtenidos son los siguientes:

Tabla problema 20

Lectura de dato:

setwd("C:/Users/KETSY/Desktop/Experimental/Capítulo 5")
df=read.csv("Cap5Prob20.csv")
df
##    Pegamento Temperatura    Y
## 1         A1          60 2.50
## 2         A1          60 2.80
## 3         A1          80 3.80
## 4         A1          80 3.40
## 5         A1         100 4.00
## 6         A1         100 4.20
## 7         A2          60 1.60
## 8         A2          60 1.22
## 9         A2          80 3.20
## 10        A2          80 2.80
## 11        A2         100 4.30
## 12        A2         100 4.70
df$Pegamento=factor(df$Pegamento)
df$Temperatura=factor(df$Temperatura)
df$Y=as.double(df$Y)

Modelo Estadístico ANOVA

modelo=aov(Y~Pegamento*Temperatura,data=df)
summary(modelo)
##                       Df Sum Sq Mean Sq F value   Pr(>F)    
## Pegamento              1  0.691   0.691   10.99   0.0161 *  
## Temperatura            2 10.354   5.177   82.35 4.34e-05 ***
## Pegamento:Temperatura  2  1.366   0.683   10.87   0.0101 *  
## Residuals              6  0.377   0.063                     
## ---
## Signif. codes:  0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1

Boxplot: Visualización de los datos

boxplot(Y~Pegamento,data=df,main="Gráficos de los pegamento",col="pink")

boxplot(Y~Temperatura,data=df,main="Resistencia a la torsión de las adhesiones",col="pink")

boxplot(Y~Pegamento*Temperatura,data=df,main="Gráficos de las variables",col="pink")

Prueba de comparación múltiple: TukeyHSD

tk=TukeyHSD(modelo)
tk
##   Tukey multiple comparisons of means
##     95% family-wise confidence level
## 
## Fit: aov(formula = Y ~ Pegamento * Temperatura, data = df)
## 
## $Pegamento
##        diff        lwr        upr     p adj
## A2-A1 -0.48 -0.8342158 -0.1257842 0.0160877
## 
## $Temperatura
##        diff       lwr      upr     p adj
## 80-60  1.27 0.7260119 1.813988 0.0009122
## 100-60 2.27 1.7260119 2.813988 0.0000343
## 100-80 1.00 0.4560119 1.543988 0.0032134
## 
## $`Pegamento:Temperatura`
##                diff         lwr       upr     p adj
## A2:60-A1:60   -1.24 -2.23787597 -0.242124 0.0188874
## A1:80-A1:60    0.95 -0.04787597  1.947876 0.0613074
## A2:80-A1:60    0.35 -0.64787597  1.347876 0.7301328
## A1:100-A1:60   1.45  0.45212403  2.447876 0.0088011
## A2:100-A1:60   1.85  0.85212403  2.847876 0.0024766
## A1:80-A2:60    2.19  1.19212403  3.187876 0.0009867
## A2:80-A2:60    1.59  0.59212403  2.587876 0.0055020
## A1:100-A2:60   2.69  1.69212403  3.687876 0.0003113
## A2:100-A2:60   3.09  2.09212403  4.087876 0.0001416
## A2:80-A1:80   -0.60 -1.59787597  0.397876 0.2878599
## A1:100-A1:80   0.50 -0.49787597  1.497876 0.4368423
## A2:100-A1:80   0.90 -0.09787597  1.897876 0.0761198
## A1:100-A2:80   1.10  0.10212403  2.097876 0.0327623
## A2:100-A2:80   1.50  0.50212403  2.497876 0.0074161
## A2:100-A1:100  0.40 -0.59787597  1.397876 0.6284243

Prueba de normalidad de los residuos

qqnorm(modelo$residuals,main="Gráfica de Normalidad",col="6")
qqline(modelo$residuals)

shapiro.test(modelo$residuals)
## 
##  Shapiro-Wilk normality test
## 
## data:  modelo$residuals
## W = 0.77302, p-value = 0.004698

Prueba de igualdad de varianzas: Homocedasticidad

require(car)
leveneTest(Y~Temperatura,data=df)
## Levene's Test for Homogeneity of Variance (center = median)
##       Df F value  Pr(>F)  
## group  2  4.4568 0.04516 *
##        9                  
## ---
## Signif. codes:  0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
leveneTest(Y~Pegamento,data=df)
## Levene's Test for Homogeneity of Variance (center = median)
##       Df F value Pr(>F)
## group  1  2.7953 0.1255
##       10

Gráfica de independencia de los residuos

plot(modelo$residuals,main="Gráfica de Independencia de los Residuos",col="6")
abline(h=0)

Preguntas

a)Plantee las hipótesis de interés en este problema y el modelo estadístico correspondiente.

Ho : Efecto de Pegamento (A) = 0

HA : Efecto de Pegamento (A) ≠ 0

Ho : Efecto de Temperatura de curadp (B) = 0

HA : Efecto de Temperatura de curado (B) ≠ 0

Estas hipótesis se prueban mediante la técnica de análisis de varianza (modelo estadístico: ANOVA), para un diseño factorial 3 × 2 con 2 réplicas.

b)Construya el ANOVA y decida cuáles efectos están activos.

Al realizar el análisis de ANOVA, se observa que la variable pegamento con un valor p=0.016 y la temperatura de curado con un valor p=0.000, se obtuvo valores p<0.05, por lo tanto se rechaza Ho, y se concluye que ambos efectos están activos.

c)Dibuje las gráficas de efectos y determine con ellas el mejor tratamiento.

interaction.plot(df$Pegamento,df$Temperatura,df$Y,main="Interaccion entre las variables",col="6")

En la gráfica de interacción se puede observar el Pegamento A2 a una temperatura de curado de 100°C, representan el mejor tratamiento, al lograr mayor resistencia de torsión de las adhesiones de componentes electrónicos sobre placas.

d)Estime la resistencia a la torsión en el mejor tratamiento.

La resitencia a la torción en el mejor tratamiento es de 4.5

e)Verifique residuos.

plot(modelo$residuals,main="Gráfica de Independencia de los Residuos",col="6")
abline(h=0)

Conclusiones

  • En el análisis de ANOVA, los pegamentos con un valor p=0.016 y la temperatura con un valor p=0.000 (ambos con 0<0.05) se puede concluir que tienen un efecto significativo en la resistencia a la torsión de las adhesiones componentes electrónicos sobre placas, es decir las medias son diferentes.

  • No existe interacción (AB) con un nivel de confianza del 95% sobre la media de resistencia a la torsión de las adhesiones de componentes electrónicos sobre placas.

  • El mejor tratamiento es el Pegamento A2 a una temperatura de curado de 100°C, logrando una resistencia media de 4.5

  • En este problema no se cumple con el supuesto de normalidad, pero se puede decir que cumple con la igualdad de varianzas y con la indendecia de los datos.

Problema 21

Enunciado

Resistencia de caucho vulcanizado

Se desea investigar de qué manera afecta el tiempo de curado y el tipo del acelerante a la resistencia de caucho vulcanizado. Se realiza un experimento y se obtienen los siguientes datos:

Tabla problema 22

Lectura de dato:

setwd("C:/Users/KETSY/Desktop/Experimental/Capítulo 5")
df=read.csv("Cap5-Prob21.csv",sep=";")
df
##    ACELERANTE TIEMPO.DE.CURA    Y
## 1          -1             -1 3900
## 2          -1             -1 3600
## 3          -1              0 4100
## 4          -1              0 3500
## 5          -1              1 4000
## 6          -1              1 3800
## 7           0             -1 4300
## 8           0             -1 3700
## 9           0              0 4200
## 10          0              0 3900
## 11          0              1 4300
## 12          0              1 3600
## 13          1             -1 3700
## 14          1             -1 4100
## 15          1              0 3900
## 16          1              0 4000
## 17          1              1 3600
## 18          1              1 3800
df$TIEMPO=factor(df$TIEMPO)
df$ACELERANTE=factor(df$ACELERANTE)
str(df)
## 'data.frame':    18 obs. of  4 variables:
##  $ ACELERANTE    : Factor w/ 3 levels "-1","0","1": 1 1 1 1 1 1 2 2 2 2 ...
##  $ TIEMPO.DE.CURA: int  -1 -1 0 0 1 1 -1 -1 0 0 ...
##  $ Y             : int  3900 3600 4100 3500 4000 3800 4300 3700 4200 3900 ...
##  $ TIEMPO        : Factor w/ 3 levels "-1","0","1": 1 1 2 2 3 3 1 1 2 2 ...

Modelo Estadístico ANOVA

modelo=aov(Y~TIEMPO+ACELERANTE,data=df)
summary(modelo)
##             Df Sum Sq Mean Sq F value Pr(>F)
## TIEMPO       2  21111   10556   0.152   0.86
## ACELERANTE   2 114444   57222   0.825   0.46
## Residuals   13 902222   69402

Boxplot: Visualización de los datos

boxplot(Y~TIEMPO,data=df,main="Gráfica de Tiempo de cura",col="pink")

boxplot(Y~ACELERANTE,data = df,main="Gráfica de tipo de acelerante",col="pink")

boxplot(Y~TIEMPO+ACELERANTE,data=df,main="Gráfica de las variables",col="pink")

interaction.plot(df$TIEMPO,df$ACELERANTE,df$Y,main="Gráfica de Interacción",col="pink")

Prueba de comparación múltiple: TukeyHSD

tk=TukeyHSD(modelo)
tk
##   Tukey multiple comparisons of means
##     95% family-wise confidence level
## 
## Fit: aov(formula = Y ~ TIEMPO + ACELERANTE, data = df)
## 
## $TIEMPO
##           diff       lwr      upr     p adj
## 0--1  50.00000 -351.6061 451.6061 0.9424302
## 1--1 -33.33333 -434.9394 368.2728 0.9739228
## 1-0  -83.33333 -484.9394 318.2728 0.8493245
## 
## $ACELERANTE
##            diff       lwr      upr     p adj
## 0--1  183.33333 -218.2728 584.9394 0.4708685
## 1--1   33.33333 -368.2728 434.9394 0.9739228
## 1-0  -150.00000 -551.6061 251.6061 0.5979909
plot(tk,col="6")

Prueba de normalidad de los residuos

qqnorm(modelo$residuals,main="Gráfica de Normalidad de los residuos",col="6")
qqline(modelo$residuals)

shapiro.test(modelo$residuals)
## 
##  Shapiro-Wilk normality test
## 
## data:  modelo$residuals
## W = 0.94083, p-value = 0.2994

Prueba de igualdad de varianzas: Homoscedesticidad

library("car")
leveneTest(Y~TIEMPO,data=df)
## Levene's Test for Homogeneity of Variance (center = median)
##       Df F value Pr(>F)
## group  2  0.1373 0.8728
##       15
leveneTest(Y~ACELERANTE,data=df)
## Levene's Test for Homogeneity of Variance (center = median)
##       Df F value Pr(>F)
## group  2   1.789  0.201
##       15

Gráfica de independencia de los residuos

plot(modelo$residuals,col="6")
abline(h=0)

plot(df$TIEMPO,modelo$residuals,col="pink")
abline(h=0)

Preguntas

a)Señale el nombre del diseño de experimento utilizado y su modelo estadístico.

Diseño Factorial, diseño estadístico ANOVA.

b)Formule claramente todas las hipótesis que se pueden probar.

Ho= no afecta el tiempo de curado la resistencia del caucho

Ha= afecta el tiempo de curado la resistencia del caucho

Ho= No afecta el tipo de acelerante la resistencia del caucho

Ha= afecta el tipo de acelerante la resistencia del caucho

c)Realice el análisis estadístico apropiado para probar las hipótesis que formuló.

Se realizo análisis de ANOVA, en donde el tiempo con valor p=0.87 y el acelerante con un valor p=0.46 (p>0.05)se acepta Ho en ambos, concluyendoque ni el tiempo ni el tipo de acelerante afectan la resitencia del caucho.

d)¿Hay algún tiempo de cura que es mejor para aumentar la resistencia? Argumente su respuesta.

Como podemos observar en la gráfica los tres tiempos de cura serian iguales ya que hay un excelente traslape entre los tres tiempos. Y en el análisis de ANOVA para el tiempo p=0.87 (p>0.05) aceptando Ho.

e)¿Algún acelerante es mejor? Explique.

Los tres tipos de acelerantés son iguales al existir un excelente traslape entre ellos como se puede observaren la gráfica. Y en el análisis de ANOVA para el tipo de acelerante p=0.46 (p>0.05) aceptando Ho.

f)¿Hay alguna combinación de tiempo y acelerante que sea mejor?

En la gráfica de interacción podemos observar que el mejor tratamiento es la combinación del acelerante B con un tiempo de 60 minutos, al aumentar la resistencia del caucho vulacanizado.

h)Verifique que se cumplan los supuestos. En caso de que no se cumpliera el supuesto varianza constante para el tiempo de cura, ¿qué significaría eso y cómo pudiera corregirse?

Si se cumplen los 3 supuestos de la ANOVA: Normalidad, igualdad de varianza y la independencia.

Conclusiones

  • Se cumplen los supuestos de la ANOVA.

  • Los tres tipos de acelerantés y los 3 tiempos, son iguales, no tienen un efecto significativo sobre la resitencia del caucho.

  • En la gráfica de interacción, se puede concluir que la combinación del acelerante B con un tiempo de 60 minutos, aumentar la resistencia del caucho vulacanizado.