1 Diseño de bloques al azar

El diseño en bloque completo al azar (DBCA), el cual es llamado también experimento con dos criterios de clasificación, porque tiene dos fuentes de variación; estas son tratamientos y bloques: este diseño es un modelo estadístico en el que: Los tratamientos son designados al azar a las unidades experimentales dentro de cada bloque.

2 Problema 4-10

Atomizador mata moscas.

Se hace un estudio sobre la efectividad de tres marcas de atomizador para matar moscas. Para ello, cada producto se aplica a un grupo de 100 moscas, y se cuenta el número de moscas muertas expresado en porcentajes. Se hicieron seis réplicas, pero en días diferentes; por ello, se sospecha que puede haber algún efecto importante debido a esta fuente de variación. Los datos obtenidos se muestran a continuación:

Cuadro c4 p10.

  1. Suponiendo un DBCA, formule las hipótesis adecuadas y el modelo estadístico.
  2. ¿Existe diferencia entre la efectividad promedio de los atomizadores?
  3. ¿Hay algún atomizador mejor? Argumente su respuesta.
  4. ¿Hay diferencias significativas en los resultados de diferentes días en que se realizó el experimento? Argumente su respuesta.
  5. Verifique los supuestos de normalidad y de igual varianza entre las marcas.

2.1 Resolución del problema

Hipótesis:

Ho: µ1= µ2= µ3

Ha: al menos una de las medias de las marcas sea diferente

2.1.1 Entrada de datos

##    Marca Trat  Y
## 1      1    1 72
## 2      1    2 65
## 3      1    3 67
## 4      1    4 75
## 5      1    5 62
## 6      1    6 73
## 7      2    1 55
## 8      2    2 59
## 9      2    3 68
## 10     2    4 70
## 11     2    5 53
## 12     2    6 50
## 13     3    1 64
## 14     3    2 74
## 15     3    3 61
## 16     3    4 58
## 17     3    5 51
## 18     3    6 69
## 'data.frame':    18 obs. of  3 variables:
##  $ Marca: Factor w/ 3 levels "1","2","3": 1 1 1 1 1 1 2 2 2 2 ...
##  $ Trat : Factor w/ 6 levels "1","2","3","4",..: 1 2 3 4 5 6 1 2 3 4 ...
##  $ Y    : num  72 65 67 75 62 73 55 59 68 70 ...

2.1.2 Modelo estadístico del ANOVA

modelo=aov(Y~Trat+Marca,data=df)
summary(modelo)
##             Df Sum Sq Mean Sq F value Pr(>F)
## Trat         5  281.3   56.27   1.094  0.421
## Marca        2  296.3  148.17   2.881  0.103
## Residuals   10  514.3   51.43

a) ¿Existe diferencia entre la efectividad promedio de los atomizadores?

En la prueba ANOVA: Se obtuvo un valor-p = 0.103 > 0.05, por lo tanto se acepta Ho. No existe diferencia entre la efectividad promedio de los atomizadores.

2.1.3 Boxplot: Visualización de los datos

boxplot(Y~Marca,data=df,main="Diagrama de cajas de Marca",col='pink')

boxplot(Y~Trat,data=df,main="Diagrama de cajas de Tratamientos",col='orange')

b)¿ Hay algún atomizador mejor? Argumente su respuesta.

En el Boxplot Marca: En este caso como los intervalos de confianza se traslapan entonces los atomizadores son estadísticamente iguales en cuanto a sus medias. Aunque se puede decir que hay una leve mejor efectividad en la marca 1.

c) Hay diferencias significativas en los resultados de diferentes días en que se realizó el experimento? Argumente su respuesta. En el Boxplot Trat: En este caso como los intervalos de confianza casi todos se traslapan entonces los resultados de diferentes días en que se realizó el experimento son estadísticamente iguales en cuanto a sus medias, excepto una leve diferencia del día 5.

2.1.4 Prueba de normalidad de los residuales

qqnorm(modelo$residuals)
qqline(modelo$residuals,col='red')

2.1.5 Prueba de Shapiro-Wilks

shapiro.test(modelo$residuals)
## 
##  Shapiro-Wilk normality test
## 
## data:  modelo$residuals
## W = 0.9575, p-value = 0.5541

2.1.6 Prueba de Levene para la igualdad de varianzas: Homocedasticidad

library(car)
## Loading required package: carData
leveneTest(Y~Trat,data=df)
## Levene's Test for Homogeneity of Variance (center = median)
##       Df F value Pr(>F)
## group  5  0.2832 0.9134
##       12

2.1.7 Prueba de independencia de error de los datos

plot(modelo$residuals)
abline(h=0,col='red')

d) Verifique los supuestos de normalidad y de igual varianza entre las marcas.

En la gráfica de prueba de normalidad de los datos, se observa que estos siguen una distribución normal ya que tienden a quedar cerca a la línea.

En la gráfica de prueba de independencia de error de los datos, se observa que los puntos se distribuyen de manera aleatoria alrededor de la línea, por lo que se cumple el supuesto que los tratamientos tienen igual varianza.

2.1.8 Conclusiones

Se obtuvo un valor-p = 0.103 > 0.05, por lo tanto se acepta Ho. No existe diferencia entre la efectividad promedio de los atomizadores. Los atomizadores son estadísticamente iguales en cuanto a sus medias. Aunque se puede decir que hay una leve mejor efectividad en la marca 1.

3 Problema 4-15

Balanza.{width=30%]

Un aspecto crítico para que se conserve la leche es la temperatura de almacenamiento. De manera tradicional se han usado termómetros de mercurio (Mer) para verificar que la temperatura sea la adecuada, pero ahora se han comprado termómetros electrónicos (Rtd) para facilitar el proceso de medición. Sin embargo, se duda de las mediciones de estos nuevos dispositivos. Para aclarar dudas y diagnosticar la situación, durante cinco días se toman mediciones con ambos tipos de termómetros en varios silos (a la misma hora). Los datos para cinco silos se muestran a continuación:

Cuadro c4 p15.

3.1 Resolución del problema

3.1.1 Análisis de los datos - PARTE I

3.1.2 Entrada de datos

## 'data.frame':    25 obs. of  3 variables:
##  $ Silo: Factor w/ 5 levels "A","B","C","D",..: 1 1 1 1 1 2 2 2 2 2 ...
##  $ Dia : Factor w/ 5 levels "1","2","3","4",..: 1 2 3 4 5 1 2 3 4 5 ...
##  $ Y   : num  2.6 2.8 5 0 2.4 6.4 6.4 2.3 4.2 4 ...
  1. Observe los datos y establezca una conjetura acerca de la confiabilidad de las mediciones con Rtd (del termometro de mercurio no hay duda)

  2. Es claro que el silo se puede ver como tratamiento y dias como bloque. Considere solo los datos de Rtd y establezca el modelo estadistico. Tambien haga el ANOVA correspondiente y obtenga conclusiones.

3.1.3 Modelo estadístico del ANOVA y Boxplot

modelo=aov(Y~Silo+Dia,data=df)

summary(modelo)
##             Df Sum Sq Mean Sq F value   Pr(>F)    
## Silo         4 182.53   45.63   8.091 0.000912 ***
## Dia          4  62.01   15.50   2.749 0.064865 .  
## Residuals   16  90.24    5.64                     
## ---
## Signif. codes:  0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
boxplot(Y~Silo,data=df,col='yellow')

boxplot(Y~Dia,data=df,col='pink')

Silo: Los silos no son iguales ya que presentan un valor de P<0.05:Hipotesis alternativa.

Dia:Los dias tienen temperaturas iguales ya que presentan un valor de P>0.05: Hipotesis nula.

3.1.4 Prueba de Comparaciones Multiples: TukeyHSD

tk=TukeyHSD(modelo)

tk
##   Tukey multiple comparisons of means
##     95% family-wise confidence level
## 
## Fit: aov(formula = Y ~ Silo + Dia, data = df)
## 
## $Silo
##      diff         lwr        upr     p adj
## B-A  2.10  -2.5016327  6.7016327 0.6374197
## C-A -3.16  -7.7616327  1.4416327 0.2656259
## D-A  2.18  -2.4216327  6.7816327 0.6057729
## E-A -4.42  -9.0216327  0.1816327 0.0628520
## C-B -5.26  -9.8616327 -0.6583673 0.0212974
## D-B  0.08  -4.5216327  4.6816327 0.9999980
## E-B -6.52 -11.1216327 -1.9183673 0.0039696
## D-C  5.34   0.7383673  9.9416327 0.0191638
## E-C -1.26  -5.8616327  3.3416327 0.9144393
## E-D -6.60 -11.2016327 -1.9983673 0.0035673
## 
## $Dia
##      diff       lwr      upr     p adj
## 2-1  0.12 -4.481633 4.721633 0.9999897
## 3-1  0.18 -4.421633 4.781633 0.9999479
## 4-1 -2.88 -7.481633 1.721633 0.3478187
## 5-1 -3.32 -7.921633 1.281633 0.2254054
## 3-2  0.06 -4.541633 4.661633 0.9999994
## 4-2 -3.00 -7.601633 1.601633 0.3107739
## 5-2 -3.44 -8.041633 1.161633 0.1984234
## 4-3 -3.06 -7.661633 1.541633 0.2932674
## 5-3 -3.50 -8.101633 1.101633 0.1859252
## 5-4 -0.44 -5.041633 4.161633 0.9982140
plot(tk)

Con la prueba Tukey se observa las diferencia entre Silos y Dias

3.1.5 Analisis de supuestos: Los datos vienen de una distribucion normal.

qqnorm(modelo$residuals)

qqline(modelo$residuals,col='red')

3.1.6 Prueba de Shapiro

shapiro.test(modelo$residuals)
## 
##  Shapiro-Wilk normality test
## 
## data:  modelo$residuals
## W = 0.94816, p-value = 0.2279

P>0.05 se acepta H0.

3.1.7 Análisis de los datos - PARTE II

3.1.8 Entrada de datos

## function (x, df, ncp, log = FALSE)

3.1.9 Analisis de ANOVA y boxplot

modelo=aov(Y~Silo+Dia,data=df)
summary(modelo)
##             Df Sum Sq Mean Sq F value Pr(>F)
## Silo         4   4.46   1.115   0.690  0.609
## Dia          4   9.76   2.440   1.511  0.246
## Residuals   16  25.84   1.615
boxplot(Y~Silo,data=df,col='green')

boxplot(Y~Dia,data=df,col='blue')

3.1.10 Prueba de Comparaciones Multiples: TukeyHSD

tk=TukeyHSD(modelo)

tk
##   Tukey multiple comparisons of means
##     95% family-wise confidence level
## 
## Fit: aov(formula = Y ~ Silo + Dia, data = df)
## 
## $Silo
##     diff     lwr    upr     p adj
## B-A  0.9 -1.5624 3.3624 0.7940241
## C-A  0.1 -2.3624 2.5624 0.9999395
## D-A  1.0 -1.4624 3.4624 0.7268563
## E-A  0.2 -2.2624 2.6624 0.9990573
## C-B -0.8 -3.2624 1.6624 0.8536191
## D-B  0.1 -2.3624 2.5624 0.9999395
## E-B -0.7 -3.1624 1.7624 0.9033967
## D-C  0.9 -1.5624 3.3624 0.7940241
## E-C  0.1 -2.3624 2.5624 0.9999395
## E-D -0.8 -3.2624 1.6624 0.8536191
## 
## $Dia
##     diff     lwr       upr     p adj
## 2-1  0.4 -2.0624 2.8624003 0.9864301
## 3-1  0.1 -2.3624 2.5624003 0.9999395
## 4-1 -1.4 -3.8624 1.0624003 0.4380469
## 5-1 -0.4 -2.8624 2.0624003 0.9864301
## 3-2 -0.3 -2.7624 2.1624003 0.9954349
## 4-2 -1.8 -4.2624 0.6624003 0.2152533
## 5-2 -0.8 -3.2624 1.6624003 0.8536191
## 4-3 -1.5 -3.9624 0.9624003 0.3729211
## 5-3 -0.5 -2.9624 1.9624003 0.9693357
## 5-4  1.0 -1.4624 3.4624003 0.7268563
plot(tk)

3.1.11 Prueba de normalidad de los residuales

qqnorm(modelo$residuals)

qqline(modelo$residuals,col='red')

3.1.12 Conclusiones

Analisis de lo obtenido: Silo: P>0.05: Hipotesis nula, Dias: P>0.05: Hipotesis nula

d)¿Las conclusiones obtenidas en los incisos anteriores coinciden? Comente su respuesta.

  1. Datos pareados. Para comparar los dos métodos de medición (Mer y Rtd) obtenga como variable de respuesta a la diferencia de temperatura que registran los metodos para cada dia en cada silo. Considerando esto, establezca el modelo estadistico, haga el ANOVA correspondiente y obtenga conclusiones.

3.1.13 Análisis de los datos - PARTE III

3.1.14 Entrada de datos

## 'data.frame':    25 obs. of  3 variables:
##  $ Silo: Factor w/ 5 levels "A","B","C","D",..: 1 1 1 1 1 2 2 2 2 2 ...
##  $ Dia : Factor w/ 5 levels "1","2","3","4",..: 1 2 3 4 5 1 2 3 4 5 ...
##  $ Y   : num  1.4 1.2 0 0.5 0.6 1.4 0.4 0.3 0.2 0 ...

3.1.15 Analisis de ANOVA y boxplot

modelo=aov(Y~Silo+Dia,data=df)

summary(modelo)
##             Df Sum Sq Mean Sq F value  Pr(>F)   
## Silo         4  96.81  24.203   6.660 0.00236 **
## Dia          4  41.96  10.490   2.887 0.05640 . 
## Residuals   16  58.15   3.634                   
## ---
## Signif. codes:  0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
boxplot(Y~Silo,data=df,col='orange')

boxplot(Y~Dia,data=df,col='yellow')

3.1.16 Prueba de Comparaciones Multiples: TukeyHSD

tk=TukeyHSD(modelo)
tk
##   Tukey multiple comparisons of means
##     95% family-wise confidence level
## 
## Fit: aov(formula = Y ~ Silo + Dia, data = df)
## 
## $Silo
##      diff        lwr       upr     p adj
## B-A -0.28 -3.9738038 3.4138038 0.9992815
## C-A  3.26 -0.4338038 6.9538038 0.0975664
## D-A  0.42 -3.2738038 4.1138038 0.9965009
## E-A  4.62  0.9261962 8.3138038 0.0110343
## C-B  3.54 -0.1538038 7.2338038 0.0636394
## D-B  0.70 -2.9938038 4.3938038 0.9760870
## E-B  4.90  1.2061962 8.5938038 0.0069223
## D-C -2.84 -6.5338038 0.8538038 0.1783452
## E-C  1.36 -2.3338038 5.0538038 0.7897851
## E-D  4.20  0.5061962 7.8938038 0.0220905
## 
## $Dia
##      diff         lwr      upr     p adj
## 2-1  0.04 -3.65380378 3.733804 0.9999997
## 3-1 -0.72 -4.41380378 2.973804 0.9735221
## 4-1  0.76 -2.93380378 4.453804 0.9678574
## 5-1  3.04 -0.65380378 6.733804 0.1346943
## 3-2 -0.76 -4.45380378 2.933804 0.9678574
## 4-2  0.72 -2.97380378 4.413804 0.9735221
## 5-2  3.00 -0.69380378 6.693804 0.1426179
## 4-3  1.48 -2.21380378 5.173804 0.7361905
## 5-3  3.76  0.06619622 7.453804 0.0450163
## 5-4  2.28 -1.41380378 5.973804 0.3606355
plot(tk)

3.1.17 Prueba de normalidad de los residuales

qqnorm(modelo$residuals)
qqline(modelo$residuals,col='red')

3.1.18 Conclusiones

Analisis de lo obtenido: Silo: P<0.05: Hipotesis alternativa, Dias: P>0.05: Hipotesis nula

4 Problema 4-19

Balanza. Se comprueba el peso en gramos de un material de tres proveedo res: A, B y C, por tres diferentes inspectores: I, II y III, utilizando tres diferentes escalas: 1, 2 y 3. El experimento se lleva a cabo como el siguiente cuadro latino:

Cuadro c4p19.

  1. ¿Hay diferencias entre los proveedores?
  2. ¿Hay diferencias entre los inspectores y entre las escalas?
  3. Si el peso debe ser 15 g, ¿cuál proveedor es mejor? d ) Si algún factor de bloque es no significativo, elimínelo y haga el análisis adecuado.

4.1 Resolución del problema

4.1.1 Entrada De Los Datos

##   Var1 Var2 Trat  Y
## 1    1    1    A 16
## 2    2    1    B 15
## 3    3    1    C 13
## 4    1    2    B 10
## 5    2    2    C  9
## 6    3    2    A 11
## 7    1    3    C 11
## 8    2    3    A 14
## 9    3    3    B 13
##   Inspector Escala Trat  Y
## 1         1      1    A 16
## 2         2      1    B 15
## 3         3      1    C 13
## 4         1      2    B 10
## 5         2      2    C  9
## 6         3      2    A 11
## 7         1      3    C 11
## 8         2      3    A 14
## 9         3      3    B 13
## 'data.frame':    9 obs. of  4 variables:
##  $ Inspector: int  1 2 3 1 2 3 1 2 3
##  $ Escala   : int  1 1 1 2 2 2 3 3 3
##  $ Trat     : chr  "A" "B" "C" "B" ...
##  $ Y        : num  16 15 13 10 9 11 11 14 13
##  - attr(*, "out.attrs")=List of 2
##   ..$ dim     : int [1:2] 3 3
##   ..$ dimnames:List of 2
##   .. ..$ Var1: chr [1:3] "Var1=1" "Var1=2" "Var1=3"
##   .. ..$ Var2: chr [1:3] "Var2=1" "Var2=2" "Var2=3"

4.1.2 Analisis de ANOVA

modelo=aov(Y~Inspector+Escala+Trat,data=df)
summary(modelo)
##             Df Sum Sq Mean Sq F value  Pr(>F)   
## Inspector    2   0.22   0.111       1 0.50000   
## Escala       2  32.89  16.444     148 0.00671 **
## Trat         2  10.89   5.444      49 0.02000 * 
## Residuals    2   0.22   0.111                   
## ---
## Signif. codes:  0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1

valor p = 0.50000 para los inspectores, se acepta Ho

4.1.3 Boxplot: Comparacion de Experimentos

boxplot(Y~Escala,data = df,col='green')

boxplot(Y~Trat,data = df,col='blue')

boxplot(Y~Inspector,data = df,col='pink')

El proveedor A, es el mejor proveedor porque es el que más se acerca al peso esperado de 15g

4.1.4 Prueba de Comparaciones Multiples: TukeyHSD

tk=TukeyHSD(modelo)
tk
##   Tukey multiple comparisons of means
##     95% family-wise confidence level
## 
## Fit: aov(formula = Y ~ Inspector + Escala + Trat, data = df)
## 
## $Inspector
##              diff       lwr      upr    p adj
## 2-1  3.333333e-01 -1.269927 1.936593 0.548184
## 3-1  1.776357e-15 -1.603260 1.603260 1.000000
## 3-2 -3.333333e-01 -1.936593 1.269927 0.548184
## 
## $Escala
##          diff       lwr        upr     p adj
## 2-1 -4.666667 -6.269927 -3.0634068 0.0061007
## 3-1 -2.000000 -3.603260 -0.3967402 0.0327189
## 3-2  2.666667  1.063407  4.2699265 0.0186734
## 
## $Trat
##          diff       lwr         upr     p adj
## B-A -1.000000 -2.603260  0.60325985 0.1191149
## C-A -2.666667 -4.269927 -1.06340682 0.0186734
## C-B -1.666667 -3.269927 -0.06340682 0.0464424
plot(tk)

4.1.5 Prueba de normalidad de los residuales

qqnorm(modelo$residuals)
qqline(modelo$residuals,col='red')

4.1.6 Prueba de Shapiro-Wilks

shapiro.test(modelo$residuals)
## 
##  Shapiro-Wilk normality test
## 
## data:  modelo$residuals
## W = 0.61728, p-value = 0.0001526

4.1.7 Prueba de Levene para la Igualdad de Varianza

require(car)
leveneTest(Y~Trat,data=df)
## Levene's Test for Homogeneity of Variance (center = median)
##       Df F value Pr(>F)
## group  2  0.0556 0.9464
##        6
leveneTest(Y~Escala,data=df)
## Levene's Test for Homogeneity of Variance (center = median)
##       Df F value Pr(>F)
## group  2  0.1429 0.8697
##        6

4.1.8 Prueba de independencia de error de los datos

plot(modelo$residuals)
abline(h=0,col='red')

4.1.9 Conclusiones

  1. ¿Hay diferencias entre los proveedores?

En el análisis de ANOVA , con un valor p = 0.02000 * (p < 0.05) para los proveedores, se rechaza Ho, concluyendo que hay diferencia significativa en al menos 1 proveedor.

  1. ¿Hay diferencias entre los inspectores y entre las escalas? En el análisis de ANOVA , con un valor p = 0.50000 para los inspectores, se acepta Ho, concluyendo que no hay diferencia significativa entre los instructores. Entre las escalas con un valor p = 0.00671 ** (p < 0.05), se rechaza Ho, concluyendo que hay diferencias significativas en al menos 1 escala.

  2. Si el peso debe ser 15 g, ¿cuál proveedor es mejor? El proveedor A, es el mejor proveedor porque es el que más se acerca al peso esperado de 15g.

  3. Si algún factor de bloque es no significativo, elimínelo y haga el análisis adecuado. Se elimina el factor de bloque de los inspectores, ya que se concluyó que no tiene efecto en la variable respuesta, al tener una p < 0.05 por lo tanto no hay diferencia significativa. Al hacer los análisis nuevamente se observó que las escalas y los proveedores seguían teniendo diferencia significativa, pero con un mayor grado de significancia.

Nota: Es importante tomar en cuenta que los datos no cumplen con los supuestos de normalidad e independencia de la ANOVA, por lo que el estudio no es reproducible.

5 Diseños Factoriales

El objetivo de un diseño factorial es estudiar el efecto de varios factores sobre una o varias respuestas, cuando se tiene el mismo interés sobre todos los factores. Los factores pueden ser de tipo cualitativo (máquinas, tipos de material, operador, la presencia o ausencia de una operación previa, etc.), o de tipo cuantitativo (temperatura, humedad, velocidad, presión, etc.). Para estudiar la manera en que influye cada factor sobre la variable de respuesta es necesario elegir al menos dos niveles de prueba para cada uno de ellos. Con el diseño factorial completo se corren aleatoriamente todas las posibles combinaciones que pueden formarse con los niveles de los factores a investigar.

6 Problema 5-19

Botellas. {width=20%}

Se corre un diseño factorial 3 × 2 con 10 réplicas para investigar el hinchamiento del catalizador después de la extrusión en la fabricación de botellas de polietileno de alta densidad. El catalizador se utiliza en la obtención de dicho polietileno. Los factores investigados son: molde (con dos niveles) y B: catalizador (con tres niveles). Los datos obtenidos se muestran en la siguiente tabla:

Cuadro c5 p19.

  1. Plantee las hipótesis de interés en este problema y el modelo estadístico correspondiente.
  2. Construya la tabla de análisis de varianza y determine cuáles efectos están activos.
  3. Dibuje las gráficas de medias para los dos efectos principales con los métodos LSD y de Tukey. Compare los resultados de ambos métodos.
  4. Haga la gráfica de interacción con intervalos de confianza sobrepuestos.
  5. Determine cuál es el mejor tratamiento. ¿Cuál es el hinchamiento predicho en el mejor tratamiento? f ) Verifique los supuestos de normalidad y varianza constante.
  6. Utilice la gráfica de residuos contra factores para detectar posibles efectos sobre la dispersión del hinchamiento. ¿En cuál molde parece que es menor la dispersión?

6.1 Resolucion del Problema

Hipótesis:

Ho : Efecto de Molde (A) = 0 HA : Efecto de Molde (A) ≠ 0

Ho : Efecto de Catalizador (B) = 0 HA : Efecto de Catalizador (B) ≠ 0

6.1.1 Entrada De Los Datos

##    Molde Catalizador  Y
## 1     -1          -1 93
## 2     -1          -1 92
## 3     -1          -1 90
## 4     -1          -1 91
## 5     -1          -1 92
## 6     -1          -1 91
## 7     -1          -1 90
## 8     -1          -1 91
## 9     -1          -1 93
## 10    -1          -1 90
## 11     1          -1 88
## 12     1          -1 88
## 13     1          -1 87
## 14     1          -1 87
## 15     1          -1 88
## 16     1          -1 87
## 17     1          -1 87
## 18     1          -1 87
## 19     1          -1 87
## 20     1          -1 88
## 21    -1           0 92
## 22    -1           0 94
## 23    -1           0 90
## 24    -1           0 91
## 25    -1           0 90
## 26    -1           0 91
## 27    -1           0 92
## 28    -1           0 92
## 29    -1           0 92
## 30    -1           0 91
## 31     1           0 90
## 32     1           0 88
## 33     1           0 88
## 34     1           0 88
## 35     1           0 89
## 36     1           0 90
## 37     1           0 89
## 38     1           0 88
## 39     1           0 88
## 40     1           0 89
## 41    -1           1 95
## 42    -1           1 94
## 43    -1           1 94
## 44    -1           1 94
## 45    -1           1 94
## 46    -1           1 97
## 47    -1           1 95
## 48    -1           1 96
## 49    -1           1 94
## 50    -1           1 96
## 51     1           1 91
## 52     1           1 90
## 53     1           1 92
## 54     1           1 90
## 55     1           1 97
## 56     1           1 89
## 57     1           1 90
## 58     1           1 91
## 59     1           1 91
## 60     1           1 91
## 'data.frame':    60 obs. of  3 variables:
##  $ Molde      : int  -1 -1 -1 -1 -1 -1 -1 -1 -1 -1 ...
##  $ Catalizador: int  -1 -1 -1 -1 -1 -1 -1 -1 -1 -1 ...
##  $ Y          : int  93 92 90 91 92 91 90 91 93 90 ...

6.1.2 Analisis de ANOVA

modelo=aov(Y~Molde+Catalizador,data=df)
summary(modelo)
##             Df Sum Sq Mean Sq F value   Pr(>F)    
## Molde        1 180.27  180.27  110.89 6.79e-15 ***
## Catalizador  2 153.03   76.52   47.07 1.02e-12 ***
## Residuals   56  91.03    1.63                     
## ---
## Signif. codes:  0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1

Ambos efectos el molde y el catalizador están activos

6.1.3 Boxplot: Comparacion de Experimentos

boxplot(Y~Molde,data=df,col='blue')

boxplot(Y~Catalizador,data=df,col='orange')

boxplot(Y~Molde*Catalizador,data=df,col='yellow')

interaction.plot(df$Molde,df$Catalizador,df$Y,col=1:3)

6.1.4 Prueba de Comparaciones Multiples: TukeyHSD

tk=TukeyHSD(modelo)
tk
##   Tukey multiple comparisons of means
##     95% family-wise confidence level
## 
## Fit: aov(formula = Y ~ Molde + Catalizador, data = df)
## 
## $Molde
##           diff       lwr       upr p adj
## 1--1 -3.466667 -4.126135 -2.807199     0
## 
## $Catalizador
##      diff        lwr      upr     p adj
## 0--1 0.75 -0.2206975 1.720698 0.1598613
## 1--1 3.70  2.7293025 4.670698 0.0000000
## 1-0  2.95  1.9793025 3.920698 0.0000000
plot(tk)

6.1.5 Prueba de normalidad de los residuales

qqnorm(modelo$residuals)
qqline(modelo$residuals,col='red')

6.1.6 Prueba de Shapiro-Wilks

shapiro.test(modelo$residuals)
## 
##  Shapiro-Wilk normality test
## 
## data:  modelo$residuals
## W = 0.87917, p-value = 2.485e-05

6.1.7 Prueba de Levene para la Igualdad de Varianza

require(car)
leveneTest(Y~Molde,data=df)
## Levene's Test for Homogeneity of Variance (center = median)
##       Df F value Pr(>F)
## group  1  0.1322 0.7175
##       58
leveneTest(Y~Catalizador,data=df)
## Levene's Test for Homogeneity of Variance (center = median)
##       Df F value Pr(>F)
## group  2  2.0397 0.1394
##       57

ambos la p > 0.05, nos indica que hay varianzas constantes.

6.1.8 Prueba de Indepencia de Los Errores de los Datos

plot(modelo$residuals)
abline(h=0,col='red')

6.1.9 Conclusiones

• Ambos efectos el molde y el catalizador están activos. • El mejor tratamiento sería Molde A1 y el Catalizador B3, con un hinchamiento predicho de 94.9. • En la prueba Shapiro con un valor p = 2.485e-05 (p<0.05), se rechaza Ho, por lo que se concluye que los datos no se distribuyen de forma normal. • En el leveneTest para catalizadores y moldes, en ambos la p > 0.05, nos indica que hay varianzas constantes. • Observando la gráfica de residuos contra factores, pareciera que la dispersión es menor en el molde B.

7 Problema 5-20

Adhesivo.

Para mejorar la resistencia a la torsión de las adhesiones de componentes electrónicos sobre placas, se estudiaron dos tipos de pegamentos (A1 y A2) y tres temperaturas de curado (60, 80 y 100°C). En cada combinación se analizaron dos componentes y los resultados obtenidos son los siguientes:

Cuadro c5p20. a) Plantee las hipótesis de interés en este problema y el modelo estadístico correspondiente. b) Construya el ANOVA y decida cuáles efectos están activos. c) Dibuje las gráficas de efectos y determine con ellas el mejor tratamiento. d) Estime la resistencia a la torsión en el mejor tratamiento. e) Verifique residuos.

7.1 Resolucion del Problema

FACTOR A: Pegamento 𝐻0: 𝜇A1=𝜇A2 𝐻𝐴: 𝜇A1≠𝜇A2

FACTOR B: Temperatura de curado 𝐻0: 𝜇60=𝜇80 =𝜇100 𝐻𝐴: 𝜇60≠𝜇80 ≠𝜇100

INTERACCIÓN 𝐻0: 𝜇AB = 0 𝐻𝐴: 𝜇AB ≠ 0

7.1.1 Entrada De Los Datos

##    Pegamento Temperatura    Y
## 1         A1          60 2.50
## 2         A1          80 3.80
## 3         A1         100 4.00
## 4         A1          60 2.80
## 5         A1          80 3.40
## 6         A1         100 4.20
## 7         A2          60 1.60
## 8         A2          80 3.20
## 9         A2         100 4.30
## 10        A2          60 1.22
## 11        A2          80 2.80
## 12        A2         100 4.70
## 'data.frame':    12 obs. of  3 variables:
##  $ Pegamento  : chr  "A1" "A1" "A1" "A1" ...
##  $ Temperatura: int  60 80 100 60 80 100 60 80 100 60 ...
##  $ Y          : num  2.5 3.8 4 2.8 3.4 4.2 1.6 3.2 4.3 1.22 ...

7.1.2 Analisis de ANOVA

modelo=aov(Y~Pegamento+Temperatura,data=df)
summary(modelo)
##             Df Sum Sq Mean Sq F value   Pr(>F)    
## Pegamento    1  0.691   0.691   3.171 0.112807    
## Temperatura  2 10.354   5.177  23.754 0.000431 ***
## Residuals    8  1.744   0.218                     
## ---
## Signif. codes:  0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1

7.1.3 Boxplot: Comparacion de Experimentos

boxplot(Y~Temperatura,data=df,main="Resistencia a la torsión de las adhesiones",col='yellow')

7.1.4 Prueba de Comparaciones Multiples: TukeyHSD

tk=TukeyHSD(modelo)
tk$Trat
## NULL

7.1.5 Prueba de normalidad de los residuales

qqnorm(modelo$residuals)
qqline(modelo$residuals,col='red')

7.1.6 Prueba de Shapiro-Wilks

shapiro.test(modelo$residuals)
## 
##  Shapiro-Wilk normality test
## 
## data:  modelo$residuals
## W = 0.94809, p-value = 0.6092

7.1.7 Conclusiones

  • FACTOR A: Pegamento

Se ha demostrado estadísticamente (P < 0,05) que los pegamentos tienen una influencia significativa en la resistencia a la torsión de las adhesiones componentes electrónicos sobre placas, es decir las medias son diferentes.

  • FACTOR B: Temperatura de curado Como en P valor < 0,05; entonces se rechaza la hipótesis nula, concluyendo que las medias de resistencia a la torsión de las adhesiones de componentes electrónicos sobre placas son diferentes.

  • INTERACCIÓN:

No existe interacción (AB) con un nivel de confianza del 95% sobre la media de resistencia a la torsión de las adhesiones de componentes electrónicos sobre placas.

  1. Análisis de grafica de ineracción:

● El factor (Pegamentos) tiene un efecto negativo en la variable de respuesta (resistencia a la torsión de componentes). ● El factor (temperaturas) tiene un efecto negativo en la variable de respuesta (resistencia a la torsión de componentes). ● La interacción AB existe.

8 Problema 5-21

Caucho vulcanizado.

Se desea investigar de qué manera afecta el tiempo de curado y el tipo del acelerante a la resistencia de caucho vulcanizado. Se realiza un experimento y se obtienen los siguientes datos:

Cuadro c5p21.

  1. Señale el nombre del diseño de experimento utilizado y su modelo estadístico.
  2. Formule claramente todas las hipótesis que se pueden probar.
  3. Realice el análisis estadístico apropiado para probar las hipótesis que formuló.
  4. ¿Hay algún tiempo de cura que es mejor para aumentar la resistencia? Argumente su respuesta.
  5. ¿Algún acelerante es mejor? Explique. f ) ¿Hay alguna combinación de tiempo y acelerante que sea mejor?
  6. Explique de manera gráfica cómo se obtuvo en la computadora el valor-p para tiempo de cura.
  7. Verifique que se cumplan los supuestos. En caso de que no se cumpliera el supuesto de varianza constante para el tiempo de cura, ¿qué significaría eso y cómo pudiera corregirse?

8.1 Resolución del problema

8.1.1 Entrada De Los Datos

##    ACELERANTE TIEMPO.DE.CURA    Y
## 1          -1             -1 3900
## 2          -1             -1 3600
## 3          -1              0 4100
## 4          -1              0 3500
## 5          -1              1 4000
## 6          -1              1 3800
## 7           0             -1 4300
## 8           0             -1 3700
## 9           0              0 4200
## 10          0              0 3900
## 11          0              1 4300
## 12          0              1 3600
## 13          1             -1 3700
## 14          1             -1 4100
## 15          1              0 3900
## 16          1              0 4000
## 17          1              1 3600
## 18          1              1 3800
## 'data.frame':    18 obs. of  3 variables:
##  $ ACELERANTE    : int  -1 -1 -1 -1 -1 -1 0 0 0 0 ...
##  $ TIEMPO.DE.CURA: int  -1 -1 0 0 1 1 -1 -1 0 0 ...
##  $ Y             : int  3900 3600 4100 3500 4000 3800 4300 3700 4200 3900 ...

8.1.2 Analisis de ANOVA

modelo=aov(Y~ACELERANTE+TIEMPO.DE.CURA,data=df)
summary(modelo)
##                Df Sum Sq Mean Sq F value Pr(>F)
## ACELERANTE      2 114444   57222   0.825   0.46
## TIEMPO.DE.CURA  2  21111   10556   0.152   0.86
## Residuals      13 902222   69402

El p_valor= 0.46 y 0.86 sugiere que no hay diferencia significativa entre los acelerantes y el tiempo de curado a las resistencia de caucho volcanico.

8.1.3 Boxplot: Comparacion de Experimentos

boxplot(Y~TIEMPO.DE.CURA,data=df,col='blue')

boxplot(Y~ACELERANTE,data=df,col='pink')

boxplot(Y~ACELERANTE*TIEMPO.DE.CURA,data=df,col='green')

interaction.plot(df$ACELERANTE,df$TIEMPO.DE.CURA,df$Y,col = 1:3)

1- No existe diferencia en las graficas de tiempo de curado y acelerante -1 y 1, pero si hay diferencia significativa en el tiempo de curado y acelerante 0.

2- En la grafica de comparacion del acelerantes y tiempo de curado señala que son diferentes los valores.

3- No existe interaccion entre los experimentos 0 y -1.

8.1.4 Prueba de Comparaciones Multiples: TukeyHSD

tk=TukeyHSD(modelo)
tk
##   Tukey multiple comparisons of means
##     95% family-wise confidence level
## 
## Fit: aov(formula = Y ~ ACELERANTE + TIEMPO.DE.CURA, data = df)
## 
## $ACELERANTE
##            diff       lwr      upr     p adj
## 0--1  183.33333 -218.2728 584.9394 0.4708685
## 1--1   33.33333 -368.2728 434.9394 0.9739228
## 1-0  -150.00000 -551.6061 251.6061 0.5979909
## 
## $TIEMPO.DE.CURA
##           diff       lwr      upr     p adj
## 0--1  50.00000 -351.6061 451.6061 0.9424302
## 1--1 -33.33333 -434.9394 368.2728 0.9739228
## 1-0  -83.33333 -484.9394 318.2728 0.8493245

Al comparar las medias de los diferentes valores obtenemos p_valores > 0.05 por lo que no existe diferencias significativas en entre las medias de los acelerantes y el tiempo de curado de los experimantos

8.1.5 Prueba de Normalidad

qqnorm(modelo$residuals)
qqline(modelo$residuals, col='purple')

shapiro.test(modelo$residuals)
## 
##  Shapiro-Wilk normality test
## 
## data:  modelo$residuals
## W = 0.94083, p-value = 0.2994

La prueba de Shapiro Wilks arroja un valor de p=0.2994 por lo que se acepta la Ho.

8.1.6 Prueba de Levene para la Igualdad de Varianza

require(car)
leveneTest(Y~ACELERANTE,data=df)
## Levene's Test for Homogeneity of Variance (center = median)
##       Df F value Pr(>F)
## group  2   1.789  0.201
##       15
leveneTest(Y~TIEMPO.DE.CURA,data=df)
## Levene's Test for Homogeneity of Variance (center = median)
##       Df F value Pr(>F)
## group  2  0.1373 0.8728
##       15

La prueba de levene indica que las varianzas son iguales a un nivel de significancia de 95%.

8.1.7 Prueba de Indepencia de Los Errores de los Datos

plot(modelo$residuals)
abline(h=0,col='red')

En la tabla demuestra que los modelos residuales de los experiementos son diferentes a la linea 0 estan bastante dispersos..

8.1.8 Conclusiones

Este problema se realizo bajo un diseño factorial 3x3 con dos factores. Las hipotesis estadisticas tanto de los acelerantes y la del tiempo de curado demostraron que existe diferencias en ambas graficas de los datos por lo que se desaprueba la Ho y se aprueba la Ha.

Se comprobo que el mejor tiempo curado a 14ºC de 60 minutos tiene un mayor afecto para aumentar la resistencia de caucho volcanico.En cuanto a los acelerante se comprobo que el acelerante B mostro un mayor efecto para el mejoramiento de la resistencia del caucho volcanico.

Se demostro que la combinacion de tiempo de curado a 14ºc de 60 minutos y acelerante B muestra una mejor resistencia al caucho vulcanizado.

Mediante la prueba de shapiro winks se obtuvo un valor p_valor de 0.2994 lo que significa que se acepta la Ho.