Trabajo de diseño de experimento

Ejercicio 3-1

Se estudia la resistencia a la tensión del cemento portlanb. Pueden usarse económicamente cuantro diferentes técnicas de mezclado. Sean colectado los siguientes datos:

tabla<-c(3129, 3000, 2865, 2890,
        3200, 3300, 2975, 3150,
        2800, 2900, 2985, 3050,
        2600, 2700, 2600, 2765)
metodo<-as.factor(c(rep(c("1","2","3","4"),each =4)))
base<-data.frame(tabla, metodo)
base

##    tabla metodo
## 1   3129      1
## 2   3000      1
## 3   2865      1
## 4   2890      1
## 5   3200      2
## 6   3300      2
## 7   2975      2
## 8   3150      2
## 9   2800      3
## 10  2900      3
## 11  2985      3
## 12  3050      3
## 13  2600      4
## 14  2700      4
## 15  2600      4
## 16  2765      4

A continuación, mostraremos la gráfica de caja y bigote de los datos anteriores.

boxplot(tabla ~ metodo, col = c("bisque1", "azure", "pink","antiquewhite1"),
        ylab = "Resistencia a la tensión (lb/pulg^2)", xlab= "Técnicas de mezclado.", sub="Figura_1", cex.sub=0.5)

Calculamos los promedios de cada técnica de mezclado

tapply(tabla, metodo, mean)

##       1       2       3       4 
## 2971.00 3156.25 2933.75 2666.25

Mostraremos la tabla de ANOVA correspondiente a los datos anteriores

fm1 = aov(lm(tabla ~ metodo))
fm1

## Call:
##    aov(formula = lm(tabla ~ metodo))
## 
## Terms:
##                   metodo Residuals
## Sum of Squares  489740.2  153908.3
## Deg. of Freedom        3        12
## 
## Residual standard error: 113.2506
## Estimated effects may be unbalanced

A continuación mostraremos un resumen de la tabla anterior.

summary(fm1)

##             Df Sum Sq Mean Sq F value   Pr(>F)    
## metodo       3 489740  163247   12.73 0.000489 ***
## Residuals   12 153908   12826                     
## ---
## Signif. codes:  0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1

Con el siguiente código, obtenemos el valor del coeficiente de Fisher calculado en función de los datos del ejercicio

qf(0.05, 4-1, 16-4, lower.tail = F)

## [1] 3.490295

Probaremos que la hipótesis de que las técnicas de mezclado afectan la resistencia del cemento es cierta, utilizando un nivel de significancia de \(\alpha = 0.05\).

Tomando en cuenta los datos obtenidos en el estudio, la hipótesis nula establece que las medias de las técnicas de mezclado son iguales, mientras que la hipótesis alternativa plantea que las medias son diferentes o que al menos una de ellas difiere.

Para determinar cuál de las hipótesis (nula o alternativa) es verdadera, presentaremos dos métodos:

1ra forma: Utilizaremos los valores de Fisher obtenidos en el análisis de varianza (ANOVA) y el valor de Fisher calculado. Al observar que \(12.73>3.490295\), lo cual indica que el valor de Fisher del ANOVA es mayor que el valor de Fisher calculado, se concluye que rechazamos la hipótesis nula y aceptamos la hipótesis alternativa.

2da forma: Usando el valor de p obtenido en el resumen de la tabla ANOVA y el valor de \(\alpha\) elegido para nuestro estudio. Como el valor de \(0.00489<0.05\), se demuestra que el valor de p de la tabla ANOVA es menor que \(\alpha\), por lo que rechazamos la hipótesis nula y aceptamos la hipótesis alternativa.

A continuación, analizaremos si existe una diferencia en la técnica de mezclado por pares. Mostraremos una tabla de datos y un gráfico para ilustrar.

intervals = TukeyHSD(fm1)
intervals

##   Tukey multiple comparisons of means
##     95% family-wise confidence level
## 
## Fit: aov(formula = lm(tabla ~ metodo))
## 
## $metodo
##        diff        lwr        upr     p adj
## 2-1  185.25  -52.50029  423.00029 0.1493561
## 3-1  -37.25 -275.00029  200.50029 0.9652776
## 4-1 -304.75 -542.50029  -66.99971 0.0115923
## 3-2 -222.50 -460.25029   15.25029 0.0693027
## 4-2 -490.00 -727.75029 -252.24971 0.0002622
## 4-3 -267.50 -505.25029  -29.74971 0.0261838

plot(intervals, sub="Figura_2", cex.sub=0.5)

Validación del modelo ANOVA

A partir de los residuos del modelo, comprobaremos si el modelo ANOVA es adecuado. Los tres supuestos que se deben cumplir son: independencia, homocedasticidad y normalidad.

Independencia

Probaremos la independencia con la siguiente gráfica:

plot(fm1$residuals,sub="Figura_3", cex.sub=0.5)

Como se puede observar en la figura 3, al ver que los datos están dispersos y no tienen una forma específica, podemos afirmar que son independientes.

Normalidad

Para probar la normalidad en el estudio, lo haremos a través de gráficas y utilizando el test de Shapiro-Wilk.

summary(fm1$residuals)

##    Min. 1st Qu.  Median    Mean 3rd Qu.    Max. 
## -181.25  -69.94   11.38    0.00   63.12  158.00

hist(fm1$residuals, sub="Figura_4", cex.sub=0.5)

Como podemos observar en la figura 4, el histograma intenta tomar forma de campana de Gauss, lo cual es una indicación de normalidad en los datos.

qqnorm(fm1$residuals, sub="Figura_5", cex.sub=0.5)  #Se cumple la linealidad para todos los predictores
qqline(fm1$residuals, sub="Figura_6", cex.sub=0.5) #Distribución normal de los residuos

Con las gráficas podemos ver la linealidad de los datos que tienden en línea recta y no están muy separados como se muestra en la figura 6.

Si utilizamos el test de Shapiro-Wilk, tendremos lo siguiente:

shapiro.test(fm1$residuals)

## 
##  Shapiro-Wilk normality test
## 
## data:  fm1$residuals
## W = 0.97046, p-value = 0.846

Con lo cual podemos ver que el valor p es de \(0.846\) y es mayor que el nivel de significancia (\(\alpha\)) escogido. Con esto podemos afirmar que no hay suficiente evidencia para rechazar la hipótesis de normalidad en el estudio.

Homocedasticidad

Para demostrar si las varianzas son iguales o no difieren, utilizaremos el test de Bartlett.

bartlett.test(fm1$residuals ~ metodo)

## 
##  Bartlett test of homogeneity of variances
## 
## data:  fm1$residuals by metodo
## Bartlett's K-squared = 0.71158, df = 3, p-value = 0.8705

Observando los datos obtenidos del test de Bartlett, podemos decir que las varianzas son iguales, ya que el valor p es de \(0.8705\), lo que es mayor que \(\alpha\).

Conclusion

Con los datos obtenidos, podemos decir que la técnica de mezclado menos eficaz para aumentar la resistencia a la tensión del cemento sería la cuarta, ya que su media es la que difiere más en el estudio, como se observa en la figura 2, y tiene la menor media en las técnicas de mezclado. Por lo tanto, las mejores opciones en las técnicas de mezclado serían la 1, la 2 y la 3, ya que sus medias no difieren mucho.

Ejercicio 3-1 ANOVA

Rafael Diaz, Juleisy Orozco, Edgar Triana, Nicolle Guzman, Daniel Mejia

2023-03-17