Se estudia la resistencia a la tensión del cemento portlanb. Pueden usarse económicamente cuantro diferentes técnicas de mezclado. Sean colectado los siguientes datos:
tabla<-c(3129, 3000, 2865, 2890,
3200, 3300, 2975, 3150,
2800, 2900, 2985, 3050,
2600, 2700, 2600, 2765)
metodo<-as.factor(c(rep(c("1","2","3","4"),each =4)))
base<-data.frame(tabla, metodo)
base
## tabla metodo
## 1 3129 1
## 2 3000 1
## 3 2865 1
## 4 2890 1
## 5 3200 2
## 6 3300 2
## 7 2975 2
## 8 3150 2
## 9 2800 3
## 10 2900 3
## 11 2985 3
## 12 3050 3
## 13 2600 4
## 14 2700 4
## 15 2600 4
## 16 2765 4
A continuación, mostraremos la gráfica de caja y bigote de los datos anteriores.
boxplot(tabla ~ metodo, col = c("bisque1", "azure", "pink","antiquewhite1"),
ylab = "Resistencia a la tensión (lb/pulg^2)", xlab= "Técnicas de mezclado.", sub="Figura_1", cex.sub=0.5)
Calculamos los promedios de cada técnica de mezclado
tapply(tabla, metodo, mean)
## 1 2 3 4
## 2971.00 3156.25 2933.75 2666.25
Mostraremos la tabla de ANOVA correspondiente a los datos anteriores
fm1 = aov(lm(tabla ~ metodo))
fm1
## Call:
## aov(formula = lm(tabla ~ metodo))
##
## Terms:
## metodo Residuals
## Sum of Squares 489740.2 153908.3
## Deg. of Freedom 3 12
##
## Residual standard error: 113.2506
## Estimated effects may be unbalanced
A continuación mostraremos un resumen de la tabla anterior.
summary(fm1)
## Df Sum Sq Mean Sq F value Pr(>F)
## metodo 3 489740 163247 12.73 0.000489 ***
## Residuals 12 153908 12826
## ---
## Signif. codes: 0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
Con el siguiente código, obtenemos el valor del coeficiente de Fisher calculado en función de los datos del ejercicio
qf(0.05, 4-1, 16-4, lower.tail = F)
## [1] 3.490295
Probaremos que la hipótesis de que las técnicas de mezclado afectan la resistencia del cemento es cierta, utilizando un nivel de significancia de \(\alpha = 0.05\).
Tomando en cuenta los datos obtenidos en el estudio, la hipótesis nula establece que las medias de las técnicas de mezclado son iguales, mientras que la hipótesis alternativa plantea que las medias son diferentes o que al menos una de ellas difiere.
Para determinar cuál de las hipótesis (nula o alternativa) es verdadera, presentaremos dos métodos:
1ra forma: Utilizaremos los valores de Fisher obtenidos en el análisis de varianza (ANOVA) y el valor de Fisher calculado. Al observar que \(12.73>3.490295\), lo cual indica que el valor de Fisher del ANOVA es mayor que el valor de Fisher calculado, se concluye que rechazamos la hipótesis nula y aceptamos la hipótesis alternativa.
2da forma: Usando el valor de p obtenido en el resumen de la tabla ANOVA y el valor de \(\alpha\) elegido para nuestro estudio. Como el valor de \(0.00489<0.05\), se demuestra que el valor de p de la tabla ANOVA es menor que \(\alpha\), por lo que rechazamos la hipótesis nula y aceptamos la hipótesis alternativa.
A continuación, analizaremos si existe una diferencia en la técnica de mezclado por pares. Mostraremos una tabla de datos y un gráfico para ilustrar.
intervals = TukeyHSD(fm1)
intervals
## Tukey multiple comparisons of means
## 95% family-wise confidence level
##
## Fit: aov(formula = lm(tabla ~ metodo))
##
## $metodo
## diff lwr upr p adj
## 2-1 185.25 -52.50029 423.00029 0.1493561
## 3-1 -37.25 -275.00029 200.50029 0.9652776
## 4-1 -304.75 -542.50029 -66.99971 0.0115923
## 3-2 -222.50 -460.25029 15.25029 0.0693027
## 4-2 -490.00 -727.75029 -252.24971 0.0002622
## 4-3 -267.50 -505.25029 -29.74971 0.0261838
plot(intervals, sub="Figura_2", cex.sub=0.5)
A partir de los residuos del modelo, comprobaremos si el modelo ANOVA es adecuado. Los tres supuestos que se deben cumplir son: independencia, homocedasticidad y normalidad.
Probaremos la independencia con la siguiente gráfica:
plot(fm1$residuals,sub="Figura_3", cex.sub=0.5)
Como se puede observar en la figura 3, al ver que los datos están dispersos y no tienen una forma específica, podemos afirmar que son independientes.
Para probar la normalidad en el estudio, lo haremos a través de gráficas y utilizando el test de Shapiro-Wilk.
summary(fm1$residuals)
## Min. 1st Qu. Median Mean 3rd Qu. Max.
## -181.25 -69.94 11.38 0.00 63.12 158.00
hist(fm1$residuals, sub="Figura_4", cex.sub=0.5)
Como podemos observar en la figura 4, el histograma intenta tomar forma de campana de Gauss, lo cual es una indicación de normalidad en los datos.
qqnorm(fm1$residuals, sub="Figura_5", cex.sub=0.5) #Se cumple la linealidad para todos los predictores
qqline(fm1$residuals, sub="Figura_6", cex.sub=0.5) #Distribución normal de los residuos
Con las gráficas podemos ver la linealidad de los datos que tienden en línea recta y no están muy separados como se muestra en la figura 6.
Si utilizamos el test de Shapiro-Wilk, tendremos lo siguiente:
shapiro.test(fm1$residuals)
##
## Shapiro-Wilk normality test
##
## data: fm1$residuals
## W = 0.97046, p-value = 0.846
Con lo cual podemos ver que el valor p es de \(0.846\) y es mayor que el nivel de significancia (\(\alpha\)) escogido. Con esto podemos afirmar que no hay suficiente evidencia para rechazar la hipótesis de normalidad en el estudio.
Para demostrar si las varianzas son iguales o no difieren, utilizaremos el test de Bartlett.
bartlett.test(fm1$residuals ~ metodo)
##
## Bartlett test of homogeneity of variances
##
## data: fm1$residuals by metodo
## Bartlett's K-squared = 0.71158, df = 3, p-value = 0.8705
Observando los datos obtenidos del test de Bartlett, podemos decir que las varianzas son iguales, ya que el valor p es de \(0.8705\), lo que es mayor que \(\alpha\).
Con los datos obtenidos, podemos decir que la técnica de mezclado menos eficaz para aumentar la resistencia a la tensión del cemento sería la cuarta, ya que su media es la que difiere más en el estudio, como se observa en la figura 2, y tiene la menor media en las técnicas de mezclado. Por lo tanto, las mejores opciones en las técnicas de mezclado serían la 1, la 2 y la 3, ya que sus medias no difieren mucho.