Se estudia el rendimiento de un proceso químico. Se piensa que las dos variables más importantes son la presión y la temperatura. Se seleccionan tres niveles de cada factor y se lleva a cabo un experimento factorial con dos réplicas. Analizar los datos y sacar concluciones. Utilizar alpha=0.05
temperatura<-factor(c(rep("temperatura150",3),
rep("temperatura160",3),
rep("temperatura170",3),
rep("temperatura150",3),
rep("temperatura160",3),
rep("temperatura170",3)))
presion<- factor(c(200,215,230,200,215,230,200,215,230,200,215,230,200,215,230,200,215,230))
proce_qui<-c(90.4,90.7,90.2,90.1,90.5,89.9,90.5,90.8,90.4,90.2,90.6,90.4,90.3,90.6,90.1,90.7,90.9,90.1)
data <- data.frame(temperatura,presion,proce_qui)
data
## temperatura presion proce_qui
## 1 temperatura150 200 90.4
## 2 temperatura150 215 90.7
## 3 temperatura150 230 90.2
## 4 temperatura160 200 90.1
## 5 temperatura160 215 90.5
## 6 temperatura160 230 89.9
## 7 temperatura170 200 90.5
## 8 temperatura170 215 90.8
## 9 temperatura170 230 90.4
## 10 temperatura150 200 90.2
## 11 temperatura150 215 90.6
## 12 temperatura150 230 90.4
## 13 temperatura160 200 90.3
## 14 temperatura160 215 90.6
## 15 temperatura160 230 90.1
## 16 temperatura170 200 90.7
## 17 temperatura170 215 90.9
## 18 temperatura170 230 90.1
Modelo <- lm(proce_qui ~ (temperatura + presion)^2)
ANOVA <- aov(Modelo)
summary(ANOVA)
## Df Sum Sq Mean Sq F value Pr(>F)
## temperatura 2 0.3011 0.1506 8.469 0.008539 **
## presion 2 0.7678 0.3839 21.594 0.000367 ***
## temperatura:presion 4 0.0689 0.0172 0.969 0.470006
## Residuals 9 0.1600 0.0178
## ---
## Signif. codes: 0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
Efectos <- data.frame(temperatura, presion, proce_qui)
plot.design(Efectos, fun="mean", main=" Gráfica de efectos principales", ylab= "Rendimiento del proceso químico", xlab="Factor")
De la gráfica anterior, podemos realizar las siguientes conclusiones:
Con respecto a la temperatura, podemos decir que a una temperatura de 160, el rendimiento del proceso químico es menor en comparación con las otras temperaturas. Mientras que a una temperatura de 170, se obtiene el mayor rendimiento del proceso químico en comparación con las demás temperaturas.
Con respecto a la presión, podemos decir que se obtendrá un menor rendimiento del proceso químico cuando la presión sea de 230, mientras que se alcanzará un mayor rendimiento cuando la presión sea de 215.
interaction.plot(temperatura, presion, proce_qui,
main="Interacción Temperatura-Presión", xlab="Temperatura", ylab="Rendimiento del proceso químico", col=c(1:3))
De la gráfica anterior, podemos realizar las siguientes conclusiones:
Si nos centramos únicamente en las temperaturas, podemos observar en la gráfica que en el rango de 150 a 160 de la temperatura, disminuye el rendimiento del proceso químico en comparación con todas las presiones estudiadas. Mientras que en los intervalos de 160 a 170, el rendimiento del proceso químico aumenta para todas las presiones estudiadas.
Además, se puede observar que el menor rendimiento químico se obtiene cuando la temperatura es de 160 y la presión es de 230, mientras que el mayor rendimiento del proceso químico se obtiene cuando la temperatura es de 170 con una presión de 215.
Probaremos la independencia con la siguiente gráfica:
plot(rstandard(Modelo),
main="Gráfica de residuos estándar",
xlab="Observación", ylab="Residuos estandarizados")
Como se puede observar al ver la gráfica, se puede apreciar que los datos están dispersos y no tienen una forma específica. Por lo tanto, podemos afirmar que son independientes.
Para probar la normalidad en el estudio, lo haremos a través del test de Shapiro-Wilk
Nuestras hipótesis a considerar en la validación de la normalidad son los siguientes:
La hipótesis nula será que tiene una distribucion normal.
La hipótesis alternativa será que no sigue una distribucion normal.
shapiro.test(rstandard(Modelo))
##
## Shapiro-Wilk normality test
##
## data: rstandard(Modelo)
## W = 0.87366, p-value = 0.02046
De los datos obtenidos del test, podemos observar que el p-valor es menor que el valor de significancia \(\alpha\). Por lo tanto, podemos concluir que los datos no siguen una distribución normal.
Para demostrar si las varianzas son iguales o difieren, utilizaremos el test de Levene, ya que estamos en una distribución que no es normal.
Nuestras hipótesis a considerar en la validación de la homocedasticidad son los siguientes:
La hipótesis nula será que sus varianzas son iguales.
La hipótesis alternativa será que al menos una de ellas difiere.
library(car)
## Loading required package: carData
leveneTest(proce_qui ~ temperatura)
## Levene's Test for Homogeneity of Variance (center = median)
## Df F value Pr(>F)
## group 2 0.6325 0.5448
## 15
leveneTest(proce_qui ~ presion)
## Levene's Test for Homogeneity of Variance (center = median)
## Df F value Pr(>F)
## group 2 0.3608 0.703
## 15
Del test de Levene, podemos concluir que tanto la temperatura como la presión cumplen la hipótesis nula de que sus varianzas son iguales, ya que los p-valores obtenidos para cada factor son mayores al valor de significancia.
En conclusión, hemos validado la tabla de ANOVA con base en lo anterior.