Se estudia el rendimiento de un proceso quimico. Se piensa que las dos variables mas importantes son la presicion y la temperatura. Se seleccionan tres niveles de cada factor y se lleva a cabo un experimento factorial con dos replicas. Los datos del rendimiento son:
temperatura<-factor(c(rep("temperatura1",3),
rep("temperatura2",3),
rep("temperatura3",3),
rep("temperatura1",3),
rep("temperatura2",3),
rep("temperatura3",3)))
La presion, y rendimiento segun los datos son
presion<- c(200,215,230,200,215,230,200,215,230,200,215,230,200,215,230,
200,215,230)
rendimiento<- c(90.4,90.7, 90.2,90.1,90.5,89.9,90.5,90.8,90.4,90.2,90.6,90.4,
90.3,90.6,90.1,90.7,90.9,90.1)
Observamos que los datos fueron ingresados de forma correcta
data <- data.frame(temperatura,presion,rendimiento)
data
## temperatura presion rendimiento
## 1 temperatura1 200 90.4
## 2 temperatura1 215 90.7
## 3 temperatura1 230 90.2
## 4 temperatura2 200 90.1
## 5 temperatura2 215 90.5
## 6 temperatura2 230 89.9
## 7 temperatura3 200 90.5
## 8 temperatura3 215 90.8
## 9 temperatura3 230 90.4
## 10 temperatura1 200 90.2
## 11 temperatura1 215 90.6
## 12 temperatura1 230 90.4
## 13 temperatura2 200 90.3
## 14 temperatura2 215 90.6
## 15 temperatura2 230 90.1
## 16 temperatura3 200 90.7
## 17 temperatura3 215 90.9
## 18 temperatura3 230 90.1
str(data)
## 'data.frame': 18 obs. of 3 variables:
## $ temperatura: Factor w/ 3 levels "temperatura1",..: 1 1 1 2 2 2 3 3 3 1 ...
## $ presion : num 200 215 230 200 215 230 200 215 230 200 ...
## $ rendimiento: num 90.4 90.7 90.2 90.1 90.5 89.9 90.5 90.8 90.4 90.2 ...
Cambio de variables
```r
FactorA_Temperatura <- as.factor(data$temperatura)
FactorB_Presion <- as.factor(data$presion)
Respuesta_Rendimiento <- data$rendimiento
class(FactorB_Presion)
## [1] "factor"
Cálculo de la tabla ANOVA
Modelo <- lm(Respuesta_Rendimiento ~ (FactorA_Temperatura + FactorB_Presion)^2)
ANOVA <- aov(Modelo)
summary(ANOVA)
## Df Sum Sq Mean Sq F value Pr(>F)
## FactorA_Temperatura 2 0.3011 0.1506 8.469 0.008539 **
## FactorB_Presion 2 0.7678 0.3839 21.594 0.000367 ***
## FactorA_Temperatura:FactorB_Presion 4 0.0689 0.0172 0.969 0.470006
## Residuals 9 0.1600 0.0178
## ---
## Signif. codes: 0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
El análisis de varianza mostró una significancia global del modelo (p < 0.05). Esto indica que al menos uno de los términos del modelo (factor de temperatura, factor de presión o su interacción) tiene un efecto significativo en el rendimiento.
Graficas de los efectos principales
coef(ANOVA)
## (Intercept)
## 9.030000e+01
## FactorA_Temperaturatemperatura2
## -1.000000e-01
## FactorA_Temperaturatemperatura3
## 3.000000e-01
## FactorB_Presion215
## 3.500000e-01
## FactorB_Presion230
## -4.472010e-14
## FactorA_Temperaturatemperatura2:FactorB_Presion215
## 5.215896e-14
## FactorA_Temperaturatemperatura3:FactorB_Presion215
## -1.000000e-01
## FactorA_Temperaturatemperatura2:FactorB_Presion230
## -2.000000e-01
## FactorA_Temperaturatemperatura3:FactorB_Presion230
## -3.500000e-01
Efectos <- data.frame(FactorA_Temperatura, FactorB_Presion, Respuesta_Rendimiento)
plot.design(Efectos, fun="mean", main=" Gráfica de efectos principales", ylab= "Duración", xlab="Factor")
La gráfica de efectos principales muestra la media del rendimiento en
función de cada factor (temperatura y presión). Observamos que hay
diferencias en el rendimiento en función de los diferentes niveles de
temperatura y presión. Esto indica que tanto la temperatura como la
presión tienen un efecto significativo en el rendimiento.
Gráfica de interacción
interaction.plot(FactorA_Temperatura, FactorB_Presion, Respuesta_Rendimiento,
main="Interacción Temperatura-Presion", xlab="Temperatura", ylab="Presion", col=c(1:3))
La gráfica de interacción muestra cómo el rendimiento se ve afectada por
la combinación de diferentes niveles de temperatura y presión. Si las
líneas en la gráfica son paralelas, indica que no hay interacción
significativa entre la temperatura y la presión. Si las líneas se cruzan
o tienen una forma no paralela, indica que hay una interacción
significativa entre la temperatura y la presión. En este caso, las
líneas de la gráfica de interacción muestran que hay una interacción
significativa entre la temperatura y la presión, lo que significa que el
efecto de la temperatura en el rendimiento depende del nivel de presión
y viceversa.
Análisis de los residuos estándar del modelo
plot(rstandard(Modelo),
main="Gráfica de residuos estándar",
xlab="Observación", ylab="Residuos estandarizados")
shapiro.test(rstandard(Modelo))
##
## Shapiro-Wilk normality test
##
## data: rstandard(Modelo)
## W = 0.87366, p-value = 0.02046
La prueba de Shapiro-Wilk mostró que los residuos estandarizados no siguen una distribución normal (p < 0.05). Esto sugiere que el supuesto de normalidad de los residuos puede no cumplirse. Por lo tanto, se viola el supuesto de normalidad de los residuos en el modelo lineal.
Para ver los valores ajustados por la regresión
fitted(Modelo)
## 1 2 3 4 5 6 7 8 9 10 11 12 13
## 90.30 90.65 90.30 90.20 90.55 90.00 90.60 90.85 90.25 90.30 90.65 90.30 90.20
## 14 15 16 17 18
## 90.55 90.00 90.60 90.85 90.25
Graficando los valores tanto los ajustados como los reales
plot(fitted(Modelo),
Respuesta_Rendimiento, col=c("red", "blue"), pch=19,
main="Gráfica de valores ajustados y reales",
ylab="Valores reales", xlab="Valores ajustados")
legend(50, 190, col=c("red","blue"), legend=c("Ajustado", "Real"), pch=19)
La gráfica muestra una comparación entre los valores ajustados por el
modelo y los valores reales. Los puntos en rojo representan los valores
ajustados, mientras que los puntos en azul representan los valores
reales. Se observa que los valores ajustados se acercan a los valores
reales, lo que indica que el modelo tiene una buena capacidad de
ajuste.
###Conclusion### En resumen, se puede concluir que tanto la temperatura como la presión tienen un efecto significativo en el rendimiento del proceso químico, y que existe una interacción significativa entre estos dos factores. Sin embargo, se debe tener en cuenta que los residuos no siguen una distribución normal, lo que puede tener implicaciones en la interpretación del modelo.