Actividad ejercicio 1

Andres Marin, Carlos de la Hoz, Wendy Martinez, Julian Gelis y Jesus Narvaez

Se estudia el rendimiento de un proceso quimico. Se piensa que las dos variables mas importantes son la presicion y la temperatura. Se seleccionan tres niveles de cada factor y se lleva a cabo un experimento factorial con dos replicas. Los datos del rendimiento son:

temperatura<-factor(c(rep("temperatura1",3),
                   rep("temperatura2",3),
                   rep("temperatura3",3),
                   rep("temperatura1",3),
                   rep("temperatura2",3),
                   rep("temperatura3",3)))

La presion, y rendimiento segun los datos son

presion<- c(200,215,230,200,215,230,200,215,230,200,215,230,200,215,230,
            200,215,230)
rendimiento<- c(90.4,90.7, 90.2,90.1,90.5,89.9,90.5,90.8,90.4,90.2,90.6,90.4,
             90.3,90.6,90.1,90.7,90.9,90.1)

Observamos que los datos fueron ingresados de forma correcta

data <- data.frame(temperatura,presion,rendimiento)
data
##     temperatura presion rendimiento
## 1  temperatura1     200        90.4
## 2  temperatura1     215        90.7
## 3  temperatura1     230        90.2
## 4  temperatura2     200        90.1
## 5  temperatura2     215        90.5
## 6  temperatura2     230        89.9
## 7  temperatura3     200        90.5
## 8  temperatura3     215        90.8
## 9  temperatura3     230        90.4
## 10 temperatura1     200        90.2
## 11 temperatura1     215        90.6
## 12 temperatura1     230        90.4
## 13 temperatura2     200        90.3
## 14 temperatura2     215        90.6
## 15 temperatura2     230        90.1
## 16 temperatura3     200        90.7
## 17 temperatura3     215        90.9
## 18 temperatura3     230        90.1
str(data)
## 'data.frame':    18 obs. of  3 variables:
##  $ temperatura: Factor w/ 3 levels "temperatura1",..: 1 1 1 2 2 2 3 3 3 1 ...
##  $ presion    : num  200 215 230 200 215 230 200 215 230 200 ...
##  $ rendimiento: num  90.4 90.7 90.2 90.1 90.5 89.9 90.5 90.8 90.4 90.2 ...
Cambio de variables

```r
FactorA_Temperatura <- as.factor(data$temperatura)
FactorB_Presion <- as.factor(data$presion)
Respuesta_Rendimiento <- data$rendimiento
class(FactorB_Presion)
## [1] "factor"

Cálculo de la tabla ANOVA

Modelo <- lm(Respuesta_Rendimiento ~ (FactorA_Temperatura + FactorB_Presion)^2)
ANOVA <- aov(Modelo)
summary(ANOVA)
##                                     Df Sum Sq Mean Sq F value   Pr(>F)    
## FactorA_Temperatura                  2 0.3011  0.1506   8.469 0.008539 ** 
## FactorB_Presion                      2 0.7678  0.3839  21.594 0.000367 ***
## FactorA_Temperatura:FactorB_Presion  4 0.0689  0.0172   0.969 0.470006    
## Residuals                            9 0.1600  0.0178                     
## ---
## Signif. codes:  0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1

El análisis de varianza mostró una significancia global del modelo (p < 0.05). Esto indica que al menos uno de los términos del modelo (factor de temperatura, factor de presión o su interacción) tiene un efecto significativo en el rendimiento.

Graficas de los efectos principales

coef(ANOVA)
##                                        (Intercept) 
##                                       9.030000e+01 
##                    FactorA_Temperaturatemperatura2 
##                                      -1.000000e-01 
##                    FactorA_Temperaturatemperatura3 
##                                       3.000000e-01 
##                                 FactorB_Presion215 
##                                       3.500000e-01 
##                                 FactorB_Presion230 
##                                      -4.472010e-14 
## FactorA_Temperaturatemperatura2:FactorB_Presion215 
##                                       5.215896e-14 
## FactorA_Temperaturatemperatura3:FactorB_Presion215 
##                                      -1.000000e-01 
## FactorA_Temperaturatemperatura2:FactorB_Presion230 
##                                      -2.000000e-01 
## FactorA_Temperaturatemperatura3:FactorB_Presion230 
##                                      -3.500000e-01
Efectos <- data.frame(FactorA_Temperatura, FactorB_Presion, Respuesta_Rendimiento)
plot.design(Efectos, fun="mean", main=" Gráfica de efectos principales", ylab= "Duración", xlab="Factor")

La gráfica de efectos principales muestra la media del rendimiento en función de cada factor (temperatura y presión). Observamos que hay diferencias en el rendimiento en función de los diferentes niveles de temperatura y presión. Esto indica que tanto la temperatura como la presión tienen un efecto significativo en el rendimiento.

Gráfica de interacción

interaction.plot(FactorA_Temperatura, FactorB_Presion, Respuesta_Rendimiento,
                 main="Interacción Temperatura-Presion", xlab="Temperatura", ylab="Presion", col=c(1:3))

La gráfica de interacción muestra cómo el rendimiento se ve afectada por la combinación de diferentes niveles de temperatura y presión. Si las líneas en la gráfica son paralelas, indica que no hay interacción significativa entre la temperatura y la presión. Si las líneas se cruzan o tienen una forma no paralela, indica que hay una interacción significativa entre la temperatura y la presión. En este caso, las líneas de la gráfica de interacción muestran que hay una interacción significativa entre la temperatura y la presión, lo que significa que el efecto de la temperatura en el rendimiento depende del nivel de presión y viceversa.

Análisis de los residuos estándar del modelo

plot(rstandard(Modelo),
     main="Gráfica de residuos estándar",
     xlab="Observación", ylab="Residuos estandarizados")

shapiro.test(rstandard(Modelo))
## 
##  Shapiro-Wilk normality test
## 
## data:  rstandard(Modelo)
## W = 0.87366, p-value = 0.02046

La prueba de Shapiro-Wilk mostró que los residuos estandarizados no siguen una distribución normal (p < 0.05). Esto sugiere que el supuesto de normalidad de los residuos puede no cumplirse. Por lo tanto, se viola el supuesto de normalidad de los residuos en el modelo lineal.

Para ver los valores ajustados por la regresión

fitted(Modelo)
##     1     2     3     4     5     6     7     8     9    10    11    12    13 
## 90.30 90.65 90.30 90.20 90.55 90.00 90.60 90.85 90.25 90.30 90.65 90.30 90.20 
##    14    15    16    17    18 
## 90.55 90.00 90.60 90.85 90.25

Graficando los valores tanto los ajustados como los reales

plot(fitted(Modelo),
     Respuesta_Rendimiento, col=c("red", "blue"), pch=19,
     main="Gráfica de valores ajustados y reales",
     ylab="Valores reales", xlab="Valores ajustados")
legend(50, 190, col=c("red","blue"), legend=c("Ajustado", "Real"), pch=19)

La gráfica muestra una comparación entre los valores ajustados por el modelo y los valores reales. Los puntos en rojo representan los valores ajustados, mientras que los puntos en azul representan los valores reales. Se observa que los valores ajustados se acercan a los valores reales, lo que indica que el modelo tiene una buena capacidad de ajuste.

###Conclusion### En resumen, se puede concluir que tanto la temperatura como la presión tienen un efecto significativo en el rendimiento del proceso químico, y que existe una interacción significativa entre estos dos factores. Sin embargo, se debe tener en cuenta que los residuos no siguen una distribución normal, lo que puede tener implicaciones en la interpretación del modelo.