Se estudia el rendimiento de un proceso químico. Se piensa que las dos variables más importantes son la presión y la temperatura. Se seleccionan tres niveles de cada factor y se lleva a cabo un experimento factorial con dos réplicas. Analizar los datos y sacar concluciones. Utilizar alpha=0.05

temperatura<-factor(c(rep("temperatura150",3),
                    rep("temperatura160",3),
                    rep("temperatura170",3),
                   rep("temperatura150",3),
                   rep("temperatura160",3),
                   rep("temperatura170",3)))
presion<- factor(c(200,215,230,200,215,230,200,215,230,200,215,230,200,215,230,200,215,230))
proce_qui<-c(90.4,90.7,90.2,90.1,90.5,89.9,90.5,90.8,90.4,90.2,90.6,90.4,90.3,90.6,90.1,90.7,90.9,90.1)
data <- data.frame(temperatura,presion,proce_qui)
data

##       temperatura presion proce_qui
## 1  temperatura150     200      90.4
## 2  temperatura150     215      90.7
## 3  temperatura150     230      90.2
## 4  temperatura160     200      90.1
## 5  temperatura160     215      90.5
## 6  temperatura160     230      89.9
## 7  temperatura170     200      90.5
## 8  temperatura170     215      90.8
## 9  temperatura170     230      90.4
## 10 temperatura150     200      90.2
## 11 temperatura150     215      90.6
## 12 temperatura150     230      90.4
## 13 temperatura160     200      90.3
## 14 temperatura160     215      90.6
## 15 temperatura160     230      90.1
## 16 temperatura170     200      90.7
## 17 temperatura170     215      90.9
## 18 temperatura170     230      90.1

Mostraremos la tabla de ANOVA correspondiente a los datos anteriores

Modelo <- lm(proce_qui ~ (temperatura + presion)^2)
ANOVA <- aov(Modelo)
summary(ANOVA)

##                     Df Sum Sq Mean Sq F value   Pr(>F)    
## temperatura          2 0.3011  0.1506   8.469 0.008539 ** 
## presion              2 0.7678  0.3839  21.594 0.000367 ***
## temperatura:presion  4 0.0689  0.0172   0.969 0.470006    
## Residuals            9 0.1600  0.0178                     
## ---
## Signif. codes:  0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1

Graficas de los efectos principales

Efectos <- data.frame(temperatura, presion, proce_qui)
plot.design(Efectos, fun="mean", main=" Gráfica de efectos principales", ylab= "Rendimiento del proceso químico", xlab="Factor")

De la gráfica anterior, podemos realizar las siguientes conclusiones:

Con respecto a la temperatura, podemos decir que a una temperatura de 160, el rendimiento del proceso químico es menor en comparación con las otras temperaturas. Mientras que a una temperatura de 170, se obtiene el mayor rendimiento del proceso químico en comparación con las demás temperaturas.

Con respecto a la presión, podemos decir que se obtendrá un menor rendimiento del proceso químico cuando la presión sea de 230, mientras que se alcanzará un mayor rendimiento cuando la presión sea de 215.

Gráfica de interacción

interaction.plot(temperatura, presion, proce_qui,
                 main="Interacción Temperatura-Presión", xlab="Temperatura", ylab="Rendimiento del proceso químico", col=c(1:3))

De la gráfica anterior, podemos realizar las siguientes conclusiones:

Si nos centramos únicamente en las temperaturas, podemos observar en la gráfica que en el rango de 150 a 160 de la temperatura, disminuye el rendimiento del proceso químico en comparación con todas las presiones estudiadas. Mientras que en los intervalos de 160 a 170, el rendimiento del proceso químico aumenta para todas las presiones estudiadas.

Además, se puede observar que el menor rendimiento químico se obtiene cuando la temperatura es de 160 y la presión es de 230, mientras que el mayor rendimiento del proceso químico se obtiene cuando la temperatura es de 170 con una presión de 215.

Validación del modelo ANOVA

Independencia

Probaremos la independencia con la siguiente gráfica:

plot(rstandard(Modelo),
     main="Gráfica de residuos estándar",
     xlab="Observación", ylab="Residuos estandarizados")

Como se puede observar al ver la gráfica, se puede apreciar que los datos están dispersos y no tienen una forma específica. Por lo tanto, podemos afirmar que son independientes.

Normalidad

Para probar la normalidad en el estudio, lo haremos a través del test de Shapiro-Wilk

Nuestras hipótesis a considerar en la validación de la normalidad son los siguientes:

La hipótesis nula será que tiene una distribucion normal.

La hipótesis alternativa será que no sigue una distribucion normal.

shapiro.test(rstandard(Modelo))

## 
##  Shapiro-Wilk normality test
## 
## data:  rstandard(Modelo)
## W = 0.87366, p-value = 0.02046

De los datos obtenidos del test, podemos observar que el p-valor es menor que el valor de significancia \(\alpha\). Por lo tanto, podemos concluir que los datos no siguen una distribución normal.

Homocedasticidad

Para demostrar si las varianzas son iguales o difieren, utilizaremos el test de Levene, ya que estamos en una distribución que no es normal.

Nuestras hipótesis a considerar en la validación de la homocedasticidad son los siguientes:

La hipótesis nula será que sus varianzas son iguales.

La hipótesis alternativa será que al menos una de ellas difiere.

library(car)

## Loading required package: carData

leveneTest(proce_qui ~ temperatura)

## Levene's Test for Homogeneity of Variance (center = median)
##       Df F value Pr(>F)
## group  2  0.6325 0.5448
##       15

leveneTest(proce_qui ~ presion)

## Levene's Test for Homogeneity of Variance (center = median)
##       Df F value Pr(>F)
## group  2  0.3608  0.703
##       15

Del test de Levene, podemos concluir que tanto la temperatura como la presión cumplen la hipótesis nula de que sus varianzas son iguales, ya que los p-valores obtenidos para cada factor son mayores al valor de significancia.

En conclusión, hemos validado la tabla de ANOVA con base en lo anterior.

Diseño factorial 2^2

Rafael Diaz, Juleisy Orozco, Edgar Triana, Nicolle Guzmán y Daniel Mejía

2023-05-25