Se investigan cuatro catalizadores que pueden afectar al rendimiento de un proceso químico. Se sigue un diseño completamente aleatorizado para un solo factor en el que cada proceso que utiliza un catalizador específico se repite 6 veces. Los rendimientos obtenidos se muestran en la Tabla. ¿Tienen los cuatro catalizadores el mismo efecto sobre el rendimiento? Utilice α = 0,05.
##Instalar readxl para importar datos de excel y cargarlo.
library(readxl)
# Usamos la funcion "file.choose" para encontrar el archivo y lo copiamos en la sig
ruta_excel= ("C:\\Users\\LENOVO\\Desktop\\UN Materias\\Unal 2023-1\\DISEÑO EXPERIMENTOS\\Taller parcial diseño.xlsx")
excel_sheets(ruta_excel)
## [1] "Hoja 1" "Hoja 2" "Hoja 3" "Hoja 4" "Hoja 6" "Hoja 5"
data_excel= read_excel(ruta_excel, sheet = "Hoja 2")
print(data_excel)
## # A tibble: 24 × 2
## Ca R_d
## <chr> <dbl>
## 1 A 60
## 2 A 63
## 3 A 62
## 4 A 61
## 5 A 63
## 6 A 62
## 7 B 65
## 8 B 67
## 9 B 70
## 10 B 68
## # ℹ 14 more rows
Modelo FSCA \[Y_{ij}= \mu+\tau_i+\epsilon_{ij}\] Arbol de desicion
library(collapsibleTree)
collapsibleTreeSummary(data_excel, c("Ca","R_d"), collapsed = FALSE)
#Incluimos las repeticiones para que muestre todos los datos
ANALISIS DESCRIPTIVO.
Grafico de barras.
-En este representamos el eje x la Ca (catalizadores), y R_d (Rendimiento)
#Grafico base
library(ggplot2)
ggplot(data_excel)+ aes(Ca , R_d, fill=Ca)+
geom_col(position = "dodge")+
xlab("Catalizadores")+ ylab(" Rendimiento")
-De esta manera concluimos que el “rendimiento” es mayor con el
catalizador “C” - Lo contrario al texto anterior es a una presion de
“A”
Boxplot
data_excel$Ca=as.factor(data_excel$Ca)
library(ggplot2)
ggplot(data_excel)+ aes(Ca ,R_d, fill=Ca)+
geom_boxplot() +
xlab("Catalizadores")+ ylab(" Rendimiento")
Observamos que el “rendimiento” es mayor para la “Catalizador C”,
además, estos valores presentan distribuación asimétrica.
HIPOTESIS.
\[H_0: \mu_{Ca{1}} =\mu_{Ca{2}} =\mu_{Ca{3}} =\mu_{Ca{4}}\]
\[H_1: \mu_{Ca{1}}≠\mu_{Ca{2}} ≠\mu_{Ca{3}} ≠\mu_{Ca{4}}\] TABLA DE ANOVA.
mod= aov(R_d~Ca, data_excel)
summary(mod)
## Df Sum Sq Mean Sq F value Pr(>F)
## Ca 3 192.5 64.15 14.5 3.01e-05 ***
## Residuals 20 88.5 4.43
## ---
## Signif. codes: 0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
pvalor(Pr(>F)) < 0.05, por tanto, se rechaza la hipotesis nula. Las medias por “Catalizadores” son diferentes.
REVISION DE SUPUESTOS.
prueba de normalidad:
#1. Estraemos los residuales
res_mod=mod$residuals
#2. Prueba de Normalidad
shapiro.test(res_mod)
##
## Shapiro-Wilk normality test
##
## data: res_mod
## W = 0.96494, p-value = 0.5454
En este caso pvalor > 0.05, se cumple supuesto de normalidad.
PRUEBA DE TUKEY.
library(TukeyC)
tt = TukeyC(mod, "Ca")
plot(tt)
No hay diferencias entre los tratamientos “B-C” y “A-D” de
catalizadores. El tratamiento de catalizador = C implica un mayor
rendimiento. TUKEY 2.
TukeyHSD(mod, conf.level = 0.95)
## Tukey multiple comparisons of means
## 95% family-wise confidence level
##
## Fit: aov(formula = R_d ~ Ca, data = data_excel)
##
## $Ca
## diff lwr upr p adj
## B-A 5.0000000 1.600704 8.399296 0.0027711
## C-A 6.3333333 2.934037 9.732629 0.0002282
## D-A 0.1666667 -3.232629 3.565963 0.9990452
## C-B 1.3333333 -2.065963 4.732629 0.6948686
## D-B -4.8333333 -8.232629 -1.434037 0.0037860
## D-C -6.1666667 -9.565963 -2.767371 0.0003110
No hay diferencias entre los tratamientos “B-C” y “A-D” de catalizadores. Ya que el pvalor es mayor al 0.05 en esta comparación.
INTERPRETACION BIOLOGICA:
Los catalizadores SI influye en el rendimiento del proceso quimico , los analisis muestran que los catalizadores “B-C” generan mayor redimieto en el proceso quimico.
REVISION DE DATOS ATIPICOS.
#Instalamos libreria
#Valor #Valor p ≤ α: Existe un valor atípico (Rechaza H0)
library(outliers)
grubbs.test(mod$residuals)
##
## Grubbs test for one outlier
##
## data: mod$residuals
## G.15 = 2.46399, U = 0.72456, p-value = 0.1015
## alternative hypothesis: highest value 4.83333333333333 is an outlier
En este caso pvalor > 0.05, no existen datos atípicos. No es necesario imputar (ver clase 12).
MODALIDADES DE ANALISIS DE VARIANZA:
Oneway Test.
mod1v = oneway.test(R_d ~ Ca, data_excel)
mod1v
##
## One-way analysis of means (not assuming equal variances)
##
## data: R_d and Ca
## F = 15.098, num df = 3.000, denom df = 10.512, p-value = 0.0003925
Test de Kruskal-Wallis.
mod2v = kruskal.test(R_d ~ Ca, data = data_excel)
mod2v
##
## Kruskal-Wallis rank sum test
##
## data: R_d by Ca
## Kruskal-Wallis chi-squared = 17.333, df = 3, p-value = 0.0006035
Analisis varianza permutacional.
library(RVAideMemoire)
## *** Package RVAideMemoire v 0.9-82-2 ***
##
## Attaching package: 'RVAideMemoire'
## The following object is masked from 'package:TukeyC':
##
## cv
perm1<-perm.anova(R_d ~ Ca, data = data_excel, nperm = 1000, progress = F)
perm1
## Permutation Analysis of Variance Table
##
## Response: R_d
## 1000 permutations
## Sum Sq Df Mean Sq F value Pr(>F)
## Ca 192.46 3 64.153 14.498 0.000999 ***
## Residuals 88.50 20 4.425
## ---
## Signif. codes: 0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1