Se investigan cuatro catalizadores que pueden afectar al rendimiento de un proceso químico. Se sigue un diseño completamente aleatorizado para un solo factor en el que cada proceso que utiliza un catalizador específico se repite 6 veces. Los rendimientos obtenidos se muestran en la Tabla. ¿Tienen los cuatro catalizadores el mismo efecto sobre el rendimiento? Utilice α = 0,05.

##Instalar readxl para importar datos de excel y cargarlo.
library(readxl)

# Usamos la funcion "file.choose" para encontrar el archivo y lo copiamos en la sig

ruta_excel= ("C:\\Users\\LENOVO\\Desktop\\UN Materias\\Unal 2023-1\\DISEÑO EXPERIMENTOS\\Taller parcial diseño.xlsx")

excel_sheets(ruta_excel)
## [1] "Hoja 1" "Hoja 2" "Hoja 3" "Hoja 4" "Hoja 6" "Hoja 5"
data_excel= read_excel(ruta_excel, sheet = "Hoja 2")
print(data_excel)
## # A tibble: 24 × 2
##    Ca      R_d
##    <chr> <dbl>
##  1 A        60
##  2 A        63
##  3 A        62
##  4 A        61
##  5 A        63
##  6 A        62
##  7 B        65
##  8 B        67
##  9 B        70
## 10 B        68
## # ℹ 14 more rows

Modelo FSCA \[Y_{ij}= \mu+\tau_i+\epsilon_{ij}\] Arbol de desicion

library(collapsibleTree)
collapsibleTreeSummary(data_excel, c("Ca","R_d"), collapsed = FALSE)
#Incluimos las repeticiones para que muestre todos los datos

ANALISIS DESCRIPTIVO.

Grafico de barras.

-En este representamos el eje x la Ca (catalizadores), y R_d (Rendimiento)

#Grafico base
library(ggplot2)

ggplot(data_excel)+ aes(Ca , R_d, fill=Ca)+ 
  geom_col(position = "dodge")+
  xlab("Catalizadores")+ ylab(" Rendimiento")

-De esta manera concluimos que el “rendimiento” es mayor con el catalizador “C” - Lo contrario al texto anterior es a una presion de “A”

Boxplot

data_excel$Ca=as.factor(data_excel$Ca)
library(ggplot2)

ggplot(data_excel)+ aes(Ca ,R_d, fill=Ca)+ 
 geom_boxplot() +
 xlab("Catalizadores")+ ylab(" Rendimiento")

Observamos que el “rendimiento” es mayor para la “Catalizador C”, además, estos valores presentan distribuación asimétrica.

HIPOTESIS.

\[H_0: \mu_{Ca{1}} =\mu_{Ca{2}} =\mu_{Ca{3}} =\mu_{Ca{4}}\]

\[H_1: \mu_{Ca{1}}≠\mu_{Ca{2}} ≠\mu_{Ca{3}} ≠\mu_{Ca{4}}\] TABLA DE ANOVA.

mod= aov(R_d~Ca, data_excel)
summary(mod)
##             Df Sum Sq Mean Sq F value   Pr(>F)    
## Ca           3  192.5   64.15    14.5 3.01e-05 ***
## Residuals   20   88.5    4.43                     
## ---
## Signif. codes:  0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1

pvalor(Pr(>F)) < 0.05, por tanto, se rechaza la hipotesis nula. Las medias por “Catalizadores” son diferentes.

REVISION DE SUPUESTOS.

prueba de normalidad:

#1. Estraemos los residuales
res_mod=mod$residuals

#2. Prueba de Normalidad
shapiro.test(res_mod)
## 
##  Shapiro-Wilk normality test
## 
## data:  res_mod
## W = 0.96494, p-value = 0.5454

En este caso pvalor > 0.05, se cumple supuesto de normalidad.

PRUEBA DE TUKEY.

library(TukeyC)

tt = TukeyC(mod, "Ca")
plot(tt)

No hay diferencias entre los tratamientos “B-C” y “A-D” de catalizadores. El tratamiento de catalizador = C implica un mayor rendimiento. TUKEY 2.

TukeyHSD(mod, conf.level = 0.95)
##   Tukey multiple comparisons of means
##     95% family-wise confidence level
## 
## Fit: aov(formula = R_d ~ Ca, data = data_excel)
## 
## $Ca
##           diff       lwr       upr     p adj
## B-A  5.0000000  1.600704  8.399296 0.0027711
## C-A  6.3333333  2.934037  9.732629 0.0002282
## D-A  0.1666667 -3.232629  3.565963 0.9990452
## C-B  1.3333333 -2.065963  4.732629 0.6948686
## D-B -4.8333333 -8.232629 -1.434037 0.0037860
## D-C -6.1666667 -9.565963 -2.767371 0.0003110

No hay diferencias entre los tratamientos “B-C” y “A-D” de catalizadores. Ya que el pvalor es mayor al 0.05 en esta comparación.

INTERPRETACION BIOLOGICA:

Los catalizadores SI influye en el rendimiento del proceso quimico , los analisis muestran que los catalizadores “B-C” generan mayor redimieto en el proceso quimico.

REVISION DE DATOS ATIPICOS.

#Instalamos libreria
#Valor #Valor p ≤ α: Existe un valor atípico (Rechaza H0)
library(outliers)
grubbs.test(mod$residuals)
## 
##  Grubbs test for one outlier
## 
## data:  mod$residuals
## G.15 = 2.46399, U = 0.72456, p-value = 0.1015
## alternative hypothesis: highest value 4.83333333333333 is an outlier

En este caso pvalor > 0.05, no existen datos atípicos. No es necesario imputar (ver clase 12).

MODALIDADES DE ANALISIS DE VARIANZA:

Oneway Test.

mod1v = oneway.test(R_d ~ Ca, data_excel)
mod1v
## 
##  One-way analysis of means (not assuming equal variances)
## 
## data:  R_d and Ca
## F = 15.098, num df = 3.000, denom df = 10.512, p-value = 0.0003925

Test de Kruskal-Wallis.

mod2v = kruskal.test(R_d ~ Ca, data = data_excel)
mod2v
## 
##  Kruskal-Wallis rank sum test
## 
## data:  R_d by Ca
## Kruskal-Wallis chi-squared = 17.333, df = 3, p-value = 0.0006035

Analisis varianza permutacional.

library(RVAideMemoire)
## *** Package RVAideMemoire v 0.9-82-2 ***
## 
## Attaching package: 'RVAideMemoire'
## The following object is masked from 'package:TukeyC':
## 
##     cv
perm1<-perm.anova(R_d ~ Ca, data = data_excel, nperm = 1000, progress = F)
perm1
## Permutation Analysis of Variance Table
## 
## Response: R_d
## 1000 permutations
##           Sum Sq Df Mean Sq F value   Pr(>F)    
## Ca        192.46  3  64.153  14.498 0.000999 ***
## Residuals  88.50 20   4.425                     
## ---
## Signif. codes:  0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1