PUNTO 2

Se investigan cuatro catalizadores que pueden afectar al rendimiento de un proceso químico. Se sigue un diseño completamente aleatorizado para un solo factor en el que cada proceso que utiliza un catalizador específico se repite 6 veces. ¿Tienen los cuatro catalizadores el mismo efecto sobre el rendimiento? Utilice α = 0,05.

library(readxl)
data <- read_excel( "C:\\Users\\Lenovo\\Desktop\\2023-1\\Diseño\\Datos Taller. pto 2.xlsx")

print(data)
## # A tibble: 24 × 3
##    catalizador  rend rep  
##    <chr>       <dbl> <chr>
##  1 A              60 i    
##  2 A              63 ii   
##  3 A              62 iii  
##  4 A              61 iv   
##  5 A              63 v    
##  6 A              62 vi   
##  7 B              65 i    
##  8 B              67 ii   
##  9 B              70 iii  
## 10 B              68 iv   
## # ℹ 14 more rows

ARBOL DE DESICIÓN

library(collapsibleTree)

collapsibleTreeSummary (data, 
                        c("catalizador", "rep", "rend"), 
                        collapsed = FALSE)

MODELO \[ Y_{ij} = \mu + \tau_i + \epsilon_{ij}\] ANALISIS DESCRIPTIVO

Grafico de barras

#Grafico base
library(ggplot2)

ggplot(data)+
  aes(catalizador, rend, fill= catalizador)+
  geom_col(position = 'dodge')+
  xlab ("catalizador") + ylab ("rendimiento") 

Se observa que el catalizador que permite mejor rendimiento del proyecto es el C y el que genera menor rendimiento es el A.

Boxplot

library(ggplot2)

ggplot(data)+
  aes(catalizador, rend, fill = catalizador)+
  geom_boxplot()+
  xlab ("catalizador") + ylab ("rendimiento")

Observamos datos “atípicos” para el catalizador C y D y el rendimiento es mayor con el catalizador C.

HIPOTESIS \[H_0: \mu_A = \mu_B = \mu_C = \mu_D\] \[H_1: \mu_A ≠ \mu_B ≠ \mu_C ≠ \mu_D\] TABLA DE ANOVA

mod = aov(rend~ catalizador, data)
summary(mod)
##             Df Sum Sq Mean Sq F value   Pr(>F)    
## catalizador  3  192.5   64.15    14.5 3.01e-05 ***
## Residuals   20   88.5    4.43                     
## ---
## Signif. codes:  0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1

pvalor < 0.05, por tanto se rechaza la hipotesis nula, al menos uno de los catalizadores tiene efecto en el rendimiento.

REVISION DE SUPUESTOS

Prueba de normalidad

#1. Extraemos los residuales 
res_mod = mod$residuals

#2. Prueba de normalidad
shapiro.test(res_mod)
## 
##  Shapiro-Wilk normality test
## 
## data:  res_mod
## W = 0.96494, p-value = 0.5454

En este caso pvalor > 0.05, se cumple supuesto de normalidad.

Prueba de varianzas iguales

#3.Probando homocedasticidad (varianzas iguales)
bartlett.test(res_mod, data$catalizador)
## 
##  Bartlett test of homogeneity of variances
## 
## data:  res_mod and data$catalizador
## Bartlett's K-squared = 2.9844, df = 3, p-value = 0.394

En este caso pvalor> 0.05, se cumple supuesto de varianzas iguales

REVISION DE DATOS ATÍPICOS

#Instalamos libreria 
#Valor p ≤ α: Existe un valor atípico (Rechaza H0)
#
library(outliers)
grubbs.test(mod$residuals)
## 
##  Grubbs test for one outlier
## 
## data:  mod$residuals
## G.15 = 2.46399, U = 0.72456, p-value = 0.1015
## alternative hypothesis: highest value 4.83333333333333 is an outlier

pvalue > 0.05, no se detectaron datos atípicos.

PRUEBA DE TUKEY

library(TukeyC)

tt = TukeyC(mod, "catalizador")
plot(tt)

Se concluye que no hay diferencias entre los tratamientos por catalizadores B y C y sucede lo mismo entre el A y el D.

Tukey 2

TukeyHSD(mod, conf.level = 0.95)
##   Tukey multiple comparisons of means
##     95% family-wise confidence level
## 
## Fit: aov(formula = rend ~ catalizador, data = data)
## 
## $catalizador
##           diff       lwr       upr     p adj
## B-A  5.0000000  1.600704  8.399296 0.0027711
## C-A  6.3333333  2.934037  9.732629 0.0002282
## D-A  0.1666667 -3.232629  3.565963 0.9990452
## C-B  1.3333333 -2.065963  4.732629 0.6948686
## D-B -4.8333333 -8.232629 -1.434037 0.0037860
## D-C -6.1666667 -9.565963 -2.767371 0.0003110

Hay diferencia entre los tratamientos A-B, A-C, B-D, C-D.

INTERPRETACIÓN BIOLÓGICA

El tratamiento que presenta mayor rendimiento es el del catalizador C, el de menor es el A. LOs tratamientos D-A obtienen resultados parecidos.

MODALIDADES DE ANALISIS DE VARIANZA

Oneway Test

mod1v = oneway.test(rend~catalizador, data)
mod1v
## 
##  One-way analysis of means (not assuming equal variances)
## 
## data:  rend and catalizador
## F = 15.098, num df = 3.000, denom df = 10.512, p-value = 0.0003925

Test de Kruskal-Wallis

mod2v = kruskal.test(rend ~catalizador, data)
mod2v
## 
##  Kruskal-Wallis rank sum test
## 
## data:  rend by catalizador
## Kruskal-Wallis chi-squared = 17.333, df = 3, p-value = 0.0006035

Analisis varianza permutacional

library(RVAideMemoire)
## *** Package RVAideMemoire v 0.9-82-2 ***
## 
## Attaching package: 'RVAideMemoire'
## The following object is masked from 'package:TukeyC':
## 
##     cv
perm1<-perm.anova(rend ~ catalizador, data = data, nperm = 1000, progress = F)
perm1
## Permutation Analysis of Variance Table
## 
## Response: rend
## 1000 permutations
##             Sum Sq Df Mean Sq F value   Pr(>F)    
## catalizador 192.46  3  64.153  14.498 0.000999 ***
## Residuals    88.50 20   4.425                     
## ---
## Signif. codes:  0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1

Todos los resultados pvalor < 0.05, confirma los resultados anteriores