Kruskal-Wallis - Ejercicio 1

Datos

Tres métodos de tratamiento. Medimos satisfacción en escala 1-20.

grupo_A <- c(8, 10, 7, 9)
grupo_B <- c(14, 16, 15, 13)
grupo_C <- c(10, 11, 9, 12)

x <- c(grupo_A, grupo_B, grupo_C)
grupos <- rep(c('A','B','C'), each=4)
N <- length(x)

Rangos globales

Asignamos rangos del 1 al N mezclando todos los grupos.

rangos <- rank(x)
rangos

##  [1]  2.0  5.5  1.0  3.5 10.0 12.0 11.0  9.0  5.5  7.0  3.5  8.0

Suma de rangos por grupo

Ri <- tapply(rangos, grupos, sum)
ni <- tapply(x, grupos, length)
Ri

##  A  B  C 
## 12 42 24

ni

## A B C 
## 4 4 4

Estadístico H

H <- (12 / (N*(N+1))) * sum(Ri^2 / ni) - 3*(N+1)
k <- length(unique(grupos))
p <- pchisq(H, df=k-1, lower.tail=FALSE)

H = 8.7692 | p = 0.01247

Decisión

p = 0.01247 ≤ 0.05 → Se rechaza H₀. Hay diferencia significativa entre al menos dos métodos.

library(dunn.test)
dunn.test(x, grupos, method='bonferroni')

##   Kruskal-Wallis rank sum test
## 
## data: x and grupos
## Kruskal-Wallis chi-squared = 8.831, df = 2, p-value = 0.01
## 
## 
##                    Dunn's Pairwise Comparison of x by grupos                  
##                                  (Bonferroni)                                 
## Col Mean-│
## Row Mean │          A          B
## ─────────┼──────────────────────
##        B │  -2.952082
##          │     0.0047*
##          │
##        C │  -1.180832   1.771249
##          │     0.3565     0.1148 
## 
## α = 0.05
## Reject Ho if p ≤ α/2, where p = Pr(Z ≥ |z|)

Los pares con p ajustado ≤ 0.05 presentan diferencia significativa.

Podemos ver que existe diferencia de distribución de datos entre el par A y B