Tres métodos de tratamiento. Medimos satisfacción en escala 1-20.
grupo_A <- c(8, 10, 7, 9)
grupo_B <- c(14, 16, 15, 13)
grupo_C <- c(10, 11, 9, 12)
x <- c(grupo_A, grupo_B, grupo_C)
grupos <- rep(c('A','B','C'), each=4)
N <- length(x)
Asignamos rangos del 1 al N mezclando todos los grupos.
rangos <- rank(x)
rangos
## [1] 2.0 5.5 1.0 3.5 10.0 12.0 11.0 9.0 5.5 7.0 3.5 8.0
Ri <- tapply(rangos, grupos, sum)
ni <- tapply(x, grupos, length)
Ri
## A B C
## 12 42 24
ni
## A B C
## 4 4 4
H <- (12 / (N*(N+1))) * sum(Ri^2 / ni) - 3*(N+1)
k <- length(unique(grupos))
p <- pchisq(H, df=k-1, lower.tail=FALSE)
H = 8.7692 | p = 0.01247
p = 0.01247 ≤ 0.05 → Se rechaza H₀. Hay diferencia significativa entre al menos dos métodos.
library(dunn.test)
dunn.test(x, grupos, method='bonferroni')
## Kruskal-Wallis rank sum test
##
## data: x and grupos
## Kruskal-Wallis chi-squared = 8.831, df = 2, p-value = 0.01
##
##
## Dunn's Pairwise Comparison of x by grupos
## (Bonferroni)
## Col Mean-│
## Row Mean │ A B
## ─────────┼──────────────────────
## B │ -2.952082
## │ 0.0047*
## │
## C │ -1.180832 1.771249
## │ 0.3565 0.1148
##
## α = 0.05
## Reject Ho if p ≤ α/2, where p = Pr(Z ≥ |z|)
Los pares con p ajustado ≤ 0.05 presentan diferencia significativa.
Podemos ver que existe diferencia de distribución de datos entre el par A y B