Apa Itu Metode Kruskal-Wallis?

Uji Kruskal-Wallis adalah salah satu uji inferensi nonparametrik yang berdasarkan pada peringkat (rank). Kruskal dan Wallis mengembangkan uji untuk kasus tiga atau lebih populasi. Selain itu, uji ini identik dengan uji One-Way ANOVA. Perbedaannya terletak pada distribusi dari data yang ingin diuji. Uji Kruskal-Wallis dapat menjadi alternatif dari uji One-Way ANOVA jika terdapat minimal satu kelompok sampel yang ingin diuji memiliki sebaran data yang tidak berdistribusi normal dan dapat digunakan untuk menguji apakah populasi adalah identik.

Apa Fungsi Metode Krusal-Wallis?

Uji ini bertujuan untuk menentukan apakah terdapat perbedaan yang signifikan secara statistik antara k kelompok sampel acak (random) yang bersifat independen yang berskala data numerik (interval/rasio) atau ordinal.

Syarat Data

  1. Data yang digunakan terdiri dari k sampel yang independen dan ditarik secara acak dari populasi.
  2. Data yang digunakan berskala ordinal atau numerik (interval/rasio) yang didasarkan pada rank.
  3. Distribusi data yang diuji tidak berdistribusi normal.

Rumus

Rumus Uji Kruskal-Wallis \[H = \frac{12}{N(N+1)} \sum_{j=1}^k \frac{R^2_j}{n_j} - 3(N+1)\]

Keterangan :

H: nilai Kruskal-Wallis dari hasil perhitungan

\(R_j\): jumlah rank dari kelompok/kategori ke-j

\(n_j\): banyaknya kasus dalam sampel pada kelompok/kategori ke-j

k: banyaknya kelompok/kategori

N: jumlah seluruh observasi( N = \(n_1 + n_2 + ... + n_k\) )

Pengujian Data

Uji Normalitas (Saphiro-Wilk)

  1. Hipotesis

    \(H_0\) : Data berdistribusi normal

    \(H_1\) : Data tidak berdistribusi normal

  2. Taraf Signifikansi (\(\alpha\))

  3. Daerah Kritis \(H_0\) ditolak jika p-value < \(\alpha\)

  4. Statistik Uji

    Menggunakan saphiro.test() untuk menguji normalitas pada masing-masing tahun.

  5. Kesimpulan

    Jika hasil p-value < 0,05 maka \(H_0\) ditolak yang berarti data tidak berdistribusi normal, sedangkan apabila hasil p-value \(\geq\) 0,05 maka \(H_0\) tidak ditolak yang berarti data berdistribusi normal.

Uji Kruskal-Wallis

  1. Hipotesis

    \(H_0\) : Tidak terdapat perbedaan antara tiga atau lebih kelompok data

    \(H_1\) : Terdapat perbedaan antara tiga atau lebih kelompok data

  2. Taraf Signifikansi (\(\alpha\))

  3. Daerah Kritis

    \(H_0\) ditolak jika \(H_{hit} > H_{tabel}\) dengan syarat \(n_i \leq 3; k = 3\) atau

    \(H_0\) ditolak jika \(H_{hit} > \chi^2_{k-1} (\alpha)\) dengan syarat \(n_i \neq 5; k = 3\) atau

    \(H_0\) ditolak jika p-value < \(\alpha\)

    Sumber tabel :

    Tabel Kruskal-Wallis

    Tabel Chi-Square

  4. Statistik Uji

    Menggunakan kruskal.test() untuk mendapatkan nilai p-value dari data yang dimiliki.

  5. Kesimpulan

    Jika hasil p-value < 0,05 maka \(H_0\) ditolak yang berarti terdapat perbedaan antara tiga atau lebih kelompok data, sedangkan apabila hasil p-value \(\geq\) 0,05 maka \(H_0\) tidak ditolak yang berarti bahwa tidak terdapat perbedaan antara tiga atau lebih kelompok data.

Pengaplikasian Pada Sebuah Kasus

Pandemi COVID-19 telah membawa dampak signifikan bagi kesehatan masyarakat di seluruh dunia, termasuk Indonesia. Kemunculan COVID-19 pada akhir tahun 2019 memicu lonjakan angka kematian yang belum pernah terjadi sebelumnya. Analisis data banyaknya kematian sebelum, selama, dan setelah penyebaran COVID-19 merupakan langkah penting untuk memahami dampak pandemi ini terhadap kesehatan masyarakat. Informasi yang diperoleh dari analisis ini dapat digunakan untuk merumuskan kebijakan yang tepat, mengalokasikan sumber daya secara efektif, dan kebutuhan untuk strategi pencegahan dan intervensi yang lebih baik di masa depan. Oleh sebab itu, untuk mengetahui ada atau tidaknya perbedaan yang terjadi, maka dilakukan pengujian menggunakan uji Kruskal-Wallis melalui R-Studio sebagai berikut.

Aktifkan library() yang dibutuhkan

library(rmarkdown)
library(knitr)
library(readxl)
library(kableExtra)
library(ggpubr)

Import data yang sudah dimiliki

Memasukkan data yang diperoleh dari Publikasi BPS Kota Surabaya pada software R-Studio sebagai berikut.

data_kematian <- read_excel("C:/Users/anisa/Documents/001kuliah/Sistem Informasi Manajemen/tbp2/kematian.xlsx")

Tampilkan data yang telah diimport

kable_input = kable(data_kematian, format = "html", col.names = c("2019", "2020", "2021"),  align = "c")
  data_styling = kable_styling(kable_input, full_width = TRUE)
  scroll_box(data_styling, height = "300px")
2019 2020 2021
917 971 1673
485 553 1018
819 852 1711
756 784 1493
636 728 1276
1347 1381 2357
857 921 1568
1131 1122 2291
324 340 668
1722 2011 3503
1105 1367 242
708 837 1510
446 503 1041
384 457 857
754 881 1582
566 684 1260
1798 2316 3494
1389 1624 2601
540 677 1140
460 465 911
486 534 1014
615 843 1371
313 393 779
365 517 836
722 854 1597
756 878 153
311 292 553
448 492 984
454 514 913
318 379 756
438 588 992


Uji data yang sudah di import

  • Uji Normalitas

Mengingat uji Kruskal-Wallis tidak memerlukan jenis data yang normal, maka dilakuan uji normalitas data pada masing-masing tahun.

Uji normalitas banyak kematian di Surabaya tahun 2019

Probability Plot Data Banyaknya Kematian Di Surabaya Tahun 2019

  ggqqplot(data_kematian$'2019')

Berdasarkan persebaran yang diperoleh dari hasil probability plot di atas, diketahui bahwa terdapat data yang jauh dari garis linear yang berarti bahwa data tersebut tidak normal. Asumsi ini dapat dibuktikan lebih lanjut melalui perhitungan menggunakan shapiro test

shapiro.test(data_kematian$'2019')
## 
##  Shapiro-Wilk normality test
## 
## data:  data_kematian$"2019"
## W = 0.85133, p-value = 0.0005408

Karena p-value = 0,0005408 < 0,05 maka data jumlah kematian di Surabaya tahun 2019 tersebut tidak berdistribusi normal.

Uji normalitas tingkat kematian di Surabaya tahun 2020

Probability Plot Data Banyaknya Kematian Di Surabaya Tahun 2020

  ggqqplot(data_kematian$'2020')

Pengujian menggunakan shapiro test

shapiro.test(data_kematian$'2020')
## 
##  Shapiro-Wilk normality test
## 
## data:  data_kematian$"2020"
## W = 0.83617, p-value = 0.0002606

Karena p-value = 0,0002606 < 0,05 maka data banyaknya kematian di Surabaya tahun 2020 tersebut tidak berdistribusi normal.

Uji normalitas tingkat banyaknya kematian di Surabaya tahun 2021

Probability Plot Data Kematian Di Surabaya Tahun 2021

  ggqqplot(data_kematian$'2021')

Pengujian menggunakan shapiro test

shapiro.test(data_kematian$'2021')
## 
##  Shapiro-Wilk normality test
## 
## data:  data_kematian$"2021"
## W = 0.88579, p-value = 0.003244

Karena p-value = 0,003244 < 0,05 maka data jumlah kematian di Surabaya tahun 2021 tersebut tidak berdistribusi normal.

  • Uji Kruskal-Wallis

Setelah diketahui bahwa data berdistribusi tidak normal selanjutnya menguji data-data tersebut menggunakan uji Kruskal-Wallis.

Uji kruskal-wallis tingkat kematian di Surabaya tahun 2019, 2020, dan 2021

kruskal.test(data_kematian, alternative = "two.sided", conf.level = 0.95)
## 
##  Kruskal-Wallis rank sum test
## 
## data:  data_kematian
## Kruskal-Wallis chi-squared = 19.104, df = 2, p-value = 7.107e-05

Karena p-value = \(7.107e^{-05}\) < 0,05 maka terdapat perbedaan tingkat kematian antara tahun 2019, 2020, dan 2021.

Analisis Hasil Uji

Berdasarkan pengujian yang telah dilakukan, diperoleh bahwa data tingkat kematian di Surabaya pada tahun 2019, 2020, dan 2021 tidak berdistribusi normal. Selain itu, berdasarkan hasil uji Kruskal-Wallis, diperoleh bahwa terdapat perbedaan yang signifikan pada setiap tahunnya. Oleh karena itu, dapat disimpulkan bahwa terdapat perbedaan tingkat kematian di Surabaya sebelum, selama, dan setelah penyebaran COVID-19.

Daftar Pustaka

BPS. (2022) Banyaknya Kematian yang Dilaporkan per Kecamatan Hasil Registrasi 2020- 2022. Diakses pada 19 Mei 2024

Karmini. (2020). Statistika Non Parametrik. Mulawarman University Press.

K, Yasin. (2023) Daftar Kode Warna HTML CSS Lengkap dan Cara Menggunakannya. Diakses pada 23 Mei 2024

Nugroho, S. (2008). Statistika Nonparametrika (J. Rizal (ed.); 1st ed.). UNIB Press.

NIST. (2011) Probability Plot. Diakkses pada 23 Mei 2024

King, A.P. & Eckersley, R.J. (2019). Wilk Test. Diakses pada 19 Mei 2024

Pratama, Andre. (2020) Index Tutorial Belajar HTML Duniailkom. Diakses pada 20 Mei 2024

Zar. (1984). Critical Values of the Kruskal-Wallis H Distribution. Diakses pada 23 Mei 2024