Uji Kruskal-Wallis adalah salah satu uji inferensi nonparametrik yang berdasarkan pada peringkat (rank). Kruskal dan Wallis mengembangkan uji untuk kasus tiga atau lebih populasi. Selain itu, uji ini identik dengan uji One-Way ANOVA. Perbedaannya terletak pada distribusi dari data yang ingin diuji. Uji Kruskal-Wallis dapat menjadi alternatif dari uji One-Way ANOVA jika terdapat minimal satu kelompok sampel yang ingin diuji memiliki sebaran data yang tidak berdistribusi normal dan dapat digunakan untuk menguji apakah populasi adalah identik.
Uji ini bertujuan untuk menentukan apakah terdapat perbedaan yang signifikan secara statistik antara k kelompok sampel acak (random) yang bersifat independen yang berskala data numerik (interval/rasio) atau ordinal.
Rumus Uji Kruskal-Wallis \[H = \frac{12}{N(N+1)} \sum_{j=1}^k \frac{R^2_j}{n_j} - 3(N+1)\]
Keterangan :
H: nilai Kruskal-Wallis dari hasil perhitungan
\(R_j\): jumlah rank dari kelompok/kategori ke-j
\(n_j\): banyaknya kasus dalam sampel pada kelompok/kategori ke-j
k: banyaknya kelompok/kategori
N: jumlah seluruh observasi( N = \(n_1 + n_2 + ... + n_k\) )
Hipotesis
\(H_0\) : Data berdistribusi normal
\(H_1\) : Data tidak berdistribusi normal
Taraf Signifikansi (\(\alpha\))
Daerah Kritis \(H_0\) ditolak jika p-value < \(\alpha\)
Statistik Uji
Menggunakan saphiro.test() untuk menguji normalitas pada
masing-masing tahun.
Kesimpulan
Jika hasil p-value < 0,05 maka \(H_0\) ditolak yang berarti data tidak berdistribusi normal, sedangkan apabila hasil p-value \(\geq\) 0,05 maka \(H_0\) tidak ditolak yang berarti data berdistribusi normal.
Hipotesis
\(H_0\) : Tidak terdapat perbedaan antara tiga atau lebih kelompok data
\(H_1\) : Terdapat perbedaan antara tiga atau lebih kelompok data
Taraf Signifikansi (\(\alpha\))
Daerah Kritis
\(H_0\) ditolak jika \(H_{hit} > H_{tabel}\) dengan syarat \(n_i \leq 3; k = 3\) atau
\(H_0\) ditolak jika \(H_{hit} > \chi^2_{k-1} (\alpha)\) dengan syarat \(n_i \neq 5; k = 3\) atau
\(H_0\) ditolak jika p-value < \(\alpha\)
Sumber tabel :
Statistik Uji
Menggunakan kruskal.test() untuk mendapatkan nilai
p-value dari data yang dimiliki.
Kesimpulan
Jika hasil p-value < 0,05 maka \(H_0\) ditolak yang berarti terdapat perbedaan antara tiga atau lebih kelompok data, sedangkan apabila hasil p-value \(\geq\) 0,05 maka \(H_0\) tidak ditolak yang berarti bahwa tidak terdapat perbedaan antara tiga atau lebih kelompok data.
Pandemi COVID-19 telah membawa dampak signifikan bagi kesehatan masyarakat di seluruh dunia, termasuk Indonesia. Kemunculan COVID-19 pada akhir tahun 2019 memicu lonjakan angka kematian yang belum pernah terjadi sebelumnya. Analisis data banyaknya kematian sebelum, selama, dan setelah penyebaran COVID-19 merupakan langkah penting untuk memahami dampak pandemi ini terhadap kesehatan masyarakat. Informasi yang diperoleh dari analisis ini dapat digunakan untuk merumuskan kebijakan yang tepat, mengalokasikan sumber daya secara efektif, dan kebutuhan untuk strategi pencegahan dan intervensi yang lebih baik di masa depan. Oleh sebab itu, untuk mengetahui ada atau tidaknya perbedaan yang terjadi, maka dilakukan pengujian menggunakan uji Kruskal-Wallis melalui R-Studio sebagai berikut.
Aktifkan library() yang dibutuhkan
library(rmarkdown)
library(knitr)
library(readxl)
library(kableExtra)
library(ggpubr)
Import data yang sudah dimiliki
Memasukkan data yang diperoleh dari Publikasi BPS Kota Surabaya pada software R-Studio sebagai berikut.
data_kematian <- read_excel("C:/Users/anisa/Documents/001kuliah/Sistem Informasi Manajemen/tbp2/kematian.xlsx")
Tampilkan data yang telah diimport
kable_input = kable(data_kematian, format = "html", col.names = c("2019", "2020", "2021"), align = "c")
data_styling = kable_styling(kable_input, full_width = TRUE)
scroll_box(data_styling, height = "300px")
| 2019 | 2020 | 2021 |
|---|---|---|
| 917 | 971 | 1673 |
| 485 | 553 | 1018 |
| 819 | 852 | 1711 |
| 756 | 784 | 1493 |
| 636 | 728 | 1276 |
| 1347 | 1381 | 2357 |
| 857 | 921 | 1568 |
| 1131 | 1122 | 2291 |
| 324 | 340 | 668 |
| 1722 | 2011 | 3503 |
| 1105 | 1367 | 242 |
| 708 | 837 | 1510 |
| 446 | 503 | 1041 |
| 384 | 457 | 857 |
| 754 | 881 | 1582 |
| 566 | 684 | 1260 |
| 1798 | 2316 | 3494 |
| 1389 | 1624 | 2601 |
| 540 | 677 | 1140 |
| 460 | 465 | 911 |
| 486 | 534 | 1014 |
| 615 | 843 | 1371 |
| 313 | 393 | 779 |
| 365 | 517 | 836 |
| 722 | 854 | 1597 |
| 756 | 878 | 153 |
| 311 | 292 | 553 |
| 448 | 492 | 984 |
| 454 | 514 | 913 |
| 318 | 379 | 756 |
| 438 | 588 | 992 |
Uji data yang sudah di import
Mengingat uji Kruskal-Wallis tidak memerlukan jenis data yang normal, maka dilakuan uji normalitas data pada masing-masing tahun.
Uji normalitas banyak kematian di Surabaya tahun 2019
Probability Plot Data Banyaknya Kematian Di Surabaya Tahun 2019
ggqqplot(data_kematian$'2019')
Berdasarkan persebaran yang diperoleh dari hasil probability plot di atas, diketahui bahwa terdapat data yang jauh dari garis linear yang berarti bahwa data tersebut tidak normal. Asumsi ini dapat dibuktikan lebih lanjut melalui perhitungan menggunakan shapiro test
shapiro.test(data_kematian$'2019')
##
## Shapiro-Wilk normality test
##
## data: data_kematian$"2019"
## W = 0.85133, p-value = 0.0005408
Karena p-value = 0,0005408 < 0,05 maka data jumlah kematian di Surabaya tahun 2019 tersebut tidak berdistribusi normal.
Uji normalitas tingkat kematian di Surabaya tahun 2020
Probability Plot Data Banyaknya Kematian Di Surabaya Tahun 2020
ggqqplot(data_kematian$'2020')
Pengujian menggunakan shapiro test
shapiro.test(data_kematian$'2020')
##
## Shapiro-Wilk normality test
##
## data: data_kematian$"2020"
## W = 0.83617, p-value = 0.0002606
Karena p-value = 0,0002606 < 0,05 maka data banyaknya kematian di Surabaya tahun 2020 tersebut tidak berdistribusi normal.
Uji normalitas tingkat banyaknya kematian di Surabaya tahun 2021
Probability Plot Data Kematian Di Surabaya Tahun 2021
ggqqplot(data_kematian$'2021')
Pengujian menggunakan shapiro test
shapiro.test(data_kematian$'2021')
##
## Shapiro-Wilk normality test
##
## data: data_kematian$"2021"
## W = 0.88579, p-value = 0.003244
Karena p-value = 0,003244 < 0,05 maka data jumlah kematian di Surabaya tahun 2021 tersebut tidak berdistribusi normal.
Setelah diketahui bahwa data berdistribusi tidak normal selanjutnya menguji data-data tersebut menggunakan uji Kruskal-Wallis.
Uji kruskal-wallis tingkat kematian di Surabaya tahun 2019, 2020, dan 2021
kruskal.test(data_kematian, alternative = "two.sided", conf.level = 0.95)
##
## Kruskal-Wallis rank sum test
##
## data: data_kematian
## Kruskal-Wallis chi-squared = 19.104, df = 2, p-value = 7.107e-05
Karena p-value = \(7.107e^{-05}\) < 0,05 maka terdapat perbedaan tingkat kematian antara tahun 2019, 2020, dan 2021.
Berdasarkan pengujian yang telah dilakukan, diperoleh bahwa data tingkat kematian di Surabaya pada tahun 2019, 2020, dan 2021 tidak berdistribusi normal. Selain itu, berdasarkan hasil uji Kruskal-Wallis, diperoleh bahwa terdapat perbedaan yang signifikan pada setiap tahunnya. Oleh karena itu, dapat disimpulkan bahwa terdapat perbedaan tingkat kematian di Surabaya sebelum, selama, dan setelah penyebaran COVID-19.
BPS. (2022) Banyaknya Kematian yang Dilaporkan per Kecamatan Hasil Registrasi 2020- 2022. Diakses pada 19 Mei 2024
Karmini. (2020). Statistika Non Parametrik. Mulawarman University Press.
K, Yasin. (2023) Daftar Kode Warna HTML CSS Lengkap dan Cara Menggunakannya. Diakses pada 23 Mei 2024
Nugroho, S. (2008). Statistika Nonparametrika (J. Rizal (ed.); 1st ed.). UNIB Press.
NIST. (2011) Probability Plot. Diakkses pada 23 Mei 2024
King, A.P. & Eckersley, R.J. (2019). Wilk Test. Diakses pada 19 Mei 2024
Pratama, Andre. (2020) Index Tutorial Belajar HTML Duniailkom. Diakses pada 20 Mei 2024
Zar. (1984). Critical Values of the Kruskal-Wallis H Distribution. Diakses pada 23 Mei 2024