Uji Kruskal-Wallis adalah salah satu uji inferensi nonparametrik yang berdasarkan pada peringkat (rank). Kruskal dan Wallis mengembangkan uji untuk kasus tiga atau lebih populasi. Selain itu, uji ini identik dengan uji One-Way ANOVA. Perbedaannya terletak pada distribusi dari data yang ingin diuji. Uji Kruskal-Wallis dapat menjadi alternatif dari uji One-Way ANOVA jika terdapat minimal satu kelompok sampel yang ingin diuji memiliki sebaran data yang tidak berdistribusi normal dan dapat digunakan untuk menguji apakah populasi adalah identik.
Uji ini bertujuan untuk menentukan apakah terdapat perbedaan yang signifikan secara statistik antara k kelompok sampel acak (random) yang bersifat independen yang berskala data numerik (interval/rasio) atau ordinal.
Rumus Uji Kruskal-Wallis \[H = \frac{12}{N(N+1)} \sum_{j=1}^k \frac{R^2_j}{n_j} - 3(N+1)\] Keterangan :
H : nilai Kruskal-Wallis dari hasil perhitungan
\(R_j\) : jumlah rank dari kelompok/kategori ke-j
\(n_j\) : banyaknya kasus dalam sampel pada kelompok/kategori ke-j
k : banyaknya kelompok/kategori
N : jumlah seluruh observasi (N = \(n_1 + n_2 + ... + n_k\))
Hipotesis
\(H_0\) : Data berdistribusi normal
\(H_1\) : Data tidak berdistribusi normal
Taraf Signifikansi (\(\alpha\))
Daerah Kritis \(H_0\) ditolak jika \(p-value < \alpha\)
Statistik Uji
Menggunakan saphiro.test() untuk menguji normalitas pada
masing-masing variabel.
Kesimpulan
Jika p-value < 0,05, maka \(H_0\) ditolak sehingga data berdistribusi normal, sedangkan apabila p-value \(\geq\) 0,05, maka \(H_0\) tidak ditolak sehingga data berdistribusi normal.
Hipotesis
\(H_0\) : Tidak terdapat perbedaan antara tiga atau lebih kelompok data
\(H_1\) : Terdapat perbedaan antara tiga atau lebih kelompok data
Taraf Signifikansi (\(\alpha\))
Daerah Kritis
\(H_0\) ditolak jika \(H_{hit} > H_{tabel}\) dengan syarat \(n_i \leq 3; k = 3\) atau
\(H_0\) ditolak jika \(H_{hit} > \chi^2_{k-1} (\alpha)\) dengan syarat \(n_i \neq 5; k = 3\) atau
\(H_0\) ditolak jika \(p-value < \alpha\)
Tabel :
Statistik Uji
Menggunakan kruskal.test() untuk mendapatkan nilai
p-value dari data yang dimiliki.
Kesimpulan
Jika p-value < 0,05, maka \(H_0\) ditolak sehingga terdapat perbedaan, sedangkan apabila hasil p-value \(\geq\) 0,05 maka, \(H_0\) tidak ditolak sehingga tidak terdapat perbedaan antara tiga atau lebih kelompok data.
Pendidikan telah menjadi salah satu pilar utama pembangunan sosial dan ekonomi di banyak negara. Negara-negara seperti Finland, Germany, dan Austria dikenal memiliki sistem pendidikan yang kuat dan berkualitas tinggi, yang berkontribusi pada peningkatan sumber daya manusia dan pertumbuhan ekonomi. Salah satu indikator penting untuk mengukur pencapaian dalam bidang pendidikan adalah rata-rata tahun yang dihabiskan oleh individu berusia 25 tahun ke atas dalam pendidikan formal. Indikator ini memberikan gambaran tentang seberapa lama populasi dewasa telah mengenyam pendidikan formal, yang mencerminkan komitmen negara terhadap pendidikan dan aksesibilitas pendidikan bagi masyarakat.
Uji Kruskal-Wallis menjadi salah satu metode statistik untuk mengetahui apakah terdapat perbedaan rata-rata lama sekolah individu di atas 25 tahun pada tahun 2000-2015 di Finland, Germany, dan Austria. Berikut ini merupakan langkah-langkah yang dapat diikuti dengan bantuan software R-Studio.
1) Aktifkan library() yang
dibutuhkan
library(rmarkdown) # Membuat dokumen dinamis dengan kode R dan teks.
library(knitr) # Membuat laporan otomatis dari kode R.
library(readxl) # Membaca data dari Excel ke R.
library(kableExtra) # Mempercantik tabel dalam R Markdown.
library(ggpubr) # Mempermudah pembuatan plot dengan ggplot2.
library(magick) # Melampirkan gambar dan mengedit gambar
2) Import data yang sudah dimiliki
Data diperoleh dari dataset CM2
Rata-rata_Lama_Sekolah=read_excel("C:/Users/tadan/KULIAH/SEMESTER 4/SIM/Rata-rata Sekolah_CM2_SIM.xlsx")
3) Tampilkan data yang telah diimport
Data rata-rata lama sekolah individu di atas 25 tahun pada tahun 2000-2015 di Finland, Germany, dan Austria.
kable_input = kable(Rata_rata_Lama_Sekolah, format = "html", col.names = c("Tahun", "Finland", "Germany", "Austria"), align = "c")
data_styling = kable_styling(kable_input, full_width = TRUE)
scroll_box(data_styling, height = "300px")
| Tahun | Finland | Germany | Austria |
|---|---|---|---|
| 2000 | 9.3 | 11.2 | 9.0 |
| 2001 | 9.4 | 11.7 | 9.2 |
| 2002 | 9.5 | 12.1 | 9.4 |
| 2003 | 9.6 | 12.5 | 9.6 |
| 2004 | 11.9 | 12.9 | 9.8 |
| 2005 | 12.0 | 13.3 | 9.9 |
| 2006 | 12.0 | 13.6 | 10.1 |
| 2007 | 12.0 | 13.7 | 11.6 |
| 2008 | 12.2 | 13.7 | 11.5 |
| 2009 | 12.2 | 13.8 | 11.7 |
| 2010 | 12.3 | 13.8 | 11.8 |
| 2011 | 12.3 | 13.9 | 11.8 |
| 2012 | 12.4 | 14.0 | 11.8 |
| 2013 | 12.3 | 14.0 | 11.9 |
| 2014 | 12.4 | 14.0 | 12.1 |
| 2015 | 12.4 | 14.1 | 12.1 |
4) Uji data yang sudah di import
Seperti apa yang sudah dijelaskan pada awal materi, uji Kruskal-Wallis tidak memerlukan asumsi data normal. Oleh karena itu, sebelum uji Kruskal-Wallis, dilakukan uji normalitas data pada masing-masing tahun untuk memastikan bahwa data tidak berditribusi normal.
Uji normalitas rata-rata lama pendidikan pada tahun 2000-2015 di Finland
Probability Plot Data rata-rata lama pendidikan pada tahun 2000-2015 di Finland
ggqqplot(Rata_rata_Lama_Sekolah$'Finland')
Berdasarkan persebaran titik yang diperoleh dari hasil probability plot di atas, terlihat bahwa terdapat data yang jauh dari garis linear. Hal ini adalah satu ciri data yang tidak berditribusi normal. Asumsi ini dapat dibuktikan lebih lanjut melalui perhitungan menggunakan shapiro test.
shapiro.test(Rata_rata_Lama_Sekolah$'Finland')
##
## Shapiro-Wilk normality test
##
## data: Rata_rata_Lama_Sekolah$Finland
## W = 0.66266, p-value = 6.736e-05
Karena p-value = 6.736e-05 < 0,05, maka data rata-rata lama pendidikan pada tahun 2000-2015 di Finland tidak berdistribusi normal.
Uji normalitas rata-rata lama pendidikan pada tahun 2000-2015 di Germany
Probability Plot Data rata-rata lama pendidikan pada tahun 2000-2015 di Germany
ggqqplot(Rata_rata_Lama_Sekolah$'Germany')
Pengujian menggunakan shapiro test
shapiro.test(Rata_rata_Lama_Sekolah$'Germany')
##
## Shapiro-Wilk normality test
##
## data: Rata_rata_Lama_Sekolah$Germany
## W = 0.81413, p-value = 0.004222
Karena p-value = 0.004222 < 0,05, maka data rata-rata lama pendidikan pada tahun 2000-2015 di Germany tidak berdistribusi normal.
Uji normalitas rata-rata lama pendidikan pada tahun 2000-2015 di Austria
Probability Plot Data rata-rata lama pendidikan pada tahun 2000-2015 di Austria
ggqqplot(Rata_rata_Lama_Sekolah$'Austria')
Pengujian menggunakan shapiro test
shapiro.test(Rata_rata_Lama_Sekolah$'Austria')
##
## Shapiro-Wilk normality test
##
## data: Rata_rata_Lama_Sekolah$Austria
## W = 0.82188, p-value = 0.005399
Karena p-value = 0.005399 < 0,05, maka data rata-rata lama pendidikan pada tahun 2000-2015 di Austria tidak berdistribusi normal.
Setelah terbukti bahwa data berdistribusi tidak normal, data dapat dilakukan uji lanjut menggunakan uji Kruskal-Wallis.
Uji kruskal-wallis rata-rata lama sekolah individu di atas 25 tahun pada tahun 2000-2015 di Finland, Germany, dan Austria.
kruskal.test(Rata_rata_Lama_Sekolah[, c("Finland", "Germany", "Austria")], alternative = "two.sided")
##
## Kruskal-Wallis rank sum test
##
## data: Rata_rata_Lama_Sekolah[, c("Finland", "Germany", "Austria")]
## Kruskal-Wallis chi-squared = 24.151, df = 2, p-value = 5.697e-06
Karena p-value = 5.697e-06 \(\leq\) 0,05, maka terdapat perbedaan rata-rata lama sekolah individu di atas 25 tahun pada tahun 2000-2015 di Finland, Germany, dan Austria.
Line Chart data rata-rata lama sekolah individu di atas 25 tahun pada tahun 2000-2015 di Finland, Germany, dan Austria.
Line_Chart_Rata_rata_Lama_Sekolah = image_read("C:/Users/tadan/KULIAH/SEMESTER 4/SIM/Line Chart Rata-rata Lama Sekolah.jpg")
Line_Chart_Rata_rata_Lama_Sekolah
Berdasarkan gambar line chart di atas, terlihat bahwa pada Negara Finland, Germany, dan Austria terdapat perbedaan yang signifikan pada rata-rata lama sekolah individu di atas 25 tahun pada tahun 2000-2015.
Bar Chart rerata dari rata-rata lama sekolah tahun 2000-2015 pada Negara Finland, Germany, dan Austria
Rerata_Finland = mean(Rata_rata_Lama_Sekolah$'Finland')
Rerata_Finland
Rerata_Germany = mean(Rata_rata_Lama_Sekolah$'Germany')
Rerata_Germany
Rerata_Austria = mean(Rata_rata_Lama_Sekolah$'Austria')
Rerata_Austria
Rerata_Setiap_Negara = c(Rerata_Finland, Rerata_Germany, Rerata_Austria)
Rerata_Setiap_Negara
Negara = c("Finland", "Germany", "Austria")
barplot(Rerata_Setiap_Negara, names.arg = Negara, col = "khaki",
main = "Rata-rata Setiap Negara",
xlab = "Negara", ylab = "Rata-rata")
Mendukung line chart sebelumnya, pada bar chart rerata dari rata-rata lama sekolah tahun 2000-2015 pada Negara Finland, Germany, dan Austria menunjukkan perbedaan yang cukup signifikan.
Berdasarkan pengujian yang telah dilakukan, diperoleh bahwa data rata-rata lama sekolah individu di atas 25 tahun pada tahun 2000-2015 di Finland, Germany, dan Austria tidak berdistribusi normal. Selain itu, berdasarkan hasil uji Kruskal-Wallis, diperoleh bahwa terdapat perbedaan yang signifikan pada setiap negara.
Terdapatnya perbedaan yang signifikan pada setiap negara juga dapat dilihat pada line chart yang memperlihatkan warna garis yang menunjukkan negara tidak berhimpitan. Lebih dari itu, pada bar chart juga menunjukkan rerata dari rata-rata lama sekolah tahun 2000-2015 pada Negara Finland, Germany, dan Austria memiliki nilai yang cukup berbeda.
Perbedaan signifikan ini menunjukkan bahwa setiap negara mungkin memiliki kebijakan pendidikan spesifik yang mempengaruhi lama waktu individu mengenyam pendidikan formal. Temuan ini memberikan wawasan penting bagi para pembuat kebijakan untuk memahami faktor-faktor yang mempengaruhi durasi pendidikan formal sehingga pembuat kebijakan dapat merancang strategi yang lebih efektif untuk meningkatkan akses dan kualitas pendidikan di negara mereka.