UJI KRUSKAL-WALLIS

ANALISIS RATA-RATA LAMA SEKOLAH INDIVIDU DI ATAS 25 TAHUN PADA 2000-2015 DI NEGARA FINLAND, GERMANY, DAN AUSTRIA

Tiara Fitri Adani (M0722076)


Metode Kruskal-Wallis

Uji Kruskal-Wallis adalah salah satu uji inferensi nonparametrik yang berdasarkan pada peringkat (rank). Kruskal dan Wallis mengembangkan uji untuk kasus tiga atau lebih populasi. Selain itu, uji ini identik dengan uji One-Way ANOVA. Perbedaannya terletak pada distribusi dari data yang ingin diuji. Uji Kruskal-Wallis dapat menjadi alternatif dari uji One-Way ANOVA jika terdapat minimal satu kelompok sampel yang ingin diuji memiliki sebaran data yang tidak berdistribusi normal dan dapat digunakan untuk menguji apakah populasi adalah identik.

Fungsi Metode Krusal-Wallis

Uji ini bertujuan untuk menentukan apakah terdapat perbedaan yang signifikan secara statistik antara k kelompok sampel acak (random) yang bersifat independen yang berskala data numerik (interval/rasio) atau ordinal.

Syarat Data

  1. Data yang digunakan terdiri dari k sampel yang independen dan ditarik secara acak dari populasi.
  2. Data yang digunakan berskala ordinal atau numerik (interval/rasio) yang didasarkan pada rank.
  3. Distribusi data yang diuji tidak berdistribusi normal.

Rumus

Rumus Uji Kruskal-Wallis \[H = \frac{12}{N(N+1)} \sum_{j=1}^k \frac{R^2_j}{n_j} - 3(N+1)\] Keterangan :

H : nilai Kruskal-Wallis dari hasil perhitungan

\(R_j\) : jumlah rank dari kelompok/kategori ke-j

\(n_j\) : banyaknya kasus dalam sampel pada kelompok/kategori ke-j

k : banyaknya kelompok/kategori

N : jumlah seluruh observasi (N = \(n_1 + n_2 + ... + n_k\))

Pengujian Data

Uji Normalitas (Saphiro-Wilk)

  1. Hipotesis

    \(H_0\) : Data berdistribusi normal

    \(H_1\) : Data tidak berdistribusi normal

  2. Taraf Signifikansi (\(\alpha\))

  3. Daerah Kritis \(H_0\) ditolak jika \(p-value < \alpha\)

  4. Statistik Uji

    Menggunakan saphiro.test() untuk menguji normalitas pada masing-masing variabel.

  5. Kesimpulan

    Jika p-value < 0,05, maka \(H_0\) ditolak sehingga data berdistribusi normal, sedangkan apabila p-value \(\geq\) 0,05, maka \(H_0\) tidak ditolak sehingga data berdistribusi normal.

Uji Kruskal-Wallis

  1. Hipotesis

    \(H_0\) : Tidak terdapat perbedaan antara tiga atau lebih kelompok data

    \(H_1\) : Terdapat perbedaan antara tiga atau lebih kelompok data

  2. Taraf Signifikansi (\(\alpha\))

  3. Daerah Kritis

    \(H_0\) ditolak jika \(H_{hit} > H_{tabel}\) dengan syarat \(n_i \leq 3; k = 3\) atau

    \(H_0\) ditolak jika \(H_{hit} > \chi^2_{k-1} (\alpha)\) dengan syarat \(n_i \neq 5; k = 3\) atau

    \(H_0\) ditolak jika \(p-value < \alpha\)

    Tabel :

    Tabel Kruskal-Wallis dan Tabel Chi-Square

  4. Statistik Uji

    Menggunakan kruskal.test() untuk mendapatkan nilai p-value dari data yang dimiliki.

  5. Kesimpulan

    Jika p-value < 0,05, maka \(H_0\) ditolak sehingga terdapat perbedaan, sedangkan apabila hasil p-value \(\geq\) 0,05 maka, \(H_0\) tidak ditolak sehingga tidak terdapat perbedaan antara tiga atau lebih kelompok data.

Pengaplikasian Pada Sebuah Kasus

Pendidikan telah menjadi salah satu pilar utama pembangunan sosial dan ekonomi di banyak negara. Negara-negara seperti Finland, Germany, dan Austria dikenal memiliki sistem pendidikan yang kuat dan berkualitas tinggi, yang berkontribusi pada peningkatan sumber daya manusia dan pertumbuhan ekonomi. Salah satu indikator penting untuk mengukur pencapaian dalam bidang pendidikan adalah rata-rata tahun yang dihabiskan oleh individu berusia 25 tahun ke atas dalam pendidikan formal. Indikator ini memberikan gambaran tentang seberapa lama populasi dewasa telah mengenyam pendidikan formal, yang mencerminkan komitmen negara terhadap pendidikan dan aksesibilitas pendidikan bagi masyarakat.

Uji Kruskal-Wallis menjadi salah satu metode statistik untuk mengetahui apakah terdapat perbedaan rata-rata lama sekolah individu di atas 25 tahun pada tahun 2000-2015 di Finland, Germany, dan Austria. Berikut ini merupakan langkah-langkah yang dapat diikuti dengan bantuan software R-Studio.

1) Aktifkan library() yang dibutuhkan

library(rmarkdown)  # Membuat dokumen dinamis dengan kode R dan teks.
library(knitr)      # Membuat laporan otomatis dari kode R.
library(readxl)     # Membaca data dari Excel ke R.
library(kableExtra) # Mempercantik tabel dalam R Markdown.
library(ggpubr)     # Mempermudah pembuatan plot dengan ggplot2.
library(magick)     # Melampirkan gambar dan mengedit gambar


2) Import data yang sudah dimiliki

Data diperoleh dari dataset CM2

Rata-rata_Lama_Sekolah=read_excel("C:/Users/tadan/KULIAH/SEMESTER 4/SIM/Rata-rata Sekolah_CM2_SIM.xlsx")


3) Tampilkan data yang telah diimport

Data rata-rata lama sekolah individu di atas 25 tahun pada tahun 2000-2015 di Finland, Germany, dan Austria.

kable_input = kable(Rata_rata_Lama_Sekolah, format = "html", col.names = c("Tahun", "Finland", "Germany", "Austria"),  align = "c")
  data_styling = kable_styling(kable_input, full_width = TRUE)
  scroll_box(data_styling, height = "300px")
Tahun Finland Germany Austria
2000 9.3 11.2 9.0
2001 9.4 11.7 9.2
2002 9.5 12.1 9.4
2003 9.6 12.5 9.6
2004 11.9 12.9 9.8
2005 12.0 13.3 9.9
2006 12.0 13.6 10.1
2007 12.0 13.7 11.6
2008 12.2 13.7 11.5
2009 12.2 13.8 11.7
2010 12.3 13.8 11.8
2011 12.3 13.9 11.8
2012 12.4 14.0 11.8
2013 12.3 14.0 11.9
2014 12.4 14.0 12.1
2015 12.4 14.1 12.1


4) Uji data yang sudah di import

  • Uji Normalitas

Seperti apa yang sudah dijelaskan pada awal materi, uji Kruskal-Wallis tidak memerlukan asumsi data normal. Oleh karena itu, sebelum uji Kruskal-Wallis, dilakukan uji normalitas data pada masing-masing tahun untuk memastikan bahwa data tidak berditribusi normal.

Uji normalitas rata-rata lama pendidikan pada tahun 2000-2015 di Finland

Probability Plot Data rata-rata lama pendidikan pada tahun 2000-2015 di Finland

ggqqplot(Rata_rata_Lama_Sekolah$'Finland')

Berdasarkan persebaran titik yang diperoleh dari hasil probability plot di atas, terlihat bahwa terdapat data yang jauh dari garis linear. Hal ini adalah satu ciri data yang tidak berditribusi normal. Asumsi ini dapat dibuktikan lebih lanjut melalui perhitungan menggunakan shapiro test.

shapiro.test(Rata_rata_Lama_Sekolah$'Finland')
## 
##  Shapiro-Wilk normality test
## 
## data:  Rata_rata_Lama_Sekolah$Finland
## W = 0.66266, p-value = 6.736e-05

Karena p-value = 6.736e-05 < 0,05, maka data rata-rata lama pendidikan pada tahun 2000-2015 di Finland tidak berdistribusi normal.

Uji normalitas rata-rata lama pendidikan pada tahun 2000-2015 di Germany

Probability Plot Data rata-rata lama pendidikan pada tahun 2000-2015 di Germany

ggqqplot(Rata_rata_Lama_Sekolah$'Germany')

Pengujian menggunakan shapiro test

shapiro.test(Rata_rata_Lama_Sekolah$'Germany')
## 
##  Shapiro-Wilk normality test
## 
## data:  Rata_rata_Lama_Sekolah$Germany
## W = 0.81413, p-value = 0.004222

Karena p-value = 0.004222 < 0,05, maka data rata-rata lama pendidikan pada tahun 2000-2015 di Germany tidak berdistribusi normal.

Uji normalitas rata-rata lama pendidikan pada tahun 2000-2015 di Austria

Probability Plot Data rata-rata lama pendidikan pada tahun 2000-2015 di Austria

ggqqplot(Rata_rata_Lama_Sekolah$'Austria')

Pengujian menggunakan shapiro test

shapiro.test(Rata_rata_Lama_Sekolah$'Austria')
## 
##  Shapiro-Wilk normality test
## 
## data:  Rata_rata_Lama_Sekolah$Austria
## W = 0.82188, p-value = 0.005399

Karena p-value = 0.005399 < 0,05, maka data rata-rata lama pendidikan pada tahun 2000-2015 di Austria tidak berdistribusi normal.

  • Uji Kruskal-Wallis

Setelah terbukti bahwa data berdistribusi tidak normal, data dapat dilakukan uji lanjut menggunakan uji Kruskal-Wallis.

Uji kruskal-wallis rata-rata lama sekolah individu di atas 25 tahun pada tahun 2000-2015 di Finland, Germany, dan Austria.

kruskal.test(Rata_rata_Lama_Sekolah[, c("Finland", "Germany", "Austria")], alternative = "two.sided")
## 
##  Kruskal-Wallis rank sum test
## 
## data:  Rata_rata_Lama_Sekolah[, c("Finland", "Germany", "Austria")]
## Kruskal-Wallis chi-squared = 24.151, df = 2, p-value = 5.697e-06

Karena p-value = 5.697e-06 \(\leq\) 0,05, maka terdapat perbedaan rata-rata lama sekolah individu di atas 25 tahun pada tahun 2000-2015 di Finland, Germany, dan Austria.

Visualisasi Data

  • Line Chart

Line Chart data rata-rata lama sekolah individu di atas 25 tahun pada tahun 2000-2015 di Finland, Germany, dan Austria.

Line_Chart_Rata_rata_Lama_Sekolah = image_read("C:/Users/tadan/KULIAH/SEMESTER 4/SIM/Line Chart Rata-rata Lama Sekolah.jpg")
Line_Chart_Rata_rata_Lama_Sekolah

Berdasarkan gambar line chart di atas, terlihat bahwa pada Negara Finland, Germany, dan Austria terdapat perbedaan yang signifikan pada rata-rata lama sekolah individu di atas 25 tahun pada tahun 2000-2015.

  • Bar Chart

Bar Chart rerata dari rata-rata lama sekolah tahun 2000-2015 pada Negara Finland, Germany, dan Austria

Rerata_Finland = mean(Rata_rata_Lama_Sekolah$'Finland')
Rerata_Finland
Rerata_Germany = mean(Rata_rata_Lama_Sekolah$'Germany')
Rerata_Germany
Rerata_Austria = mean(Rata_rata_Lama_Sekolah$'Austria')
Rerata_Austria

Rerata_Setiap_Negara = c(Rerata_Finland, Rerata_Germany, Rerata_Austria)
Rerata_Setiap_Negara

Negara = c("Finland", "Germany", "Austria")
barplot(Rerata_Setiap_Negara, names.arg = Negara, col = "khaki", 
        main = "Rata-rata Setiap Negara", 
        xlab = "Negara", ylab = "Rata-rata")

Mendukung line chart sebelumnya, pada bar chart rerata dari rata-rata lama sekolah tahun 2000-2015 pada Negara Finland, Germany, dan Austria menunjukkan perbedaan yang cukup signifikan.

Analisis Hasil Uji

Berdasarkan pengujian yang telah dilakukan, diperoleh bahwa data rata-rata lama sekolah individu di atas 25 tahun pada tahun 2000-2015 di Finland, Germany, dan Austria tidak berdistribusi normal. Selain itu, berdasarkan hasil uji Kruskal-Wallis, diperoleh bahwa terdapat perbedaan yang signifikan pada setiap negara.

Terdapatnya perbedaan yang signifikan pada setiap negara juga dapat dilihat pada line chart yang memperlihatkan warna garis yang menunjukkan negara tidak berhimpitan. Lebih dari itu, pada bar chart juga menunjukkan rerata dari rata-rata lama sekolah tahun 2000-2015 pada Negara Finland, Germany, dan Austria memiliki nilai yang cukup berbeda.

Perbedaan signifikan ini menunjukkan bahwa setiap negara mungkin memiliki kebijakan pendidikan spesifik yang mempengaruhi lama waktu individu mengenyam pendidikan formal. Temuan ini memberikan wawasan penting bagi para pembuat kebijakan untuk memahami faktor-faktor yang mempengaruhi durasi pendidikan formal sehingga pembuat kebijakan dapat merancang strategi yang lebih efektif untuk meningkatkan akses dan kualitas pendidikan di negara mereka.

Referensi

  1. Karmini. (2020). Statistika Non Parametrik. Mulawarman University Press.
  2. K, Yasin. (2023) Daftar Kode Warna HTML CSS Lengkap dan Cara Menggunakannya. Diakses pada 23 Mei 2024
  3. Nugroho, S. (2008). Statistika Nonparametrika (J. Rizal (ed.); 1st ed.). UNIB Press.
  4. NIST. (2011) Probability Plot. Diakkses pada 23 Mei 2024
  5. King, A.P. & Eckersley, R.J. (2019). Wilk Test. Diakses pada 19 Mei 2024
  6. Pratama, Andre. (2020) Index Tutorial Belajar HTML Duniailkom. Diakses pada 20 Mei 2024
  7. Zar. (1984). Critical Values of the Kruskal-Wallis H Distribution. Diakses pada 23 Mei 2024