Uji Kruskal-Wallis

Uji Kruskal-Wallis atau biasa disebut kruskal wallis satu arah anova merupakan gagasan dari dua orang yaitu William kruskal dan W. allen wallis. Analisis varians satu-arah berdasarkan peringkat Kruskal-Wallis yaitu teknik nonparametrik yang digunakan untuk menguji hipotesis nol yang menyatakan bahwa beberapa sampel telah ditarik dari populasi-populasi yag sama atau identik. Dan apabila kasus yang diselidiki hanya dua sampel, maka uji Kruskal-Wallis setara dengan uji Mann-Whitney. Uji Kruskal-Wallis memanfaatkan informasi yang lebih banyak ketimbang yang digunakan pada uji median.

Metode ini bertujuan untuk menguji perbedaan median atau peringkat rata-rata antar lebih dari dua kelompok yang independen satu sama lain. Metode ini juga memiliki asumsi sebagai berikut:

  1. Variabel independen berskala kategorik dengan lebih dari dua kategori.
  2. Variabel dependen berskala numerik atau ordinal.
  3. Sampel pada tiap kategori independen (tidak ada tumpang tindih).
  4. Variabilitas antar kelompok harus sama (bentuk sebaran data serupa).

Pengujian Data Menggunakan Metode kruskal Walis

  1. Hipotesis

    • \(H_0\): Tidak ada perbedaan yang signifikan antara kelompok-kelompok yang diuji, atau semua populasi memiliki median yang sama.
    • \(H_1\): Setidaknya ada satu kelompok yang median atau distribusinya berbeda dengan kelompok lainnya.
  2. Taraf Signifikansi

    Taraf signifikansi dilambangkan dengan \(\alpha\).

  3. Daerah Kritis

    Tolak \(H_0\) jika:\(H > \chi^2_{\alpha,\, df}\) atau \(p\)-value \(< \alpha\)

  4. Statistik Uji

    Rumus statistik uji Kruskal-Wallis adalah:

    \[H = \frac{12}{N(N + 1)} \sum_{j=1}^{k} \frac{R_j^2}{n_j} - 3(N + 1)\]

    Keterangan:

    \(H\) : Nilai statistik Kruskal-Wallis
    \(k\) : Jumlah kelompok
    \(N\) : Total seluruh data
    \(n_j\) : Banyak data pada kelompok ke-\(j\)
    \(R_j\) : Jumlah ranking dari kelompok ke-\(j\)

  5. Kesimpulan

    • Jika \(p\)-value \(< \alpha\): Terdapat perbedaan yang signifikan antar kelompok.
    • Jika \(p\)-value \(\geq \alpha\): Tidak terdapat perbedaan yang signifikan antar kelompok.

Pengaplikasian Pada Data

Dalam dunia bisnis, analisis penjualan berdasarkan wilayah pasar merupakan hal yang penting untuk mengevaluasi kinerja distribusi dan efektivitas strategi pemasaran. Perusahaan perlu mengetahui apakah terdapat perbedaan yang signifikan dalam pencapaian penjualan di berbagai wilayah pasar agar dapat mengambil kebijakan yang tepat sasaran, seperti pengalokasian sumber daya atau penyesuaian strategi promosi.

Namun, dalam banyak kasus, data penjualan antar wilayah tidak selalu memenuhi asumsi distribusi normal yang dibutuhkan dalam analisis parametrik seperti ANOVA. Oleh karena itu, pendekatan statistik non-parametrik menjadi alternatif yang tepat untuk menguji perbedaan distribusi data penjualan antar kelompok wilayah.

Salah satu metode non-parametrik yang digunakan adalah uji Kruskal-Wallis, yang dapat digunakan untuk membandingkan distribusi atau median dari tiga kelompok atau lebih yang independen. Uji ini tidak mensyaratkan distribusi normal dan sangat cocok digunakan ketika data berskala ordinal atau ketika asumsi ANOVA tidak terpenuhi.

Dalam penelitian ini, dilakukan uji Kruskal-Wallis terhadap data penjualan dari empat wilayah pasar yang berbeda untuk mengetahui apakah terdapat perbedaan distribusi penjualan yang signifikan antar wilayah tersebut. Berikut adalah langkah-langkah yang dapat di lakukan pada Rstudio:

Library yang digunakan

library(DT)
## Warning: package 'DT' was built under R version 4.4.3
library(readxl)
## Warning: package 'readxl' was built under R version 4.4.2
library(rmarkdown)

Import Data

datatable(Data_Penjualan_Perwilayah)

Uji Kruskal-Wallis

  1. Hipotesis

    • \(H_0\): Tidak ada perbedaan yang signifikan antara central, east, south, dan west.
    • \(H_1\): Setidaknya ada satu kelompok yang distribusinya berbeda dengan kelompok lainnya.
  2. Taraf Signifikansi

    \(\alpha\) = 0,05

  3. Daerah Kritis

    Tolak \(H_0\) jika:\(H > \chi^2_{\alpha,\, df}\) atau \(p\)-value < 0,05

  • Statistik Uji

  • Data_Penjualan_Perwilayah$Wilayah <- as.factor(Data_Penjualan_Perwilayah$Market)
    summary(Data_Penjualan_Perwilayah)
    ##     Market              sales          Wilayah  
    ##  Length:177         Min.   : 17.0   Central:56  
    ##  Class :character   1st Qu.: 93.0   East   :37  
    ##  Mode  :character   Median :140.0   South  :28  
    ##                     Mean   :178.3   West   :56  
    ##                     3rd Qu.:200.0               
    ##                     Max.   :678.0
    kruskal.test(sales ~ Market, data = Data_Penjualan_Perwilayah)
    ## 
    ##  Kruskal-Wallis rank sum test
    ## 
    ## data:  sales by Market
    ## Kruskal-Wallis chi-squared = 2.2269, df = 3, p-value = 0.5267
    1. Kesimpulan
      Karena nilai p-value = 0,5267 > 0,05 maka \(H_0\) di tolak,artinya setidaknya ada satu kelompok yg distribusinya berbeda dengan kelompok yang lain.

    Hasil Analisis Uji

    Analisis penjualan berdasarkan wilayah pasar penting dilakukan untuk mengevaluasi efektivitas distribusi dan strategi pemasaran perusahaan. Karena data penjualan tidak selalu memenuhi asumsi distribusi normal, digunakanlah metode non-parametrik seperti uji Kruskal-Wallis yang cocok untuk membandingkan distribusi atau median lebih dari dua kelompok independen. Dalam studi ini, uji Kruskal-Wallis diterapkan pada data penjualan dari empat wilayah (Central, East, South, dan West) untuk mengetahui apakah terdapat perbedaan yang signifikan antar wilayah tersebut. Hasil analisis menunjukkan bahwa nilai p-value sebesar 0,5267 lebih besar dari taraf signifikansi 0,05, sehingga tidak ada cukup bukti untuk menyimpulkan adanya perbedaan distribusi penjualan antar wilayah. Dengan kata lain, penjualan di keempat wilayah tersebut relatif merata, sehingga strategi distribusi dan pemasaran yang telah diterapkan belum perlu disesuaikan secara spesifik untuk masing-masing wilayah.