Pengantar Analisis Data Kategorik - Uji Statistik Non-Parametrik

Video Pembelajaran - P2

Video Pembelajaran dapat diakses melalui link berikut : https://ipb.link/materipadk

Uji Peringkat Bertanda Wilcoxon (Wilcoxon Signed-Rank Test)

Tujuan

Uji Wilcoxon Signed-Rank adalah uji nonparametrik yang digunakan untuk membandingkan median dari satu sampel terhadap suatu nilai median yang dihipotesiskan, atau untuk membandingkan dua sampel berpasangan

Prinsip Kerja

Data diurutkan berdasarkan besarnya perbedaan antara nilai sampel dan median yang dihipotesiskan, kemudian diberi peringkat (rank). Peringkat tersebut kemudian dijumlahkan secara terpisah untuk tanda positif dan negatif, dan perbedaan ini digunakan untuk menentukan apakah median sampel berbeda secara signifikan dari median yang dihipotesiskan.

Penggunaan

Uji ini sering digunakan sebagai alternatif dari uji t ketika asumsi normalitas tidak terpenuhi.

Contoh Soal

10 contoh UKM dipilih untuk verifikasi dengan omset bulanannya: 8.1, 7.8, 13.5, 12.1, 10.0, 5.3, 6.9, 9.5, 11.5, 10.1

Benarkah nilai tengah omset bulanan UKM Kota Bogor sebesar Rp 10 juta?

# Soal 1
data <- c(8.1, 7.8, 13.5, 12.1, 10, 5.3, 6.9, 9.5, 11.5, 10.1)
median_hypothesis <- 10

# Uji Wilcoxon Signed-Rank
result <- wilcox.test(data, mu = median_hypothesis, alternative = "two.sided")
print(result)
## 
##  Wilcoxon signed rank test with continuity correction
## 
## data:  data
## V = 17, p-value = 0.5536
## alternative hypothesis: true location is not equal to 10

Karena P-value > alpha maka belum Cukup bukti untuk menyatakan bahwa nilai tengah omset bulanan UKM Kota Bogor sebesar Rp 10 juta.

Uji Mann-Whitney (Mann-Whitney U Test)

Tujuan

Uji Mann-Whitney, juga dikenal sebagai uji Wilcoxon rank-sum, digunakan untuk membandingkan dua kelompok independen guna mengetahui apakah distribusi satu kelompok cenderung lebih besar atau lebih kecil daripada kelompok lain. Ini adalah alternatif nonparametrik dari uji t untuk dua sampel independen ketika asumsi normalitas tidak terpenuhi.

Prinsip Kerja

Data dari kedua kelompok diurutkan bersama, dan peringkat (ranks) diberikan untuk masing-masing nilai. Kemudian, jumlah peringkat dari kedua kelompok dibandingkan. Jika distribusi antara kedua kelompok berbeda, jumlah peringkat akan berbeda secara signifikan.

Penggunaan

Uji ini sering digunakan ketika data ordinal atau data interval yang tidak memenuhi asumsi normalitas. Misalnya, membandingkan produktivitas padi antara dua jenis dataran yang berbeda.

Contoh Soal

Menteri Pertanian mengambil 24 sampel padi di dataran rendah & 24 padi di dataran tinggi. Menteri tersebut mengatakan bahwa produktivitas padi di dataran rendah lebih besar dibandingkan dengan dataran tinggi. Ujilah dengan uji Mann-Whitney pernyataan menteri tersebut pada taraf nyata 5%!

# Soal 1
# Data Produktivitas Padi
rendah <- c(1200, 1350, 1115, 1400, 1000, 990, 1000, 970, 1200, 1100, 1500, 1450, 1350, 1200, 950, 1100, 1000, 1500, 1350, 980, 1400, 1200, 1000, 1000)
tinggi <- c(1100, 980, 995, 1200, 900, 1000, 980, 1100, 1115, 990, 1000, 1100, 1200, 1000, 980, 970, 990, 1200, 1000, 1100, 1000, 1100, 980, 970)

# Uji Mann-Whitney
wilcox.test(rendah, tinggi, alternative = "greater")
## 
##  Wilcoxon rank sum test with continuity correction
## 
## data:  rendah and tinggi
## W = 416, p-value = 0.004006
## alternative hypothesis: true location shift is greater than 0

Karena P-value < alpha maka Cukup bukti untuk menyatakan bahwa produktivitas padi di dataran rendah lebih besar dibandingkan dengan dataran tinggi pada taraf nyata 5%.

Korelasi Spearman (Spearman’s Rank Correlation)

Tujuan

Korelasi Spearman digunakan untuk mengukur hubungan monotonic antara dua variabel ordinal atau interval/rasio yang tidak harus linier. Ini adalah alternatif nonparametrik dari korelasi Pearson yang tidak memerlukan asumsi linieritas atau normalitas.

Prinsip Kerja

Nilai dari kedua variabel diberi peringkat, dan korelasi antara peringkat ini dihitung. Korelasi Spearman mengukur kekuatan dan arah hubungan monotonic antara kedua variabel.

Penggunaan

Uji ini digunakan ketika kita ingin mengetahui apakah ada hubungan antara dua variabel yang tidak harus linier. Misalnya, mengukur hubungan antara kehadiran dalam kuliah dan nilai ujian akhir.

Contoh Soal

Berikut ini adalah data jumlah kehadiran dalam kuliah dan nilai ujian akhir. Hitung korelasi peringkat Spearman antara jumlah kehadiran dalam kuliah dan nilai ujian akhir. Uji apakah kedua peubah tersebut saling bebas?

# Soal 1
# Data Kehadiran dan Nilai Ujian
kehadiran <- c(13, 12, 15, 15, 10, 13, 15, 13, 16, 16)
nilai_ujian <- c(53, 42, 70, 69, 32, 76, 73, 45, 58, 45)

# Korelasi Spearman
cor.test(kehadiran, nilai_ujian, method = "spearman")
## 
##  Spearman's rank correlation rho
## 
## data:  kehadiran and nilai_ujian
## S = 93.306, p-value = 0.2095
## alternative hypothesis: true rho is not equal to 0
## sample estimates:
##       rho 
## 0.4345108

Karena P-value > alpha maka Tidak cukup bukti untuk menyatakan bahwa ada hubungan antara jumlah kehadiran kuliah dan nilai ujian akhir pada taraf nyata 5%.

Uji Tanda Data Berpasangan (Paired Sign Test)

Tujuan

Uji tanda untuk data berpasangan digunakan untuk menguji apakah median dari perbedaan antara dua pengukuran berpasangan (sebelum dan sesudah) berbeda dari nol. Ini adalah uji nonparametrik sederhana yang hanya memperhatikan arah (tanda) perbedaan, bukan besar perbedaannya.

Prinsip Kerja

Setiap pasangan nilai dibandingkan, dan tanda perbedaannya (+ atau -) dicatat. Jumlah tanda positif dibandingkan dengan jumlah tanda negatif untuk menentukan apakah terdapat perbedaan signifikan antara dua kondisi.

Penggunaan

Uji ini digunakan ketika datanya berpasangan dan tidak memenuhi asumsi normalitas, atau ketika hanya tertarik pada arah perubahan. Misalnya, menguji apakah pengaturan suhu ruangan mampu menurunkan suhu badan pada penderita demam.

Contoh Soal

Uji coba pengaturan suhu ruangan rumah sakit diharapkan dapat menurunkan suhu badan bagi penderita demam. Sebelum pengaturan suhu ruangan dilakukan pengukuran suhu badan awal dan setelah pengaturan suhu ruangan dilakukan pengukuran suhu badan akhir, didapatkan data berikut. Selidikilah dengan α = 5%, apakah model pengaturan suhu ruangan mampu menurunkan suhu badan bagi penderita demam?

#Soal 1
# Data Suhu Badan Sebelum dan Sesudah
awal <- c(39, 38.5, 38.5, 37, 37, 38, 37, 38.5, 38, 38, 37, 38, 39, 37.5)
akhir <- c(38, 38.5, 37, 39, 37, 38, 38, 38, 37.5, 37, 37, 38.5, 38, 37.5)
data <- awal-akhir

# Hitung tanda (+ atau -) untuk tiap data
sign_test <- sign(data-0)

# Uji tanda
library(BSDA)
result <- SIGN.test(data, md = 0, alternative = "greater")
print(result)
## 
##  One-sample Sign-Test
## 
## data:  data
## s = 6, p-value = 0.2539
## alternative hypothesis: true median is greater than 0
## 95 percent confidence interval:
##    0 Inf
## sample estimates:
## median of x 
##           0 
## 
## Achieved and Interpolated Confidence Intervals: 
## 
##                   Conf.Level L.E.pt U.E.pt
## Lower Achieved CI     0.9102      0    Inf
## Interpolated CI       0.9500      0    Inf
## Upper Achieved CI     0.9713      0    Inf

Karena P-value > alpha maka Tidak Cukup bukti untuk menyatakan bahwa model pengaturan suhu ruangan mampu menurunkan suhu badan bagi penderita demam pada taraf nyata 5%.

Uji Wilcoxon Data Berpasangan (Wilcoxon Signed-Rank Test)

Tujuan

Uji nonparametrik yang digunakan untuk membandingkan dua sampel berpasangan. Uji ini menguji apakah distribusi perbedaan antara dua pengukuran berpasangan secara signifikan berbeda dari nol. Ini adalah alternatif nonparametrik dari uji t berpasangan ketika asumsi normalitas tidak terpenuhi.

Prinsip Kerja

Perbedaan antara dua pengukuran dihitung, dan nilai-nilai ini diberi peringkat berdasarkan besarnya perbedaan (tanpa memperhatikan tanda). Peringkat ini kemudian dijumlahkan secara terpisah untuk nilai positif dan negatif, dan perbedaan jumlah ini diuji untuk menentukan signifikansi.

Penggunaan

Uji ini sering digunakan ketika ada dua pengukuran yang berpasangan, misalnya sebelum dan sesudah intervensi, dan kita ingin mengetahui apakah terdapat perubahan signifikan. Misalnya, menguji apakah Indeks Pembangunan Manusia (IPM) kota/kabupaten meningkat setelah masa pemerintahan tertentu.

Contoh Soal

BPS provinsi Jawa Barat telah mengukur IPM pada 10 kota/kabupaten di provinsi Jawa Barat. BPS menyatakan bahwa IPM kota/kabupaten di provinsi Jawa Barat lebih tinggi setelah masa pemerintahan Gubernur X. Ujilah pernyataan tersebut pada taraf nyata 5%.

# Data IPM Sebelum dan Sesudah
sebelum <- c(68.84, 71.16, 68.08, 71.87, 69.99, 72.20, 70.44, 67.52, 66.61, 68.84)
sesudah <- c(77.41, 76.68, 77.39, 76.10, 69.73, 68.88, 67.10, 72.62, 69.46, 70.86)

# Uji Wilcoxon
wilcox.test(sebelum, sesudah, paired = TRUE, alternative = "greater")
## 
##  Wilcoxon signed rank exact test
## 
## data:  sebelum and sesudah
## V = 10, p-value = 0.9678
## alternative hypothesis: true location shift is greater than 0

Karena P-value > alpha maka Tidak Cukup bukti untuk menyatakan bahwa IPM kota/kabupaten di provinsi Jawa Barat lebih tinggi setelah masa pemerintahan Gubernur X pada taraf nyata 5%.

Latihan Soal

Soal 1:

Seorang peneliti membandingkan kadar kolesterol antara dua kelompok: satu kelompok yang mengikuti diet rendah lemak dan satu kelompok yang tidak. Peneliti mengumpulkan 30 sampel kadar kolesterol dari masing-masing kelompok. Peneliti ingin mengetahui apakah kadar kolesterol pada kelompok yang mengikuti diet rendah lemak lebih rendah dibandingkan dengan kelompok yang tidak mengikuti diet tersebut. Ujilah pernyataan peneliti tersebut menggunakan uji Mann-Whitney pada taraf nyata 5%! Dengan Data Kadar Kolesterol :

  • diet rendah : 190, 180, 185, 175, 200, 195, 185, 180, 170, 175, 180, 190, 185, 175, 170, 190, 200, 185, 190, 175, 180, 185, 200, 195, 180, 175, 190, 195, 185, 180

  • tidak diet : 210, 220, 215, 230, 225, 220, 210, 225, 220, 230, 240, 220, 225, 230, 220, 225, 230, 220, 210, 225, 220, 230, 215, 225, 230, 220, 210, 230, 225, 220

Soal 2:

Sebuah studi membandingkan tingkat kepuasan pelanggan antara dua jenis layanan: layanan A dan layanan B. Peneliti mengumpulkan 20 sampel tingkat kepuasan dari masing-masing layanan. Peneliti ingin mengetahui apakah tingkat kepuasan pelanggan untuk layanan A lebih tinggi dibandingkan dengan layanan B. Ujilah pernyataan peneliti tersebut menggunakan uji Mann-Whitney pada taraf nyata 5%! Dengan Data Tingkat Kepuasan :

  • layanan A : 85, 90, 88, 87, 92, 91, 85, 89, 90, 92, 87, 90, 85, 92, 89, 90, 88, 91, 92, 85

  • layanan B : 80, 75, 77, 78, 72, 76, 75, 80, 74, 76, 77, 75, 80, 78, 75, 72, 76, 77, 78, 74

Soal 3:

Seorang peneliti ingin mengetahui apakah rata-rata waktu respons aplikasi berbeda antara dua platform: platform X dan platform Y. Peneliti mengumpulkan 15 sampel waktu respons dari masing-masing platform. Ujilah apakah waktu respons pada platform X lebih cepat dibandingkan dengan platform Y menggunakan uji Mann-Whitney pada taraf nyata 5%! Dengan Data Waktu Respons :

  • platform X : 0.95, 1.05, 1.00, 0.90, 1.10, 0.85, 1.00, 0.95, 1.05, 1.00, 0.90, 1.10, 1.00, 0.95, 1.05

  • platform Y : 1.20, 1.25, 1.30, 1.15, 1.35, 1.20, 1.30, 1.25, 1.35, 1.30, 1.15, 1.20, 1.25, 1.30, 1.20

Soal 4:

Berikut ini adalah data jumlah buku yang dibaca dalam sebulan dan skor kepuasan dari survei. Hitung korelasi peringkat Spearman antara jumlah buku yang dibaca dan skor kepuasan. Uji apakah kedua peubah tersebut saling bebas? Dengan Data Jumlah Buku dan Skor Kepuasan :

  • jumlah buku : 3, 5, 2, 4, 6, 3, 7, 4, 5, 6

  • skor kepuasan : 7, 9, 5, 6, 10, 7, 8, 6, 9, 8

Soal 5:

Berikut ini adalah data frekuensi penggunaan aplikasi sosial media per hari dan tingkat stres yang diukur. Hitung korelasi peringkat Spearman antara frekuensi penggunaan aplikasi sosial media dan tingkat stres. Uji apakah kedua peubah tersebut saling bebas? Dengan Data Frekuensi Penggunaan dan Tingkat Stres :

  • frekuensi penggunaan : 2, 4, 5, 3, 6, 2, 7, 5, 4, 6

  • tingkat stres : 4, 6, 7, 5, 8, 4, 9, 7, 6, 8

Soal 6:

Berikut ini adalah data jumlah proyek yang dikerjakan dan jumlah jam tidur per malam. Hitung korelasi peringkat Spearman antara jumlah proyek dan jumlah jam tidur. Uji apakah kedua peubah tersebut saling bebas? Dengan Data Jumlah Proyek dan Jam Tidur :

  • jumlah proyek : 2, 3, 4, 2, 5, 3, 6, 4, 5, 3

  • jam tidur : 7, 6, 5, 8, 4, 7, 3, 5, 6, 7

Soal 7:

Uji coba pemberian suplemen vitamin C diharapkan dapat meningkatkan kadar vitamin C dalam darah. Sebelum pemberian suplemen, dilakukan pengukuran kadar vitamin C dalam darah, dan setelah pemberian suplemen dilakukan pengukuran kadar vitamin C darah. Selidikilah dengan α = 5%, apakah pemberian suplemen vitamin C mampu meningkatkan kadar vitamin C dalam darah? Dengan Data Kadar Vitamin C Sebelum dan Sesudah :

  • sebelum : 50, 55, 53, 52, 56, 54, 55, 52, 53, 57, 54, 55, 56, 53

  • sesudah : 60, 62, 61, 65, 64, 63, 62, 64, 63, 66, 65, 62, 63, 64

Soal 8:

Uji coba metode baru dalam pelatihan fisik diharapkan dapat meningkatkan kemampuan aerobik. Sebelum pelatihan, dilakukan pengukuran kemampuan aerobik, dan setelah pelatihan dilakukan pengukuran kemampuan aerobik kembali. Selidikilah dengan α = 5%, apakah metode pelatihan baru mampu meningkatkan kemampuan aerobik? Dengan Data Kemampuan Aerobik Sebelum dan Sesudah :

  • sebelum : 30, 32, 31, 29, 33, 30, 31, 29, 32, 30, 33, 31, 32, 29

  • sesudah : 35, 37, 36, 34, 38, 35, 36, 34, 37, 35, 38, 36, 37, 34

Soal 9:

Penelitian dilakukan untuk mengevaluasi efektivitas obat baru dalam mengurangi tekanan darah tinggi. Sebelum pengobatan, dilakukan pengukuran tekanan darah, dan setelah pengobatan dilakukan pengukuran tekanan darah kembali. Selidikilah dengan α = 5%, apakah obat baru tersebut mampu menurunkan tekanan darah? Dengan Data Tekanan Darah Sebelum dan Sesudah :

  • sebelum : 150, 145, 148, 152, 149, 147, 146, 150, 148, 151, 149, 146, 152, 148
  • sesudah : 140, 135, 138, 142, 139, 137, 136, 140, 138, 141, 139, 136, 142, 138

Soal 10:

Sebuah penelitian dilakukan untuk mengevaluasi apakah program pelatihan bahasa Inggris dapat meningkatkan skor tes bahasa Inggris. Sebelum mengikuti program, dilakukan tes awal, dan setelah mengikuti program dilakukan tes akhir. Selidikilah dengan α = 5%, apakah program pelatihan bahasa Inggris mampu meningkatkan skor tes bahasa Inggris? Dengan Data Skor Tes Bahasa Inggris Sebelum dan Sesudah :

  • sebelum : 70, 72, 68, 74, 71, 73, 69, 72, 70, 75, 72, 71, 74, 69

  • sesudah : 80, 82, 78, 84, 81, 83, 79, 82, 80, 85, 82, 81, 84, 79