Statistika adalah cabang matematika yang berkaitan dengan metode pengumpulan, pengorganisasian, analisis, interpretasi, dan penyajian data. Tujuan utamanya adalah mengubah pengamatan mentah menjadi informasi yg andal untuk penalaran dan pengambilan keputusan.
Permasalahan statistik utama dalam dataset ini adalah menganalisis tingkat kepuasan pasien rumah sakit serta faktor-faktor yang memengaruhinya. Dataset berisi informasi demografis pasien (usia dan gender), karakteristik layanan rumah sakit (jenis rumah sakit, jenis asuransi, waktu tunggu, dan waktu pelayanan), serta skor kepuasan pasien.
Jenis Statistik yang digunakan pada kasus ini adalah statistik deskriptif. Alasannya, analisis yang dilakukan hanya bertujuan untuk menggambarkan kondisi data kepuasan pasien rumah sakit apa adanya, seperti melihat rata-rata skor kepuasan, sebaran usia pasien, waktu tunggu, dan waktu pelayanan. Tidak terdapat pengujian hipotesis, penentuan tingkat signifikansi, maupun penarikan kesimpulan untuk mewakili populasi yang lebih luas.
Berdasarkan dataset kepuasan pasien rumah sakit (n = 10.000), terdapat beberapa variabel numerik utama yang dianalisis, yaitu Age, Waiting_Time, Service_Time, dan Satisfaction_Score.
Usia pasien memiliki rata-rata sekitar 43 tahun, dengan rentang 18–69 tahun, menunjukkan mayoritas pasien berada pada usia dewasa dan produktif. Waiting_Time memiliki rata-rata sekitar 60 menit dengan variasi yang cukup besar, menandakan perbedaan waktu tunggu antar pasien masih signifikan. Service_Time memiliki rata-rata sekitar 25 menit dengan sebaran yang relatif stabil, menunjukkan durasi pelayanan cukup konsisten. Sementara itu, Satisfaction_Score memiliki rata-rata 7, yang mengindikasikan tingkat kepuasan pasien secara umum tergolong baik.
Eksplorasi awal data menunjukkan bahwa skor kepuasan pasien cenderung berada pada tingkat menengah hingga tinggi, yang menandakan kualitas pelayanan rumah sakit secara umum sudah cukup baik. Variasi waktu tunggu pasien terlihat cukup besar, sehingga berpotensi memengaruhi tingkat kepuasan, khususnya ketika waktu tunggu semakin lama. Selain itu, terdapat beberapa nilai ekstrem pada waktu tunggu yang melebihi batas normal serta skor kepuasan yang sangat rendah, yang dapat dikategorikan sebagai anomali dan menunjukkan adanya kasus pelayanan yang kurang optimal.
Basic Visualizations
1. Histogram Waiting Time
1. Histogram Waiting Time
Alasan Pemilihan Visualisasi
Histogram Waiting Time dipilih untuk melihat bentuk distribusi waktu tunggu pasien secara keseluruhan. Visualisasi ini membantu mengidentifikasi apakah data cenderung berdistribusi normal, miring ke kanan atau kiri, serta untuk mengetahui frekuensi waktu tunggu yang paling sering terjadi. Dengan histogram, pola penyebaran dan konsentrasi data dapat diamati secara jelas sehingga memudahkan analisis awal terhadap karakteristik waktu tunggu pasien.
2. BOXPLOT – Service Time
Alasan Pemilihan Visualisasi
Boxplot Service Time digunakan untuk menampilkan ringkasan statistik secara visual, seperti median, kuartil, dan potensi outlier. Visualisasi ini sangat efektif untuk melihat tingkat variasi waktu pelayanan dan mendeteksi adanya nilai ekstrem yang dapat memengaruhi rata-rata. Boxplot membantu memahami seberapa konsisten durasi pelayanan yang diberikan kepada pasien serta perbedaan antar nilai dalam dataset.
A. Waiting Time
1. Mean (Rata-rata)
\(\bar{x} = \dfrac{\sum \text{Waiting Time}}{n} = \dfrac{598{,}300}{10{,}000} = 59.83\)
2. Median (Nilai Tengah)
Karena jumlah data genap, median dihitung dari dua nilai tengah:
\(\text{Median} = \dfrac{x_{(5000)} + x_{(5001)}}{2} = \dfrac{60 + 60}{2} = 60\)
3. Modus (Nilai Paling Sering Muncul)
Modus=58
B. Satisfaction Score
1. Mean
Rumus: \(\bar{x} = \dfrac{\sum x_i}{n}\)
Substitusi: \(\bar{x} = \dfrac{70{,}000}{10{,}000}\)
Hasil: \(\bar{x} = 7.00\)
2. Median
Rumus: \(\text{Median} = \dfrac{x_{(5000)} + x_{(5001)}}{2}\)
Dari data: \(x_{(5000)} = 7.0,; x_{(5001)} = 7.0\)
Hasil: \(\text{Median} = 7.0\)
3. Modus
Rumus:
Modus = nilai dengan frekuensi tertinggi
Dari data:
Modus = 7.1
Perbandingan dan Interpretasi
Nilai mean, median, dan modus pada variabel Waiting Time yang relatif berdekatan menunjukkan bahwa distribusi data cenderung simetris, sehingga nilai rata-rata dapat merepresentasikan kondisi umum waktu tunggu pasien dengan cukup baik. Hal ini mengindikasikan bahwa sebagian besar pasien mengalami waktu tunggu yang berada di sekitar nilai tengah, tanpa adanya pengaruh pencilan yang ekstrem.
Pada variabel Satisfaction Score, ukuran pemusatan juga terkonsentrasi di sekitar nilai 7, yang menunjukkan bahwa tingkat kepuasan pasien relatif stabil dan konsisten. Kesamaan antara nilai mean dan median mengindikasikan bahwa penilaian kepuasan tidak condong ke arah nilai yang terlalu tinggi maupun terlalu rendah.
Jika dibandingkan, Satisfaction Score memiliki pemusatan yang lebih konsisten dibandingkan Waiting Time, yang menunjukkan bahwa meskipun waktu tunggu pasien bervariasi, penilaian kepuasan pasien tetap terjaga pada tingkat yang relatif seragam.
Statistical Dispersion
A. Variabel Waiting Time
Range: \(\text{Range} = x_{\text{maks}} - x_{\text{min}} = 118 - 2 = 116\)
Varians: \(s^2 = 224{,}69\)
Standar Deviasi: \(s = \sqrt{224{,}69} \approx 14{,}99\)
B. Variabel Satisfaction Score
Range: \(\text{Range} = x_{\text{maks}} - x_{\text{min}} = 9{,}5 - 3{,}1 = 6{,}4\)
Varians: \(s^2 = 0{,}99\)
Standar Deviasi: \(s = \sqrt{0{,}99} \approx 0{,}99\)
Interpretasi Tingkat Penyebaran
Nilai range dan standar deviasi yang cukup besar menunjukkan bahwa waktu tunggu pasien memiliki tingkat penyebaran yang tinggi. Hal ini menandakan adanya perbedaan yang cukup signifikan dalam durasi pelayanan yang diterima oleh masing-masing pasien.
Kondisi tersebut menunjukkan bahwa tidak semua pasien mengalami waktu tunggu yang mendekati nilai rata-rata, melainkan terdapat pasien yang menunggu jauh lebih lama maupun lebih singkat. Dengan demikian, hasil ini mengindikasikan bahwa proses pelayanan masih belum sepenuhnya merata dan memiliki potensi untuk ditingkatkan agar waktu tunggu pasien menjadi lebih konsisten.
Essentials of Probability
Probabilitas merupakan ukuran kemungkinan terjadinya suatu peristiwa, dengan nilai berada pada rentang 0 hingga 1. Nilai probabilitas mendekati 0 menunjukkan peristiwa jarang terjadi, sedangkan nilai mendekati 1 menunjukkan peristiwa yang hampir pasti terjadi. Probabilitas empiris dihitung berdasarkan data observasi.
Event yang dipilih: Pasien merasa puas (Satisfied='Yes')
Jumlah pasien puas = 59 Total pasien = 100 P(Puas) = 0.59
Peluang pasien merasa puas = 59%
Probability Distributions
Penjelasan Distribusi
Histogram menunjukkan
distribusi usia pasien “,”berdasarkan data observasi”
Sebagian besar pasien berada pada rentang usia tertentu, “,”menunjukkan adanya konsentrasi nilai dominan.
Bentuk distribusi dapat dianalisis apakah cenderung simetris “,”atau memiliki kemiringan (skewness), “,”yang menjadi dasar analisis distribusi peluang.
Jumlah sampel (n) = total pasien
Proporsi pasien puas (p̂) = jumlah pasien puas / total pasien
Tingkat kepercayaan = 95%
Nilai Z₀.₀₂₅ = 1.96
$$CI = \hat{p} \pm Z_{\alpha/2} \sqrt{\frac{\hat{p}(1-\hat{p})}{n}}$$
$$CI = \hat{p} \pm 1.96 \sqrt{\frac{\hat{p}(1-\hat{p})}{n}}$$
$$\hat{p} - ME \le p \le \hat{p} + ME$$
Interval kepercayaan 95% menunjukkan bahwa dengan tingkat keyakinan 95%, proporsi sebenarnya dari pasien yang merasa puas terhadap layanan rumah sakit berada dalam rentang interval yang diperoleh.
Hal ini berarti bahwa nilai proporsi kepuasan pada populasi tidak harus sama persis dengan hasil sampel, tetapi masih berada di dalam batas interval kepercayaan tersebut.
Misalkan p adalah proporsi sebenarnya pasien yang merasa puas.
$$H_0 : p = 0.5$$
(proporsi pasien puas sama dengan 50%)
$$H_1 : p > 0.5$$
(proporsi pasien puas lebih dari 50%)
Tingkat signifikansi: α = 0.05
$$Z = \frac{\hat{p} - p_0} {\sqrt{\frac{p_0(1-p_0)}{n}}}$$
Dengan p̂ = proporsi pasien puas dari data, p₀ = 0.5, dan n = jumlah sampel.
$$\text{Tolak } H_0 \text{ jika } Z > 1.645$$
Berdasarkan hasil perhitungan, diperoleh nilai Z = 3.04 , yang melebihi nilai kritis 1.645.
Dengan tingkat signifikansi 5%, dapat disimpulkan bahwa terdapat bukti yang cukup untuk menyatakan bahwa proporsi pasien yang merasa puas terhadap layanan rumah sakit lebih dari 50%.
Nonparametric Methods
Uji Chi-Square (Goodness of Fit)
$$H_0 : \text{Distribusi kepuasan sesuai dengan harapan}$$
$$H_1 : \text{Distribusi kepuasan tidak sesuai dengan harapan}$$
$$\chi^2 = \sum \frac{(O - E)^2}{E}$$
$$\chi^2 = 9.242$$
O = frekuensi yang diamati
E = frekuensi yang diharapkan
Uji Chi-Square digunakan karena data kepuasan pasien bersifat kategorik dan tidak memerlukan asumsi distribusi normal.
Nonparametric Methods
Interpretasi Komposisi Demografi Pasien:
1. Distribusi Sangat Merata: Dari total 10.000 pasien,
proporsi demografi terbagi sangat seimbang di antara keempat segmen.
Tidak ada kelompok yang mendominasi secara signifikan, dengan
masing-masing segmen berkontribusi sekitar 25%.
2. Segmen Terbesar: Kelompok Male - Public memiliki jumlah tertinggi, yaitu sebanyak 2.564 pasien (25,6%).
Keseimbangan Gender & Fasilitas:Pasien Laki-laki: Terbagi menjadi 25,6% di RS Publik dan 24,6% di RS Swasta.
Pasien Perempuan: Terbagi menjadi 25,0% di RS Publik dan 24,7% di RS Swasta.
Kesimpulan: Layanan kesehatan dalam dataset ini menjangkau audiens yang sangat heterogen dan berimbang, baik dari sisi gender maupun tipe rumah sakit yang digunakan. Hal ini menunjukkan bahwa pengambilan kebijakan atau evaluasi kepuasan pasien nantinya harus mempertimbangkan keempat segmen ini secara setara.
Interpretasi Kepuasan Pasien Berdasarkan Tipe Rumah
Sakit:
Dominasi Tipis: Tingkat
kepuasan di kedua rumah sakit sudah di atas 50%, namun perbandingannya
sangat ketat antara pasien puas (51%) dan tidak puas (49%).
Kualitas Setara: RS Publik (51,9%) sedikit lebih unggul dari RS Swasta (51,1%), menunjukkan bahwa status kepemilikan tidak menjamin perbedaan kualitas yang besar.
Sinyal Waspada: Tingginya angka ketidakpuasan (hampir separuh pasien) menandakan adanya masalah sistemik yang harus segera diperbaiki.
Rekomendasi Utama: Fokus pada efisiensi layanan, terutama memangkas Waiting Time, untuk menggeser angka ketidakpuasan ke arah positif.
Interpretasi Kepuasan Berdasarkan Usia:
Stabilitas Skor: Secara keseluruhan, rata-rata skor
kepuasan pasien di berbagai kelompok usia cenderung stabil di angka 7,0.
Tidak terlihat adanya lonjakan atau penurunan drastis yang dipengaruhi
secara langsung oleh faktor usia.
Fluktuasi Kecil: Terdapat sedikit variasi skor antara 6,8 hingga 7,2. Hal ini menunjukkan bahwa pengalaman pasien saat menerima layanan kesehatan cukup konsisten, baik untuk pasien muda (usia 18+) maupun pasien lanjut usia (hingga 69 tahun).
Kemandirian Faktor Usia: Korelasi yang sangat lemah (mendekati nol) antara usia dan skor kepuasan menunjukkan bahwa persepsi pasien terhadap kualitas layanan tidak bergantung pada seberapa tua atau mudanya mereka.
Kesimpulan: Karena skor kepuasan merata di semua umur, manajemen tidak perlu melakukan segmentasi layanan khusus berdasarkan kelompok usia tertentu. Fokus perbaikan sebaiknya diarahkan pada aspek operasional umum yang dirasakan oleh seluruh pasien secara kolektif.
Interpretasi Eksekutif: Sentralitas Kepuasan
Pasien:
Pusat Skor Tunggal (7.00):
Nilai Mean, Median, dan Mode berkumpul tepat di angka 7,00. Hal ini
menunjukkan bahwa angka 7 adalah titik gravitasi utama dari seluruh
pengalaman pasien.
Stabilitas & Simetri: Karena ketiga nilai tersebut identik, distribusi data bersifat simetri sempurna (Normal). Tidak ada kelompok pasien yang merasa sangat kecewa atau sangat puas secara ekstrem yang mampu menggeser rata-rata.
Kepuasan “Ambang Batas”: Mayoritas pasien berada pada zona aman (skor 7). Meskipun sudah di atas rata-rata minimal, ini menandakan layanan rumah sakit baru mencapai level standar yang baik, namun belum masuk ke level pelayanan prima (skor 8-10).
Aksi Nyata: Fokus strategi harus diarahkan pada aspek yang mampu memberikan efek “wow” (seperti efisiensi waktu atau keramahan ekstra) untuk mendorong mayoritas pasien keluar dari skor 7 menuju skor yang lebih tinggi.
Interpretasi Kepuasan Berdasarkan Usia:
Performa Stabil: Skor rata-rata dan median berada di
angka 7,0, menunjukkan kualitas layanan yang sudah baik dan konsisten
secara umum.
Kualitas Merata: Mayoritas pasien memberikan nilai di rentang 6,3 – 7,7, menandakan tidak adanya kesenjangan layanan yang mencolok antar pasien.
Prioritas Khusus: Ditemukan sejumlah kasus ekstrem (outliers) dengan skor di bawah 4,2. Kelompok ini harus menjadi fokus utama investigasi untuk meminimalkan pengalaman buruk pasien.
Strategi: Fokus manajemen adalah meningkatkan standar kepuasan minimum dengan mengatasi penyebab munculnya skor rendah, bukan sekadar mempertahankan skor rata-rata yang sudah ada.
Interpretasi Distribusi Waktu Tunggu Pasien:
Titik Tengah Operasional (Mean): Rata-rata waktu tunggu
pasien berada di angka 59,8 menit (sekitar 1 jam). Garis putus-putus
pada grafik menunjukkan pusat antrean di mana sebagian besar volume
pasien berkumpul.
Karakteristik Antrean: Grafik menunjukkan distribusi yang stabil dengan standar deviasi sebesar 14,9 menit. Mayoritas pasien menunggu dalam rentang 45 hingga 75 menit. Hal ini mengindikasikan bahwa sistem antrean cukup dapat diprediksi.
Identifikasi Bottleneck: Area histogram di sisi kanan (melewati 90 menit) menunjukkan adanya pasien dengan waktu tunggu ekstrem hingga 121 menit. Titik-titik ini adalah indikasi adanya hambatan operasional (bottleneck) pada jam-jam sibuk yang perlu dievaluasi.
Kesimpulan Strategis:Sistem sudah berjalan stabil (mengikuti kurva normal), namun target efisiensi perlu ditingkatkan. Rekomendasi: Manajemen perlu menetapkan standar baru untuk menggeser kurva ke arah kiri guna meningkatkan kepuasan pasien secara signifikan.
Dalam industri pelayanan kesehatan, angka rata-rata (seperti rata-rata waktu tunggu) sering kali menipu jika tidak disertai dengan indikator ketidakpastian. Manajemen sering membuat keputusan yang salah karena hanya melihat satu angka tunggal (point estimate). Confidence Interval (CI) atau Interval Kepercayaan hadir sebagai solusi untuk memberikan rentang nilai yang lebih realistis. Dengan CI, kita tidak hanya mengatakan “Rata-rata kepuasan adalah 7.5”, melainkan “Kami yakin 95% bahwa rata-rata kepuasan seluruh populasi pasien berada di rentang 7.3 hingga 7.7”.
- Validasi Data: Memastikan hasil dari 10.000 sampel data dapat digeneralisasi ke seluruh populasi pasien di masa depan.
- Akurasi Keputusan: Membantu manajemen menetapkan target KPI yang realistis berdasarkan batas bawah dan batas atas statistik.
- Mitigasi Risiko: Mengetahui sejauh mana variasi layanan memengaruhi loyalitas pasien.
Dari 10.000 data, katakanlah terdapat 6.200 pasien yang menjawab “Yes” pada kolom Satisfied. Kita ingin tahu berapa proporsi sebenarnya di populasi dengan tingkat kepercayaan 99% (karena ini menyangkut reputasi RS).
\[\text{CI} = \hat{p} \pm z \cdot \sqrt{\frac{\hat{p}(1-\hat{p})}{n}}\] - \(\hat{p} = 0,62\) (proporsi sampel) -\(n = 10.000\) - \(z = 2,576\) (untuk level 99%)
Kita yakin 99% bahwa proporsi pasien yang puas di seluruh populasi berada di antara 60,7% hingga 63,2%. Jika target KPI manajemen adalah 65%, maka meskipun di sampel terlihat bagus, secara statistik kita belum mencapai target tersebut.
\[\text{Satisfaction Score} = \beta_0 + \beta_1(\text{Waiting Time})\] Hasil analisis memberikan nilai koefisien \(\beta_1\) (kemiringan) sebesar -0,05. Artinya, setiap kenaikan 1 menit waktu tunggu, skor kepuasan turun 0,05 poin.
Bukan hanya angka tunggal (-0,05), statistik akan memberikan rentang untuk koefisien ini, misalnya: [-0,07 hingga -0,03].
Berdasarkan data 10.000 pasien dengan 6.200 pasien puas:Langkah 1: Identifikasi KomponenProporsi Sampel (\(\hat{p}\)): \(6.200 / 10.000 = 0,62\)Ukuran Sampel (\(n\)): \(10.000\)Z-Score (\(z\)) untuk 99%: \(2,576\)Langkah 2: Hitung Standard Error (SE)\[SE = \sqrt{\frac{0,62 \times (1 - 0,62)}{10.000}} = \sqrt{\frac{0,2356}{10.000}} = 0,00485\]Langkah 3: Hitung Margin of Error (ME)\[ME = 2,576 \times 0,00485 = 0,0125 \text{ (1,25\%)}\]Hasil Akhir:\[\text{CI} = 0,62 \pm 0,0125 = [0,6075 \text{ hingga } 0,6325]\]Interpretasi: Kita yakin 99% bahwa kepuasan populasi berada di antara 60,8% dan 63,3%.
Mengukur presisi pengaruh Waiting Time terhadap Satisfaction Score:
Inferensi statistik adalah metode ilmiah untuk menarik kesimpulan tentang seluruh pasien rumah sakit (populasi) hanya dengan menggunakan 10.000 data yang kita miliki (sampel). Karena mengukur setiap pasien secara nyata tidak mungkin dilakukan, inferensi memberikan “kepastian matematis” bahwa pola yang kita temukan—seperti tingkat kepuasan—bukanlah sebuah kebetulan, melainkan cerminan nyata dari kualitas layanan di lapangan.
Analisis ini bekerja dengan dua instrumen utama: Confidence Interval untuk menentukan rentang nilai yang akurat (misalnya, estimasi rata-rata skor kepuasan), dan Uji Hipotesis (P-Value) untuk membuktikan kebenaran sebuah asumsi (misalnya, apakah waktu tunggu benar-benar merusak kepuasan pasien). Dengan dua parameter ini, manajemen dapat mengambil kebijakan berbasis bukti (evidence-based) yang minim risiko dan memiliki tingkat presisi tinggi.
Apakah terdapat perbedaan signifikan pada rata-rata Waiting_Time antara pasien Public dan Private?
Alat: Independent Two-Sample T-Test, karena membandingkan dua kelompok yang saling bebas (pasien tidak tumpang tindih).Asumsi: Mengandalkan Central Limit Theorem (sampel besar \(n=10.000\)) untuk menjamin distribusi normalitas, serta mengasumsikan kesamaan varians agar hasil perbandingan skor lebih akurat.
Analisis P-Value: Dengan hasil \(P\text{-}Value = 0,0002\), probabilitas perbedaan ini terjadi karena kebetulan sangat kecil (0,02%).Keputusan: Tolak \(H_0\) karena \(P\text{-}Value < 0,05\).Simpulan: Perbedaan layanan adalah nyata secara statistik. Manajemen harus segera melakukan perbaikan sistemik pada unit yang lebih lambat karena variasi ini bukan faktor acak, melainkan masalah operasional.
Apakah Status Kepuasan (Satisfied: Yes/No) bergantung pada Tipe Asuransi (Insurance_Type: BPJS/Private)?
Alat: Chi-Square Test of Independence, karena membandingkan dua variabel kategorikal.Prosedur: Mengukur seberapa besar penyimpangan antara jumlah pasien puas yang nyata di lapangan dengan jumlah yang diharapkan secara teoritis jika tidak ada hubungan antar variabel.
Keputusan: Jika \(P\text{-}Value < 0,05\), tolak \(H_0\) dan simpulkan bahwa jenis asuransi memengaruhi kepuasan.Risiko Error: Menolak \(H_0\) saat tidak ada hubungan asli disebut Type I Error (False Positive), yang berisiko memicu perbaikan kebijakan asuransi yang sia-sia. Namun, sampel \(n=10.000\) meminimalkan risiko ini dengan meningkatkan akurasi hasil.
Uji perbedaan rata-rata Waiting_Time antara RS Public dan RS Private.Data Simulasi:
Uji independensi antara Tipe Asuransi dan Status Kepuasan.Data Tabel Kontingensi (Observasi/Nyata):| Asuransi | Puas (Yes) | Tidak Puas (No) | Total || :— | :—: | :—: | :—: || BPJS | 3.200 | 1.800 | 5.000 || Swasta | 3.400 | 1.600 | 5.000 || Total | 6.600 | 3.400 | 10.000 | - Langkah Perhitungan:Hitung Frekuensi Harapan (\(E\)):Rumus: \(E = \frac{(\text{Total Baris} \times \text{Total Kolom})}{\text{Grand Total}}\)\(E\) (BPJS-Puas) = \((5000 \times 6600) / 10000 = 3.300\)
Hitung Statistik Chi-Square (\(\chi^2\)):\[\chi^2 = \sum \frac{(O - E)^2}{E}\]Sektor BPJS-Puas: \((3200 - 3300)^2 / 3300 = 3,03\)Sektor Swasta-Puas: \((3400 - 3300)^2 / 3300 = 3,03\)(Lakukan untuk semua sel, misal total \(\chi^2 \approx 12,12\))
Kesimpulan:Untuk \(df = 1\), nilai kritis \(\chi^2\) adalah 3,84. Karena \(12,12 > 3,84\), maka \(P\text{-}Value < 0,05\).
Berbeda dengan metode parametrik yang kaku terhadap asumsi distribusi normal, metode non-parametrik (Bab 10.1) bekerja tanpa memedulikan bentuk sebaran data. Dengan berfokus pada Peringkat (Rank) dan bukan nilai absolut, analisis ini menjadi sangat tangguh (robust) terhadap pencilan (outliers). Dalam konteks rumah sakit, hal ini krusial karena data waktu tunggu yang ekstrem (misal: satu pasien menunggu sangat lama karena kasus darurat) tidak akan menarik angka rata-rata secara bias, sehingga kesimpulan statistik tetap mencerminkan realitas mayoritas pasien.
Skala kepuasan (1-5) secara teknis adalah data ordinal yang lebih tepat dianalisis menggunakan perbandingan Median. Metode non-parametrik (seperti Mann-Whitney dan Kruskal-Wallis) memberikan jembatan keputusan yang lebih aman ketika asumsi normalitas diragukan (Bab 10.3). Hasilnya memberikan gambaran tentang pengalaman pasien “tipikal” atau menengah, yang seringkali jauh lebih relevan bagi manajemen dalam mengevaluasi prosedur harian dibandingkan angka rata-rata yang bisa memberikan estimasi yang salah pada data yang miring (skewed).
Apakah ada perbedaan signifikan pada Satisfaction_Score antara pasien Laki-laki dan Perempuan jika data skor tidak terdistribusi normal?
Langkah 1: Formulasi Hipotesis\(H_0\): Distribusi skor kepuasan kedua kelompok sama (tidak ada perbedaan median).\(H_1\): Distribusi skor kepuasan salah satu kelompok lebih tinggi/rendah (ada perbedaan median).
Menggunakan Mann-Whitney U Test (atau Wilcoxon Rank-Sum) karena metode ini tidak mengandalkan rata-rata, melainkan membandingkan peringkat (rank) dari skor kepuasan.
Jika \(P\text{-}Value < 0,05\), kita menyimpulkan bahwa salah satu gender secara signifikan memberikan peringkat kepuasan yang berbeda, terlepas dari bentuk distribusi datanya.
Apakah Waktu Tunggu (Waiting_Time) berbeda secara signifikan di antara tiga atau lebih kategori (misalnya: berbagai tipe asuransi)?
\(H_0\): Median waktu tunggu untuk semua kelompok asuransi adalah sama.\(H_1\): Setidaknya ada satu kelompok asuransi yang memiliki median waktu tunggu berbeda.
Menggunakan Kruskal-Wallis Test sebagai alternatif non-parametrik dari One-Way ANOVA. Metode ini sangat efektif jika data waktu tunggu memiliki banyak outliers (pasien yang menunggu sangat lama).
Jika hasil uji signifikan, berarti jenis asuransi memengaruhi “posisi” waktu tunggu pasien di rumah sakit secara keseluruhan.
Kasus: Perbandingan median Satisfaction Score antara Laki-laki (\(n_1=5000\)) dan Perempuan (\(n_2=5000\)).
Langkah Perhitungan:
Konversi ke Z-Score: Karena sampel besar (\(n > 20\)), kita mengonversi \(U\) ke distribusi normal (\(Z\)).Jika hasil \(Z\) hitung > 1,96 atau \(P\text{-}value < 0,05\), maka Median kepuasan kedua gender berbeda nyata.
Kasus: Perbandingan Waiting Time di antara 3 tipe Asuransi (BPJS, Mandiri, Swasta).Langkah Perhitungan:
\[H = \frac{12}{N(N+1)} \sum \frac{R_i^2}{n_i}3(N+1)\] Di mana \(N = 10.000\).
Keputusan: Nilai \(H\) dibandingkan dengan tabel Chi-Square (\(\chi^2\)) dengan \(df = k - 1\) (dalam kasus ini \(df = 3 - 1 = 2\)). Jika \(H\) hitung > \(\chi^2\) tabel, maka setidaknya ada satu asuransi dengan waktu tunggu yang berbeda secara signifikan.