Members

INSTITUT TEKNOLOGI SAINS BANDUNG
naifah edria arta
NIM: 52250056
Study Casus, Visualization
INSTITUT TEKNOLOGI SAINS BANDUNG
Frizzy Lithmensyah
NIM: 52250062
Data Preparation
INSTITUT TEKNOLOGI SAINS BANDUNG
Lulu Najla Salsabila
NIM: 52250069
Chapter Data
INSTITUT TEKNOLOGI SAINS BANDUNG
Naila Syahrani Putri
NIM: 52250070
Chapter Data
INSTITUT TEKNOLOGI SAINS BANDUNG
Ni. MD Aurora Sekarningrum
NIM: 52250072
Members Prepation, Chapter Data

Summary of Basic Statistics

## Column

Cahpter 1

1
Pendahuluan

Statistika adalah cabang matematika yang berkaitan dengan metode pengumpulan, pengorganisasian, analisis, interpretasi, dan penyajian data. Tujuan utamanya adalah mengubah pengamatan mentah menjadi informasi yg andal untuk penalaran dan pengambilan keputusan.

2
Permasalahan Statistik Utama dari Dataset

Permasalahan statistik utama dalam dataset ini adalah menganalisis tingkat kepuasan pasien rumah sakit serta faktor-faktor yang memengaruhinya. Dataset berisi informasi demografis pasien (usia dan gender), karakteristik layanan rumah sakit (jenis rumah sakit, jenis asuransi, waktu tunggu, dan waktu pelayanan), serta skor kepuasan pasien.

3
Jenis Statistik yang Digunakan

Jenis Statistik yang digunakan pada kasus ini adalah statistik deskriptif. Alasannya, analisis yang dilakukan hanya bertujuan untuk menggambarkan kondisi data kepuasan pasien rumah sakit apa adanya, seperti melihat rata-rata skor kepuasan, sebaran usia pasien, waktu tunggu, dan waktu pelayanan. Tidak terdapat pengujian hipotesis, penentuan tingkat signifikansi, maupun penarikan kesimpulan untuk mewakili populasi yang lebih luas.

Cahpter 2

1
Ringkasan Statistik Variabel Numerik

Berdasarkan dataset kepuasan pasien rumah sakit (n = 10.000), terdapat beberapa variabel numerik utama yang dianalisis, yaitu Age, Waiting_Time, Service_Time, dan Satisfaction_Score.

Usia pasien memiliki rata-rata sekitar 43 tahun, dengan rentang 18–69 tahun, menunjukkan mayoritas pasien berada pada usia dewasa dan produktif. Waiting_Time memiliki rata-rata sekitar 60 menit dengan variasi yang cukup besar, menandakan perbedaan waktu tunggu antar pasien masih signifikan. Service_Time memiliki rata-rata sekitar 25 menit dengan sebaran yang relatif stabil, menunjukkan durasi pelayanan cukup konsisten. Sementara itu, Satisfaction_Score memiliki rata-rata 7, yang mengindikasikan tingkat kepuasan pasien secara umum tergolong baik.

2
Pola Awal, Tren, dan Anomali

Eksplorasi awal data menunjukkan bahwa skor kepuasan pasien cenderung berada pada tingkat menengah hingga tinggi, yang menandakan kualitas pelayanan rumah sakit secara umum sudah cukup baik. Variasi waktu tunggu pasien terlihat cukup besar, sehingga berpotensi memengaruhi tingkat kepuasan, khususnya ketika waktu tunggu semakin lama. Selain itu, terdapat beberapa nilai ekstrem pada waktu tunggu yang melebihi batas normal serta skor kepuasan yang sangat rendah, yang dapat dikategorikan sebagai anomali dan menunjukkan adanya kasus pelayanan yang kurang optimal.

Cahpter 3

Basic Visualizations

1. Histogram Waiting Time

Cahpter 3 (Alasan Pemilihan Visualisasi)

1. Histogram Waiting Time

Alasan Pemilihan Visualisasi

Histogram Waiting Time dipilih untuk melihat bentuk distribusi waktu tunggu pasien secara keseluruhan. Visualisasi ini membantu mengidentifikasi apakah data cenderung berdistribusi normal, miring ke kanan atau kiri, serta untuk mengetahui frekuensi waktu tunggu yang paling sering terjadi. Dengan histogram, pola penyebaran dan konsentrasi data dapat diamati secara jelas sehingga memudahkan analisis awal terhadap karakteristik waktu tunggu pasien.

2. BOXPLOT – Service Time

Alasan Pemilihan Visualisasi

Boxplot Service Time digunakan untuk menampilkan ringkasan statistik secara visual, seperti median, kuartil, dan potensi outlier. Visualisasi ini sangat efektif untuk melihat tingkat variasi waktu pelayanan dan mendeteksi adanya nilai ekstrem yang dapat memengaruhi rata-rata. Boxplot membantu memahami seberapa konsisten durasi pelayanan yang diberikan kepada pasien serta perbedaan antar nilai dalam dataset.

Cahpter 4

2
Pola Awal, Tren, dan Anomali

A. Waiting Time

1. Mean (Rata-rata)

\(\bar{x} = \dfrac{\sum \text{Waiting Time}}{n} = \dfrac{598{,}300}{10{,}000} = 59.83\)

2. Median (Nilai Tengah)

Karena jumlah data genap, median dihitung dari dua nilai tengah:

\(\text{Median} = \dfrac{x_{(5000)} + x_{(5001)}}{2} = \dfrac{60 + 60}{2} = 60\)

3. Modus (Nilai Paling Sering Muncul)

Modus=58

2
Pola Awal, Tren, dan Anomali

B. Satisfaction Score

1. Mean

Rumus: \(\bar{x} = \dfrac{\sum x_i}{n}\)

Substitusi: \(\bar{x} = \dfrac{70{,}000}{10{,}000}\)

Hasil: \(\bar{x} = 7.00\)

2. Median

Rumus: \(\text{Median} = \dfrac{x_{(5000)} + x_{(5001)}}{2}\)

Dari data: \(x_{(5000)} = 7.0,; x_{(5001)} = 7.0\)

Hasil: \(\text{Median} = 7.0\)

3. Modus

Rumus:

Modus = nilai dengan frekuensi tertinggi

Dari data:

Modus = 7.1

2
Pola Awal, Tren, dan Anomali

Perbandingan dan Interpretasi

Nilai mean, median, dan modus pada variabel Waiting Time yang relatif berdekatan menunjukkan bahwa distribusi data cenderung simetris, sehingga nilai rata-rata dapat merepresentasikan kondisi umum waktu tunggu pasien dengan cukup baik. Hal ini mengindikasikan bahwa sebagian besar pasien mengalami waktu tunggu yang berada di sekitar nilai tengah, tanpa adanya pengaruh pencilan yang ekstrem.

Pada variabel Satisfaction Score, ukuran pemusatan juga terkonsentrasi di sekitar nilai 7, yang menunjukkan bahwa tingkat kepuasan pasien relatif stabil dan konsisten. Kesamaan antara nilai mean dan median mengindikasikan bahwa penilaian kepuasan tidak condong ke arah nilai yang terlalu tinggi maupun terlalu rendah.

Jika dibandingkan, Satisfaction Score memiliki pemusatan yang lebih konsisten dibandingkan Waiting Time, yang menunjukkan bahwa meskipun waktu tunggu pasien bervariasi, penilaian kepuasan pasien tetap terjaga pada tingkat yang relatif seragam.

Cahpter 5

2
Pola Awal, Tren, dan Anomali

Statistical Dispersion

A. Variabel Waiting Time

Range: \(\text{Range} = x_{\text{maks}} - x_{\text{min}} = 118 - 2 = 116\)

Varians: \(s^2 = 224{,}69\)

Standar Deviasi: \(s = \sqrt{224{,}69} \approx 14{,}99\)

B. Variabel Satisfaction Score

Range: \(\text{Range} = x_{\text{maks}} - x_{\text{min}} = 9{,}5 - 3{,}1 = 6{,}4\)

Varians: \(s^2 = 0{,}99\)

Standar Deviasi: \(s = \sqrt{0{,}99} \approx 0{,}99\)

2
Pola Awal, Tren, dan Anomali

Interpretasi Tingkat Penyebaran

Nilai range dan standar deviasi yang cukup besar menunjukkan bahwa waktu tunggu pasien memiliki tingkat penyebaran yang tinggi. Hal ini menandakan adanya perbedaan yang cukup signifikan dalam durasi pelayanan yang diterima oleh masing-masing pasien.

Kondisi tersebut menunjukkan bahwa tidak semua pasien mengalami waktu tunggu yang mendekati nilai rata-rata, melainkan terdapat pasien yang menunggu jauh lebih lama maupun lebih singkat. Dengan demikian, hasil ini mengindikasikan bahwa proses pelayanan masih belum sepenuhnya merata dan memiliki potensi untuk ditingkatkan agar waktu tunggu pasien menjadi lebih konsisten.

Cahpter 6

Essentials of Probability

Pengertian Singkat

Probabilitas merupakan ukuran kemungkinan terjadinya suatu peristiwa, dengan nilai berada pada rentang 0 hingga 1. Nilai probabilitas mendekati 0 menunjukkan peristiwa jarang terjadi, sedangkan nilai mendekati 1 menunjukkan peristiwa yang hampir pasti terjadi. Probabilitas empiris dihitung berdasarkan data observasi.

Penentuan Event

Event yang dipilih: Pasien merasa puas (Satisfied='Yes')

Perhitungan Peluang

Jumlah pasien puas = 59 Total pasien = 100 P(Puas) = 0.59

Interpretasi

Peluang pasien merasa puas = 59%

Cahpter 7

Probability Distributions

Penjelasan Distribusi

Histogram menunjukkan distribusi usia pasien “,”berdasarkan data observasi”

Sebagian besar pasien berada pada rentang usia tertentu, “,”menunjukkan adanya konsentrasi nilai dominan.

Bentuk distribusi dapat dianalisis apakah cenderung simetris “,”atau memiliki kemiringan (skewness), “,”yang menjadi dasar analisis distribusi peluang.

Cahpter 8

Confidence Interval
Chapter 8 – Confidence Interval 95% (Kepuasan Pasien)
Data

Jumlah sampel (n) = total pasien
Proporsi pasien puas (p̂) = jumlah pasien puas / total pasien
Tingkat kepercayaan = 95%
Nilai Z₀.₀₂₅ = 1.96

Rumus interval kepercayaan untuk proporsi

$$CI = \hat{p} \pm Z_{\alpha/2} \sqrt{\frac{\hat{p}(1-\hat{p})}{n}}$$

Substitusi

$$CI = \hat{p} \pm 1.96 \sqrt{\frac{\hat{p}(1-\hat{p})}{n}}$$

Hasil interval kepercayaan 95%

$$\hat{p} - ME \le p \le \hat{p} + ME$$

Makna Interval Kepercayaan

Interval kepercayaan 95% menunjukkan bahwa dengan tingkat keyakinan 95%, proporsi sebenarnya dari pasien yang merasa puas terhadap layanan rumah sakit berada dalam rentang interval yang diperoleh.

Hal ini berarti bahwa nilai proporsi kepuasan pada populasi tidak harus sama persis dengan hasil sampel, tetapi masih berada di dalam batas interval kepercayaan tersebut.

Cahpter 9

Statistical Inference
Chapter 9 – Statistical Inference (Uji Hipotesis Kepuasan Pasien)
Perumusan Hipotesis

Misalkan p adalah proporsi sebenarnya pasien yang merasa puas.

$$H_0 : p = 0.5$$

(proporsi pasien puas sama dengan 50%)

$$H_1 : p > 0.5$$

(proporsi pasien puas lebih dari 50%)

Tingkat signifikansi: α = 0.05

Statistik uji proporsi

$$Z = \frac{\hat{p} - p_0} {\sqrt{\frac{p_0(1-p_0)}{n}}}$$

Dengan p̂ = proporsi pasien puas dari data, p₀ = 0.5, dan n = jumlah sampel.

Kriteria Keputusan

$$\text{Tolak } H_0 \text{ jika } Z > 1.645$$

Kesimpulan

Berdasarkan hasil perhitungan, diperoleh nilai Z = 3.04 , yang melebihi nilai kritis 1.645.

Dengan tingkat signifikansi 5%, dapat disimpulkan bahwa terdapat bukti yang cukup untuk menyatakan bahwa proporsi pasien yang merasa puas terhadap layanan rumah sakit lebih dari 50%.

Cahpter 10

Nonparametric Methods

Chapter 10 – Nonparametric Methods (Uji Chi-Square)
Uji Nonparametrik

Uji Chi-Square (Goodness of Fit)

Hipotesis

$$H_0 : \text{Distribusi kepuasan sesuai dengan harapan}$$

$$H_1 : \text{Distribusi kepuasan tidak sesuai dengan harapan}$$

Statistik Uji

$$\chi^2 = \sum \frac{(O - E)^2}{E}$$

$$\chi^2 = 9.242$$

Keterangan

O = frekuensi yang diamati

E = frekuensi yang diharapkan

Alasan Pemilihan

Uji Chi-Square digunakan karena data kepuasan pasien bersifat kategorik dan tidak memerlukan asumsi distribusi normal.

Nonparametric Methods

Dataset

All About Basic Visualizations

## Column

Pie-Chart

Interpretasi Komposisi Demografi Pasien:

1. Distribusi Sangat Merata: Dari total 10.000 pasien, proporsi demografi terbagi sangat seimbang di antara keempat segmen. Tidak ada kelompok yang mendominasi secara signifikan, dengan masing-masing segmen berkontribusi sekitar 25%.

2. Segmen Terbesar: Kelompok Male - Public memiliki jumlah tertinggi, yaitu sebanyak 2.564 pasien (25,6%).

Keseimbangan Gender & Fasilitas:Pasien Laki-laki: Terbagi menjadi 25,6% di RS Publik dan 24,6% di RS Swasta.

Pasien Perempuan: Terbagi menjadi 25,0% di RS Publik dan 24,7% di RS Swasta.

Kesimpulan: Layanan kesehatan dalam dataset ini menjangkau audiens yang sangat heterogen dan berimbang, baik dari sisi gender maupun tipe rumah sakit yang digunakan. Hal ini menunjukkan bahwa pengambilan kebijakan atau evaluasi kepuasan pasien nantinya harus mempertimbangkan keempat segmen ini secara setara.

Bar-Chart

Interpretasi Kepuasan Pasien Berdasarkan Tipe Rumah Sakit:

Dominasi Tipis: Tingkat kepuasan di kedua rumah sakit sudah di atas 50%, namun perbandingannya sangat ketat antara pasien puas (51%) dan tidak puas (49%).

Kualitas Setara: RS Publik (51,9%) sedikit lebih unggul dari RS Swasta (51,1%), menunjukkan bahwa status kepemilikan tidak menjamin perbedaan kualitas yang besar.

Sinyal Waspada: Tingginya angka ketidakpuasan (hampir separuh pasien) menandakan adanya masalah sistemik yang harus segera diperbaiki.

Rekomendasi Utama: Fokus pada efisiensi layanan, terutama memangkas Waiting Time, untuk menggeser angka ketidakpuasan ke arah positif.

Line-Chart

Interpretasi Kepuasan Berdasarkan Usia:

Stabilitas Skor: Secara keseluruhan, rata-rata skor kepuasan pasien di berbagai kelompok usia cenderung stabil di angka 7,0. Tidak terlihat adanya lonjakan atau penurunan drastis yang dipengaruhi secara langsung oleh faktor usia.

Fluktuasi Kecil: Terdapat sedikit variasi skor antara 6,8 hingga 7,2. Hal ini menunjukkan bahwa pengalaman pasien saat menerima layanan kesehatan cukup konsisten, baik untuk pasien muda (usia 18+) maupun pasien lanjut usia (hingga 69 tahun).

Kemandirian Faktor Usia: Korelasi yang sangat lemah (mendekati nol) antara usia dan skor kepuasan menunjukkan bahwa persepsi pasien terhadap kualitas layanan tidak bergantung pada seberapa tua atau mudanya mereka.

Kesimpulan: Karena skor kepuasan merata di semua umur, manajemen tidak perlu melakukan segmentasi layanan khusus berdasarkan kelompok usia tertentu. Fokus perbaikan sebaiknya diarahkan pada aspek operasional umum yang dirasakan oleh seluruh pasien secara kolektif.

Central Tedency

Interpretasi Eksekutif: Sentralitas Kepuasan Pasien:

Pusat Skor Tunggal (7.00): Nilai Mean, Median, dan Mode berkumpul tepat di angka 7,00. Hal ini menunjukkan bahwa angka 7 adalah titik gravitasi utama dari seluruh pengalaman pasien.

Stabilitas & Simetri: Karena ketiga nilai tersebut identik, distribusi data bersifat simetri sempurna (Normal). Tidak ada kelompok pasien yang merasa sangat kecewa atau sangat puas secara ekstrem yang mampu menggeser rata-rata.

Kepuasan “Ambang Batas”: Mayoritas pasien berada pada zona aman (skor 7). Meskipun sudah di atas rata-rata minimal, ini menandakan layanan rumah sakit baru mencapai level standar yang baik, namun belum masuk ke level pelayanan prima (skor 8-10).

Aksi Nyata: Fokus strategi harus diarahkan pada aspek yang mampu memberikan efek “wow” (seperti efisiensi waktu atau keramahan ekstra) untuk mendorong mayoritas pasien keluar dari skor 7 menuju skor yang lebih tinggi.

Stastical Dispersion

Interpretasi Kepuasan Berdasarkan Usia:

Performa Stabil: Skor rata-rata dan median berada di angka 7,0, menunjukkan kualitas layanan yang sudah baik dan konsisten secara umum.

Kualitas Merata: Mayoritas pasien memberikan nilai di rentang 6,3 – 7,7, menandakan tidak adanya kesenjangan layanan yang mencolok antar pasien.

Prioritas Khusus: Ditemukan sejumlah kasus ekstrem (outliers) dengan skor di bawah 4,2. Kelompok ini harus menjadi fokus utama investigasi untuk meminimalkan pengalaman buruk pasien.

Strategi: Fokus manajemen adalah meningkatkan standar kepuasan minimum dengan mengatasi penyebab munculnya skor rendah, bukan sekadar mempertahankan skor rata-rata yang sudah ada.

Probability Distributions

Interpretasi Distribusi Waktu Tunggu Pasien:

Titik Tengah Operasional (Mean): Rata-rata waktu tunggu pasien berada di angka 59,8 menit (sekitar 1 jam). Garis putus-putus pada grafik menunjukkan pusat antrean di mana sebagian besar volume pasien berkumpul.

Karakteristik Antrean: Grafik menunjukkan distribusi yang stabil dengan standar deviasi sebesar 14,9 menit. Mayoritas pasien menunggu dalam rentang 45 hingga 75 menit. Hal ini mengindikasikan bahwa sistem antrean cukup dapat diprediksi.

Identifikasi Bottleneck: Area histogram di sisi kanan (melewati 90 menit) menunjukkan adanya pasien dengan waktu tunggu ekstrem hingga 121 menit. Titik-titik ini adalah indikasi adanya hambatan operasional (bottleneck) pada jam-jam sibuk yang perlu dievaluasi.

Kesimpulan Strategis:Sistem sudah berjalan stabil (mengikuti kurva normal), namun target efisiensi perlu ditingkatkan. Rekomendasi: Manajemen perlu menetapkan standar baru untuk menggeser kurva ke arah kiri guna meningkatkan kepuasan pasien secara signifikan.

Confidence Interval

## Column

Pendahuluan

1
Latar Belakang

Dalam industri pelayanan kesehatan, angka rata-rata (seperti rata-rata waktu tunggu) sering kali menipu jika tidak disertai dengan indikator ketidakpastian. Manajemen sering membuat keputusan yang salah karena hanya melihat satu angka tunggal (point estimate). Confidence Interval (CI) atau Interval Kepercayaan hadir sebagai solusi untuk memberikan rentang nilai yang lebih realistis. Dengan CI, kita tidak hanya mengatakan “Rata-rata kepuasan adalah 7.5”, melainkan “Kami yakin 95% bahwa rata-rata kepuasan seluruh populasi pasien berada di rentang 7.3 hingga 7.7”.

2
Tujuan Analisis

- Validasi Data: Memastikan hasil dari 10.000 sampel data dapat digeneralisasi ke seluruh populasi pasien di masa depan.

- Akurasi Keputusan: Membantu manajemen menetapkan target KPI yang realistis berdasarkan batas bawah dan batas atas statistik.

- Mitigasi Risiko: Mengetahui sejauh mana variasi layanan memengaruhi loyalitas pasien.

Kasus 1: Confidence Interval (Loyalitas Pasien)

1
Masalah

Dari 10.000 data, katakanlah terdapat 6.200 pasien yang menjawab “Yes” pada kolom Satisfied. Kita ingin tahu berapa proporsi sebenarnya di populasi dengan tingkat kepercayaan 99% (karena ini menyangkut reputasi RS).

2
Rumus Proporsi

\[\text{CI} = \hat{p} \pm z \cdot \sqrt{\frac{\hat{p}(1-\hat{p})}{n}}\] - \(\hat{p} = 0,62\) (proporsi sampel) -\(n = 10.000\) - \(z = 2,576\) (untuk level 99%)

3
Perhitungan
  • Standard Error (SE): \(\sqrt{\frac{0,62 \times 0,38}{10.000}} = \sqrt{0,00002356} = 0,00485\)
  • Margin of Error (ME): \(2,576 \times 0,00485 = 0,0125\) (atau 1,25%)
  • Rentang CI: \(0,62 \pm 0,0125 = [0,6075 \text{ sampai } 0,6325]\)
4
Interpretasi

Kita yakin 99% bahwa proporsi pasien yang puas di seluruh populasi berada di antara 60,7% hingga 63,2%. Jika target KPI manajemen adalah 65%, maka meskipun di sampel terlihat bagus, secara statistik kita belum mencapai target tersebut.

Kasus 2: Confidence Interval (Prediksi Skor)

1
Model Linear

\[\text{Satisfaction Score} = \beta_0 + \beta_1(\text{Waiting Time})\] Hasil analisis memberikan nilai koefisien \(\beta_1\) (kemiringan) sebesar -0,05. Artinya, setiap kenaikan 1 menit waktu tunggu, skor kepuasan turun 0,05 poin.

2
Confidence Interval untuk \(\beta_1\)

Bukan hanya angka tunggal (-0,05), statistik akan memberikan rentang untuk koefisien ini, misalnya: [-0,07 hingga -0,03].

3
Analisis Kompleksitas
  • Jika interval tidak mencakup angka 0: Berarti Waiting Time adalah prediktor yang signifikan secara statistik terhadap kepuasan.
  • Lebar Interval: Jika intervalnya sangat sempit (misal: -0,051 hingga -0,049), berarti model prediksi kita sangat presisi. Jika sangat lebar, berarti ada variabel lain (seperti Service_Time) yang mengganggu (noise) sehingga prediksi kita tidak stabil.

Perhitungan

1
Perhitungan Mann-Whitney U Test (Uji 2 Grup)

Berdasarkan data 10.000 pasien dengan 6.200 pasien puas:Langkah 1: Identifikasi KomponenProporsi Sampel (\(\hat{p}\)): \(6.200 / 10.000 = 0,62\)Ukuran Sampel (\(n\)): \(10.000\)Z-Score (\(z\)) untuk 99%: \(2,576\)Langkah 2: Hitung Standard Error (SE)\[SE = \sqrt{\frac{0,62 \times (1 - 0,62)}{10.000}} = \sqrt{\frac{0,2356}{10.000}} = 0,00485\]Langkah 3: Hitung Margin of Error (ME)\[ME = 2,576 \times 0,00485 = 0,0125 \text{ (1,25\%)}\]Hasil Akhir:\[\text{CI} = 0,62 \pm 0,0125 = [0,6075 \text{ hingga } 0,6325]\]Interpretasi: Kita yakin 99% bahwa kepuasan populasi berada di antara 60,8% dan 63,3%.

2
Perhitungan Kruskal-Wallis Test (Uji > 2 Grup)

Mengukur presisi pengaruh Waiting Time terhadap Satisfaction Score:

  • Langkah 1: Identifikasi KomponenKoefisien Regresi (\(\hat{\beta}_1\)): \(-0,05\) (Penurunan skor per menit).Standard Error Koefisien (\(SE_{\beta}\)): \(0,005\) (Dari output model regresi).Z-Score (\(z\)) untuk 95%: \(1,96\)
  • Langkah 2: Hitung Margin of Error (ME)\[ME = 1,96 \times 0,005 = 0,0098\]
  • Langkah 3: Tentukan Rentang Interval\[\text{Batas Bawah} = -0,05 - 0,0098 = -0,0598\]\[\text{Batas Atas} = -0,05 + 0,0098 = -0,0402\]Hasil Akhir:\[\text{CI} = [-0,0598 \text{ hingga } -0,0402]\]

Statistical Inference

## Column

PENDAHULUAN

1
Jembatan Data: Dari Sampel ke Populasi

Inferensi statistik adalah metode ilmiah untuk menarik kesimpulan tentang seluruh pasien rumah sakit (populasi) hanya dengan menggunakan 10.000 data yang kita miliki (sampel). Karena mengukur setiap pasien secara nyata tidak mungkin dilakukan, inferensi memberikan “kepastian matematis” bahwa pola yang kita temukan—seperti tingkat kepuasan—bukanlah sebuah kebetulan, melainkan cerminan nyata dari kualitas layanan di lapangan.

2
Parameter Keputusan: Estimasi dan Pengujian

Analisis ini bekerja dengan dua instrumen utama: Confidence Interval untuk menentukan rentang nilai yang akurat (misalnya, estimasi rata-rata skor kepuasan), dan Uji Hipotesis (P-Value) untuk membuktikan kebenaran sebuah asumsi (misalnya, apakah waktu tunggu benar-benar merusak kepuasan pasien). Dengan dua parameter ini, manajemen dapat mengambil kebijakan berbasis bukti (evidence-based) yang minim risiko dan memiliki tingkat presisi tinggi.

KASUS 1: Uji T-Test Independen (Perbandingan Mean)

2
Masalah

Apakah terdapat perbedaan signifikan pada rata-rata Waiting_Time antara pasien Public dan Private?

2
Langkah 1: Formulasi Hipotesis
  • \(H_0\): Tidak ada perbedaan rata-rata waktu tunggu antara RS Public dan Private (\(\mu_1 = \mu_2\)).
  • \(H_1\): Terdapat perbedaan signifikan antara keduanya (\(\mu_1 \neq \mu_2\)).Penggunaan uji dua arah (two-tailed) dilakukan untuk mendeteksi perbedaan secara objektif tanpa memihak salah satu grup.
3
Langkah 2: Metode Uji

Alat: Independent Two-Sample T-Test, karena membandingkan dua kelompok yang saling bebas (pasien tidak tumpang tindih).Asumsi: Mengandalkan Central Limit Theorem (sampel besar \(n=10.000\)) untuk menjamin distribusi normalitas, serta mengasumsikan kesamaan varians agar hasil perbandingan skor lebih akurat.

4
Langkah 3: Keputusan Statistik

Analisis P-Value: Dengan hasil \(P\text{-}Value = 0,0002\), probabilitas perbedaan ini terjadi karena kebetulan sangat kecil (0,02%).Keputusan: Tolak \(H_0\) karena \(P\text{-}Value < 0,05\).Simpulan: Perbedaan layanan adalah nyata secara statistik. Manajemen harus segera melakukan perbaikan sistemik pada unit yang lebih lambat karena variasi ini bukan faktor acak, melainkan masalah operasional.

KASUS 2: Uji Chi-Square (Independensi Kategorikal)

1
Masalah

Apakah Status Kepuasan (Satisfied: Yes/No) bergantung pada Tipe Asuransi (Insurance_Type: BPJS/Private)?

2
Langkah 1: Formulasi Hipotesis
  • \(H_0\): Kepuasan dan Tipe Asuransi bersifat independen. Status pembayaran (BPJS/Private) tidak memengaruhi peluang pasien untuk merasa puas.
  • \(H_1\): Kepuasan bergantung pada Tipe Asuransi. Terdapat pola perbedaan tingkat kepuasan yang sistematis antar kelompok asuransi.
3
Langkah 2: Metode Uji

Alat: Chi-Square Test of Independence, karena membandingkan dua variabel kategorikal.Prosedur: Mengukur seberapa besar penyimpangan antara jumlah pasien puas yang nyata di lapangan dengan jumlah yang diharapkan secara teoritis jika tidak ada hubungan antar variabel.

4
Langkah 3: Interpretasi & Keputusan

Keputusan: Jika \(P\text{-}Value < 0,05\), tolak \(H_0\) dan simpulkan bahwa jenis asuransi memengaruhi kepuasan.Risiko Error: Menolak \(H_0\) saat tidak ada hubungan asli disebut Type I Error (False Positive), yang berisiko memicu perbaikan kebijakan asuransi yang sia-sia. Namun, sampel \(n=10.000\) meminimalkan risiko ini dengan meningkatkan akurasi hasil.

Perhitungan

1
Masalah

Uji perbedaan rata-rata Waiting_Time antara RS Public dan RS Private.Data Simulasi:

  • RS Public (\(n_1\)): 5.000 pasien | Rata-rata (\(\bar{x}_1\)) = 35,2 menit | Std. Deviasi (\(s_1\)) = 8,4
  • RS Private (\(n_2\)): 5.000 pasien | Rata-rata (\(\bar{x}_2\)) = 34,5 menit | Std. Deviasi (\(s_2\)) = 7,9 Langkah Perhitungan:
  • Hitung Pooled Standard Deviation (\(s_p\)):\[s_p = \sqrt{\frac{(n_1-1)s_1^2 + (n_2-1)s_2^2}{n_1+n_2-2}} = \sqrt{\frac{4999(8,4^2) + 4999(7,9^2)}{9998}} \approx 8,15\]Hitung Nilai \(t\)-Statistik:\[t = \frac{\bar{x}_1 - \bar{x}_2}{s_p \sqrt{\frac{1}{n_1} + \frac{1}{n_2}}} = \frac{35,2 - 34,5}{8,15 \sqrt{\frac{1}{5000} + \frac{1}{5000}}} = \frac{0,7}{0,163} \approx 4,29\]
2
Langkah 1: Formulasi Hipotesis

Uji independensi antara Tipe Asuransi dan Status Kepuasan.Data Tabel Kontingensi (Observasi/Nyata):| Asuransi | Puas (Yes) | Tidak Puas (No) | Total || :— | :—: | :—: | :—: || BPJS | 3.200 | 1.800 | 5.000 || Swasta | 3.400 | 1.600 | 5.000 || Total | 6.600 | 3.400 | 10.000 | - Langkah Perhitungan:Hitung Frekuensi Harapan (\(E\)):Rumus: \(E = \frac{(\text{Total Baris} \times \text{Total Kolom})}{\text{Grand Total}}\)\(E\) (BPJS-Puas) = \((5000 \times 6600) / 10000 = 3.300\)

  • Hitung Statistik Chi-Square (\(\chi^2\)):\[\chi^2 = \sum \frac{(O - E)^2}{E}\]Sektor BPJS-Puas: \((3200 - 3300)^2 / 3300 = 3,03\)Sektor Swasta-Puas: \((3400 - 3300)^2 / 3300 = 3,03\)(Lakukan untuk semua sel, misal total \(\chi^2 \approx 12,12\))

  • Kesimpulan:Untuk \(df = 1\), nilai kritis \(\chi^2\) adalah 3,84. Karena \(12,12 > 3,84\), maka \(P\text{-}Value < 0,05\).

Nonparametric Methods

## Column

Pendahuluan

1
Fleksibilitas Distribusi dan Ketahanan terhadap Pencilan (Robustness)

Berbeda dengan metode parametrik yang kaku terhadap asumsi distribusi normal, metode non-parametrik (Bab 10.1) bekerja tanpa memedulikan bentuk sebaran data. Dengan berfokus pada Peringkat (Rank) dan bukan nilai absolut, analisis ini menjadi sangat tangguh (robust) terhadap pencilan (outliers). Dalam konteks rumah sakit, hal ini krusial karena data waktu tunggu yang ekstrem (misal: satu pasien menunggu sangat lama karena kasus darurat) tidak akan menarik angka rata-rata secara bias, sehingga kesimpulan statistik tetap mencerminkan realitas mayoritas pasien.

2
Validitas pada Data Ordinal dan Akurasi Keputusan “Pasien Tipikal”

Skala kepuasan (1-5) secara teknis adalah data ordinal yang lebih tepat dianalisis menggunakan perbandingan Median. Metode non-parametrik (seperti Mann-Whitney dan Kruskal-Wallis) memberikan jembatan keputusan yang lebih aman ketika asumsi normalitas diragukan (Bab 10.3). Hasilnya memberikan gambaran tentang pengalaman pasien “tipikal” atau menengah, yang seringkali jauh lebih relevan bagi manajemen dalam mengevaluasi prosedur harian dibandingkan angka rata-rata yang bisa memberikan estimasi yang salah pada data yang miring (skewed).

Uji Mann-Whitney U (Uji Dua Sampel Independen)

1
Masalah

Apakah ada perbedaan signifikan pada Satisfaction_Score antara pasien Laki-laki dan Perempuan jika data skor tidak terdistribusi normal?

2
Langkah 2: Metode Uji

Langkah 1: Formulasi Hipotesis\(H_0\): Distribusi skor kepuasan kedua kelompok sama (tidak ada perbedaan median).\(H_1\): Distribusi skor kepuasan salah satu kelompok lebih tinggi/rendah (ada perbedaan median).

3
Perhitungan Mann-Whitney U Test (Uji 2 Grup)

Menggunakan Mann-Whitney U Test (atau Wilcoxon Rank-Sum) karena metode ini tidak mengandalkan rata-rata, melainkan membandingkan peringkat (rank) dari skor kepuasan.

4
Langkah 3: Interpretasi

Jika \(P\text{-}Value < 0,05\), kita menyimpulkan bahwa salah satu gender secara signifikan memberikan peringkat kepuasan yang berbeda, terlepas dari bentuk distribusi datanya.

Uji Kruskal-Wallis (Uji K-Sampel Independen)

1
Masalah

Apakah Waktu Tunggu (Waiting_Time) berbeda secara signifikan di antara tiga atau lebih kategori (misalnya: berbagai tipe asuransi)?

2
Langkah 1: Formulasi Hipotesis

\(H_0\): Median waktu tunggu untuk semua kelompok asuransi adalah sama.\(H_1\): Setidaknya ada satu kelompok asuransi yang memiliki median waktu tunggu berbeda.

3
Langkah 2: Metode Uji

Menggunakan Kruskal-Wallis Test sebagai alternatif non-parametrik dari One-Way ANOVA. Metode ini sangat efektif jika data waktu tunggu memiliki banyak outliers (pasien yang menunggu sangat lama).

4
Langkah 3: Keputusan Statistik

Jika hasil uji signifikan, berarti jenis asuransi memengaruhi “posisi” waktu tunggu pasien di rumah sakit secara keseluruhan.

Perhitungan

1
Perhitungan Mann-Whitney U Test (Uji 2 Grup)

Kasus: Perbandingan median Satisfaction Score antara Laki-laki (\(n_1=5000\)) dan Perempuan (\(n_2=5000\)).

Langkah Perhitungan:

  • Penggabungan & Peringkat: Gabungkan semua 10.000 data dan urutkan dari skor terkecil ke terbesar. Berikan peringkat 1 s/d 10.000.
  • Jumlah Peringkat (\(R\)): Hitung total peringkat untuk masing-masing grup.Misal: Total Peringkat Laki-laki (\(R_1\)) = 24.500.000
  • Rumus Statistik \(U\):\[U_1 = n_1n_2 + \frac{n_1(n_1+1)}{2} - R_1\]\[U_1 = (5000 \cdot 5000) + \frac{5000(5001)}{2} - 24.500.000 = 13.002.500\]

Konversi ke Z-Score: Karena sampel besar (\(n > 20\)), kita mengonversi \(U\) ke distribusi normal (\(Z\)).Jika hasil \(Z\) hitung > 1,96 atau \(P\text{-}value < 0,05\), maka Median kepuasan kedua gender berbeda nyata.

2
Perhitungan Kruskal-Wallis Test (Uji > 2 Grup)

Kasus: Perbandingan Waiting Time di antara 3 tipe Asuransi (BPJS, Mandiri, Swasta).Langkah Perhitungan:

  • Tentukan \(n\) tiap grup: Misal \(n_{\text{BPJS}}=4000, n_{\text{Mandiri}}=3000, n_{\text{Swasta}}=3000\).
  • Hitung Kuadrat Jumlah Peringkat (\(R_i^2\)):
    • Cari total peringkat untuk setiap kategori asuransi. Rumus Statistik \(H\):

\[H = \frac{12}{N(N+1)} \sum \frac{R_i^2}{n_i}3(N+1)\] Di mana \(N = 10.000\).

Keputusan: Nilai \(H\) dibandingkan dengan tabel Chi-Square (\(\chi^2\)) dengan \(df = k - 1\) (dalam kasus ini \(df = 3 - 1 = 2\)). Jika \(H\) hitung > \(\chi^2\) tabel, maka setidaknya ada satu asuransi dengan waktu tunggu yang berbeda secara signifikan.