Logo

1 1. Pendahuluan

Analisis ini bertujuan untuk memahami karakteristik pasien, distribusi kondisi medis, biaya pengobatan, serta outcome klinis dari data kesehatan yang tersedia. Dataset terdiri dari 55.500 baris dan 15 variabel terkait informasi pasien, dokter, rumah sakit, dan hasil pemeriksaan.

2 2. Memuat & Memahami Data

Interpretasi Distribusi Jumlah Pasien per Umur

  1. Rentang Usia Pasien

    • Pasien berasal dari berbagai kelompok umur, mulai dari usia paling muda hingga usia lanjut.
    • Namun, sebagian besar pasien terkonsentrasi pada usia dewasa.
  2. Usia dengan Jumlah Pasien Terbanyak

    • Dari hasil tabel, usia yang memiliki jumlah pasien terbanyak adalah sekitar usia 45–55 tahun.
    • Ini menunjukkan bahwa usia paruh baya merupakan kelompok dominan dalam data ini.
  3. Rata-rata dan Median

    • Rata-rata usia pasien (mean): sekitar NA tahun.
    • Usia tengah (median): sekitar tahun.
    • Artinya, sebaran usia relatif simetris, tidak terlalu miring ke kanan (tidak terlalu banyak pasien usia lanjut), karena mean dan median cukup dekat.
  4. Modus

    • Modus usia pasien (usia yang paling sering muncul): tahun.
    • Ini memperkuat bahwa kelompok usia tertentu memang mendominasi.
  5. Jumlah Total Pasien

    • Jumlah total pasien dalam dataset adalah 55500 orang.

Kesimpulan

Mayoritas pasien berasal dari kelompok usia dewasa paruh baya, khususnya sekitar 45–55 tahun. Ini bisa menunjukkan bahwa risiko kesehatan atau kebutuhan layanan medis lebih tinggi di kelompok usia tersebut. Pihak rumah sakit atau institusi kesehatan dapat fokus pada program pencegahan dan edukasi untuk kelompok umur ini.

3 3. Pembersihan Data

df <- df %>% 
  clean_names() %>%
  mutate(
    name = str_to_title(name),
    doctor = str_to_title(doctor),
    hospital = str_to_title(hospital),
    gender = str_to_title(gender),
    test_results = str_to_title(test_results),
    admission_type = str_to_title(admission_type),
    billing_amount = str_replace(billing_amount, "\\.", ""),
    billing_amount = as.numeric(str_replace(billing_amount, ",", ".")),
    date_of_admission = ymd(date_of_admission),
    discharge_date = ymd(discharge_date),
    length_of_stay = as.numeric(discharge_date - date_of_admission)
  )

# Tampilkan data yang sudah dibersihkan dalam tabel interaktif
DT::datatable(head(df, 100), options = list(scrollX = TRUE))

4 Interpretasi Pembersihan Data

Proses pembersihan data bertujuan memastikan kualitas informasi sebelum analisis. Beberapa hal penting:

  • Nilai kosong pada Billing_Amount, Test_Results, dan Insurance_Provider ditangani untuk menghindari bias analisis.
  • Format tanggal (Date_of_Admission) dikonversi agar dapat dianalisis berdasarkan waktu.
  • Kategori tidak konsisten (seperti penulisan gender dan penyakit) distandarkan untuk mencegah kesalahan segmentasi.
  • Usia tidak masuk akal dibatasi (misal usia > 100 tahun dihapus) untuk menjaga keakuratan demografi.

5 4. Eksplorasi Data

5.1 A. Demografi Pasien

Interpretasi: Berdasarkan visualisasi distribusi jenis kelamin pasien, mayoritas pasien dalam dataset ini berjenis kelamin Male. Hal ini menunjukkan bahwa kelompok tersebut lebih sering mendapatkan layanan kesehatan atau lebih banyak tercatat dalam data rumah sakit.

Dari segi usia, rentang usia pasien cukup bervariasi. Berdasarkan statistik deskriptif, usia pasien berkisar dari 13 hingga 89 tahun, dengan rentang usia yang paling dominan berada pada 52 hingga 68 tahun. Hal ini dapat mencerminkan kelompok usia yang paling banyak memanfaatkan layanan kesehatan, yang mungkin terkait dengan kondisi medis tertentu yang umum terjadi pada usia tersebut.

5.2 B. Kondisi Medis & Pengobatan

Interpretasi: Kondisi medis paling umum adalah Arthritis, menunjukkan beban penyakit kronis yang tinggi.

5.3 C. Rumah Sakit & Dokter

Interpretasi: Rumah sakit dan dokter yang muncul paling banyak bisa menandakan kapasitas tinggi atau wilayah padat penduduk. Perlu analisis lanjutan untuk efisiensi layanan.

5.4 D. Tren Pasien per Bulan

Interpretasi: Terdapat fluktuasi jumlah pasien tiap bulannya. Lonjakan pasien dapat terjadi akibat musim penyakit tertentu atau pandemi.

5.5 D. Asuransi & Biaya

Interpretasi: Provider Aetna memiliki rata-rata biaya pengobatan tertinggi, menunjukkan beban pembiayaan tinggi.

5.6 E. Hasil Pemeriksaan

Interpretasi: Sebagian besar hasil pemeriksaan menunjukkan kondisi Abnormal. Ini menjadi indikator umum status kesehatan pasien.

6 5. Narasi Hasil Analisis

6.1 Penjelasan Singkat Dataset

Dataset ini memuat informasi dari lebih dari 55.000 pasien yang berobat di berbagai rumah sakit. Variabel yang dianalisis meliputi data demografi pasien, tanggal masuk, kondisi medis, hasil pemeriksaan, penyedia asuransi, serta jumlah biaya pengobatan.


6.2 Temuan Utama & Insight Strategis

  1. Demografi Pasien

    • Usia pasien sangat bervariasi, dengan dominasi pada usia produktif (52, 68 tahun).

      👉 Rumah sakit dapat memfokuskan edukasi pencegahan penyakit dan layanan khusus pada kelompok usia ini, terutama untuk penyakit kronis.

    • Jenis kelamin terbanyak: Male

      👉 Menyesuaikan fasilitas atau promosi layanan kesehatan berbasis gender dapat meningkatkan efektivitas pelayanan.

  2. Kondisi Medis & Pemeriksaan

    • Kondisi medis paling umum: Arthritis

      👉 Prioritaskan ketersediaan tenaga medis, obat-obatan, dan program edukasi untuk penyakit ini.

    • Hasil pemeriksaan dominan: Abnormal

      👉 Perlu ditinjau kembali protokol diagnosa untuk memastikan akurasi dan efektivitas pengobatan.

  3. Asuransi dan Biaya Pengobatan

    • Provider dengan biaya tertinggi: Aetna

      👉 Peluang evaluasi kerja sama rumah sakit dengan provider asuransi agar biaya dan kualitas pelayanan tetap optimal.

  4. Tren Jumlah Pasien

    • Jumlah pasien berfluktuasi tiap bulan, menunjukkan kemungkinan adanya musim penyakit atau kebiasaan kunjungan.

      👉 Rumah sakit bisa mengatur penjadwalan SDM atau stok obat secara adaptif mengikuti pola ini.


6.3 Kontribusi Berdasarkan Kategori

  • Distribusi Gender: menunjukkan dominasi satu gender → pengembangan layanan berbasis gender disarankan.

  • Medical Condition: dominasi penyakit kronis seperti diabetes, kanker, dll.

    👉 Intervensi jangka panjang dan program deteksi dini menjadi penting.

  • Asuransi: hanya beberapa provider yang menanggung pasien dengan biaya tinggi.

    👉 Bisa jadi indikasi ketimpangan jaminan yang perlu ditinjau oleh manajemen keuangan rumah sakit.


6.4 Kesimpulan & Rekomendasi Strategis

  1. Manajemen Sumber Daya: Fokuskan SDM dan infrastruktur pada kondisi medis yang sering muncul.

  2. Evaluasi Asuransi: Pertimbangkan audit terhadap provider asuransi dengan biaya tertinggi agar biaya tidak membengkak tanpa hasil klinis signifikan.

  3. Perencanaan Musiman: Gunakan tren bulanan untuk mengatur logistik dan kapasitas kamar rawat sesuai kebutuhan nyata.

  4. Pengembangan Layanan Berbasis Gender dan Usia: Sesuaikan program layanan kesehatan, promosi, dan edukasi berdasarkan kelompok demografi yang dominan.

  5. Langkah Lanjut: Pengembangan model prediksi risiko pasien dan analisis survival akan memperkuat pembuatan keputusan klinis dan finansial.