Analisis ini bertujuan untuk memahami karakteristik pasien, distribusi kondisi medis, biaya pengobatan, serta outcome klinis dari data kesehatan yang tersedia. Dataset terdiri dari 55.500 baris dan 15 variabel terkait informasi pasien, dokter, rumah sakit, dan hasil pemeriksaan.
Interpretasi Distribusi Jumlah Pasien per Umur
Rentang Usia Pasien
Usia dengan Jumlah Pasien Terbanyak
Rata-rata dan Median
Modus
Jumlah Total Pasien
Kesimpulan
Mayoritas pasien berasal dari kelompok usia dewasa paruh baya, khususnya sekitar 45–55 tahun. Ini bisa menunjukkan bahwa risiko kesehatan atau kebutuhan layanan medis lebih tinggi di kelompok usia tersebut. Pihak rumah sakit atau institusi kesehatan dapat fokus pada program pencegahan dan edukasi untuk kelompok umur ini.
df <- df %>%
clean_names() %>%
mutate(
name = str_to_title(name),
doctor = str_to_title(doctor),
hospital = str_to_title(hospital),
gender = str_to_title(gender),
test_results = str_to_title(test_results),
admission_type = str_to_title(admission_type),
billing_amount = str_replace(billing_amount, "\\.", ""),
billing_amount = as.numeric(str_replace(billing_amount, ",", ".")),
date_of_admission = ymd(date_of_admission),
discharge_date = ymd(discharge_date),
length_of_stay = as.numeric(discharge_date - date_of_admission)
)
# Tampilkan data yang sudah dibersihkan dalam tabel interaktif
DT::datatable(head(df, 100), options = list(scrollX = TRUE))Proses pembersihan data bertujuan memastikan kualitas informasi sebelum analisis. Beberapa hal penting:
Billing_Amount,
Test_Results, dan Insurance_Provider ditangani
untuk menghindari bias analisis.Date_of_Admission)
dikonversi agar dapat dianalisis berdasarkan waktu.Interpretasi: Berdasarkan visualisasi distribusi jenis kelamin pasien, mayoritas pasien dalam dataset ini berjenis kelamin Male. Hal ini menunjukkan bahwa kelompok tersebut lebih sering mendapatkan layanan kesehatan atau lebih banyak tercatat dalam data rumah sakit.
Dari segi usia, rentang usia pasien cukup bervariasi. Berdasarkan statistik deskriptif, usia pasien berkisar dari 13 hingga 89 tahun, dengan rentang usia yang paling dominan berada pada 52 hingga 68 tahun. Hal ini dapat mencerminkan kelompok usia yang paling banyak memanfaatkan layanan kesehatan, yang mungkin terkait dengan kondisi medis tertentu yang umum terjadi pada usia tersebut.
Interpretasi: Kondisi medis paling umum adalah Arthritis, menunjukkan beban penyakit kronis yang tinggi.
Interpretasi: Rumah sakit dan dokter yang muncul paling banyak bisa menandakan kapasitas tinggi atau wilayah padat penduduk. Perlu analisis lanjutan untuk efisiensi layanan.
Interpretasi: Terdapat fluktuasi jumlah pasien tiap bulannya. Lonjakan pasien dapat terjadi akibat musim penyakit tertentu atau pandemi.
Interpretasi: Provider Aetna memiliki rata-rata biaya pengobatan tertinggi, menunjukkan beban pembiayaan tinggi.
Interpretasi: Sebagian besar hasil pemeriksaan menunjukkan kondisi Abnormal. Ini menjadi indikator umum status kesehatan pasien.
Dataset ini memuat informasi dari lebih dari 55.000 pasien yang berobat di berbagai rumah sakit. Variabel yang dianalisis meliputi data demografi pasien, tanggal masuk, kondisi medis, hasil pemeriksaan, penyedia asuransi, serta jumlah biaya pengobatan.
Demografi Pasien
Usia pasien sangat bervariasi, dengan dominasi pada usia produktif (52, 68 tahun).
👉 Rumah sakit dapat memfokuskan edukasi pencegahan penyakit dan layanan khusus pada kelompok usia ini, terutama untuk penyakit kronis.
Jenis kelamin terbanyak: Male
👉 Menyesuaikan fasilitas atau promosi layanan kesehatan berbasis gender dapat meningkatkan efektivitas pelayanan.
Kondisi Medis & Pemeriksaan
Kondisi medis paling umum: Arthritis
👉 Prioritaskan ketersediaan tenaga medis, obat-obatan, dan program edukasi untuk penyakit ini.
Hasil pemeriksaan dominan: Abnormal
👉 Perlu ditinjau kembali protokol diagnosa untuk memastikan akurasi dan efektivitas pengobatan.
Asuransi dan Biaya Pengobatan
Provider dengan biaya tertinggi: Aetna
👉 Peluang evaluasi kerja sama rumah sakit dengan provider asuransi agar biaya dan kualitas pelayanan tetap optimal.
Tren Jumlah Pasien
Jumlah pasien berfluktuasi tiap bulan, menunjukkan kemungkinan adanya musim penyakit atau kebiasaan kunjungan.
👉 Rumah sakit bisa mengatur penjadwalan SDM atau stok obat secara adaptif mengikuti pola ini.
Distribusi Gender: menunjukkan dominasi satu gender → pengembangan layanan berbasis gender disarankan.
Medical Condition: dominasi penyakit kronis seperti diabetes, kanker, dll.
👉 Intervensi jangka panjang dan program deteksi dini menjadi penting.
Asuransi: hanya beberapa provider yang menanggung pasien dengan biaya tinggi.
👉 Bisa jadi indikasi ketimpangan jaminan yang perlu ditinjau oleh manajemen keuangan rumah sakit.
Manajemen Sumber Daya: Fokuskan SDM dan infrastruktur pada kondisi medis yang sering muncul.
Evaluasi Asuransi: Pertimbangkan audit terhadap provider asuransi dengan biaya tertinggi agar biaya tidak membengkak tanpa hasil klinis signifikan.
Perencanaan Musiman: Gunakan tren bulanan untuk mengatur logistik dan kapasitas kamar rawat sesuai kebutuhan nyata.
Pengembangan Layanan Berbasis Gender dan Usia: Sesuaikan program layanan kesehatan, promosi, dan edukasi berdasarkan kelompok demografi yang dominan.
Langkah Lanjut: Pengembangan model prediksi risiko pasien dan analisis survival akan memperkuat pembuatan keputusan klinis dan finansial.