Eksplorasi data statistik kematian global dari 204 negara selama tiga dekade menggunakan berbagai teknik visualisasi dan analisis statistik.
Sumber Data: Our World in Data β Global Burden of Disease Study 2019
Link: kaggle.com/datasets/iamsouravbanerjee/cause-of-deaths-around-the-world
Mata Kuliah: Probabilitas dan Statistika
Kematian adalah fenomena universal yang dapat dikaji secara ilmiah untuk memahami pola kesehatan populasi global.
Penyakit penyebab kematian merupakan salah satu indikator penting dalam menilai kualitas kesehatan suatu negara. Dengan memahami pola penyebab kematian, pemerintah dan lembaga kesehatan dapat merumuskan kebijakan yang lebih tepat sasaran untuk meningkatkan angka harapan hidup masyarakat.
Dataset yang digunakan dalam analisis ini bersumber dari Our World in Data yang merangkum data Global Burden of Disease (GBD) Study 2019 yang diterbitkan oleh Institute for Health Metrics and Evaluation (IHME). Data ini mencakup 204 negara/wilayah dari tahun 1990 hingga 2019 dengan 31 kategori penyebab kematian.
| Nama Variabel | Jenis Data | Skala | Keterangan |
|---|---|---|---|
Country/Territory | Kategorik | Nominal | Nama negara/wilayah (204 kategori) |
Code | Kategorik | Nominal | Kode ISO negara (misal: IDN = Indonesia) |
Year | Numerik | Interval | Tahun pengamatan (1990β2019) |
Cardiovascular Diseases | Numerik | Rasio | Jumlah kematian akibat penyakit kardiovaskular |
Neoplasms | Numerik | Rasio | Jumlah kematian akibat kanker/tumor |
Tuberculosis | Numerik | Rasio | Jumlah kematian akibat tuberkulosis |
Malaria | Numerik | Rasio | Jumlah kematian akibat malaria |
| ... dan 27 variabel numerik lainnya | |||
Pie chart digunakan untuk menampilkan proporsi/persentase dari setiap kategori terhadap keseluruhan data.
Grafik lingkaran berikut menunjukkan proporsi 7 penyebab kematian terbesar di Indonesia pada tahun 2019, dengan total 1.713.143 kematian.
Bar chart (diagram batang) digunakan untuk membandingkan nilai antar kategori secara visual.
Grafik batang berikut membandingkan total kematian dari seluruh penyebab di 10 negara dengan angka kematian tertinggi pada tahun 2019.
Histogram digunakan untuk melihat distribusi frekuensi dari data numerik kontinu, menunjukkan bentuk sebaran data.
Histogram berikut menggambarkan sebaran jumlah kematian akibat penyakit kardiovaskular di 204 negara pada tahun 2019.
Density plot adalah versi halus dari histogram yang menampilkan estimasi distribusi probabilitas kontinu dari data.
Dalam analisis ini, density plot divisualisasikan sebagai grafik tren dengan area terisi (area chart) untuk menunjukkan evolusi jumlah kematian akibat neoplasms (kanker) di Indonesia dari tahun 1990 hingga 2019.
Boxplot (diagram kotak) merangkum distribusi data melalui 5 ukuran sekaligus: minimum, Q1, median, Q3, dan maksimum.
Boxplot berikut membandingkan distribusi jumlah kematian akibat penyakit kardiovaskular di berbagai kawasan dunia pada tahun 2019.
| Kawasan | Q1 | Median (Q2) | Q3 | IQR | Rata-rata |
|---|---|---|---|---|---|
| Asia | 58.824 | 138.139 | 324.764 | 265.940 | 473.496 |
| Eropa | 32.998 | 55.921 | 188.113 | 155.115 | 167.491 |
| Amerika | 15.015 | 27.140 | 72.629 | 57.614 | 101.214 |
| Afrika | 18.157 | 28.149 | 54.489 | 36.332 | 41.813 |
| Oseania | 869 | 2.642 | 15.540 | 14.671 | 12.205 |
Statistik deskriptif merangkum karakteristik utama dari suatu kumpulan data menggunakan ukuran numerik.
Tabel berikut menyajikan perhitungan lengkap statistik deskriptif untuk 4 variabel numerik utama di Indonesia selama periode 1990β2019 (n = 30 tahun).
| Ukuran Statistik | Kardiovaskular | Neoplasms | Tuberkulosis | Malaria |
|---|---|---|---|---|
| Mean (Rata-rata) | 452.900 | 155.756 | 106.567 | 2.489 |
| Median (Nilai Tengah) | 447.747 | 152.240 | 113.118 | 2.543 |
| Modus (Nilai Terbanyak)* | 484.000 | 164.000 | 118.000 | 3.000 |
| Q1 (Kuartil 1) | 342.414 | 121.912 | 92.813 | 1.236 |
| Q3 (Kuartil 3) | 558.106 | 188.339 | 117.563 | 3.208 |
| Range (Rentang) | 373.179 | 133.888 | 51.460 | 5.488 |
| Varians | 14.328.860.182 | 1.590.850.158 | 240.525.792 | 1.909.319 |
| Standar Deviasi | 119.703 | 39.885 | 15.509 | 1.382 |
*Modus dihitung dengan pembulatan ke ribuan terdekat karena data kontinu.
π« Cardiovascular Diseases:
π¦ Tuberculosis:
π¦ Malaria:
Berdasarkan analisis statistik terhadap dataset Cause of Deaths Around the World, dapat ditarik beberapa kesimpulan utama: