Analisis statistik deskriptif dan inferensial pola kematian global berdasarkan data historis 1990β2019 dari 204 negara, dengan fokus pada Indonesia.
Kematian merupakan fenomena universal yang dipengaruhi oleh berbagai faktor seperti penyakit, lingkungan, perilaku, dan akses kesehatan. Pemahaman terhadap pola penyebab kematian sangat penting untuk pengambilan kebijakan kesehatan yang tepat sasaran.
Laporan ini menganalisis dataset Cause of Deaths Around the World (Historical Data) yang memuat data kematian berdasarkan 29 penyebab dari 204 negara selama periode 1990β2019. Analisis mencakup statistik deskriptif, visualisasi data, dan inferensi statistik untuk memahami tren global maupun kondisi spesifik Indonesia.
Dataset bersumber dari Our World in Data (OWID) yang diunggah di Kaggle oleh IAMSUPERADAM. Data mencatat jumlah kematian per penyebab di setiap negara per tahun.
Dataset memiliki dua variabel kategorik utama:
| Variabel | Tipe | Contoh Nilai | Keterangan |
|---|---|---|---|
| Country/Territory | Nominal | Indonesia, China, USA | 204 negara/wilayah unik |
| Region | Nominal | Asia, Eropa, Afrika | Pengelompokan geografis benua |
| Code | Nominal | IDN, CHN, USA | Kode ISO 3-huruf negara |
Terdapat 29 variabel numerik (jumlah kematian per penyebab) dan 1 variabel numerik temporal:
| Variabel | Tipe | Skala | Contoh (Indonesia 2019) |
|---|---|---|---|
| Year | Numerik diskrit | Rasio | 1990 β 2019 |
| Cardiovascular Diseases | Numerik kontinu | Rasio | 651.481 |
| Neoplasms (Cancer) | Numerik kontinu | Rasio | 229.524 |
| Tuberculosis | Numerik kontinu | Rasio | 76.549 |
| Road Injuries | Numerik kontinu | Rasio | 37.004 |
| Diabetes Mellitus | Numerik kontinu | Rasio | 106.333 |
Pie chart digunakan untuk menyajikan data kategorik (penyebab kematian) dengan menampilkan proporsi setiap kategori terhadap keseluruhan. Cocok digunakan ketika ingin memperlihatkan perbandingan bagian terhadap total.
Statistik Deskriptif: Pada tahun 2019, penyakit kardiovaskular mendominasi penyebab kematian global dengan proporsi 34,1% dari total kematian. Diikuti oleh Neoplasms (kanker) sebesar 18,5%, Penyakit Pernapasan Kronis 7,3%, dan Penyakit Digestif 4,7%.
Statistik Inferensia: Dominasi penyakit tidak menular (kardiovaskular + kanker + pernapasan = ~60%) mengindikasikan bahwa secara global, pola kematian telah bergeser dari penyakit infeksi ke penyakit kronis. Hal ini konsisten dengan teori transisi epidemiologi, di mana negara yang mengalami peningkatan kesejahteraan cenderung menghadapi beban penyakit tidak menular yang lebih besar. Bagi Indonesia, tren ini menjadi sinyal penting untuk memperkuat program pencegahan penyakit jantung dan kanker.
Bar chart digunakan untuk membandingkan nilai antar kategori (variabel kategorik). Di sini kita membandingkan jumlah kematian akibat tiga penyebab utama berdasarkan region/benua pada tahun 2019.
Statistik Deskriptif: Asia mendominasi jumlah kematian absolut di seluruh kategori penyakit β kardiovaskular (10,77 juta), kanker (5,57 juta), dan infeksi pernapasan (1,18 juta). Hal ini wajar mengingat Asia memiliki populasi terbesar dunia. Eropa menempati posisi kedua untuk kardiovaskular dan kanker, sementara Afrika menonjol untuk kematian akibat infeksi pernapasan relatif terhadap penyakit lainnya.
Statistik Inferensia: Perbedaan pola antar benua mencerminkan perbedaan faktor risiko, sistem kesehatan, dan tingkat pembangunan. Afrika memiliki beban infeksi yang proporsional lebih tinggi β mengindikasikan masih tingginya angka kematian akibat penyakit yang seharusnya dapat dicegah. Asia perlu mewaspadai lonjakan penyakit tidak menular seiring urbanisasi yang pesat. Temuan ini signifikan secara statistik mengingat perbedaan antar benua jauh melampaui variasi dalam satu benua.
Histogram digunakan untuk menampilkan distribusi frekuensi data numerik kontinu. Data dibagi ke dalam kelas-kelas interval (bin) untuk menampilkan pola sebaran data.
Statistik Deskriptif: Distribusi kematian kardiovaskular di Indonesia selama 1990β2019 menunjukkan sebaran yang cukup merata di seluruh rentang nilai (278.302 β 651.481). Hal ini menggambarkan pertumbuhan yang konsisten dari tahun ke tahun. Mean = 452.900, Median = 447.747, menunjukkan distribusi yang hampir simetris (mendekati normal).
Statistik Inferensia: Distribusi yang mendekati seragam/uniform mengindikasikan bahwa kematian kardiovaskular di Indonesia meningkat secara linear dan konsisten tanpa adanya lonjakan atau penurunan drastis. Ini berbeda dari penyakit infeksi seperti TB yang menunjukkan tren penurunan. Jika tren ini berlanjut, diproyeksikan angka kematian kardiovaskular Indonesia akan terus meningkat β menjadikan penyakit jantung sebagai ancaman kesehatan publik nomor satu yang membutuhkan intervensi kebijakan segera.
Density plot (kurva kepadatan) merupakan versi halus dari histogram yang menggunakan Kernel Density Estimation (KDE) untuk memperlihatkan distribusi probabilitas kontinu dari data numerik.
Statistik Deskriptif: Keempat penyebab kematian menunjukkan bentuk distribusi yang berbeda. Kardiovaskular memiliki distribusi lebar dan datar (platykurtic) β mencerminkan variasi besar antar tahun. Kanker menunjukkan distribusi yang lebih sempit. Tuberkulosis dan Road Injuries memiliki distribusi terpusat (leptokurtic) karena perubahan antar tahun yang relatif kecil.
Statistik Inferensia: Bentuk distribusi memberikan petunjuk tentang stabilitas dan prediktabilitas tren. Penyakit dengan distribusi sempit (TB, kecelakaan jalan) lebih mudah diprediksi, sementara kardiovaskular dengan distribusi lebar menunjukkan akselerasi pertumbuhan yang memerlukan pemodelan tren lebih lanjut. Diabetes menunjukkan distribusi right-skewed (menceng kanan), mengindikasikan lonjakan signifikan di periode terbaru β sinyal darurat epidemiologi.
Boxplot (box-and-whisker plot) menampilkan ringkasan statistik 5-nilai: minimum, Q1, median, Q3, dan maksimum. Sangat berguna untuk membandingkan distribusi dan mendeteksi outlier.
Statistik Deskriptif: Kardiovaskular memiliki box terlebar (IQR = Q3βQ1 = 565.573 β 342.414 = 223.159), menandakan variabilitas tinggi antar tahun. TB memiliki IQR paling sempit (117.586 β 92.813 = 24.773), artinya distribusinya sangat terpusat. Diabetes menunjukkan distribusi menceng ke kanan karena median (56.637) berada jauh di bawah Q3 (85.186).
Statistik Inferensia: Tidak ditemukan outlier pada semua variabel (semua nilai berada dalam rentang whisker), mengindikasikan tren yang konsisten tanpa kejadian luar biasa. IQR yang lebar pada kardiovaskular dan kanker mengkonfirmasi pertumbuhan yang akseleratif. Posisi median TB yang tinggi dibanding batas bawah box mengindikasikan distribusi left-skewed β angka TB tinggi di awal periode dan terus menurun, konsisten dengan keberhasilan program penanggulangan TB Indonesia.
Berikut adalah perhitungan lengkap ukuran statistik untuk lima variabel numerik kematian di Indonesia (1990β2019, n = 30 tahun).
| Statistik | Kardiovaskular | Kanker | Tuberkulosis | Kecelakaan Jalan | Diabetes |
|---|---|---|---|---|---|
| Mean (Rata-rata) | 452.900 | 155.756 | 106.567 | 44.184 | 62.952 |
| Median | 447.747 | 152.240 | 113.118 | 44.911 | 56.637 |
| Modus | β* | β* | β* | β* | β* |
| Q1 (Kuartil 1) | 342.414 | 121.912 | 92.813 | 38.001 | 42.444 |
| Q3 (Kuartil 3) | 565.573 | 190.904 | 117.586 | 49.188 | 85.186 |
| IQR (Q3βQ1) | 223.159 | 68.992 | 24.773 | 11.187 | 42.742 |
| Range (MaksβMin) | 373.179 | 133.888 | 51.460 | 13.731 | 73.114 |
| Minimum | 278.302 | 95.636 | 76.549 | 36.866 | 33.219 |
| Maksimum | 651.481 | 229.524 | 128.009 | 50.597 | 106.333 |
| Varians | 14.328.860.182 | 1.590.850.158 | 240.525.792 | 29.113.282 | 564.279.824 |
| Std. Deviasi (SD) | 119.703 | 39.886 | 15.509 | 5.396 | 23.755 |
| CV (SD/Mean) | 26,4% | 25,6% | 14,5% | 12,2% | 37,7% |
* Modus tidak bermakna pada data kontinu yang bersifat time-series karena setiap nilai cenderung unik. Pada konteks ini, modus dapat diinterpretasikan sebagai kelas interval dengan frekuensi tertinggi pada histogram.
| Ukuran | Definisi | Interpretasi pada Data Ini |
|---|---|---|
| Mean | Rata-rata aritmetika seluruh nilai | Rata-rata kematian kardiovaskular Indonesia selama 30 tahun = 452.900/tahun |
| Median | Nilai tengah data terurut | 50% tahun memiliki kematian kardiovaskular di bawah 447.747 |
| Modus | Nilai yang paling sering muncul | Pada data kontinu time-series, menggunakan kelas modal histogram |
| Q1 | Persentil ke-25 | 25% tahun terendah memiliki kematian kardiovaskular β€342.414 |
| Q3 | Persentil ke-75 | 75% tahun memiliki kematian kardiovaskular β€565.573 |
| Range | Selisih nilai maks dan min | Rentang kematian kardiovaskular sepanjang 30 tahun = 373.179 |
| Varians | Rata-rata kuadrat simpangan dari mean | Varians tinggi β data tersebar jauh dari rata-rata (pertumbuhan signifikan) |
| Std. Deviasi | Akar varians; satuan sama dengan data | SD kardiovaskular = 119.703 β tiap tahun rata-rata menyimpang 119.703 dari mean |