Analisis Penyebab Kematian Dunia
Laporan Analisis Data Β· Probabilitas & Statistika

Penyebab Kematian
di Dunia

Analisis statistik deskriptif dan inferensial pola kematian global berdasarkan data historis 1990–2019 dari 204 negara, dengan fokus pada Indonesia.

Sumber Data
Kaggle / OWID
Periode
1990 – 2019
Total Baris
6.120
Negara
204
01

Pendahuluan

Kematian merupakan fenomena universal yang dipengaruhi oleh berbagai faktor seperti penyakit, lingkungan, perilaku, dan akses kesehatan. Pemahaman terhadap pola penyebab kematian sangat penting untuk pengambilan kebijakan kesehatan yang tepat sasaran.

Laporan ini menganalisis dataset Cause of Deaths Around the World (Historical Data) yang memuat data kematian berdasarkan 29 penyebab dari 204 negara selama periode 1990–2019. Analisis mencakup statistik deskriptif, visualisasi data, dan inferensi statistik untuk memahami tren global maupun kondisi spesifik Indonesia.

🎯
Tujuan Analisis Menyajikan gambaran komprehensif pola penyebab kematian global; mengidentifikasi tren temporal kematian akibat penyakit tidak menular di Indonesia; serta menghitung dan menginterpretasikan ukuran statistik deskriptif dari data numerik.
02

Deskripsi Dataset

Dataset bersumber dari Our World in Data (OWID) yang diunggah di Kaggle oleh IAMSUPERADAM. Data mencatat jumlah kematian per penyebab di setiap negara per tahun.

Variabel Kategorik

Dataset memiliki dua variabel kategorik utama:

VariabelTipeContoh NilaiKeterangan
Country/TerritoryNominalIndonesia, China, USA204 negara/wilayah unik
RegionNominalAsia, Eropa, AfrikaPengelompokan geografis benua
CodeNominalIDN, CHN, USAKode ISO 3-huruf negara

Variabel Numerik

Terdapat 29 variabel numerik (jumlah kematian per penyebab) dan 1 variabel numerik temporal:

VariabelTipeSkalaContoh (Indonesia 2019)
YearNumerik diskritRasio1990 – 2019
Cardiovascular DiseasesNumerik kontinuRasio651.481
Neoplasms (Cancer)Numerik kontinuRasio229.524
TuberculosisNumerik kontinuRasio76.549
Road InjuriesNumerik kontinuRasio37.004
Diabetes MellitusNumerik kontinuRasio106.333
03

Pie Chart

Pie chart digunakan untuk menyajikan data kategorik (penyebab kematian) dengan menampilkan proporsi setiap kategori terhadap keseluruhan. Cocok digunakan ketika ingin memperlihatkan perbandingan bagian terhadap total.

Proporsi Penyebab Kematian Global Tahun 2019
Top 8 penyebab + kategori lainnya Β· Total seluruh negara
πŸ“Š Interpretasi Pie Chart

Statistik Deskriptif: Pada tahun 2019, penyakit kardiovaskular mendominasi penyebab kematian global dengan proporsi 34,1% dari total kematian. Diikuti oleh Neoplasms (kanker) sebesar 18,5%, Penyakit Pernapasan Kronis 7,3%, dan Penyakit Digestif 4,7%.

Statistik Inferensia: Dominasi penyakit tidak menular (kardiovaskular + kanker + pernapasan = ~60%) mengindikasikan bahwa secara global, pola kematian telah bergeser dari penyakit infeksi ke penyakit kronis. Hal ini konsisten dengan teori transisi epidemiologi, di mana negara yang mengalami peningkatan kesejahteraan cenderung menghadapi beban penyakit tidak menular yang lebih besar. Bagi Indonesia, tren ini menjadi sinyal penting untuk memperkuat program pencegahan penyakit jantung dan kanker.

04

Bar Chart

Bar chart digunakan untuk membandingkan nilai antar kategori (variabel kategorik). Di sini kita membandingkan jumlah kematian akibat tiga penyebab utama berdasarkan region/benua pada tahun 2019.

Jumlah Kematian per Benua Berdasarkan Penyebab Utama (2019)
Perbandingan Kardiovaskular, Kanker, dan Infeksi Pernapasan antar wilayah
πŸ“Š Interpretasi Bar Chart

Statistik Deskriptif: Asia mendominasi jumlah kematian absolut di seluruh kategori penyakit β€” kardiovaskular (10,77 juta), kanker (5,57 juta), dan infeksi pernapasan (1,18 juta). Hal ini wajar mengingat Asia memiliki populasi terbesar dunia. Eropa menempati posisi kedua untuk kardiovaskular dan kanker, sementara Afrika menonjol untuk kematian akibat infeksi pernapasan relatif terhadap penyakit lainnya.

Statistik Inferensia: Perbedaan pola antar benua mencerminkan perbedaan faktor risiko, sistem kesehatan, dan tingkat pembangunan. Afrika memiliki beban infeksi yang proporsional lebih tinggi β€” mengindikasikan masih tingginya angka kematian akibat penyakit yang seharusnya dapat dicegah. Asia perlu mewaspadai lonjakan penyakit tidak menular seiring urbanisasi yang pesat. Temuan ini signifikan secara statistik mengingat perbedaan antar benua jauh melampaui variasi dalam satu benua.

05

Histogram

Histogram digunakan untuk menampilkan distribusi frekuensi data numerik kontinu. Data dibagi ke dalam kelas-kelas interval (bin) untuk menampilkan pola sebaran data.

Distribusi Kematian Akibat Kardiovaskular di Indonesia (1990–2019)
Frekuensi berdasarkan kelas interval jumlah kematian per tahun
πŸ“Š Interpretasi Histogram

Statistik Deskriptif: Distribusi kematian kardiovaskular di Indonesia selama 1990–2019 menunjukkan sebaran yang cukup merata di seluruh rentang nilai (278.302 – 651.481). Hal ini menggambarkan pertumbuhan yang konsisten dari tahun ke tahun. Mean = 452.900, Median = 447.747, menunjukkan distribusi yang hampir simetris (mendekati normal).

Statistik Inferensia: Distribusi yang mendekati seragam/uniform mengindikasikan bahwa kematian kardiovaskular di Indonesia meningkat secara linear dan konsisten tanpa adanya lonjakan atau penurunan drastis. Ini berbeda dari penyakit infeksi seperti TB yang menunjukkan tren penurunan. Jika tren ini berlanjut, diproyeksikan angka kematian kardiovaskular Indonesia akan terus meningkat β€” menjadikan penyakit jantung sebagai ancaman kesehatan publik nomor satu yang membutuhkan intervensi kebijakan segera.

06

Density Plot

Density plot (kurva kepadatan) merupakan versi halus dari histogram yang menggunakan Kernel Density Estimation (KDE) untuk memperlihatkan distribusi probabilitas kontinu dari data numerik.

Density Plot: Perbandingan Distribusi Penyebab Kematian di Indonesia (1990–2019)
Kurva KDE untuk 4 penyebab kematian utama β€” memperlihatkan bentuk distribusi masing-masing
πŸ“Š Interpretasi Density Plot

Statistik Deskriptif: Keempat penyebab kematian menunjukkan bentuk distribusi yang berbeda. Kardiovaskular memiliki distribusi lebar dan datar (platykurtic) β€” mencerminkan variasi besar antar tahun. Kanker menunjukkan distribusi yang lebih sempit. Tuberkulosis dan Road Injuries memiliki distribusi terpusat (leptokurtic) karena perubahan antar tahun yang relatif kecil.

Statistik Inferensia: Bentuk distribusi memberikan petunjuk tentang stabilitas dan prediktabilitas tren. Penyakit dengan distribusi sempit (TB, kecelakaan jalan) lebih mudah diprediksi, sementara kardiovaskular dengan distribusi lebar menunjukkan akselerasi pertumbuhan yang memerlukan pemodelan tren lebih lanjut. Diabetes menunjukkan distribusi right-skewed (menceng kanan), mengindikasikan lonjakan signifikan di periode terbaru β€” sinyal darurat epidemiologi.

07

Boxplot

Boxplot (box-and-whisker plot) menampilkan ringkasan statistik 5-nilai: minimum, Q1, median, Q3, dan maksimum. Sangat berguna untuk membandingkan distribusi dan mendeteksi outlier.

Boxplot: Distribusi Penyebab Kematian Utama di Indonesia (1990–2019)
Perbandingan sebaran Q1, Median, Q3, serta nilai minimum dan maksimum
πŸ“Š Interpretasi Boxplot

Statistik Deskriptif: Kardiovaskular memiliki box terlebar (IQR = Q3–Q1 = 565.573 – 342.414 = 223.159), menandakan variabilitas tinggi antar tahun. TB memiliki IQR paling sempit (117.586 – 92.813 = 24.773), artinya distribusinya sangat terpusat. Diabetes menunjukkan distribusi menceng ke kanan karena median (56.637) berada jauh di bawah Q3 (85.186).

Statistik Inferensia: Tidak ditemukan outlier pada semua variabel (semua nilai berada dalam rentang whisker), mengindikasikan tren yang konsisten tanpa kejadian luar biasa. IQR yang lebar pada kardiovaskular dan kanker mengkonfirmasi pertumbuhan yang akseleratif. Posisi median TB yang tinggi dibanding batas bawah box mengindikasikan distribusi left-skewed β€” angka TB tinggi di awal periode dan terus menurun, konsisten dengan keberhasilan program penanggulangan TB Indonesia.

08

Statistik Deskriptif Lengkap

Berikut adalah perhitungan lengkap ukuran statistik untuk lima variabel numerik kematian di Indonesia (1990–2019, n = 30 tahun).

Total Variabel
5
Penyebab kematian
Observasi
30
Tahun (1990–2019)
Negara Fokus
IDN
Indonesia
Skala Data
Rasio
Jumlah kematian
Statistik Kardiovaskular Kanker Tuberkulosis Kecelakaan Jalan Diabetes
Mean (Rata-rata)452.900155.756106.56744.18462.952
Median447.747152.240113.11844.91156.637
Modusβ€”*β€”*β€”*β€”*β€”*
Q1 (Kuartil 1)342.414121.91292.81338.00142.444
Q3 (Kuartil 3)565.573190.904117.58649.18885.186
IQR (Q3–Q1)223.15968.99224.77311.18742.742
Range (Maks–Min)373.179133.88851.46013.73173.114
Minimum278.30295.63676.54936.86633.219
Maksimum651.481229.524128.00950.597106.333
Varians14.328.860.1821.590.850.158240.525.79229.113.282564.279.824
Std. Deviasi (SD)119.70339.88615.5095.39623.755
CV (SD/Mean)26,4%25,6%14,5%12,2%37,7%

* Modus tidak bermakna pada data kontinu yang bersifat time-series karena setiap nilai cenderung unik. Pada konteks ini, modus dapat diinterpretasikan sebagai kelas interval dengan frekuensi tertinggi pada histogram.

Penjelasan Setiap Ukuran Statistik

UkuranDefinisiInterpretasi pada Data Ini
MeanRata-rata aritmetika seluruh nilaiRata-rata kematian kardiovaskular Indonesia selama 30 tahun = 452.900/tahun
MedianNilai tengah data terurut50% tahun memiliki kematian kardiovaskular di bawah 447.747
ModusNilai yang paling sering munculPada data kontinu time-series, menggunakan kelas modal histogram
Q1Persentil ke-2525% tahun terendah memiliki kematian kardiovaskular ≀342.414
Q3Persentil ke-7575% tahun memiliki kematian kardiovaskular ≀565.573
RangeSelisih nilai maks dan minRentang kematian kardiovaskular sepanjang 30 tahun = 373.179
VariansRata-rata kuadrat simpangan dari meanVarians tinggi β†’ data tersebar jauh dari rata-rata (pertumbuhan signifikan)
Std. DeviasiAkar varians; satuan sama dengan dataSD kardiovaskular = 119.703 β†’ tiap tahun rata-rata menyimpang 119.703 dari mean
πŸ’‘
Insight Kunci dari Statistik Deskriptif Diabetes memiliki Koefisien Variasi (CV) tertinggi (37,7%), artinya penyebaran relatif data diabetes paling besar β€” mencerminkan pertumbuhan yang semakin cepat di periode terakhir. TB sebaliknya memiliki CV terendah (14,5%) dengan tren penurunan yang stabil dan konsisten. Kardiovaskular dengan mean jauh lebih tinggi dari yang lain menjadi penyebab kematian paling dominan secara konsisten sepanjang periode analisis.