Setidaknya ada tiga fenomena matematis - statistik yang saya selalu kagumi di dunia ini:
Pada saat sahur di hari terakhir puasa kemarin, saya menonton Docuseries di Netflix berjudul Connected. Pada salah satu episode berjudul Codes, saya dikenalkan kepada salah satu fenomena matematis lainnya bernama: Benford’s Law atau yang biasa dikenal sebagai First-Digit Law.
Ini bukanlah sebuah cocoklogi karena statusnya adalah LAW alias hukum dalam science.
Jadi setara dengan hukum-hukum lainnya seperti Hukum Newton, Hukum Keppler, Hukum Gravitasi, dst.
Apa sih isinya?
Jadi jika kita memiliki suatu kumpulan data angka dan mengambil hanya digit pertamanya saja, maka sebaran dari frekuensi digit pertama tersebut akan mengikuti Benford’s Law.
Lantas apa kegunaan dari hukum ini? Mulai dari menemukan fraud di perpajakan sampai mengecek keaslian suatu gambar.
Penasaran dengan hukum tersebut, sekarang saya akan mengecek dengan data-data yang tersedia di publik. Apakah benar Benford’s Law berlaku atau tidak.
Bagaimana caranya?
Simpel, saya cukup menghitung frekuensi dari first digit saja.
Pertama-tama, saya mengambil data populasi penduduk per negara di dunia dari situs worldometers. Ada 235 negara yang ada pada data tersebut. Berikut adalah contoh 20 data negara dengan populasi terbanyak:
| # | Country (or dependency) | Population (2020) | Yearly Change | Net Change | Density (P/Km²) | Land Area (Km²) | Migrants (net) | Fert. Rate | Med. Age | Urban Pop % | World Share |
|---|---|---|---|---|---|---|---|---|---|---|---|
| 1 | China | 1,439,323,776 | 0.39 % | 5,540,090 | 153 | 9,388,211 | -348,399 | 1.7 | 38 | 61 % | 18.47 % |
| 2 | India | 1,380,004,385 | 0.99 % | 13,586,631 | 464 | 2,973,190 | -532,687 | 2.2 | 28 | 35 % | 17.70 % |
| 3 | United States | 331,002,651 | 0.59 % | 1,937,734 | 36 | 9,147,420 | 954,806 | 1.8 | 38 | 83 % | 4.25 % |
| 4 | Indonesia | 273,523,615 | 1.07 % | 2,898,047 | 151 | 1,811,570 | -98,955 | 2.3 | 30 | 56 % | 3.51 % |
| 5 | Pakistan | 220,892,340 | 2.00 % | 4,327,022 | 287 | 770,880 | -233,379 | 3.6 | 23 | 35 % | 2.83 % |
| 6 | Brazil | 212,559,417 | 0.72 % | 1,509,890 | 25 | 8,358,140 | 21,200 | 1.7 | 33 | 88 % | 2.73 % |
| 7 | Nigeria | 206,139,589 | 2.58 % | 5,175,990 | 226 | 910,770 | -60,000 | 5.4 | 18 | 52 % | 2.64 % |
| 8 | Bangladesh | 164,689,383 | 1.01 % | 1,643,222 | 1,265 | 130,170 | -369,501 | 2.1 | 28 | 39 % | 2.11 % |
| 9 | Russia | 145,934,462 | 0.04 % | 62,206 | 9 | 16,376,870 | 182,456 | 1.8 | 40 | 74 % | 1.87 % |
| 10 | Mexico | 128,932,753 | 1.06 % | 1,357,224 | 66 | 1,943,950 | -60,000 | 2.1 | 29 | 84 % | 1.65 % |
| 11 | Japan | 126,476,461 | -0.30 % | -383,840 | 347 | 364,555 | 71,560 | 1.4 | 48 | 92 % | 1.62 % |
| 12 | Ethiopia | 114,963,588 | 2.57 % | 2,884,858 | 115 | 1,000,000 | 30,000 | 4.3 | 19 | 21 % | 1.47 % |
| 13 | Philippines | 109,581,078 | 1.35 % | 1,464,463 | 368 | 298,170 | -67,152 | 2.6 | 26 | 47 % | 1.41 % |
| 14 | Egypt | 102,334,404 | 1.94 % | 1,946,331 | 103 | 995,450 | -38,033 | 3.3 | 25 | 43 % | 1.31 % |
| 15 | Vietnam | 97,338,579 | 0.91 % | 876,473 | 314 | 310,070 | -80,000 | 2.1 | 32 | 38 % | 1.25 % |
| 16 | DR Congo | 89,561,403 | 3.19 % | 2,770,836 | 40 | 2,267,050 | 23,861 | 6.0 | 17 | 46 % | 1.15 % |
| 17 | Turkey | 84,339,067 | 1.09 % | 909,452 | 110 | 769,630 | 283,922 | 2.1 | 32 | 76 % | 1.08 % |
| 18 | Iran | 83,992,949 | 1.30 % | 1,079,043 | 52 | 1,628,550 | -55,000 | 2.2 | 32 | 76 % | 1.08 % |
| 19 | Germany | 83,783,942 | 0.32 % | 266,897 | 240 | 348,560 | 543,822 | 1.6 | 46 | 76 % | 1.07 % |
| 20 | Thailand | 69,799,978 | 0.25 % | 174,396 | 137 | 510,890 | 19,444 | 1.5 | 40 | 51 % | 0.90 % |
20 Data Negara dengan Populasi Terbanyak
Jika saya hitung first digit dari angka populasi pernegara, lalu saya hitung frekuensinya. Saya dapatkan grafik sebagai berikut:
Ternyata hasilnya mengagetkan! Temuan saya tersebut hampir menyerupai Benford’s Law.
Sekarang saya coba iseng menggunakan data luas area setiap negara yang ada di atas. Jika saya hitung first digit dari angka populasi pernegara, lalu saya hitung frekuensinya. Saya dapatkan grafik sebagai berikut:
Ternyata data luas area setiap negara mengikuti Benford’s Law.
Saya masih penasaran, kenapa kedua data di atas mengikuti Benford’s Law? Apakah ini kesengajaan? Hehehe.
Sekarang saya akan gunakan data Covid 19 yang dihimpun di situs Wikipedia berikut. Per 16 Mei 2021 pukul 11:00 WIB, ada 242 baris data per negara.
Saya akan mencoba mengecek apakah data confirmed case per negara mengikuti Benford’s Law?
Ternyata data Covid 19 confirmed cases hampir mengikuti Benford’s Law.
Bagaimana dengan data kematian akibat Covid 19?
Ternyata data Covid 19 deaths hampir mengikuti Benford’s Law.
Kali ini saya mau menggunakan data lokal di Indonesia, yakni data hasil pemilu presiden 2019 yang direkap di situs KPU.
Saya akan menggunakan data hitung suara untuk kedua pasangan calon presiden yang berkontestasi pada saat itu. Bagaimana hasilnya?
Ternyata hasilnya juga mendekati Benford’s Law.
Tahun lalu, saya sempat mendapatkan data sales produk-produk yang dijual di salah satu retail yang dimiliki bersama oleh beberapa teman saya. Karena penasaran, saya coba cek data harga semua barang-barang yang ditransaksikan selama bulan Januari 2020. Apakah memenuhi Benford’s Law atau tidak?
Sekali lagi, data harga ternyata hampir mengikuti Benford’s Law.
Begitu pula dengan data total transaksi per konsumen, saya dapatkan:
Dari penjelasan yang saya dapatkan, jika kita memiliki suatu data yang tidak mengikuti Benford’s Law, maka bisa jadi data tersebut sudah pernah dimodifikasi sebelumnya. Kelak ini yang akan dijadikan salah satu indikasi terjadinya fraud.
Bagaimana cara melihat indikasinya? Teman-teman coba tonton saja docuseries-nya di Netflix lalu perhatikan saat sang narasumber menjelaskan bagaimana menentukan foto fake menggunakan Benford’s Law. Setelah itu, dari grafik-grafik di atas, kira-kira mana yang bisa kita indikasikan adanya modifikasi pada data?
Sebagai penutup rasa penasaran saya, saya mau mencoba apakah jumlah ayat dalam Al Qur’an juga memenuhi Benford’s Law?
Mengambil sumber dari rekapan blog berikut ini, saya coba menghitungnya:
MasyaAllah ternyata hampir mengikuti Benford’s Law.
Notes:
Berhubung Github Pages sedang error, maka saya publish artikel ini di Rpubs. Jangan lupa untuk mengunjungi blog saya di: ikanx101.com. Terima kasih.