Industri perbankan saat ini menghadapi tantangan dalam meningkatkan jumlah nasabah yang menggunakan produk deposito berjangka. Deposito berjangka merupakan salah satu produk unggulan perbankan yang memberikan bunga lebih tinggi dibandingkan tabungan biasa, namun membutuhkan strategi pemasaran yang tepat untuk menarik minat nasabah. Bank-bank di Eropa, khususnya Portugal, sering melakukan kampanye telemarketing untuk menawarkan produk deposito berjangka kepada nasabahnya. Namun, efektivitas kampanye ini sangat bervariasi dan bergantung pada berbagai faktor seperti karakteristik nasabah, kondisi ekonomi makro, serta strategi komunikasi yang digunakan.
Analisis data menjadi kunci penting dalam memahami perilaku nasabah dan mengoptimalkan kampanye pemasaran. Visualisasi data berperan krusial dalam proses analisis karena mampu menyajikan informasi kompleks menjadi bentuk yang lebih mudah dipahami. Melalui visualisasi yang tepat, pola distribusi data, hubungan antar variabel, serta tren dari waktu ke waktu dapat diidentifikasi dengan lebih cepat dan akurat.
Dataset yang digunakan dalam proyek ini adalah Bank Marketing Dataset yang diperoleh dari UCI Machine Learning Repository. Dataset ini berisi data kampanye telemarketing yang dilakukan oleh sebuah bank Portugis untuk menawarkan produk deposito berjangka kepada nasabah. Periode pengumpulan data berlangsung dari Mei 2008 hingga November 2010.
Dataset ini memiliki dimensi awal sebanyak 41.188 observasi dengan 21 variabel. Setelah dilakukan penanganan data duplikat, jumlah observasi menjadi 41176. Variabel target (y) menunjukkan keputusan nasabah, apakah berlangganan deposito (“yes”) atau tidak (“no”).
Dalam visualisasi ini, kita akan fokus pada empat aspek utama: mengidentifikasi karakteristik nasabah, pola distribusi usia, hubungan antara durasi kontak dengan keberhasilan kampanye, serta tren kampanye dari waktu ke waktu.
| No | Nama_Variabel | Tipe_Data | Peran_dalam_Analisis | Visualisasi_ke | Deskripsi |
|---|---|---|---|---|---|
| 1 | job | Kategorik | Variabel Prediktor | Visualisasi 1 | Jenis pekerjaan nasabah (12 kategori: admin., blue-collar, technician, services, management, retired, entrepreneur, self-employed, unemployed, student, housemaid, unknown) |
| 2 | age | Numerik Kontinu | Variabel Prediktor | Visualisasi 2 | Usia nasabah dalam tahun (rentang 17-98 tahun) |
| 3 | duration | Numerik Kontinu | Variabel Prediktor | Visualisasi 3 | Durasi kontak telemarketing dalam detik (rentang 0-4918 detik) |
| 4 | month | Kategorik (Ordinal) | Variabel Prediktor | Visualisasi 4 & 5 | Bulan pelaksanaan kontak terakhir (Jan s/d Dec) |
| 5 | y | Kategorik (Biner) | Variabel Target | Seluruh Visualisasi | Keputusan nasabah: yes (berlangganan) atau no (tidak berlangganan) |
Untuk mendukung analisis yang lebih mendalam, dilakukan pembuatan variabel turunan sebagai berikut:
| No | Nama_Variabel | Variabel_Asal | Metode_Pembuatan | Kategori | Tujuan |
|---|---|---|---|---|---|
| 1 | age_group | age | Pengelompokan usia ke dalam 6 kategori | 18-25, 26-35, 36-45, 46-55, 56-65, 65+ | Menganalisis pola usia secara kelompok |
| 2 | duration_group | duration | Pengelompokan durasi ke dalam 4 kategori | Short (<100s), Medium (100-300s), Long (300-600s), Very Long (>600s) | Menganalisis hubungan durasi dengan keberhasilan |
| Keputusan | Jumlah | Persentase | |
|---|---|---|---|
| yes | Berlangganan | 4639 | 11.27% |
| no | Tidak Berlangganan | 36537 | 88.73% |
Dari data di atas terlihat bahwa hanya 4639 nasabah yang bersedia berlangganan deposito, yang mengindikasikan adanya ketidakseimbangan kelas (imbalanced class) dalam dataset.
Pertanyaan Analitis: Bagaimana karakteristik demografis nasabah berdasarkan pekerjaan dan hubungannya dengan tingkat keberhasilan kampanye?
Berdasarkan grafik di atas, terlihat bahwa nasabah dengan pekerjaan student, retired, dan unemployed menunjukkan persentase keberhasilan yang lebih tinggi (porsi warna hijau lebih besar) dibandingkan kategori lainnya. Keempat kategori pekerjaan dengan jumlah nasabah terbanyak adalah admin., blue-collar, technician, dan services. Dari segi proporsi keberhasilan, kelompok student dan retired cenderung lebih responsif terhadap penawaran deposito berjangka. Hal ini dapat dijelaskan oleh karakteristik kelompok ini yang mungkin memiliki lebih banyak waktu untuk mempertimbangkan penawaran atau memiliki kebutuhan menabung yang lebih tinggi untuk masa depan. Bank dapat melakukan segmentasi nasabah berdasarkan pekerjaan untuk mengoptimalkan alokasi sumber daya pemasaran, dengan memberikan prioritas pada kelompok pekerjaan yang menunjukkan potensi keberhasilan lebih tinggi.
Pertanyaan Analitis: Bagaimana pola distribusi usia nasabah dan hubungannya dengan keputusan berlangganan deposito berjangka?
Berdasarkan histogram di atas, terlihat bahwa distribusi usia nasabah secara keseluruhan cenderung simetris dengan puncak pada rentang usia 30-40 tahun. Nasabah dengan usia di bawah 25 tahun dan di atas 75 tahun memiliki jumlah yang relatif sedikit. Ketika membandingkan kedua kelompok, terlihat bahwa nasabah yang berlangganan deposito (warna hijau) memiliki proporsi yang lebih tinggi pada rentang usia 25-45 tahun dan 55-70 tahun dibandingkan kelompok yang tidak berlangganan. Hal ini menunjukkan adanya pola bimodal pada kelompok nasabah yang responsif terhadap penawaran deposito. Strategi komunikasi dan nilai yang ditawarkan perlu disesuaikan dengan karakteristik kebutuhan setiap kelompok usia.
Pertanyaan Analitis: Apakah terdapat hubungan antara durasi kontak telemarketing dengan tingkat keberhasilan kampanye?
Grafik di atas menunjukkan pola yang sangat jelas bahwa semakin lama durasi kontak, semakin tinggi tingkat keberhasilan kampanye. Pada durasi Very Long (>600 detik), tingkat keberhasilan melonjak drastis menjadi hampir 50%, yang berarti hampir separuh nasabah yang diajak berbicara lebih dari 10 menit bersedia berlangganan deposito. Bank perlu melatih petugas telemarketing untuk tidak terburu-buru dalam melakukan penawaran dan memberikan ruang bagi nasabah untuk bertanya, karena investasi waktu yang lebih panjang terbukti meningkatkan peluang keberhasilan secara signifikan.
Pertanyaan Analitis: Bagaimana tren tingkat keberhasilan kampanye deposito berjangka dari waktu ke waktu (per bulan)?
Line chart di atas menunjukkan bahwa tingkat keberhasilan kampanye mengalami fluktuasi yang cukup signifikan antar bulan, Tingkat keberhasilan tertinggi terjadi di Bulan Maret (Mar) dan Tingkat keberhasilan terendah terjadi di Bulan Mei (May). Garis putus-putus merah menunjukkan rata-rata tingkat keberhasilan keseluruhan sebesar r round(avg_rate, 1)%. Pola musiman ini dapat digunakan untuk menentukan waktu yang tepat dalam melakukan kampanye pemasaran.
Pertanyaan Analitis: Bagaimana distribusi absolut jumlah kontak dan keberhasilan kampanye di setiap bulan?
Stacked Bar Chart di atas mengungkapkan adanya ketidakefisienan yang signifikan dalam alokasi sumber daya kampanye, dimana bulan mei jumlah kontak yang dihubungi lebih banyak tetapi tingkat keberhasilannya rendah sementara di bulan maret jumlah kontak yang dihubungi lebih sedikit tetapi tingkat keberhasilannya paling tinggi. Upaya pemasaran terbesar justru dilakukan pada periode dengan potensi keberhasilan paling kecil (bulan Mei), Periode dengan potensi keberhasilan tinggi (bulan Maret) mendapatkan alokasi sumber daya yang minimal, Hal ini menunjukkan strategi kampanye lebih berorientasi pada target volume panggilan tanpa mempertimbangkan faktor musiman. Bank perlu melakukan penyesuaian jadwal kampanye dengan mengalokasikan lebih banyak sumber daya pada bulan-bulan dengan potensi keberhasilan tinggi serta mengurangi intensitas kampanye pada bulan-bulan dengan tingkat keberhasilan rendah.
Nasabah dengan latar belakang pekerjaan student dan retired menunjukkan tingkat keberhasilan yang lebih tinggi dibandingkan kelompok pekerjaan lainnya. Dari perspektif usia, terdapat pola bimodal pada kelompok responsif yaitu usia 25-45 tahun dan 55-70 tahun.
Terdapat hubungan positif yang sangat kuat antara durasi kontak dan tingkat keberhasilan. Durasi kontak lebih dari 600 detik (10 menit) menghasilkan tingkat keberhasilan hingga ~48.6% atau hampir 50%.
Tingkat keberhasilan kampanye menunjukkan variasi musiman yang signifikan. Menariknya, jumlah kontak tertinggi justru dilakukan pada bulan dengan tingkat keberhasilan terendah, menunjukkan adanya inefisiensi alokasi sumber daya.