Pendahuluan

Industri perbankan saat ini menghadapi tantangan dalam meningkatkan jumlah nasabah yang menggunakan produk deposito berjangka. Deposito berjangka merupakan salah satu produk unggulan perbankan yang memberikan bunga lebih tinggi dibandingkan tabungan biasa, namun membutuhkan strategi pemasaran yang tepat untuk menarik minat nasabah. Bank-bank di Eropa, khususnya Portugal, sering melakukan kampanye telemarketing untuk menawarkan produk deposito berjangka kepada nasabahnya. Namun, efektivitas kampanye ini sangat bervariasi dan bergantung pada berbagai faktor seperti karakteristik nasabah, kondisi ekonomi makro, serta strategi komunikasi yang digunakan.

Analisis data menjadi kunci penting dalam memahami perilaku nasabah dan mengoptimalkan kampanye pemasaran. Visualisasi data berperan krusial dalam proses analisis karena mampu menyajikan informasi kompleks menjadi bentuk yang lebih mudah dipahami. Melalui visualisasi yang tepat, pola distribusi data, hubungan antar variabel, serta tren dari waktu ke waktu dapat diidentifikasi dengan lebih cepat dan akurat.

Dataset yang Digunakan

Dataset yang digunakan dalam proyek ini adalah Bank Marketing Dataset yang diperoleh dari UCI Machine Learning Repository. Dataset ini berisi data kampanye telemarketing yang dilakukan oleh sebuah bank Portugis untuk menawarkan produk deposito berjangka kepada nasabah. Periode pengumpulan data berlangsung dari Mei 2008 hingga November 2010.

Dataset ini memiliki dimensi awal sebanyak 41.188 observasi dengan 21 variabel. Setelah dilakukan penanganan data duplikat, jumlah observasi menjadi 41176. Variabel target (y) menunjukkan keputusan nasabah, apakah berlangganan deposito (“yes”) atau tidak (“no”).

Dalam visualisasi ini, kita akan fokus pada empat aspek utama: mengidentifikasi karakteristik nasabah, pola distribusi usia, hubungan antara durasi kontak dengan keberhasilan kampanye, serta tren kampanye dari waktu ke waktu.

Variabel yang Digunakan

Deskripsi Variabel yang Digunakan dalam Visualisasi
No Nama_Variabel Tipe_Data Peran_dalam_Analisis Visualisasi_ke Deskripsi
1 job Kategorik Variabel Prediktor Visualisasi 1 Jenis pekerjaan nasabah (12 kategori: admin., blue-collar, technician, services, management, retired, entrepreneur, self-employed, unemployed, student, housemaid, unknown)
2 age Numerik Kontinu Variabel Prediktor Visualisasi 2 Usia nasabah dalam tahun (rentang 17-98 tahun)
3 duration Numerik Kontinu Variabel Prediktor Visualisasi 3 Durasi kontak telemarketing dalam detik (rentang 0-4918 detik)
4 month Kategorik (Ordinal) Variabel Prediktor Visualisasi 4 & 5 Bulan pelaksanaan kontak terakhir (Jan s/d Dec)
5 y Kategorik (Biner) Variabel Target Seluruh Visualisasi Keputusan nasabah: yes (berlangganan) atau no (tidak berlangganan)

Untuk mendukung analisis yang lebih mendalam, dilakukan pembuatan variabel turunan sebagai berikut:

Tabel 2. Variabel Turunan dari Feature Engineering
No Nama_Variabel Variabel_Asal Metode_Pembuatan Kategori Tujuan
1 age_group age Pengelompokan usia ke dalam 6 kategori 18-25, 26-35, 36-45, 46-55, 56-65, 65+ Menganalisis pola usia secara kelompok
2 duration_group duration Pengelompokan durasi ke dalam 4 kategori Short (<100s), Medium (100-300s), Long (300-600s), Very Long (>600s) Menganalisis hubungan durasi dengan keberhasilan
Tabel 3. Distribusi Variabel Target (Keputusan Berlangganan Deposito)
Keputusan Jumlah Persentase
yes Berlangganan 4639 11.27%
no Tidak Berlangganan 36537 88.73%

Dari data di atas terlihat bahwa hanya 4639 nasabah yang bersedia berlangganan deposito, yang mengindikasikan adanya ketidakseimbangan kelas (imbalanced class) dalam dataset.


Analisis Visualisasi

Hubungan Pekerjaan dengan Keberhasilan Kampanye

Pertanyaan Analitis: Bagaimana karakteristik demografis nasabah berdasarkan pekerjaan dan hubungannya dengan tingkat keberhasilan kampanye?

Berdasarkan grafik di atas, terlihat bahwa nasabah dengan pekerjaan student, retired, dan unemployed menunjukkan persentase keberhasilan yang lebih tinggi (porsi warna hijau lebih besar) dibandingkan kategori lainnya. Keempat kategori pekerjaan dengan jumlah nasabah terbanyak adalah admin., blue-collar, technician, dan services. Dari segi proporsi keberhasilan, kelompok student dan retired cenderung lebih responsif terhadap penawaran deposito berjangka. Hal ini dapat dijelaskan oleh karakteristik kelompok ini yang mungkin memiliki lebih banyak waktu untuk mempertimbangkan penawaran atau memiliki kebutuhan menabung yang lebih tinggi untuk masa depan. Bank dapat melakukan segmentasi nasabah berdasarkan pekerjaan untuk mengoptimalkan alokasi sumber daya pemasaran, dengan memberikan prioritas pada kelompok pekerjaan yang menunjukkan potensi keberhasilan lebih tinggi.


Distribusi Usia Nasabah

Pertanyaan Analitis: Bagaimana pola distribusi usia nasabah dan hubungannya dengan keputusan berlangganan deposito berjangka?

Berdasarkan histogram di atas, terlihat bahwa distribusi usia nasabah secara keseluruhan cenderung simetris dengan puncak pada rentang usia 30-40 tahun. Nasabah dengan usia di bawah 25 tahun dan di atas 75 tahun memiliki jumlah yang relatif sedikit. Ketika membandingkan kedua kelompok, terlihat bahwa nasabah yang berlangganan deposito (warna hijau) memiliki proporsi yang lebih tinggi pada rentang usia 25-45 tahun dan 55-70 tahun dibandingkan kelompok yang tidak berlangganan. Hal ini menunjukkan adanya pola bimodal pada kelompok nasabah yang responsif terhadap penawaran deposito. Strategi komunikasi dan nilai yang ditawarkan perlu disesuaikan dengan karakteristik kebutuhan setiap kelompok usia.


Hubungan Durasi Kontak dengan Keberhasilan Kampanye

Pertanyaan Analitis: Apakah terdapat hubungan antara durasi kontak telemarketing dengan tingkat keberhasilan kampanye?

Grafik di atas menunjukkan pola yang sangat jelas bahwa semakin lama durasi kontak, semakin tinggi tingkat keberhasilan kampanye. Pada durasi Very Long (>600 detik), tingkat keberhasilan melonjak drastis menjadi hampir 50%, yang berarti hampir separuh nasabah yang diajak berbicara lebih dari 10 menit bersedia berlangganan deposito. Bank perlu melatih petugas telemarketing untuk tidak terburu-buru dalam melakukan penawaran dan memberikan ruang bagi nasabah untuk bertanya, karena investasi waktu yang lebih panjang terbukti meningkatkan peluang keberhasilan secara signifikan.


Tren Temporal Keberhasilan Kampanye

Pertanyaan Analitis: Bagaimana tren tingkat keberhasilan kampanye deposito berjangka dari waktu ke waktu (per bulan)?

Line chart di atas menunjukkan bahwa tingkat keberhasilan kampanye mengalami fluktuasi yang cukup signifikan antar bulan, Tingkat keberhasilan tertinggi terjadi di Bulan Maret (Mar) dan Tingkat keberhasilan terendah terjadi di Bulan Mei (May). Garis putus-putus merah menunjukkan rata-rata tingkat keberhasilan keseluruhan sebesar r round(avg_rate, 1)%. Pola musiman ini dapat digunakan untuk menentukan waktu yang tepat dalam melakukan kampanye pemasaran.


Distribusi Hasil Kampanye per Bulan

Pertanyaan Analitis: Bagaimana distribusi absolut jumlah kontak dan keberhasilan kampanye di setiap bulan?

Stacked Bar Chart di atas mengungkapkan adanya ketidakefisienan yang signifikan dalam alokasi sumber daya kampanye, dimana bulan mei jumlah kontak yang dihubungi lebih banyak tetapi tingkat keberhasilannya rendah sementara di bulan maret jumlah kontak yang dihubungi lebih sedikit tetapi tingkat keberhasilannya paling tinggi. Upaya pemasaran terbesar justru dilakukan pada periode dengan potensi keberhasilan paling kecil (bulan Mei), Periode dengan potensi keberhasilan tinggi (bulan Maret) mendapatkan alokasi sumber daya yang minimal, Hal ini menunjukkan strategi kampanye lebih berorientasi pada target volume panggilan tanpa mempertimbangkan faktor musiman. Bank perlu melakukan penyesuaian jadwal kampanye dengan mengalokasikan lebih banyak sumber daya pada bulan-bulan dengan potensi keberhasilan tinggi serta mengurangi intensitas kampanye pada bulan-bulan dengan tingkat keberhasilan rendah.

Insight dan Temuan Utama

Karakteristik Nasabah Responsif

Nasabah dengan latar belakang pekerjaan student dan retired menunjukkan tingkat keberhasilan yang lebih tinggi dibandingkan kelompok pekerjaan lainnya. Dari perspektif usia, terdapat pola bimodal pada kelompok responsif yaitu usia 25-45 tahun dan 55-70 tahun.

Durasi Komunikasi sebagai Kunci Keberhasilan

Terdapat hubungan positif yang sangat kuat antara durasi kontak dan tingkat keberhasilan. Durasi kontak lebih dari 600 detik (10 menit) menghasilkan tingkat keberhasilan hingga ~48.6% atau hampir 50%.

Pola Musiman Keberhasilan Kampanye

Tingkat keberhasilan kampanye menunjukkan variasi musiman yang signifikan. Menariknya, jumlah kontak tertinggi justru dilakukan pada bulan dengan tingkat keberhasilan terendah, menunjukkan adanya inefisiensi alokasi sumber daya.

Kesimpulan

Berdasarkan analisis visualisasi data pada kampanye telemarketing deposito berjangka, dapat disimpulkan bahwa Karakteristik nasabah memiliki peran penting dalam menentukan keberhasilan kampanye. Nasabah dengan pekerjaan student dan retired serta rentang usia muda (25-45 tahun) dan usia pra-pensiun (55-70 tahun) menunjukkan respons yang lebih baik. Durasi komunikasi merupakan faktor krusial dengan hubungan positif yang sangat kuat. Durasi kontak yang lebih panjang terbukti meningkatkan peluang keberhasilan secara signifikan. Faktor temporal menunjukkan pola musiman yang jelas. Terdapat inefisiensi alokasi sumber daya di mana upaya pemasaran terbesar justru dilakukan pada periode dengan potensi keberhasilan paling kecil.