Deposito berjangka merupakan sumber pendapatan utama bagi sebuah bank. Deposito berjangka adalah investasi tunai yang diadakan oleh sebuah lembaga keuangan. Uang Anda diinvestasikan untuk tingkat bunga yang disepakati selama jangka waktu tertentu. Untuk menarik lebih banyak nasabah untuk mengambil deposito berjangka, bank memiliki berbagai rencana sosialisasi/kampanye untuk menjual deposito berjangka kepada nasabah mereka seperti pemasaran email, iklan, pemasaran melalui telepon, dan pemasaran digital.
Kampanye pemasaran melalui telepon masih tetap menjadi salah satu cara paling efektif untuk menjangkau nasabah. Namun, bank membutuhkan pengeluaran dana yang lebih besar dengan cara tersebut untuk melaksanakan kampanye ini. Oleh karena itu, sangat penting untuk mengidentifikasi pelanggan yang kemungkinan besar akan mengambil deposito berjangka terlebih dahulu sehingga mereka dapat ditargetkan secara khusus melalui panggilan.
Dalam pembahasan kali ini, data yang akan digunakan terkait dengan data kampanye pemasaran langsung dari salah satu lembaga perbankan Portugis. Kampanye pemasaran didasarkan pada panggilan telepon yang dilakukan bank ke nasabahnya.
Objektif:
Sebelum menganalisa dataset, kita akan memanggil dataset bank dari
bank-full.csv dan disimpan kedalam object bernama
bank, kemudian akan dilakukan Exploratory Data Analyst
terhadap dataset bank tersebut.
bank <- read.csv("data_input/bank-full.csv", sep=";")Pertama kita akan memanggil library yang dibutuhkan,
karena kita akan melakukan sedikit visualisasi data agar data mudah di
lihat, maka kita akan menggunkan library yang dibutuhkan.
library(ggplot2)Selanjutnya kita akan melihat dataset yang sudah kita panggil,
gunakan head untuk melihat 6 baris pertama.
head(bank)Dari inspeksi data yang dilakukan terdapat beberapa kolom yang memiliki deskripsi sebagai berikut:
Informasi Nasabah:
age - umur nasabahjob - pekerjaan nasabahmarital- status pernikahan nasabaheducation - tingkat pendidikan nasabahdefault - apakah nasabah memiliki kredit macet?balance - rata-rata saldo nasabah per tahun, dalam
satuan eurohousing - apakah nasabah memiliki pinjaman rumah?loan - apakah nasabah memiliki pinjaman pribadi?Informasi terkait kontak terakhir nasabah selama kampanye pemasaran saat ini:
contact - Bentuk komunikasimonth - Bulanday - Tanggal dimana nasabah dihubungiduration - Lama durasi ketika nasabah dihubungi (dalam
satuan detik)Atribut Lain-Lain:
campaign - Jumlah kampanye pemasaran yang pernah
diikuti nasabah sebelumnyapdays - jumlah hari yang berlalu setelah nasabah
terakhir kali dihubungi dari kampanye sebelumnyaprevious - jumlah kontak yang dilakukan ke nasabah
sebelum kampanye ini.poutcome - hasil kampanye pemasaran sebelumnya pada
nasabah yang menikuti kampanye kali iniVariabel output:
y: apakah klien sudah berlangganan deposito berjangka?
(ya/tidak)Melakukan inspeksi tipe data, untuk memastikan tipe data dari setiap kolomnya sudah sesuai.
str(bank)#> 'data.frame': 45211 obs. of 17 variables:
#> $ age : int 58 44 33 47 33 35 28 42 58 43 ...
#> $ job : chr "management" "technician" "entrepreneur" "blue-collar" ...
#> $ marital : chr "married" "single" "married" "married" ...
#> $ education: chr "tertiary" "secondary" "secondary" "unknown" ...
#> $ default : chr "no" "no" "no" "no" ...
#> $ balance : int 2143 29 2 1506 1 231 447 2 121 593 ...
#> $ housing : chr "yes" "yes" "yes" "yes" ...
#> $ loan : chr "no" "no" "yes" "no" ...
#> $ contact : chr "unknown" "unknown" "unknown" "unknown" ...
#> $ day : int 5 5 5 5 5 5 5 5 5 5 ...
#> $ month : chr "may" "may" "may" "may" ...
#> $ duration : int 261 151 76 92 198 139 217 380 50 55 ...
#> $ campaign : int 1 1 1 1 1 1 1 1 1 1 ...
#> $ pdays : int -1 -1 -1 -1 -1 -1 -1 -1 -1 -1 ...
#> $ previous : int 0 0 0 0 0 0 0 0 0 0 ...
#> $ poutcome : chr "unknown" "unknown" "unknown" "unknown" ...
#> $ y : chr "no" "no" "no" "no" ...
Selanjutnya, mengecek nilai unik di setiap kolom untuk membantu dalam
penentuan tipe data terutama tipe data kategorik/factor. Karena ingin
mengecek semua kolomnya sekaligus maka digunakan perintah
lapply().
lengths(lapply(bank, unique))#> age job marital education default balance housing loan
#> 77 12 3 4 2 7168 2 2
#> contact day month duration campaign pdays previous poutcome
#> 3 31 12 1573 48 559 41 4
#> y
#> 2
Selanjutnya, karena terdapat beberapa kolom yang akan diubah secara
bersamaan ke tipe data factor maka bisa menggunakan function
lapply() dan as.factor untuk setiap kolom yang
akan diubah ke factor.
# Membuat daftar kolom yang akan diubah tipe datanya
columns <- c("job","marital","education","default","housing","loan","contact","day","month","poutcome","y")
# Masukkan variable columns ke function lapply()
bank[,columns] <- lapply(bank[,columns], as.factor)Kemudian, mengecek kembali tipe data apakah sudah sesuai.
str(bank)#> 'data.frame': 45211 obs. of 17 variables:
#> $ age : int 58 44 33 47 33 35 28 42 58 43 ...
#> $ job : Factor w/ 12 levels "admin.","blue-collar",..: 5 10 3 2 12 5 5 3 6 10 ...
#> $ marital : Factor w/ 3 levels "divorced","married",..: 2 3 2 2 3 2 3 1 2 3 ...
#> $ education: Factor w/ 4 levels "primary","secondary",..: 3 2 2 4 4 3 3 3 1 2 ...
#> $ default : Factor w/ 2 levels "no","yes": 1 1 1 1 1 1 1 2 1 1 ...
#> $ balance : int 2143 29 2 1506 1 231 447 2 121 593 ...
#> $ housing : Factor w/ 2 levels "no","yes": 2 2 2 2 1 2 2 2 2 2 ...
#> $ loan : Factor w/ 2 levels "no","yes": 1 1 2 1 1 1 2 1 1 1 ...
#> $ contact : Factor w/ 3 levels "cellular","telephone",..: 3 3 3 3 3 3 3 3 3 3 ...
#> $ day : Factor w/ 31 levels "1","2","3","4",..: 5 5 5 5 5 5 5 5 5 5 ...
#> $ month : Factor w/ 12 levels "apr","aug","dec",..: 9 9 9 9 9 9 9 9 9 9 ...
#> $ duration : int 261 151 76 92 198 139 217 380 50 55 ...
#> $ campaign : int 1 1 1 1 1 1 1 1 1 1 ...
#> $ pdays : int -1 -1 -1 -1 -1 -1 -1 -1 -1 -1 ...
#> $ previous : int 0 0 0 0 0 0 0 0 0 0 ...
#> $ poutcome : Factor w/ 4 levels "failure","other",..: 4 4 4 4 4 4 4 4 4 4 ...
#> $ y : Factor w/ 2 levels "no","yes": 1 1 1 1 1 1 1 1 1 1 ...
Karena urutan factor untuk kolom month dan
day_of_week belum terurut, pertama akan diurutkan
kolom-kolom tersebut:
bank$month <- ordered(bank$month, c("jan","feb","mar","apr","may","jun","jul","aug","sep","oct","nov","dec"))
levels(bank$month)#> [1] "jan" "feb" "mar" "apr" "may" "jun" "jul" "aug" "sep" "oct" "nov" "dec"
bank$day <- ordered(bank$day, c(1:31))
levels(bank$day)#> [1] "1" "2" "3" "4" "5" "6" "7" "8" "9" "10" "11" "12" "13" "14" "15"
#> [16] "16" "17" "18" "19" "20" "21" "22" "23" "24" "25" "26" "27" "28" "29" "30"
#> [31] "31"
Mengecek apakah terdapat data yang memiliki kesamaan nilai atau duplikat.
#cek duplicate
sum(duplicated(bank))#> [1] 0
Karena tidak terdapat data duplicate, maka selanjutnya cek apakah terdapat missing values.
colSums(is.na(bank))#> age job marital education default balance housing loan
#> 0 0 0 0 0 0 0 0
#> contact day month duration campaign pdays previous poutcome
#> 0 0 0 0 0 0 0 0
#> y
#> 0
Ternyata tidak terdapat kolom yang mengandung missing values.
Kemudian melakukan summary untuk melihat secara singkat informasi yang terkandung di dalam dataframe dan melihat apakah ada kejanggalan data terutama di data yang bertipe numerik.
summary(bank)#> age job marital education
#> Min. :18.00 blue-collar:9732 divorced: 5207 primary : 6851
#> 1st Qu.:33.00 management :9458 married :27214 secondary:23202
#> Median :39.00 technician :7597 single :12790 tertiary :13301
#> Mean :40.94 admin. :5171 unknown : 1857
#> 3rd Qu.:48.00 services :4154
#> Max. :95.00 retired :2264
#> (Other) :6835
#> default balance housing loan contact
#> no :44396 Min. : -8019 no :20081 no :37967 cellular :29285
#> yes: 815 1st Qu.: 72 yes:25130 yes: 7244 telephone: 2906
#> Median : 448 unknown :13020
#> Mean : 1362
#> 3rd Qu.: 1428
#> Max. :102127
#>
#> day month duration campaign
#> 20 : 2752 may :13766 Min. : 0.0 Min. : 1.000
#> 18 : 2308 jul : 6895 1st Qu.: 103.0 1st Qu.: 1.000
#> 21 : 2026 aug : 6247 Median : 180.0 Median : 2.000
#> 17 : 1939 jun : 5341 Mean : 258.2 Mean : 2.764
#> 6 : 1932 nov : 3970 3rd Qu.: 319.0 3rd Qu.: 3.000
#> 5 : 1910 apr : 2932 Max. :4918.0 Max. :63.000
#> (Other):32344 (Other): 6060
#> pdays previous poutcome y
#> Min. : -1.0 Min. : 0.0000 failure: 4901 no :39922
#> 1st Qu.: -1.0 1st Qu.: 0.0000 other : 1840 yes: 5289
#> Median : -1.0 Median : 0.0000 success: 1511
#> Mean : 40.2 Mean : 0.5803 unknown:36959
#> 3rd Qu.: -1.0 3rd Qu.: 0.0000
#> Max. :871.0 Max. :275.0000
#>
Dari Summary dapat ditarik informasi sebagai berikut: Selama campaign yang dilakukan bank, data karakteristik nasabah yang mengikuti campaign sebagai berikut:
Kita akan melakukan Exploratory Data Analysis terhadap setiap kolomnya.
Pertama akan dilihat secara singkat isi dataframe dengan menggunakan
perintah head:
head(bank)Karena tujuan kita ingin mengetahui banyaknya nasabah yang mengambil
deposito dan tidak mengambil selama kampanye berlangsung, maka kita akan
menggunakan perintah table untuk melihat proporsi
datanya.
table(bank$y)#>
#> no yes
#> 39922 5289
round(prop.table(table(bank$y))*100,1)#>
#> no yes
#> 88.3 11.7
Dari total data yang ada, hanya 11.7% (5289) nasabah yang melakukan investasi deposito dalam hal ini kesuksesan kampanye yang dilakukan oleh bank sebesar 11.7%
Selanjutnya kita akan meninjau setiap variabel yang ada di dataframe untuk mengetahui karakteristik seperti apa nasabah yang cenderung melakukan deposito.
Melakukan pengecekan distribusi umur pada nasabah:
table(bank$age,bank$y)#>
#> no yes
#> 18 5 7
#> 19 24 11
#> 20 35 15
#> 21 57 22
#> 22 89 40
#> 23 158 44
#> 24 234 68
#> 25 414 113
#> 26 671 134
#> 27 768 141
#> 28 876 162
#> 29 1014 171
#> 30 1540 217
#> 31 1790 206
#> 32 1864 221
#> 33 1762 210
#> 34 1732 198
#> 35 1685 209
#> 36 1611 195
#> 37 1526 170
#> 38 1322 144
#> 39 1344 143
#> 40 1239 116
#> 41 1171 120
#> 42 1131 111
#> 43 1058 103
#> 44 1043 93
#> 45 1110 106
#> 46 1057 118
#> 47 975 113
#> 48 915 82
#> 49 893 101
#> 50 867 72
#> 51 859 77
#> 52 826 85
#> 53 806 85
#> 54 727 84
#> 55 730 76
#> 56 710 68
#> 57 750 78
#> 58 668 72
#> 59 682 88
#> 60 498 98
#> 61 90 57
#> 62 41 39
#> 63 47 30
#> 64 39 35
#> 65 38 21
#> 66 39 24
#> 67 31 23
#> 68 15 21
#> 69 27 17
#> 70 50 17
#> 71 29 25
#> 72 28 24
#> 73 20 24
#> 74 24 13
#> 75 24 15
#> 76 16 16
#> 77 22 22
#> 78 16 14
#> 79 15 10
#> 80 19 12
#> 81 11 6
#> 82 11 8
#> 83 16 6
#> 84 4 5
#> 85 1 4
#> 86 5 4
#> 87 1 3
#> 88 2 0
#> 89 3 0
#> 90 0 2
#> 92 0 2
#> 93 0 2
#> 94 1 0
#> 95 1 1
Untuk melihat lebih jelas umur nasabah berpusat di umur berapa, kita
akan memvisualisasikannya dengan plot boxplot.
plot(bank$y, bank$age, horizontal = T)Karena batas nilai box di boxplot tidak terlihat, kita bisa
mengetahuinya dengan menggunakan summary.
summary(bank$age)#> Min. 1st Qu. Median Mean 3rd Qu. Max.
#> 18.00 33.00 39.00 40.94 48.00 95.00
summary(bank[bank$y == "no",c("age")])#> Min. 1st Qu. Median Mean 3rd Qu. Max.
#> 18.00 33.00 39.00 40.84 48.00 95.00
summary(bank[bank$y == "yes",c("age")])#> Min. 1st Qu. Median Mean 3rd Qu. Max.
#> 18.00 31.00 38.00 41.67 50.00 95.00
Dari summary terlihat bahwa data umur nasabah secara
keseluruhan baik itu nasabah yang melakukan investasi deposito maupun
tidak, usianya terpusat di usia produktif dengan rentang umur 33-48, dan
nampaknya bank tidak terlalu tertarik untuk menghubungi nasabah dengan
usia diatas 60 dan di bawah 23 tahun. Akan tetapi dari data di atas,
nasabah dengan usia di atas 60 dan di bawah 23 memiliki kecenderungan
untuk mengambil investasi deposito berjangka lebih tinggi dibanding
rentang usia terpusatnya. Kemungkinan besar karena di usia tua sudah
paham akan konsep investasi, dan di usia muda sedang terjadi trend untuk
berinvestasi. Untuk itu, sebaiknya di kampanye berikutnya bank harus
mempertinmbangkan menghubungi nasabah dengan usia tersebut.
Untuk mempermudah melihat distribusi umur nasabah, akan dilakukan
visualisasi data menggunakan ggplot untuk nasabah yang
melakukan subscribe deposito maupun tidak.
ggplot(bank, aes(age, color=y, fill=y))+
geom_histogram(color="black", bins = 42)+
facet_wrap(facets = .~y, nrow = 2, scales = "free")table(bank$marital, bank$y)#>
#> no yes
#> divorced 4585 622
#> married 24459 2755
#> single 10878 1912
Dapat dilihat bahwa jumlah nasabah yang sudah menikah lebih banyak melakukan investasi deposito dibanding yang single baik itu belum menikah maupun telah bercerai.
table(bank$education, bank$y)#>
#> no yes
#> primary 6260 591
#> secondary 20752 2450
#> tertiary 11305 1996
#> unknown 1605 252
#prop.table(table(bank$education, bank$y))Nasabah terbanyak yang melakukan investasi deposito memiliki latar pendidikan secondary, dan ada kecenderungan semakin tinggi tingkat pendidikan semakin tinggi pula nasabah tersebut akan melakukan investasi deposito.
table(bank$job, bank$y)#>
#> no yes
#> admin. 4540 631
#> blue-collar 9024 708
#> entrepreneur 1364 123
#> housemaid 1131 109
#> management 8157 1301
#> retired 1748 516
#> self-employed 1392 187
#> services 3785 369
#> student 669 269
#> technician 6757 840
#> unemployed 1101 202
#> unknown 254 34
round(prop.table(table(bank$job, bank$y))*100,1)#>
#> no yes
#> admin. 10.0 1.4
#> blue-collar 20.0 1.6
#> entrepreneur 3.0 0.3
#> housemaid 2.5 0.2
#> management 18.0 2.9
#> retired 3.9 1.1
#> self-employed 3.1 0.4
#> services 8.4 0.8
#> student 1.5 0.6
#> technician 14.9 1.9
#> unemployed 2.4 0.4
#> unknown 0.6 0.1
Berdasarkan proporsi dari setiap pekerjaan, tampak bahwa nasabah yang mengikuti kampanye pemasaran ini didominasi oleh pekerjaan blue-collar, management, technician dan admin.
Selanjutnya akan diamati pada jenis pekerjaan mana yang melakukan investasi deposito berjangka terbanyak.
bank_job_y <- as.data.frame(table(bank$job, bank$y))
names(bank_job_y) <-c("job","yes","freq")
bank_job_y <- bank_job_y[order(bank_job_y$freq, decreasing = T),]
bank_job_y[order(bank_job_y$yes,decreasing = T),]Ternyata pekerjaan dengan jenis management, technician dan blue-collar merupakan 3 job dengan jumlah nasabah yang melakukan investasi deposito terbanyak akan tetapi kategori tersebut juga banyak yang menolak melakukan investasi deposito. Hal ini terjadi karena proporsi nasabah di kategori tersebut memang lebih banyak dibandingkan dengan jenis pekerjaan nasabah lainnya.
prop.table(table(bank$job, bank$y))#>
#> no yes
#> admin. 0.1004180399 0.0139567804
#> blue-collar 0.1995974431 0.0156599058
#> entrepreneur 0.0301696490 0.0027205769
#> housemaid 0.0250160359 0.0024109177
#> management 0.1804206941 0.0287761828
#> retired 0.0386631572 0.0114131517
#> self-employed 0.0307889673 0.0041361616
#> services 0.0837185641 0.0081617306
#> student 0.0147972838 0.0059498795
#> technician 0.1494547787 0.0185795492
#> unemployed 0.0243524806 0.0044679392
#> unknown 0.0056181018 0.0007520294
table(bank$default)#>
#> no yes
#> 44396 815
Berdasarkan informasi di atas, nasabah yang terdaftar dalam kampanye kebanyakan yang tidak memiliki kredit macet, hal ini logis karena nasabah yang memiliki kredit macet biasanya memiliki sedikit dana yang tak terpakai.
Selanjutnya kita tinjau nasabah berdasarkan apakah melakukan deposito atau tidak.
table(bank$default, bank$y)#>
#> no yes
#> no 39159 5237
#> yes 763 52
Ternyata nasabah yang kreditnya tidak macet banyak melakukan subscribe deposito.
summary(bank$balance)#> Min. 1st Qu. Median Mean 3rd Qu. Max.
#> -8019 72 448 1362 1428 102127
Ternyata rentang balance/saldo nasabah yang mengikuti kampanye kali ini berada di antara -8019 dan 102127
plot(bank$y, bank$balance, horizontal = T)
Akan dilihat lebih spesifik untuk yang melakukan investasi deposito
berjangka dan yang tidak melakukan.
summary(bank[bank$y %in% "yes",c("balance","y")])#> balance y
#> Min. :-3058 no : 0
#> 1st Qu.: 210 yes:5289
#> Median : 733
#> Mean : 1804
#> 3rd Qu.: 2159
#> Max. :81204
summary(bank[bank$y %in% "no",c("balance","y")])#> balance y
#> Min. : -8019 no :39922
#> 1st Qu.: 58 yes: 0
#> Median : 417
#> Mean : 1304
#> 3rd Qu.: 1345
#> Max. :102127
Dari hasil summary dapat dilihat bahwa setengah nasabah
yang melakukan investasi deposito berjangka memiliki balance/saldo
sedikit lebih banyak dan bervariatif di banding yang tidak.
Apakah ada pengaruh tingkat balance terhadap kecenderungan nasabah untuk melakuakan investasi deposito berjangka?
Pertama akan dicek pada balance/saldo berapa jumlah nasabahnya paling banyak
bank_balance <- as.data.frame(table(bank$balance, bank$default))
names(bank_balance) <- c("balance","default","freq")
bank_balance$balance <- as.integer(as.character(bank_balance$balance))
bank_balance[order(bank_balance$freq,decreasing = T),]Ternyata justru data didominasi oleh nasabah yang memiliki balance yang rendah, bahkan terbanyak berada di balance 0. Selanjutnya akan kita tinjau untuk masing2 kategori deposito yes dan no.
bank_bd_no <- bank_balance[bank_balance$default=="no" & bank_balance$freq >0,]
bank_bd_yes <- bank_balance[bank_balance$default=="yes" & bank_balance$freq >0,]
no <- head(bank_bd_no[order(bank_bd_no$freq, decreasing = T),],10)
yes <- head(bank_bd_yes[order(bank_bd_yes$freq, decreasing = T),],10)
noyesBahkan setelah dianalisa untuk masing-masing kategorinya, nasabah yang memiliki balance 0 masih mendominasi.
Dengan hasil data seperti itu, dapat disimpulkan bahwa tingkat balance tidak mempengaruhi seorang nasabah untuk melakukan investasi deposito atau tidak.
Untuk melihat visualisasinya bisa menggunakan perintah berikut:
ggplot(bank, aes(balance, fill =y))+
geom_histogram(bins=100)table(bank$housing)#>
#> no yes
#> 20081 25130
Hal yang menarik dari proporsi pada kolom housing, yaitu pembagian nasabah yang memiliki pinjaman perumahan ternyata lebih banyak dibanding yang tidak memiliki pinjaman perumahan. Selanjutnya akan dicek proporsinya terhadap y.
table(bank$housing, bank$y)#>
#> no yes
#> no 16727 3354
#> yes 23195 1935
Seperti yang terlihat, jumlah nasabah yang memiliki pinjaman perumahan dan melakukan investasi deposito lebih kecil dibanding yang tidak memiliki pinjaman perumahan dikarenakan secara logika nasabah yang memiliki pinjaman perumahan kemungkinan kecil memiliki uang yang tidak terpakai yang bisa dialokasikan ke investasi deposito.
table(bank$loan)#>
#> no yes
#> 37967 7244
Dari keseluruhan data, nasabah yang tidak memiliki pinjaman pribadi 5x lebih besar dibanding yang memiliki pinjaman.
table(bank$loan, bank$y)#>
#> no yes
#> no 33162 4805
#> yes 6760 484
Dan terlihat pula nasabah yang melakukan investasi deposito lebih banyak dari segi nasabah yang tidak memiliki pinjaman pribadi.
Akan dilakukan analisis data berdasarkan kontak terhadap nasabah yang mengikuti kampanye.
table(bank$contact)#>
#> cellular telephone unknown
#> 29285 2906 13020
Terdapat 3 tipe komunikasi yang dilakukan selama campaign yakni cellular, telephone dan unknown. Akan diihat apakah ada pengaruh jenis komunikasi yang dilakukan selama kampanye berlangsung dengan keberhasilan nasabah untuk melakukan investasi deposito berjangka.
table(bank$contact,bank$y)#>
#> no yes
#> cellular 24916 4369
#> telephone 2516 390
#> unknown 12490 530
Ternyata jenis komunikasi yang paling efektif dalam campaign ini adalah dengan menggunakan cellular.
Akan ditinjau distribusi data dalam variabel day yang mana dalam hal ini tanggal nasabah dihubungi:
barplot(table(bank$day))
Plot diatas merupakan banyaknya nasabah ditinjau dari tanggal nasabah
tersebut dihubungi, karena kita ingin meninjau datanya berdasarkan
nasabah yang melakukan investasi deposito dan tidak, maka kita bisa
memulainya dengan melihat persebaran datanya dengan
summary
terlebih dahulu.
Melihat persebaran datanya:
bank1 <- bank
bank1$day <- as.numeric(as.character(bank1$day))
summary(bank1$day)#> Min. 1st Qu. Median Mean 3rd Qu. Max.
#> 1.00 8.00 16.00 15.81 21.00 31.00
summary(bank1[bank1$y == "no",c("day")])#> Min. 1st Qu. Median Mean 3rd Qu. Max.
#> 1.00 8.00 16.00 15.89 21.00 31.00
summary(bank1[bank1$y == "yes",c("day")])#> Min. 1st Qu. Median Mean 3rd Qu. Max.
#> 1.00 8.00 15.00 15.16 22.00 31.00
Berdasarkan hasil analisis, ternyata 50% panggilan selama kampanye dilakukan pada tanggal 8-21 disetiap bulannya.
table(bank$day, bank$y)#>
#> no yes
#> 1 232 90
#> 2 1111 182
#> 3 901 178
#> 4 1215 230
#> 5 1695 215
#> 6 1751 181
#> 7 1660 157
#> 8 1641 201
#> 9 1382 179
#> 10 403 121
#> 11 1298 181
#> 12 1359 244
#> 13 1344 241
#> 14 1638 210
#> 15 1465 238
#> 16 1223 192
#> 17 1763 176
#> 18 2080 228
#> 19 1635 122
#> 20 2560 192
#> 21 1825 201
#> 22 751 154
#> 23 813 126
#> 24 385 62
#> 25 707 133
#> 26 919 116
#> 27 971 150
#> 28 1687 143
#> 29 1616 129
#> 30 1295 271
#> 31 597 46
Dilihat dari hasil plot dan persebaran datanya, tanggal dengan jumlah nasabah yang melakukan investasi deposito berjangka ternyata hampir tersebar rata di setiap tanggalnya, hanya di tanggal 1, 10, 24, dan 31 yang memiliki jumlah nasabah yang melakukan investasi deposito yang kecil.
Untuk melihat visualisasi nasabah berdasasrkan kategori depositonya bisa menggunakan perintah berikut:
bank_day_y <- as.data.frame(table(bank$day, bank$y))
names(bank_day_y) <- c("day","deposit","count")
bank_day_y$day <- as.numeric(as.character(bank_day_y$day))
ggplot(bank_day_y, aes(day, count, fill =deposit))+
geom_col(position = "dodge")+
scale_x_continuous(breaks = seq(1,31,1))Dan ternyata untuk tanggal dimana nasabah dihubungi, bisa dilihat beberapa tanggal yang proporsi nasabah tersebut melakukan deposit itu kecil, yakni di tanggal 1, 10, 24, dan 31.
Akan ditinjau banyaknya nasabah yang mengikuti kampanye berdasarkan bulan dihubungi:
barplot(table(bank$month))Selama kampanye pemasaran berlangsung, ternyata jumlah nasabah yang paling banyak dihubungi berada di bulan Mei dan yang paling sedikit berada di bulan Desember dan Maret. Selanjutnya, akan ditinjau kategori deposit di setiap bulannya.
table(bank$month,bank$y)#>
#> no yes
#> jan 1261 142
#> feb 2208 441
#> mar 229 248
#> apr 2355 577
#> may 12841 925
#> jun 4795 546
#> jul 6268 627
#> aug 5559 688
#> sep 310 269
#> oct 415 323
#> nov 3567 403
#> dec 114 100
Hasilnya, walaupun di bulan Maret jumlah nasabah yang dihubungi jumlahnya kecil dari jumlah keseluruhan nasabah tetapi pada bulan Maret ternyata jumlah nasabah yang melakukan investasi deposit berjangka lebih tinggi dari yang tidak melakukan deposit. Dan secara persentase keberhasilan nasabah melakukan investasi deposit di bulan Maret ini jauh lebih tinggi dibanding bulan lainnya.
Dan berdasarkan proporsi datanya, bulan Desember-Januari merupakan bulan yang memiliki jumlah nasabah yang melakukan investasi deposito kecil, hal ini disebabkan karena di bulan ini banyak holiday atau hari libur. Maka perlu adanya perlakuan spesial atau event pada bulan Desember-Januari untuk menarik lebih banyak nasabah agar melakukan investasi deposito berjangka.
Akan dilihat apakah ada hubungan antara lama durasi seorang nasabah dihubungi dengan tingkat kecenderungan nasabah itu akan melakukan investasi deposito berjangka
table(bank$duration,bank$y)#>
#> no yes
#> 0 3 0
#> 1 2 0
#> 2 3 0
#> 3 4 0
#> 4 15 0
#> 5 35 0
#> 6 45 0
#> 7 73 0
#> 8 84 1
#> 9 77 0
#> 10 76 0
#> 11 96 1
#> 12 80 0
#> 13 88 0
#> 14 84 0
#> 15 85 0
#> 16 88 0
#> 17 81 0
#> 18 94 0
#> 19 71 0
#> 20 83 0
#> 21 79 0
#> 22 87 0
#> 23 76 1
#> 24 80 0
#> 25 78 1
#> 26 70 0
#> 27 71 0
#> 28 55 0
#> 29 80 0
#> 30 62 1
#> 31 57 0
#> 32 54 0
#> 33 57 0
#> 34 72 1
#> 35 66 0
#> 36 90 0
#> 37 77 0
#> 38 62 0
#> 39 75 1
#> 40 72 0
#> 41 89 0
#> 42 86 0
#> 43 96 0
#> 44 95 0
#> 45 82 0
#> 46 83 1
#> 47 81 0
#> 48 97 0
#> 49 94 1
#> 50 112 0
#> 51 116 0
#> 52 100 0
#> 53 104 0
#> 54 106 0
#> 55 118 0
#> 56 123 0
#> 57 120 0
#> 58 131 0
#> 59 130 0
#> 60 107 0
#> 61 126 1
#> 62 108 0
#> 63 138 4
#> 64 132 0
#> 65 143 3
#> 66 121 0
#> 67 154 1
#> 68 145 0
#> 69 132 2
#> 70 140 0
#> 71 158 4
#> 72 161 0
#> 73 166 0
#> 74 148 1
#> 75 145 2
#> 76 159 1
#> 77 155 0
#> 78 151 3
#> 79 132 3
#> 80 159 5
#> 81 163 3
#> 82 162 3
#> 83 141 4
#> 84 136 4
#> 85 165 1
#> 86 143 1
#> 87 160 3
#> 88 169 1
#> 89 170 7
#> 90 181 3
#> 91 164 6
#> 92 165 3
#> 93 150 5
#> 94 145 4
#> 95 149 7
#> 96 150 5
#> 97 160 8
#> 98 158 4
#> 99 150 2
#> 100 155 4
#> 101 159 4
#> 102 157 3
#> 103 166 3
#> 104 169 6
#> 105 147 3
#> 106 159 6
#> 107 137 7
#> 108 159 6
#> 109 155 1
#> 110 155 6
#> 111 164 2
#> 112 169 5
#> 113 162 4
#> 114 171 4
#> 115 134 8
#> 116 132 4
#> 117 145 5
#> 118 133 5
#> 119 165 5
#> 120 129 7
#> 121 169 4
#> 122 168 7
#> 123 166 2
#> 124 182 6
#> 125 157 8
#> 126 156 7
#> 127 148 6
#> 128 149 5
#> 129 145 2
#> 130 140 7
#> 131 134 10
#> 132 133 8
#> 133 144 7
#> 134 144 8
#> 135 151 9
#> 136 162 12
#> 137 116 8
#> 138 137 9
#> 139 166 8
#> 140 145 8
#> 141 121 6
#> 142 117 5
#> 143 144 7
#> 144 143 11
#> 145 135 5
#> 146 117 8
#> 147 139 9
#> 148 140 9
#> 149 127 9
#> 150 149 12
#> 151 152 5
#> 152 131 8
#> 153 132 9
#> 154 128 12
#> 155 135 9
#> 156 135 11
#> 157 151 6
#> 158 141 15
#> 159 141 8
#> 160 135 10
#> 161 130 7
#> 162 112 6
#> 163 125 8
#> 164 128 11
#> 165 118 12
#> 166 150 9
#> 167 115 11
#> 168 135 5
#> 169 107 13
#> 170 100 12
#> 171 120 8
#> 172 126 8
#> 173 118 11
#> 174 121 4
#> 175 121 13
#> 176 115 9
#> 177 103 9
#> 178 122 11
#> 179 112 8
#> 180 115 8
#> 181 112 12
#> 182 98 13
#> 183 96 7
#> 184 112 5
#> 185 127 12
#> 186 75 10
#> 187 104 16
#> 188 110 9
#> 189 108 5
#> 190 91 8
#> 191 97 3
#> 192 97 14
#> 193 113 10
#> 194 85 12
#> 195 88 11
#> 196 83 9
#> 197 115 0
#> 198 116 4
#> 199 98 7
#> 200 109 11
#> 201 109 9
#> 202 93 7
#> 203 102 8
#> 204 96 9
#> 205 85 7
#> 206 98 10
#> 207 97 14
#> 208 87 12
#> 209 83 11
#> 210 99 12
#> 211 102 13
#> 212 85 14
#> 213 81 9
#> 214 97 7
#> 215 87 14
#> 216 83 12
#> 217 99 8
#> 218 72 11
#> 219 95 9
#> 220 86 10
#> 221 87 9
#> 222 91 10
#> 223 73 7
#> 224 76 12
#> 225 84 7
#> 226 101 17
#> 227 82 12
#> 228 74 7
#> 229 71 16
#> 230 80 8
#> 231 81 9
#> 232 74 16
#> 233 72 9
#> 234 60 12
#> 235 64 6
#> 236 84 9
#> 237 73 6
#> 238 78 9
#> 239 87 12
#> 240 89 6
#> 241 76 8
#> 242 58 8
#> 243 74 12
#> 244 79 10
#> 245 81 12
#> 246 80 5
#> 247 82 7
#> 248 72 11
#> 249 76 4
#> 250 74 11
#> 251 75 12
#> 252 69 12
#> 253 69 13
#> 254 70 7
#> 255 75 13
#> 256 70 6
#> 257 67 12
#> 258 68 7
#> 259 69 7
#> 260 66 11
#> 261 54 19
#> 262 66 12
#> 263 58 13
#> 264 59 7
#> 265 65 12
#> 266 63 10
#> 267 67 10
#> 268 74 15
#> 269 54 7
#> 270 57 14
#> 271 56 11
#> 272 68 9
#> 273 65 7
#> 274 52 5
#> 275 54 6
#> 276 54 9
#> 277 60 5
#> 278 50 10
#> 279 43 9
#> 280 61 6
#> 281 61 7
#> 282 61 10
#> 283 66 5
#> 284 46 8
#> 285 59 7
#> 286 53 2
#> 287 51 6
#> 288 50 12
#> 289 46 10
#> 290 58 7
#> 291 54 6
#> 292 46 4
#> 293 54 13
#> 294 54 8
#> 295 54 10
#> 296 51 9
#> 297 62 9
#> 298 56 5
#> 299 46 8
#> 300 46 9
#> 301 56 15
#> 302 44 5
#> 303 37 6
#> 304 48 6
#> 305 59 12
#> 306 60 6
#> 307 36 4
#> 308 37 6
#> 309 49 11
#> 310 33 6
#> 311 47 5
#> 312 45 3
#> 313 44 6
#> 314 46 10
#> 315 35 9
#> 316 44 9
#> 317 51 9
#> 318 53 8
#> 319 46 7
#> 320 41 3
#> 321 36 6
#> 322 54 4
#> 323 51 11
#> 324 48 9
#> 325 35 8
#> 326 54 8
#> 327 41 9
#> 328 42 8
#> 329 49 5
#> 330 32 7
#> 331 33 8
#> 332 46 6
#> 333 53 3
#> 334 35 3
#> 335 40 9
#> 336 33 9
#> 337 36 4
#> 338 30 5
#> 339 52 4
#> 340 46 6
#> 341 36 9
#> 342 44 11
#> 343 40 5
#> 344 38 11
#> 345 50 7
#> 346 41 2
#> 347 39 8
#> 348 37 3
#> 349 31 7
#> 350 39 9
#> 351 29 7
#> 352 40 8
#> 353 37 6
#> 354 37 6
#> 355 29 9
#> 356 24 5
#> 357 33 4
#> 358 42 6
#> 359 40 4
#> 360 45 7
#> 361 43 7
#> 362 43 4
#> 363 36 6
#> 364 41 4
#> 365 29 6
#> 366 29 9
#> 367 23 9
#> 368 26 4
#> 369 33 8
#> 370 32 7
#> 371 35 7
#> 372 22 8
#> 373 23 6
#> 374 34 4
#> 375 31 3
#> 376 32 6
#> 377 35 7
#> 378 32 6
#> 379 36 7
#> 380 27 5
#> 381 30 4
#> 382 25 7
#> 383 31 6
#> 384 29 8
#> 385 27 8
#> 386 35 5
#> 387 28 6
#> 388 32 7
#> 389 34 4
#> 390 32 8
#> 391 27 3
#> 392 33 7
#> 393 32 6
#> 394 32 10
#> 395 27 6
#> 396 27 11
#> 397 23 7
#> 398 22 6
#> 399 41 3
#> 400 33 9
#> 401 32 5
#> 402 21 2
#> 403 14 4
#> 404 32 7
#> 405 26 3
#> 406 29 10
#> 407 28 5
#> 408 33 3
#> 409 25 9
#> 410 25 2
#> 411 24 10
#> 412 24 11
#> 413 24 3
#> 414 20 10
#> 415 18 11
#> 416 18 7
#> 417 21 7
#> 418 23 5
#> 419 24 5
#> 420 33 5
#> 421 23 4
#> 422 31 4
#> 423 18 6
#> 424 16 3
#> 425 28 2
#> 426 19 8
#> 427 29 7
#> 428 27 2
#> 429 21 7
#> 430 19 5
#> 431 26 6
#> 432 29 5
#> 433 25 1
#> 434 13 5
#> 435 22 2
#> 436 19 4
#> 437 24 3
#> 438 19 5
#> 439 18 6
#> 440 12 2
#> 441 14 6
#> 442 22 7
#> 443 15 6
#> 444 16 5
#> 445 33 7
#> 446 32 3
#> 447 17 4
#> 448 18 2
#> 449 21 10
#> 450 14 3
#> 451 20 1
#> 452 21 5
#> 453 14 8
#> 454 18 5
#> 455 23 5
#> 456 20 7
#> 457 15 5
#> 458 10 8
#> 459 17 5
#> 460 21 8
#> 461 18 3
#> 462 22 6
#> 463 19 3
#> 464 24 5
#> 465 24 5
#> 466 22 2
#> 467 17 11
#> 468 14 0
#> 469 11 3
#> 470 20 6
#> 471 24 3
#> 472 23 5
#> 473 17 7
#> 474 14 6
#> 475 18 10
#> 476 11 8
#> 477 17 3
#> 478 12 4
#> 479 18 10
#> 480 15 5
#> 481 12 5
#> 482 10 10
#> 483 20 6
#> 484 15 0
#> 485 23 6
#> 486 12 6
#> 487 16 3
#> 488 14 2
#> 489 18 6
#> 490 18 2
#> 491 15 6
#> 492 17 3
#> 493 20 3
#> 494 13 6
#> 495 13 5
#> 496 7 5
#> 497 9 3
#> 498 19 4
#> 499 10 3
#> 500 18 5
#> 501 15 5
#> 502 17 2
#> 503 17 3
#> 504 20 9
#> 505 10 3
#> 506 12 6
#> 507 13 6
#> 508 15 4
#> 509 16 6
#> 510 15 3
#> 511 12 5
#> 512 8 6
#> 513 13 6
#> 514 17 3
#> 515 18 6
#> 516 8 3
#> 517 18 3
#> 518 18 2
#> 519 8 6
#> 520 20 5
#> 521 14 2
#> 522 10 5
#> 523 16 6
#> 524 14 5
#> 525 8 6
#> 526 11 7
#> 527 12 2
#> 528 17 7
#> 529 11 6
#> 530 15 5
#> 531 15 9
#> 532 14 9
#> 533 8 3
#> 534 14 3
#> 535 13 4
#> 536 15 7
#> 537 12 4
#> 538 8 3
#> 539 8 4
#> 540 7 4
#> 541 18 4
#> 542 13 4
#> 543 17 8
#> 544 19 1
#> 545 7 5
#> 546 11 5
#> 547 10 2
#> 548 12 2
#> 549 11 3
#> 550 9 3
#> 551 13 5
#> 552 7 6
#> 553 12 5
#> 554 15 8
#> 555 4 4
#> 556 7 5
#> 557 9 1
#> 558 11 4
#> 559 17 2
#> 560 6 6
#> 561 11 4
#> 562 9 10
#> 563 11 6
#> 564 13 2
#> 565 13 5
#> 566 10 5
#> 567 10 6
#> 568 7 5
#> 569 11 3
#> 570 13 3
#> 571 5 3
#> 572 9 2
#> 573 7 1
#> 574 13 10
#> 575 8 1
#> 576 10 7
#> 577 10 7
#> 578 9 6
#> 579 13 6
#> 580 11 3
#> 581 7 1
#> 582 10 4
#> 583 7 5
#> 584 9 2
#> 585 10 6
#> 586 8 4
#> 587 6 6
#> 588 11 5
#> 589 11 3
#> 590 11 5
#> 591 9 5
#> 592 7 4
#> 593 10 4
#> 594 6 3
#> 595 8 4
#> 596 7 3
#> 597 12 2
#> 598 5 2
#> 599 12 1
#> 600 8 4
#> 601 9 2
#> 602 7 1
#> 603 11 3
#> 604 18 6
#> 605 13 3
#> 606 8 7
#> 607 10 5
#> 608 9 6
#> 609 11 4
#> 610 6 4
#> 611 15 5
#> 612 10 4
#> 613 8 1
#> 614 6 5
#> 615 5 6
#> 616 5 5
#> 617 6 5
#> 618 10 8
#> 619 8 5
#> 620 9 2
#> 621 4 3
#> 622 12 3
#> 623 8 7
#> 624 11 3
#> 625 11 5
#> 626 8 2
#> 627 6 3
#> 628 7 2
#> 629 7 5
#> 630 10 4
#> 631 6 2
#> 632 12 4
#> 633 13 5
#> 634 7 4
#> 635 7 4
#> 636 9 4
#> 637 7 5
#> 638 10 7
#> 639 6 4
#> 640 5 5
#> 641 8 7
#> 642 5 5
#> 643 10 2
#> 644 10 3
#> 645 8 7
#> 646 5 2
#> 647 7 1
#> 648 5 4
#> 649 4 6
#> 650 8 5
#> 651 6 8
#> 652 10 3
#> 653 7 4
#> 654 5 7
#> 655 5 3
#> 656 6 2
#> 657 7 4
#> 658 3 7
#> 659 6 5
#> 660 6 3
#> 661 9 5
#> 662 5 6
#> 663 4 5
#> 664 4 6
#> 665 8 3
#> 666 6 4
#> 667 7 6
#> 668 8 3
#> 669 3 5
#> 670 1 7
#> 671 4 5
#> 672 4 2
#> 673 9 2
#> 674 8 4
#> 675 6 2
#> 676 8 9
#> 677 2 2
#> 678 8 2
#> 679 5 4
#> 680 8 2
#> 681 4 4
#> 682 4 4
#> 683 2 2
#> 684 5 1
#> 685 4 3
#> 686 6 7
#> 687 3 5
#> 688 2 3
#> 689 5 2
#> 690 10 3
#> 691 5 6
#> 692 9 3
#> 693 8 2
#> 694 2 4
#> 695 6 4
#> 696 4 8
#> 697 6 2
#> 698 9 2
#> 699 7 6
#> 700 8 7
#> 701 2 6
#> 702 8 0
#> 703 6 4
#> 704 3 5
#> 705 6 5
#> 706 8 3
#> 707 2 6
#> 708 3 2
#> 709 3 9
#> 710 0 4
#> 711 5 2
#> 712 4 8
#> 713 5 1
#> 714 10 3
#> 715 5 2
#> 716 3 8
#> 717 6 3
#> 718 6 4
#> 719 3 2
#> 720 4 6
#> 721 3 2
#> 722 8 5
#> 723 7 0
#> 724 3 2
#> 725 5 4
#> 726 3 2
#> 727 3 3
#> 728 9 4
#> 729 5 4
#> 730 7 5
#> 731 2 3
#> 732 3 4
#> 733 4 5
#> 734 4 2
#> 735 5 2
#> 736 3 5
#> 737 0 5
#> 738 7 3
#> 739 2 4
#> 740 4 4
#> 741 2 2
#> 742 7 2
#> 743 1 2
#> 744 9 6
#> 745 0 5
#> 746 6 3
#> 747 6 3
#> 748 4 1
#> 749 3 3
#> 750 4 4
#> 751 0 4
#> 752 4 0
#> 753 4 3
#> 754 7 2
#> 755 4 2
#> 756 4 1
#> 757 7 2
#> 758 4 4
#> 759 4 2
#> 760 1 2
#> 761 7 4
#> 762 3 4
#> 763 3 6
#> 764 7 3
#> 765 4 3
#> 766 5 3
#> 767 2 7
#> 768 5 4
#> 769 3 2
#> 770 4 1
#> 771 6 3
#> 772 6 2
#> 773 4 2
#> 774 5 3
#> 775 4 5
#> 776 4 1
#> 777 4 2
#> 778 5 0
#> 779 4 1
#> 780 4 2
#> 781 4 5
#> 782 1 2
#> 783 2 3
#> 784 2 3
#> 785 1 1
#> 786 5 2
#> 787 7 4
#> 788 8 5
#> 789 3 2
#> 790 5 1
#> 791 2 1
#> 792 3 4
#> 793 4 1
#> 794 3 1
#> 795 4 2
#> 796 4 5
#> 797 3 1
#> 798 3 2
#> 799 4 3
#> 800 7 2
#> 801 1 4
#> 802 2 2
#> 803 1 4
#> 804 4 1
#> 805 3 2
#> 806 3 2
#> 807 3 0
#> 808 4 8
#> 809 2 3
#> 810 3 2
#> 811 3 1
#> 812 2 4
#> 813 3 4
#> 814 3 3
#> 815 2 5
#> 816 6 2
#> 817 1 3
#> 818 4 0
#> 819 2 4
#> 820 4 3
#> 821 3 2
#> 822 0 1
#> 823 2 1
#> 824 5 2
#> 825 6 1
#> 826 3 1
#> 827 5 2
#> 828 1 3
#> 829 4 5
#> 830 0 4
#> 831 1 1
#> 832 3 2
#> 833 4 2
#> 834 5 4
#> 835 6 5
#> 836 4 3
#> 837 3 5
#> 838 1 5
#> 839 0 1
#> 840 1 2
#> 841 2 3
#> 843 2 3
#> 844 6 3
#> 845 2 2
#> 846 2 2
#> 847 4 2
#> 848 0 2
#> 849 1 4
#> 850 4 4
#> 851 5 1
#> 852 2 1
#> 853 2 3
#> 854 3 5
#> 855 3 4
#> 856 2 3
#> 857 2 4
#> 858 2 2
#> 859 3 1
#> 860 2 5
#> 861 4 1
#> 862 3 3
#> 863 2 2
#> 864 1 2
#> 865 4 1
#> 866 1 1
#> 867 4 4
#> 868 2 1
#> 869 4 1
#> 870 2 2
#> 871 2 4
#> 872 1 2
#> 873 3 3
#> 874 2 3
#> 875 2 4
#> 876 1 2
#> 877 1 2
#> 878 3 3
#> 879 0 1
#> 880 1 3
#> 881 4 2
#> 882 4 7
#> 883 1 1
#> 884 3 4
#> 885 4 3
#> 886 3 1
#> 888 2 3
#> 889 2 2
#> 890 1 3
#> 891 2 3
#> 892 1 1
#> 893 0 5
#> 894 1 3
#> 895 5 5
#> 896 1 3
#> 897 2 4
#> 898 3 2
#> 899 3 2
#> 900 1 1
#> 901 1 5
#> 902 3 3
#> 903 2 4
#> 904 1 4
#> 905 2 1
#> 906 3 2
#> 907 2 1
#> 908 3 3
#> 909 1 0
#> 910 0 3
#> 911 3 4
#> 912 3 2
#> 913 1 2
#> 914 2 0
#> 915 2 1
#> 916 5 1
#> 917 0 4
#> 918 2 3
#> 919 2 2
#> 920 2 3
#> 921 3 2
#> 922 1 4
#> 923 2 3
#> 924 5 3
#> 925 2 3
#> 926 1 2
#> 927 1 1
#> 928 2 0
#> 929 2 3
#> 930 1 3
#> 931 1 2
#> 932 1 0
#> 933 1 1
#> 934 0 1
#> 935 5 4
#> 936 3 0
#> 937 2 2
#> 938 0 3
#> 939 1 2
#> 940 0 3
#> 941 1 1
#> 942 3 2
#> 943 0 3
#> 944 2 2
#> 945 1 3
#> 946 0 2
#> 947 1 0
#> 948 2 0
#> 949 0 3
#> 950 1 1
#> 951 3 2
#> 952 3 5
#> 953 5 2
#> 954 0 2
#> 955 2 3
#> 956 3 2
#> 957 2 4
#> 958 2 4
#> 959 1 2
#> 960 1 0
#> 961 1 4
#> 962 1 1
#> 963 0 4
#> 964 1 0
#> 965 3 2
#> 966 3 0
#> 967 0 3
#> 968 3 5
#> 969 1 1
#> 970 1 2
#> 971 2 1
#> 972 1 0
#> 973 3 3
#> 974 1 2
#> 975 0 1
#> 976 0 2
#> 977 2 1
#> 978 1 2
#> 979 1 1
#> 980 0 1
#> 981 1 3
#> 982 1 1
#> 983 0 2
#> 984 4 6
#> 985 1 3
#> 986 3 0
#> 987 1 0
#> 988 0 3
#> 989 1 0
#> 990 1 2
#> 991 0 1
#> 992 1 1
#> 993 0 3
#> 994 1 2
#> 995 1 0
#> 996 1 2
#> 997 1 3
#> 998 0 3
#> 999 1 0
#> 1000 1 4
#> 1001 2 2
#> 1002 2 3
#> 1003 1 1
#> 1005 1 1
#> 1006 0 2
#> 1007 2 4
#> 1008 0 3
#> 1009 3 1
#> 1010 2 1
#> 1011 3 1
#> 1012 2 2
#> 1013 4 1
#> 1014 2 1
#> 1015 2 4
#> 1017 1 4
#> 1018 2 2
#> 1019 1 3
#> 1020 1 1
#> 1021 1 0
#> 1022 1 3
#> 1023 1 1
#> 1024 0 1
#> 1025 1 2
#> 1026 2 0
#> 1027 1 2
#> 1028 2 2
#> 1029 1 1
#> 1030 1 4
#> 1031 1 1
#> 1032 2 5
#> 1033 0 1
#> 1034 2 3
#> 1035 0 1
#> 1036 3 3
#> 1037 3 1
#> 1038 1 2
#> 1039 0 3
#> 1040 2 1
#> 1041 1 1
#> 1042 0 3
#> 1044 1 3
#> 1045 1 2
#> 1046 1 2
#> 1047 1 0
#> 1048 0 2
#> 1049 1 0
#> 1051 2 3
#> 1052 2 1
#> 1053 0 1
#> 1054 1 0
#> 1055 1 1
#> 1056 3 1
#> 1057 1 2
#> 1058 2 1
#> 1059 1 2
#> 1060 1 3
#> 1061 0 1
#> 1062 2 2
#> 1063 1 7
#> 1064 1 4
#> 1065 1 0
#> 1066 1 0
#> 1067 1 0
#> 1068 0 2
#> 1070 1 1
#> 1073 0 3
#> 1074 1 2
#> 1075 1 1
#> 1076 0 3
#> 1077 1 2
#> 1078 1 2
#> 1079 1 0
#> 1080 1 4
#> 1081 1 4
#> 1082 1 1
#> 1083 2 0
#> 1084 1 2
#> 1085 0 1
#> 1086 1 1
#> 1087 1 1
#> 1088 1 1
#> 1089 0 2
#> 1090 2 1
#> 1091 2 3
#> 1092 2 2
#> 1093 1 2
#> 1094 2 2
#> 1095 0 1
#> 1096 1 1
#> 1097 0 2
#> 1098 1 1
#> 1099 2 0
#> 1100 2 0
#> 1101 2 3
#> 1102 1 2
#> 1103 1 1
#> 1104 0 1
#> 1105 0 1
#> 1106 5 1
#> 1107 0 1
#> 1108 2 0
#> 1109 0 3
#> 1110 1 1
#> 1111 2 1
#> 1112 0 1
#> 1113 1 0
#> 1114 1 1
#> 1117 1 0
#> 1118 3 0
#> 1119 0 2
#> 1120 0 4
#> 1121 4 2
#> 1122 0 1
#> 1123 0 2
#> 1124 0 1
#> 1125 0 1
#> 1126 3 1
#> 1127 0 3
#> 1128 1 0
#> 1129 0 1
#> 1130 2 4
#> 1131 1 0
#> 1132 0 1
#> 1133 0 3
#> 1134 0 4
#> 1135 1 3
#> 1136 0 1
#> 1137 0 1
#> 1138 1 3
#> 1139 2 1
#> 1140 1 0
#> 1141 0 4
#> 1142 1 1
#> 1143 1 3
#> 1144 2 1
#> 1145 2 0
#> 1147 1 0
#> 1148 1 3
#> 1149 0 2
#> 1150 1 2
#> 1151 2 1
#> 1152 1 2
#> 1153 0 2
#> 1154 0 1
#> 1156 4 2
#> 1158 0 1
#> 1159 0 1
#> 1160 1 0
#> 1161 3 1
#> 1162 2 1
#> 1164 0 3
#> 1165 3 2
#> 1166 4 0
#> 1167 2 0
#> 1168 1 0
#> 1169 1 1
#> 1170 1 0
#> 1171 2 1
#> 1173 2 2
#> 1174 0 1
#> 1175 1 1
#> 1176 1 2
#> 1178 2 1
#> 1179 1 0
#> 1180 0 1
#> 1181 1 4
#> 1182 1 3
#> 1183 1 2
#> 1184 2 1
#> 1185 2 0
#> 1186 1 1
#> 1187 3 2
#> 1190 0 2
#> 1191 1 0
#> 1192 1 1
#> 1193 0 3
#> 1195 2 0
#> 1196 1 1
#> 1199 2 2
#> 1200 2 1
#> 1201 1 2
#> 1202 0 1
#> 1203 1 2
#> 1204 1 1
#> 1205 0 4
#> 1206 3 1
#> 1207 0 3
#> 1208 1 1
#> 1209 1 1
#> 1210 1 2
#> 1211 0 1
#> 1212 2 1
#> 1213 1 0
#> 1217 1 1
#> 1218 0 1
#> 1220 1 0
#> 1221 1 0
#> 1222 1 2
#> 1223 1 2
#> 1224 2 1
#> 1225 1 0
#> 1226 1 3
#> 1227 0 1
#> 1230 0 1
#> 1231 1 1
#> 1232 0 3
#> 1233 0 1
#> 1234 0 1
#> 1236 1 1
#> 1237 1 1
#> 1238 1 1
#> 1239 1 0
#> 1240 0 1
#> 1241 2 2
#> 1242 0 4
#> 1243 1 1
#> 1244 1 1
#> 1245 1 0
#> 1246 0 1
#> 1248 0 2
#> 1249 0 2
#> 1250 0 1
#> 1252 0 1
#> 1254 1 0
#> 1255 0 1
#> 1256 1 0
#> 1257 0 1
#> 1258 0 2
#> 1259 3 1
#> 1261 1 0
#> 1262 0 1
#> 1263 0 1
#> 1265 0 2
#> 1266 1 0
#> 1268 1 1
#> 1269 1 1
#> 1271 1 0
#> 1272 1 4
#> 1273 1 0
#> 1275 0 1
#> 1276 1 1
#> 1277 1 1
#> 1279 0 1
#> 1282 0 1
#> 1283 1 0
#> 1284 1 0
#> 1286 1 0
#> 1287 2 0
#> 1288 2 1
#> 1290 0 3
#> 1291 1 0
#> 1293 0 1
#> 1294 0 1
#> 1296 1 0
#> 1297 2 2
#> 1298 0 1
#> 1302 1 0
#> 1303 0 2
#> 1306 0 1
#> 1307 3 1
#> 1309 1 1
#> 1310 0 1
#> 1311 0 2
#> 1313 0 1
#> 1314 0 1
#> 1318 0 1
#> 1319 0 1
#> 1321 0 2
#> 1323 0 1
#> 1326 1 0
#> 1327 0 1
#> 1328 0 1
#> 1329 2 1
#> 1330 1 1
#> 1331 1 0
#> 1332 0 1
#> 1333 0 1
#> 1334 0 2
#> 1336 0 3
#> 1337 1 0
#> 1339 2 0
#> 1340 0 2
#> 1341 0 2
#> 1342 0 1
#> 1343 0 1
#> 1344 0 2
#> 1345 0 1
#> 1346 0 2
#> 1347 0 1
#> 1348 0 1
#> 1349 0 1
#> 1352 0 1
#> 1353 1 1
#> 1357 0 2
#> 1359 0 2
#> 1360 0 3
#> 1361 1 0
#> 1363 0 3
#> 1364 2 0
#> 1365 1 1
#> 1366 1 1
#> 1368 1 0
#> 1369 1 1
#> 1370 0 1
#> 1372 1 0
#> 1373 0 2
#> 1374 0 1
#> 1376 1 0
#> 1377 1 0
#> 1380 1 0
#> 1381 0 1
#> 1386 2 0
#> 1387 0 1
#> 1388 1 1
#> 1389 2 1
#> 1390 1 0
#> 1391 0 1
#> 1392 1 2
#> 1393 0 1
#> 1395 0 1
#> 1397 0 1
#> 1399 0 1
#> 1403 1 0
#> 1404 0 1
#> 1405 0 1
#> 1407 0 1
#> 1408 2 1
#> 1409 1 1
#> 1410 2 1
#> 1412 1 0
#> 1416 1 1
#> 1417 0 1
#> 1419 1 0
#> 1420 0 1
#> 1422 0 4
#> 1423 1 1
#> 1424 1 1
#> 1425 1 1
#> 1426 1 1
#> 1431 1 0
#> 1432 1 0
#> 1434 2 0
#> 1435 1 0
#> 1437 0 1
#> 1438 1 0
#> 1439 0 1
#> 1440 0 1
#> 1441 1 1
#> 1446 0 2
#> 1447 0 1
#> 1448 0 3
#> 1449 1 1
#> 1451 0 2
#> 1452 2 1
#> 1456 0 1
#> 1460 0 1
#> 1461 1 1
#> 1462 2 0
#> 1463 0 1
#> 1464 1 0
#> 1467 1 2
#> 1468 0 1
#> 1469 0 1
#> 1471 0 1
#> 1472 1 1
#> 1473 1 1
#> 1476 3 0
#> 1478 1 0
#> 1484 0 1
#> 1486 0 2
#> 1487 1 0
#> 1488 0 1
#> 1489 0 1
#> 1490 0 1
#> 1491 0 1
#> 1492 1 1
#> 1495 1 0
#> 1499 0 1
#> 1500 0 1
#> 1502 0 1
#> 1503 1 2
#> 1504 1 0
#> 1508 0 1
#> 1512 0 1
#> 1514 0 1
#> 1516 1 1
#> 1519 1 0
#> 1521 1 0
#> 1528 0 2
#> 1529 2 0
#> 1531 1 1
#> 1532 0 2
#> 1534 1 0
#> 1536 0 1
#> 1540 0 2
#> 1541 0 1
#> 1543 0 1
#> 1545 0 1
#> 1548 1 0
#> 1550 0 1
#> 1551 1 0
#> 1553 0 1
#> 1554 1 1
#> 1555 0 2
#> 1556 0 1
#> 1558 0 1
#> 1559 1 0
#> 1560 0 2
#> 1563 1 0
#> 1567 1 0
#> 1569 1 0
#> 1571 0 1
#> 1573 1 1
#> 1574 0 2
#> 1576 2 2
#> 1579 0 3
#> 1580 1 0
#> 1581 1 0
#> 1584 0 1
#> 1594 0 1
#> 1597 0 1
#> 1598 0 2
#> 1600 0 1
#> 1602 0 1
#> 1603 0 1
#> 1606 1 0
#> 1608 0 1
#> 1611 1 0
#> 1613 0 1
#> 1616 0 1
#> 1617 0 1
#> 1622 0 1
#> 1623 0 1
#> 1628 0 1
#> 1635 0 1
#> 1642 0 1
#> 1649 0 1
#> 1650 1 0
#> 1656 0 1
#> 1658 0 1
#> 1661 0 1
#> 1662 1 0
#> 1663 0 1
#> 1665 0 1
#> 1666 1 0
#> 1669 0 1
#> 1677 0 1
#> 1681 0 1
#> 1687 1 0
#> 1689 0 1
#> 1691 0 1
#> 1692 0 1
#> 1697 1 1
#> 1702 0 1
#> 1707 0 1
#> 1710 0 1
#> 1713 1 0
#> 1720 1 2
#> 1721 0 2
#> 1723 0 1
#> 1727 1 0
#> 1730 0 1
#> 1735 1 1
#> 1739 1 0
#> 1740 1 0
#> 1745 2 0
#> 1767 0 1
#> 1776 0 2
#> 1777 0 1
#> 1778 1 0
#> 1789 0 1
#> 1790 0 1
#> 1792 0 1
#> 1804 1 0
#> 1805 1 0
#> 1806 0 2
#> 1809 1 0
#> 1812 1 0
#> 1816 1 0
#> 1817 0 1
#> 1820 1 0
#> 1823 1 0
#> 1833 0 1
#> 1834 1 0
#> 1835 0 1
#> 1837 1 0
#> 1842 0 1
#> 1855 1 1
#> 1859 1 0
#> 1865 0 1
#> 1867 0 1
#> 1869 1 0
#> 1871 0 2
#> 1875 1 0
#> 1877 0 2
#> 1880 1 0
#> 1882 0 1
#> 1906 1 0
#> 1914 1 0
#> 1916 0 1
#> 1917 0 1
#> 1925 1 0
#> 1934 1 0
#> 1946 0 1
#> 1957 1 0
#> 1960 0 1
#> 1962 0 1
#> 1966 1 0
#> 1970 0 1
#> 1971 0 1
#> 1972 1 0
#> 1973 0 1
#> 1975 0 1
#> 1978 0 1
#> 1980 0 1
#> 1992 1 0
#> 1994 1 0
#> 2015 0 1
#> 2016 0 2
#> 2027 1 0
#> 2028 0 1
#> 2029 0 1
#> 2033 1 0
#> 2053 2 0
#> 2055 1 0
#> 2062 0 1
#> 2078 0 1
#> 2087 0 1
#> 2093 0 1
#> 2129 1 0
#> 2150 1 0
#> 2177 1 0
#> 2184 0 1
#> 2187 1 0
#> 2191 1 0
#> 2201 1 0
#> 2219 1 0
#> 2231 0 1
#> 2241 1 0
#> 2256 1 0
#> 2260 1 0
#> 2301 0 1
#> 2330 0 1
#> 2372 0 1
#> 2389 1 0
#> 2420 0 1
#> 2429 1 0
#> 2453 0 1
#> 2456 0 1
#> 2462 1 0
#> 2485 1 0
#> 2516 0 1
#> 2621 0 1
#> 2635 1 0
#> 2653 0 1
#> 2692 0 1
#> 2769 0 1
#> 2770 0 1
#> 2775 0 1
#> 2870 1 0
#> 3025 1 0
#> 3076 0 1
#> 3078 1 0
#> 3094 0 1
#> 3102 0 1
#> 3183 0 1
#> 3253 0 1
#> 3284 1 0
#> 3322 1 0
#> 3366 1 0
#> 3422 1 0
#> 3785 1 0
#> 3881 0 1
#> 4918 1 0
summary(bank[bank$y == "no",c("duration")])#> Min. 1st Qu. Median Mean 3rd Qu. Max.
#> 0.0 95.0 164.0 221.2 279.0 4918.0
summary(bank[bank$y == "yes",c("duration")])#> Min. 1st Qu. Median Mean 3rd Qu. Max.
#> 8.0 244.0 426.0 537.3 725.0 3881.0
Ternyata nasabah kebanyakan menolak untuk melakukan investasi deposito berjangka ketika nasabah tersebut dihubungi dengan durasi 95-279 detik, sedangkan untuk nasabah yang menerima untuk melakukan investasi deposito berjangka memiliki durasi dengan rentang 244-725 detik.
Kita akan sederhanakan dataframe menjadi hanya kolom duration, deposit, dan count dari duration.
bank_dur_y <- as.data.frame(table(bank$duration, bank$y))
names(bank_dur_y) <- c("duration","deposit","count")
bank_dur_y$duration <- as.numeric(as.character(bank_dur_y$duration))
bank_dur_yTernyata ada durasi 0 di data, ini menandakan bahwa durasi 0 artinya nasabah tersebut mereject/menolak panggilan yang dilakukan selama kampanye pemasaran berlangsung.
Selanjutnya kita cek apakah ada nasabah yang melakukan subscribe deposito di durasi 0.
dyy <- bank_dur_y[bank_dur_y$deposit=="yes",]
dyy[dyy$duration==0,]Ternyata memang tidak ada yang melakukan deposito di durasi 0, hal ini masuk akal karena tidak terjadi kontak ke nasabah selama kampanye berlangsung.
Apakah lama durasi mempengaruhi kecenderungan nasabah untuk melakukan investasi deposito?
Ternyata dari hasil analisis, ada kecenderungan bahwa lama durasi mempengaruhi seorang nasabah untuk melakukan investasi deposito terutama dengan durasi 244-725 detik. Durasi yang lama menandakan bahwa nasabah yang dihubungi sudah mulai tertarik dengan kampanye yang dilakukan.
Untuk melihat hasil visualisasinya, bisa menggunakan ggplot:
ggplot(bank_dur_y, aes(duration, count, fill =deposit))+
geom_col(position = "dodge")
Terlihat garis biru (nasabah yes) lebih mendominasi di durasi yang
lama.
table(bank$campaign, bank$y)#>
#> no yes
#> 1 14983 2561
#> 2 11104 1401
#> 3 4903 618
#> 4 3205 317
#> 5 1625 139
#> 6 1199 92
#> 7 688 47
#> 8 508 32
#> 9 306 21
#> 10 252 14
#> 11 185 16
#> 12 151 4
#> 13 127 6
#> 14 89 4
#> 15 80 4
#> 16 77 2
#> 17 63 6
#> 18 51 0
#> 19 44 0
#> 20 42 1
#> 21 34 1
#> 22 23 0
#> 23 22 0
#> 24 19 1
#> 25 22 0
#> 26 13 0
#> 27 10 0
#> 28 16 0
#> 29 15 1
#> 30 8 0
#> 31 12 0
#> 32 8 1
#> 33 6 0
#> 34 5 0
#> 35 4 0
#> 36 4 0
#> 37 2 0
#> 38 3 0
#> 39 1 0
#> 41 2 0
#> 43 3 0
#> 44 1 0
#> 46 1 0
#> 50 2 0
#> 51 1 0
#> 55 1 0
#> 58 1 0
#> 63 1 0
summary(bank$campaign)#> Min. 1st Qu. Median Mean 3rd Qu. Max.
#> 1.000 1.000 2.000 2.764 3.000 63.000
Semakin kecil nilai campaign dalam hal ini berapa kali nasabah mengikuti kampanye sebelumnya, semakin besar pula kencenderungan nasabah untuk melakukan investasi deposito berjangka maupun menolak dalam kampanye kali ini.
Akan dicek berapa banyak nasabah disetiap pdays yang ada.
pdays <- as.data.frame(table(bank$pdays, bank$y))
names(pdays) <- c("pdays","deposit","count")
pdays1 <- pdays[order(pdays$count,decreasing = T),]
pdays1Kemudian kita tinjau berdasarkan jenis depositnya yakni yes dan no.
pdays1[pdays1$deposit %in% "yes",]pdays1[pdays1$deposit %in% "no",]Ternyata pdays terbanyak ada di pdays -1 yakni sebanyak 33570 untuk menolak melakukan investasi deposito dan 3384 nasabah yang melakukan investasi deposito, nilai -1 artinya nasabah belum pernah dihubungi sebelumnya. Dan berdasarkan data, nasabah di pdays -1 ini memiliki ketertarikan untuk melakukan investasi deposito berjangka jauh lebih tinggi dibanding yang sudah dihubungi sebelumnya.
Pdays dengan kecenderungan orang melakukan investasi deposito ada di rentang pdays 80-105. Di rentang pdays 178-196 juga ditemukan kecenderungan yang sama.
Dapat dikatakan kalau nasabah yang melakukan investasi deposito dan yang menolak melakukannya berpusat di pdays -1, atau dengan kata lain selama kampanye berlangsung, nasabah yang dihubungi berpusat di nasabah yang belum pernah dihubungi sebelumnya.
table(bank$previous,bank$y)#>
#> no yes
#> 0 33570 3384
#> 1 2189 583
#> 2 1650 456
#> 3 848 294
#> 4 543 171
#> 5 338 121
#> 6 194 83
#> 7 151 54
#> 8 90 39
#> 9 68 24
#> 10 41 26
#> 11 50 15
#> 12 34 10
#> 13 29 9
#> 14 14 5
#> 15 19 1
#> 16 13 0
#> 17 12 3
#> 18 6 0
#> 19 9 2
#> 20 7 1
#> 21 3 1
#> 22 5 1
#> 23 7 1
#> 24 5 0
#> 25 4 0
#> 26 1 1
#> 27 5 0
#> 28 2 0
#> 29 3 1
#> 30 2 1
#> 32 1 0
#> 35 1 0
#> 37 2 0
#> 38 2 0
#> 40 1 0
#> 41 1 0
#> 51 1 0
#> 55 0 1
#> 58 0 1
#> 275 1 0
summary(bank$previous)#> Min. 1st Qu. Median Mean 3rd Qu. Max.
#> 0.0000 0.0000 0.0000 0.5803 0.0000 275.0000
plot(bank$y, bank$previous, horizontal =T)Semakin kecil previous (jumlah kontak yang dilakukan ke nasabah sebelum kampanye ini), semakin besar pula kencenderungan nasabah untuk melakukan investasi deposito maupun menolak dalam kampanye kali ini.
table(bank$poutcome, bank$y)#>
#> no yes
#> failure 4283 618
#> other 1533 307
#> success 533 978
#> unknown 33573 3386
Nasabah yang sudah pernah sukses mengikuti kampanye sebelumnya memiliki tingkat kesuksesan untuk melakukan investasi deposito berjangka yang lebih besar dibanding yang lainnya, akan tetapi nasabah di kampanye sebelumnya failure tetap ada kemungkinan mereka akan melakukan investasi deposito di kampanye ini.
Data berdasarkan Poutcome didominasi oleh kategori unkwown, yang mana data nasabah di kampanye sebelumnya tidak diketahui.
yym <- bank[bank$y == "yes",]
plot(yym$age, yym$balance)
abline(lm(yym$balance~yym$age), col = "red")
Terlihat tidak ada hubungan antara balance/saldo dan umur nasabah di
antara nasabah yang melakukan investasi deposito selama kampanye
pemasaran berlangsung.
Sebelum malihat lebih jauh hubungan balance dan y, terlebih dahulu cek data balance apakah terdistribusi normal atau tidak.
Akan dicek apakah ada outlier dalam data balance.
summary(bank$balance)#> Min. 1st Qu. Median Mean 3rd Qu. Max.
#> -8019 72 448 1362 1428 102127
Q1 <- quantile(bank$balance,0.25)
Q3 <- quantile(bank$balance,0.75)
IQR <- Q3-Q1
Q1-(1.5*IQR)#> 25%
#> -1962
Q3+(1.5*IQR)#> 75%
#> 3462
Setelah mencari nilai batas whiskernya yakni -1962 dan 3462, akan dilakukan subseting pada kolom balance untuk melihat ada berapa outlier
nrow(bank[bank$balance > 3462 | bank$balance < -1962,])#> [1] 4729
Atau bisa dengan code berikut:
length(boxplot.stats(bank$balance)$out)#> [1] 4729
Karena terdapat 4729 outlier dan nilai mean sensitif terhadapt outlier, maka digunakan median untuk melihat pusat persebaran datanya dan sebagai acuan perbandingan yang menggantikan mean.
Selanjutnya kita akan melihat job apa saja yang memiliki median balance tertinggi.
bank_balance_job <- aggregate(balance~job, data = bank, FUN = "median")
bank_balance_job <- bank_balance_job[order(bank_balance_job$balance,decreasing = T),]
bank_balance_jobTernyata median balance tertinggi ada di retired job, dan top 3 job dengan jumlah nasabah yang melakukan investasi deposito terbanyak tidak dipengaruhi oleh median balance dari masing-masing job.
Agar hasil data mudah dilihat, maka di buatkan visualisasi sebagai berikut.
ggplot(data = bank_balance_job, aes(balance, reorder(job,balance)))+
geom_col()Selanjutnya akan dilihat pengaruh median balance berdasarkan job terhadap kecenderungan nasabah untuk melakukan investasi deposito atau tidak.
bank_bal_job_y_med <- aggregate(balance~job+y, data = bank, FUN = "median")
bank_bal_job_y_med <- bank_bal_job_y_med[order(bank_bal_job_y_med$balance,decreasing = T),]
bank_bal_job_y_medggplot(data = bank_bal_job_y_med, aes(balance, reorder(job,balance), fill=y))+
geom_bar(stat = 'identity', position = 'dodge')+
# geom_text(aes(label = balance), position = position_dodge())+
labs(y = "job")Ternyata ada trend dimana semakin besar median balance semakin besar pula kemungkinan nasabah melakukan investasi deposito di hampir semua kategori job yang diobservasi, hanya di job nasabah dengan kategori student yang sulit dilihat adanya pengaruh balance terhadap kecenderungan nasabah melakukan investasi deposito atau tidak.
yym <- bank[bank$y == "yes",]
table(yym$education)#>
#> primary secondary tertiary unknown
#> 591 2450 1996 252
yym[,c("education","balance")]aggregate(balance~education, data=yym, FUN=median)aggregate(balance~job, data=yym, FUN=median)aggregate(balance~education+job, data=yym, FUN=median)table(yym$education)#>
#> primary secondary tertiary unknown
#> 591 2450 1996 252
Dari analisa data di atas, hasilnya semakin tinggi pendidikan seseorang (> primary) semakin tinggi pula balance yang mereka miliki, dan kecenderungan mereka akan melakukan subscribe deposito semakin besar terlihat jumlah nasabah yang subscribe deposito dengan pendidikan secondary ada sebanyak 2450, tertiary ada sebanyak 1996, sedangkan primary hanya 591.
yym[yym$education %in% c("secondary","tertiary") & yym$job %in% c("technician", "management", "blue-collar") & yym$balance >=0 & yym$loan == "no"& yym$default == "no"& yym$housing == "no", ]Setelah dilakukan analisis berdasarkan data diatas, karakteristik nasabah yang cenderung untuk melakukan investasi deposito berjangka yakni nasabah dengan rentang umur 23-73, memiliki pendidikan secondary atau tertiary, jobnya antara blue collar, managemnet, atau technician, memiliki balance sama dengan atau lebih besar dari 0, tidak memiliki pinjaman baik itu pribadi dan rumah, dan tidak memiliki kredit macet.
round((1348/5289)*100,1)#> [1] 25.5
Ternyata dari data nasabah yang melakukan investasi deposito berjangka ada sebanyak 25.5% nasabah berada dalam karakteristik data di atas. Jadi ini bisa dijadikan masukan untuk fokus menargetkan nasabah dengan kategori tersebut di kampanye kali ini maupun di kampanye selanjutnya.
Dari Analisis, Nasabah kelompok usia produktif lebih banyak yang melakukan investasi deposit berjangka tetapi yang tidak melakukannya juga banyak. Untuk usia muda di bawah 23 dan usai di atas 60 tahun ditemukan kecenderungan untuk melakukan investasi deposito lebih besar hal ini karena pada usia tua lebih memungkinkan memiliki uang lebih yang bisa di investasikan dan untuk usia muda mereka lebih tertarik untuk mencoba hal-hal yang berkaitan dengan investasi. Insight ini baik bagi bank untuk fokus pada nasabah kelompok usia tua untuk mendapatkan lebih banyak nasabah yang mengambil deposito berjangka karena secara finansial dan pengetahuan akan investasi sudah mapan.
Nasabah dengan jenis pekerjaan management, technician dan blue-collar lebih banyak mengambil investasi deposito berjangka. Akan tetapi setelah ditinjau berdasarkan median dari balance pekerjaan tersebut, justru retired dan housemaid memiliki kecenderungan untuk melakukan investasi deposito. Hal ini masuk akal karena retired/pensiunan dan housemaid/pembantu rumah tangga cenderung tidak menghabiskan uangnya dalam jumlah besar sehingga mereka lebih cenderung memilih uangnya yang bekerja dengan cara mengambil investasi deposito di bank atau investasi lainnya.
Semakin tinggi tingkat pendidikan nasabah, semakin tinggi pula tingakt kecenderungan mereka untuk melakukan investasi deposito berjangka.
Nasabah yang tidak tertarik untuk mengambil pinjaman perumahan dan pinjaman pribadi memiliki kecenderungan untuk mengambil investasi deposito berjangka.
Sebagian besar nasabah bank dalam kampanye kali ini dihubungi pada bulan Mei, Juni, Juli dan Agustus. Dan sebagian besar nasabah yang dihubungi pada bulan Mei ternyata tidak tertarik untuk mengambil investasi deposito berjangka. Sebaliknya sangat sedikit nasabah yang dihubungi di bulan Maret, September, Oktober dan Desember tetapi pada bulan-bulan ini justru peluang nasabah yang mengambil investasi deposito jauh lebih tinggi. Sehingga dari insight tersebut, sebaiknya bank menghubungi lebih banyak nasabah di bulan-bulan tersebut.
Semakin jarang nasabah itu dihubungi dan semakin sedikit nasabah tersebut mengikuti kampanye sebelumya, semakin besar pula kemungkinan nasabah tersebut akan mengambil investasi deposito berjangka.
Nasabah yang masuk kategori sukses pada kampanye sebelumnya, memiliki tingkat kesuksesan untuk melakukan investasi deposito berjangka yang lebih besar, akan tetapi nasabah di kampanye sebelumnya failure tetap ada kemungkinan mereka akan melakukan investasi deposito di kampanye ini.
Karakteristik nasabah yang cenderung untuk melakukan investasi deposito berjangka yakni nasabah dengan rentang umur 23-73, memiliki pendidikan secondary atau tertiary, jobnya antara blue collar, managemnet, atau technician, memiliki balance sama dengan atau lebih besar dari 0, tidak memiliki pinjaman baik itu pribadi dan rumah, dan tidak memiliki kredit macet.