Introduction

Deposito berjangka merupakan sumber pendapatan utama bagi sebuah bank. Deposito berjangka adalah investasi tunai yang diadakan oleh sebuah lembaga keuangan. Uang Anda diinvestasikan untuk tingkat bunga yang disepakati selama jangka waktu tertentu. Untuk menarik lebih banyak nasabah untuk mengambil deposito berjangka, bank memiliki berbagai rencana sosialisasi/kampanye untuk menjual deposito berjangka kepada nasabah mereka seperti pemasaran email, iklan, pemasaran melalui telepon, dan pemasaran digital.

Kampanye pemasaran melalui telepon masih tetap menjadi salah satu cara paling efektif untuk menjangkau nasabah. Namun, bank membutuhkan pengeluaran dana yang lebih besar dengan cara tersebut untuk melaksanakan kampanye ini. Oleh karena itu, sangat penting untuk mengidentifikasi pelanggan yang kemungkinan besar akan mengambil deposito berjangka terlebih dahulu sehingga mereka dapat ditargetkan secara khusus melalui panggilan.

Dalam pembahasan kali ini, data yang akan digunakan terkait dengan data kampanye pemasaran langsung dari salah satu lembaga perbankan Portugis. Kampanye pemasaran didasarkan pada panggilan telepon yang dilakukan bank ke nasabahnya.

Objektif:

  • Tujuan bisnis: Mengurangi sumber daya pemasaran dengan mengidentifikasi nasabah yang akan malakukan investasi deposito berjangka sehingga target nasabah bisa berfokus kepada mereka.

Data Preperation

Read data / importing data

Sebelum menganalisa dataset, kita akan memanggil dataset bank dari bank-full.csv dan disimpan kedalam object bernama bank, kemudian akan dilakukan Exploratory Data Analyst terhadap dataset bank tersebut.

bank <- read.csv("data_input/bank-full.csv", sep=";")

Import Library

Pertama kita akan memanggil library yang dibutuhkan, karena kita akan melakukan sedikit visualisasi data agar data mudah di lihat, maka kita akan menggunkan library yang dibutuhkan.

library(ggplot2)

Inspeksi Data

Selanjutnya kita akan melihat dataset yang sudah kita panggil, gunakan head untuk melihat 6 baris pertama.

head(bank)

Deskripsi Data

Dari inspeksi data yang dilakukan terdapat beberapa kolom yang memiliki deskripsi sebagai berikut:

Informasi Nasabah:

  • age - umur nasabah
  • job - pekerjaan nasabah
  • marital- status pernikahan nasabah
  • education - tingkat pendidikan nasabah
  • default - apakah nasabah memiliki kredit macet?
  • balance - rata-rata saldo nasabah per tahun, dalam satuan euro
  • housing - apakah nasabah memiliki pinjaman rumah?
  • loan - apakah nasabah memiliki pinjaman pribadi?

Informasi terkait kontak terakhir nasabah selama kampanye pemasaran saat ini:

  • contact - Bentuk komunikasi
  • month - Bulan
  • day - Tanggal dimana nasabah dihubungi
  • duration - Lama durasi ketika nasabah dihubungi (dalam satuan detik)

Atribut Lain-Lain:

  • campaign - Jumlah kampanye pemasaran yang pernah diikuti nasabah sebelumnya
  • pdays - jumlah hari yang berlalu setelah nasabah terakhir kali dihubungi dari kampanye sebelumnya
  • previous - jumlah kontak yang dilakukan ke nasabah sebelum kampanye ini.
  • poutcome - hasil kampanye pemasaran sebelumnya pada nasabah yang menikuti kampanye kali ini

Variabel output:

  • y: apakah klien sudah berlangganan deposito berjangka? (ya/tidak)

Data Processing

Melakukan inspeksi tipe data, untuk memastikan tipe data dari setiap kolomnya sudah sesuai.

str(bank)
#> 'data.frame':    45211 obs. of  17 variables:
#>  $ age      : int  58 44 33 47 33 35 28 42 58 43 ...
#>  $ job      : chr  "management" "technician" "entrepreneur" "blue-collar" ...
#>  $ marital  : chr  "married" "single" "married" "married" ...
#>  $ education: chr  "tertiary" "secondary" "secondary" "unknown" ...
#>  $ default  : chr  "no" "no" "no" "no" ...
#>  $ balance  : int  2143 29 2 1506 1 231 447 2 121 593 ...
#>  $ housing  : chr  "yes" "yes" "yes" "yes" ...
#>  $ loan     : chr  "no" "no" "yes" "no" ...
#>  $ contact  : chr  "unknown" "unknown" "unknown" "unknown" ...
#>  $ day      : int  5 5 5 5 5 5 5 5 5 5 ...
#>  $ month    : chr  "may" "may" "may" "may" ...
#>  $ duration : int  261 151 76 92 198 139 217 380 50 55 ...
#>  $ campaign : int  1 1 1 1 1 1 1 1 1 1 ...
#>  $ pdays    : int  -1 -1 -1 -1 -1 -1 -1 -1 -1 -1 ...
#>  $ previous : int  0 0 0 0 0 0 0 0 0 0 ...
#>  $ poutcome : chr  "unknown" "unknown" "unknown" "unknown" ...
#>  $ y        : chr  "no" "no" "no" "no" ...

Cek Unique

Selanjutnya, mengecek nilai unik di setiap kolom untuk membantu dalam penentuan tipe data terutama tipe data kategorik/factor. Karena ingin mengecek semua kolomnya sekaligus maka digunakan perintah lapply().

lengths(lapply(bank, unique))
#>       age       job   marital education   default   balance   housing      loan 
#>        77        12         3         4         2      7168         2         2 
#>   contact       day     month  duration  campaign     pdays  previous  poutcome 
#>         3        31        12      1573        48       559        41         4 
#>         y 
#>         2

Menyesuaikan tipe data

Selanjutnya, karena terdapat beberapa kolom yang akan diubah secara bersamaan ke tipe data factor maka bisa menggunakan function lapply() dan as.factor untuk setiap kolom yang akan diubah ke factor.

# Membuat daftar kolom yang akan diubah tipe datanya
columns <- c("job","marital","education","default","housing","loan","contact","day","month","poutcome","y")
# Masukkan variable columns ke function lapply()
bank[,columns] <- lapply(bank[,columns], as.factor)

Kemudian, mengecek kembali tipe data apakah sudah sesuai.

str(bank)
#> 'data.frame':    45211 obs. of  17 variables:
#>  $ age      : int  58 44 33 47 33 35 28 42 58 43 ...
#>  $ job      : Factor w/ 12 levels "admin.","blue-collar",..: 5 10 3 2 12 5 5 3 6 10 ...
#>  $ marital  : Factor w/ 3 levels "divorced","married",..: 2 3 2 2 3 2 3 1 2 3 ...
#>  $ education: Factor w/ 4 levels "primary","secondary",..: 3 2 2 4 4 3 3 3 1 2 ...
#>  $ default  : Factor w/ 2 levels "no","yes": 1 1 1 1 1 1 1 2 1 1 ...
#>  $ balance  : int  2143 29 2 1506 1 231 447 2 121 593 ...
#>  $ housing  : Factor w/ 2 levels "no","yes": 2 2 2 2 1 2 2 2 2 2 ...
#>  $ loan     : Factor w/ 2 levels "no","yes": 1 1 2 1 1 1 2 1 1 1 ...
#>  $ contact  : Factor w/ 3 levels "cellular","telephone",..: 3 3 3 3 3 3 3 3 3 3 ...
#>  $ day      : Factor w/ 31 levels "1","2","3","4",..: 5 5 5 5 5 5 5 5 5 5 ...
#>  $ month    : Factor w/ 12 levels "apr","aug","dec",..: 9 9 9 9 9 9 9 9 9 9 ...
#>  $ duration : int  261 151 76 92 198 139 217 380 50 55 ...
#>  $ campaign : int  1 1 1 1 1 1 1 1 1 1 ...
#>  $ pdays    : int  -1 -1 -1 -1 -1 -1 -1 -1 -1 -1 ...
#>  $ previous : int  0 0 0 0 0 0 0 0 0 0 ...
#>  $ poutcome : Factor w/ 4 levels "failure","other",..: 4 4 4 4 4 4 4 4 4 4 ...
#>  $ y        : Factor w/ 2 levels "no","yes": 1 1 1 1 1 1 1 1 1 1 ...

Karena urutan factor untuk kolom month dan day_of_week belum terurut, pertama akan diurutkan kolom-kolom tersebut:

bank$month <- ordered(bank$month, c("jan","feb","mar","apr","may","jun","jul","aug","sep","oct","nov","dec"))
levels(bank$month)
#>  [1] "jan" "feb" "mar" "apr" "may" "jun" "jul" "aug" "sep" "oct" "nov" "dec"
bank$day <- ordered(bank$day, c(1:31))
levels(bank$day)
#>  [1] "1"  "2"  "3"  "4"  "5"  "6"  "7"  "8"  "9"  "10" "11" "12" "13" "14" "15"
#> [16] "16" "17" "18" "19" "20" "21" "22" "23" "24" "25" "26" "27" "28" "29" "30"
#> [31] "31"

Duplicates

Mengecek apakah terdapat data yang memiliki kesamaan nilai atau duplikat.

#cek duplicate
sum(duplicated(bank))
#> [1] 0

Karena tidak terdapat data duplicate, maka selanjutnya cek apakah terdapat missing values.

Mengecek kolom Missing Values

colSums(is.na(bank))
#>       age       job   marital education   default   balance   housing      loan 
#>         0         0         0         0         0         0         0         0 
#>   contact       day     month  duration  campaign     pdays  previous  poutcome 
#>         0         0         0         0         0         0         0         0 
#>         y 
#>         0

Ternyata tidak terdapat kolom yang mengandung missing values.

Kemudian melakukan summary untuk melihat secara singkat informasi yang terkandung di dalam dataframe dan melihat apakah ada kejanggalan data terutama di data yang bertipe numerik.

summary(bank)
#>       age                 job           marital          education    
#>  Min.   :18.00   blue-collar:9732   divorced: 5207   primary  : 6851  
#>  1st Qu.:33.00   management :9458   married :27214   secondary:23202  
#>  Median :39.00   technician :7597   single  :12790   tertiary :13301  
#>  Mean   :40.94   admin.     :5171                    unknown  : 1857  
#>  3rd Qu.:48.00   services   :4154                                     
#>  Max.   :95.00   retired    :2264                                     
#>                  (Other)    :6835                                     
#>  default        balance       housing      loan            contact     
#>  no :44396   Min.   : -8019   no :20081   no :37967   cellular :29285  
#>  yes:  815   1st Qu.:    72   yes:25130   yes: 7244   telephone: 2906  
#>              Median :   448                           unknown  :13020  
#>              Mean   :  1362                                            
#>              3rd Qu.:  1428                                            
#>              Max.   :102127                                            
#>                                                                        
#>       day            month          duration         campaign     
#>  20     : 2752   may    :13766   Min.   :   0.0   Min.   : 1.000  
#>  18     : 2308   jul    : 6895   1st Qu.: 103.0   1st Qu.: 1.000  
#>  21     : 2026   aug    : 6247   Median : 180.0   Median : 2.000  
#>  17     : 1939   jun    : 5341   Mean   : 258.2   Mean   : 2.764  
#>  6      : 1932   nov    : 3970   3rd Qu.: 319.0   3rd Qu.: 3.000  
#>  5      : 1910   apr    : 2932   Max.   :4918.0   Max.   :63.000  
#>  (Other):32344   (Other): 6060                                    
#>      pdays          previous           poutcome       y        
#>  Min.   : -1.0   Min.   :  0.0000   failure: 4901   no :39922  
#>  1st Qu.: -1.0   1st Qu.:  0.0000   other  : 1840   yes: 5289  
#>  Median : -1.0   Median :  0.0000   success: 1511              
#>  Mean   : 40.2   Mean   :  0.5803   unknown:36959              
#>  3rd Qu.: -1.0   3rd Qu.:  0.0000                              
#>  Max.   :871.0   Max.   :275.0000                              
#> 

Dari Summary dapat ditarik informasi sebagai berikut: Selama campaign yang dilakukan bank, data karakteristik nasabah yang mengikuti campaign sebagai berikut:

  • 50% Nasabah berada di rentang umur 33-48 tahun.
  • Pekerjaan nasabah didominasi oleh pekerjaan blue-collar, management dan technician.
  • Status marital nasabah didominasi oleh nasabah yang sudah menikah.
  • Status pendidikan nasabah paling tinggi di tingkat secondary.
  • Sebanyak 44396 nasabah tidak memiliki kredit macet.
  • 50% Nasabah memiliki balance di rentang 72-1428.
  • Nasabah yang memiliki pinjaman perumahan ternyata lebih banyak dari yang tidak memiliki pinjaman perumahan.
  • Nasabah didominasi oleh yang tidak memiliki pinjaman.
  • Kontak yang digunakan untuk menghubungi nasabah paling banyak adalah dengan menggunakan panggilan selular.
  • Tanggal paling banyak nasabah dihubungi berada di tangal 5,6,17,18,20, dan 21.
  • Bulan paling banyak nasabah dihubungi berada di bulan Mei.
  • Lama durasi ketika nasabah dihubungi berada di rentang 103 - 319 detik.
  • Data didominasi oleh nasabah yang belum pernah dihubungi sebelumnya atau pdays -1.
  • Kebanyakan nasabah yang dihubungi adalah nasabah yang hasil campaign sebelumnya tidak diketahui.

EDA (Exploratory Data Analysis)

Kita akan melakukan Exploratory Data Analysis terhadap setiap kolomnya.

Informasi Nasabah

Pertama akan dilihat secara singkat isi dataframe dengan menggunakan perintah head:

head(bank)

Karena tujuan kita ingin mengetahui banyaknya nasabah yang mengambil deposito dan tidak mengambil selama kampanye berlangsung, maka kita akan menggunakan perintah table untuk melihat proporsi datanya.

table(bank$y)
#> 
#>    no   yes 
#> 39922  5289
round(prop.table(table(bank$y))*100,1)
#> 
#>   no  yes 
#> 88.3 11.7

Dari total data yang ada, hanya 11.7% (5289) nasabah yang melakukan investasi deposito dalam hal ini kesuksesan kampanye yang dilakukan oleh bank sebesar 11.7%

Selanjutnya kita akan meninjau setiap variabel yang ada di dataframe untuk mengetahui karakteristik seperti apa nasabah yang cenderung melakukan deposito.

Age

Melakukan pengecekan distribusi umur pada nasabah:

table(bank$age,bank$y)
#>     
#>        no  yes
#>   18    5    7
#>   19   24   11
#>   20   35   15
#>   21   57   22
#>   22   89   40
#>   23  158   44
#>   24  234   68
#>   25  414  113
#>   26  671  134
#>   27  768  141
#>   28  876  162
#>   29 1014  171
#>   30 1540  217
#>   31 1790  206
#>   32 1864  221
#>   33 1762  210
#>   34 1732  198
#>   35 1685  209
#>   36 1611  195
#>   37 1526  170
#>   38 1322  144
#>   39 1344  143
#>   40 1239  116
#>   41 1171  120
#>   42 1131  111
#>   43 1058  103
#>   44 1043   93
#>   45 1110  106
#>   46 1057  118
#>   47  975  113
#>   48  915   82
#>   49  893  101
#>   50  867   72
#>   51  859   77
#>   52  826   85
#>   53  806   85
#>   54  727   84
#>   55  730   76
#>   56  710   68
#>   57  750   78
#>   58  668   72
#>   59  682   88
#>   60  498   98
#>   61   90   57
#>   62   41   39
#>   63   47   30
#>   64   39   35
#>   65   38   21
#>   66   39   24
#>   67   31   23
#>   68   15   21
#>   69   27   17
#>   70   50   17
#>   71   29   25
#>   72   28   24
#>   73   20   24
#>   74   24   13
#>   75   24   15
#>   76   16   16
#>   77   22   22
#>   78   16   14
#>   79   15   10
#>   80   19   12
#>   81   11    6
#>   82   11    8
#>   83   16    6
#>   84    4    5
#>   85    1    4
#>   86    5    4
#>   87    1    3
#>   88    2    0
#>   89    3    0
#>   90    0    2
#>   92    0    2
#>   93    0    2
#>   94    1    0
#>   95    1    1

Untuk melihat lebih jelas umur nasabah berpusat di umur berapa, kita akan memvisualisasikannya dengan plot boxplot.

plot(bank$y, bank$age, horizontal = T)

Karena batas nilai box di boxplot tidak terlihat, kita bisa mengetahuinya dengan menggunakan summary.

summary(bank$age)
#>    Min. 1st Qu.  Median    Mean 3rd Qu.    Max. 
#>   18.00   33.00   39.00   40.94   48.00   95.00
summary(bank[bank$y == "no",c("age")])
#>    Min. 1st Qu.  Median    Mean 3rd Qu.    Max. 
#>   18.00   33.00   39.00   40.84   48.00   95.00
summary(bank[bank$y == "yes",c("age")])
#>    Min. 1st Qu.  Median    Mean 3rd Qu.    Max. 
#>   18.00   31.00   38.00   41.67   50.00   95.00

Dari summary terlihat bahwa data umur nasabah secara keseluruhan baik itu nasabah yang melakukan investasi deposito maupun tidak, usianya terpusat di usia produktif dengan rentang umur 33-48, dan nampaknya bank tidak terlalu tertarik untuk menghubungi nasabah dengan usia diatas 60 dan di bawah 23 tahun. Akan tetapi dari data di atas, nasabah dengan usia di atas 60 dan di bawah 23 memiliki kecenderungan untuk mengambil investasi deposito berjangka lebih tinggi dibanding rentang usia terpusatnya. Kemungkinan besar karena di usia tua sudah paham akan konsep investasi, dan di usia muda sedang terjadi trend untuk berinvestasi. Untuk itu, sebaiknya di kampanye berikutnya bank harus mempertinmbangkan menghubungi nasabah dengan usia tersebut.

Untuk mempermudah melihat distribusi umur nasabah, akan dilakukan visualisasi data menggunakan ggplot untuk nasabah yang melakukan subscribe deposito maupun tidak.

ggplot(bank, aes(age, color=y, fill=y))+
  geom_histogram(color="black", bins = 42)+
  facet_wrap(facets = .~y, nrow = 2, scales = "free")

Marital

table(bank$marital, bank$y)
#>           
#>               no   yes
#>   divorced  4585   622
#>   married  24459  2755
#>   single   10878  1912

Dapat dilihat bahwa jumlah nasabah yang sudah menikah lebih banyak melakukan investasi deposito dibanding yang single baik itu belum menikah maupun telah bercerai.

Education

table(bank$education, bank$y)
#>            
#>                no   yes
#>   primary    6260   591
#>   secondary 20752  2450
#>   tertiary  11305  1996
#>   unknown    1605   252
#prop.table(table(bank$education, bank$y))

Nasabah terbanyak yang melakukan investasi deposito memiliki latar pendidikan secondary, dan ada kecenderungan semakin tinggi tingkat pendidikan semakin tinggi pula nasabah tersebut akan melakukan investasi deposito.

Job

table(bank$job, bank$y)
#>                
#>                   no  yes
#>   admin.        4540  631
#>   blue-collar   9024  708
#>   entrepreneur  1364  123
#>   housemaid     1131  109
#>   management    8157 1301
#>   retired       1748  516
#>   self-employed 1392  187
#>   services      3785  369
#>   student        669  269
#>   technician    6757  840
#>   unemployed    1101  202
#>   unknown        254   34
round(prop.table(table(bank$job, bank$y))*100,1)
#>                
#>                   no  yes
#>   admin.        10.0  1.4
#>   blue-collar   20.0  1.6
#>   entrepreneur   3.0  0.3
#>   housemaid      2.5  0.2
#>   management    18.0  2.9
#>   retired        3.9  1.1
#>   self-employed  3.1  0.4
#>   services       8.4  0.8
#>   student        1.5  0.6
#>   technician    14.9  1.9
#>   unemployed     2.4  0.4
#>   unknown        0.6  0.1

Berdasarkan proporsi dari setiap pekerjaan, tampak bahwa nasabah yang mengikuti kampanye pemasaran ini didominasi oleh pekerjaan blue-collar, management, technician dan admin.

Selanjutnya akan diamati pada jenis pekerjaan mana yang melakukan investasi deposito berjangka terbanyak.

bank_job_y <- as.data.frame(table(bank$job, bank$y))
names(bank_job_y) <-c("job","yes","freq")
bank_job_y <- bank_job_y[order(bank_job_y$freq, decreasing = T),]
bank_job_y[order(bank_job_y$yes,decreasing = T),]

Ternyata pekerjaan dengan jenis management, technician dan blue-collar merupakan 3 job dengan jumlah nasabah yang melakukan investasi deposito terbanyak akan tetapi kategori tersebut juga banyak yang menolak melakukan investasi deposito. Hal ini terjadi karena proporsi nasabah di kategori tersebut memang lebih banyak dibandingkan dengan jenis pekerjaan nasabah lainnya.

prop.table(table(bank$job, bank$y))
#>                
#>                           no          yes
#>   admin.        0.1004180399 0.0139567804
#>   blue-collar   0.1995974431 0.0156599058
#>   entrepreneur  0.0301696490 0.0027205769
#>   housemaid     0.0250160359 0.0024109177
#>   management    0.1804206941 0.0287761828
#>   retired       0.0386631572 0.0114131517
#>   self-employed 0.0307889673 0.0041361616
#>   services      0.0837185641 0.0081617306
#>   student       0.0147972838 0.0059498795
#>   technician    0.1494547787 0.0185795492
#>   unemployed    0.0243524806 0.0044679392
#>   unknown       0.0056181018 0.0007520294

Default

table(bank$default)
#> 
#>    no   yes 
#> 44396   815

Berdasarkan informasi di atas, nasabah yang terdaftar dalam kampanye kebanyakan yang tidak memiliki kredit macet, hal ini logis karena nasabah yang memiliki kredit macet biasanya memiliki sedikit dana yang tak terpakai.

Selanjutnya kita tinjau nasabah berdasarkan apakah melakukan deposito atau tidak.

table(bank$default, bank$y)
#>      
#>          no   yes
#>   no  39159  5237
#>   yes   763    52

Ternyata nasabah yang kreditnya tidak macet banyak melakukan subscribe deposito.

Balance

summary(bank$balance)
#>    Min. 1st Qu.  Median    Mean 3rd Qu.    Max. 
#>   -8019      72     448    1362    1428  102127

Ternyata rentang balance/saldo nasabah yang mengikuti kampanye kali ini berada di antara -8019 dan 102127

plot(bank$y, bank$balance, horizontal = T)

Akan dilihat lebih spesifik untuk yang melakukan investasi deposito berjangka dan yang tidak melakukan.

summary(bank[bank$y %in% "yes",c("balance","y")])
#>     balance        y       
#>  Min.   :-3058   no :   0  
#>  1st Qu.:  210   yes:5289  
#>  Median :  733             
#>  Mean   : 1804             
#>  3rd Qu.: 2159             
#>  Max.   :81204
summary(bank[bank$y %in% "no",c("balance","y")])
#>     balance         y        
#>  Min.   : -8019   no :39922  
#>  1st Qu.:    58   yes:    0  
#>  Median :   417              
#>  Mean   :  1304              
#>  3rd Qu.:  1345              
#>  Max.   :102127

Dari hasil summary dapat dilihat bahwa setengah nasabah yang melakukan investasi deposito berjangka memiliki balance/saldo sedikit lebih banyak dan bervariatif di banding yang tidak.

Apakah ada pengaruh tingkat balance terhadap kecenderungan nasabah untuk melakuakan investasi deposito berjangka?

Pertama akan dicek pada balance/saldo berapa jumlah nasabahnya paling banyak

bank_balance <- as.data.frame(table(bank$balance, bank$default))
names(bank_balance) <- c("balance","default","freq")
bank_balance$balance <- as.integer(as.character(bank_balance$balance)) 
bank_balance[order(bank_balance$freq,decreasing = T),]

Ternyata justru data didominasi oleh nasabah yang memiliki balance yang rendah, bahkan terbanyak berada di balance 0. Selanjutnya akan kita tinjau untuk masing2 kategori deposito yes dan no.

bank_bd_no <- bank_balance[bank_balance$default=="no" & bank_balance$freq >0,]
bank_bd_yes <- bank_balance[bank_balance$default=="yes" & bank_balance$freq >0,]
no <- head(bank_bd_no[order(bank_bd_no$freq, decreasing = T),],10)
yes <- head(bank_bd_yes[order(bank_bd_yes$freq, decreasing = T),],10)
no
yes

Bahkan setelah dianalisa untuk masing-masing kategorinya, nasabah yang memiliki balance 0 masih mendominasi.

Dengan hasil data seperti itu, dapat disimpulkan bahwa tingkat balance tidak mempengaruhi seorang nasabah untuk melakukan investasi deposito atau tidak.

Untuk melihat visualisasinya bisa menggunakan perintah berikut:

ggplot(bank, aes(balance, fill =y))+
  geom_histogram(bins=100)

Housing

table(bank$housing)
#> 
#>    no   yes 
#> 20081 25130

Hal yang menarik dari proporsi pada kolom housing, yaitu pembagian nasabah yang memiliki pinjaman perumahan ternyata lebih banyak dibanding yang tidak memiliki pinjaman perumahan. Selanjutnya akan dicek proporsinya terhadap y.

table(bank$housing, bank$y)
#>      
#>          no   yes
#>   no  16727  3354
#>   yes 23195  1935

Seperti yang terlihat, jumlah nasabah yang memiliki pinjaman perumahan dan melakukan investasi deposito lebih kecil dibanding yang tidak memiliki pinjaman perumahan dikarenakan secara logika nasabah yang memiliki pinjaman perumahan kemungkinan kecil memiliki uang yang tidak terpakai yang bisa dialokasikan ke investasi deposito.

Loan

table(bank$loan)
#> 
#>    no   yes 
#> 37967  7244

Dari keseluruhan data, nasabah yang tidak memiliki pinjaman pribadi 5x lebih besar dibanding yang memiliki pinjaman.

table(bank$loan, bank$y)
#>      
#>          no   yes
#>   no  33162  4805
#>   yes  6760   484

Dan terlihat pula nasabah yang melakukan investasi deposito lebih banyak dari segi nasabah yang tidak memiliki pinjaman pribadi.

Informasi terkait kontak terakhir nasabah selama kampanye pemasaran saat ini:

Akan dilakukan analisis data berdasarkan kontak terhadap nasabah yang mengikuti kampanye.

Contact

table(bank$contact)
#> 
#>  cellular telephone   unknown 
#>     29285      2906     13020

Terdapat 3 tipe komunikasi yang dilakukan selama campaign yakni cellular, telephone dan unknown. Akan diihat apakah ada pengaruh jenis komunikasi yang dilakukan selama kampanye berlangsung dengan keberhasilan nasabah untuk melakukan investasi deposito berjangka.

table(bank$contact,bank$y)
#>            
#>                no   yes
#>   cellular  24916  4369
#>   telephone  2516   390
#>   unknown   12490   530

Ternyata jenis komunikasi yang paling efektif dalam campaign ini adalah dengan menggunakan cellular.

Day

Akan ditinjau distribusi data dalam variabel day yang mana dalam hal ini tanggal nasabah dihubungi:

barplot(table(bank$day))

Plot diatas merupakan banyaknya nasabah ditinjau dari tanggal nasabah tersebut dihubungi, karena kita ingin meninjau datanya berdasarkan nasabah yang melakukan investasi deposito dan tidak, maka kita bisa memulainya dengan melihat persebaran datanya dengan summary terlebih dahulu.

Melihat persebaran datanya:

bank1 <- bank
bank1$day <- as.numeric(as.character(bank1$day))
summary(bank1$day)
#>    Min. 1st Qu.  Median    Mean 3rd Qu.    Max. 
#>    1.00    8.00   16.00   15.81   21.00   31.00
summary(bank1[bank1$y == "no",c("day")])
#>    Min. 1st Qu.  Median    Mean 3rd Qu.    Max. 
#>    1.00    8.00   16.00   15.89   21.00   31.00
summary(bank1[bank1$y == "yes",c("day")])
#>    Min. 1st Qu.  Median    Mean 3rd Qu.    Max. 
#>    1.00    8.00   15.00   15.16   22.00   31.00

Berdasarkan hasil analisis, ternyata 50% panggilan selama kampanye dilakukan pada tanggal 8-21 disetiap bulannya.

table(bank$day, bank$y)
#>     
#>        no  yes
#>   1   232   90
#>   2  1111  182
#>   3   901  178
#>   4  1215  230
#>   5  1695  215
#>   6  1751  181
#>   7  1660  157
#>   8  1641  201
#>   9  1382  179
#>   10  403  121
#>   11 1298  181
#>   12 1359  244
#>   13 1344  241
#>   14 1638  210
#>   15 1465  238
#>   16 1223  192
#>   17 1763  176
#>   18 2080  228
#>   19 1635  122
#>   20 2560  192
#>   21 1825  201
#>   22  751  154
#>   23  813  126
#>   24  385   62
#>   25  707  133
#>   26  919  116
#>   27  971  150
#>   28 1687  143
#>   29 1616  129
#>   30 1295  271
#>   31  597   46

Dilihat dari hasil plot dan persebaran datanya, tanggal dengan jumlah nasabah yang melakukan investasi deposito berjangka ternyata hampir tersebar rata di setiap tanggalnya, hanya di tanggal 1, 10, 24, dan 31 yang memiliki jumlah nasabah yang melakukan investasi deposito yang kecil.

Untuk melihat visualisasi nasabah berdasasrkan kategori depositonya bisa menggunakan perintah berikut:

bank_day_y <- as.data.frame(table(bank$day, bank$y))
names(bank_day_y) <- c("day","deposit","count")
bank_day_y$day <- as.numeric(as.character(bank_day_y$day))
ggplot(bank_day_y, aes(day, count, fill =deposit))+
  geom_col(position = "dodge")+
  scale_x_continuous(breaks = seq(1,31,1))

Dan ternyata untuk tanggal dimana nasabah dihubungi, bisa dilihat beberapa tanggal yang proporsi nasabah tersebut melakukan deposit itu kecil, yakni di tanggal 1, 10, 24, dan 31.

Month

Akan ditinjau banyaknya nasabah yang mengikuti kampanye berdasarkan bulan dihubungi:

barplot(table(bank$month))

Selama kampanye pemasaran berlangsung, ternyata jumlah nasabah yang paling banyak dihubungi berada di bulan Mei dan yang paling sedikit berada di bulan Desember dan Maret. Selanjutnya, akan ditinjau kategori deposit di setiap bulannya.

table(bank$month,bank$y)
#>      
#>          no   yes
#>   jan  1261   142
#>   feb  2208   441
#>   mar   229   248
#>   apr  2355   577
#>   may 12841   925
#>   jun  4795   546
#>   jul  6268   627
#>   aug  5559   688
#>   sep   310   269
#>   oct   415   323
#>   nov  3567   403
#>   dec   114   100

Hasilnya, walaupun di bulan Maret jumlah nasabah yang dihubungi jumlahnya kecil dari jumlah keseluruhan nasabah tetapi pada bulan Maret ternyata jumlah nasabah yang melakukan investasi deposit berjangka lebih tinggi dari yang tidak melakukan deposit. Dan secara persentase keberhasilan nasabah melakukan investasi deposit di bulan Maret ini jauh lebih tinggi dibanding bulan lainnya.

Dan berdasarkan proporsi datanya, bulan Desember-Januari merupakan bulan yang memiliki jumlah nasabah yang melakukan investasi deposito kecil, hal ini disebabkan karena di bulan ini banyak holiday atau hari libur. Maka perlu adanya perlakuan spesial atau event pada bulan Desember-Januari untuk menarik lebih banyak nasabah agar melakukan investasi deposito berjangka.

Duration

Akan dilihat apakah ada hubungan antara lama durasi seorang nasabah dihubungi dengan tingkat kecenderungan nasabah itu akan melakukan investasi deposito berjangka

table(bank$duration,bank$y)
#>       
#>         no yes
#>   0      3   0
#>   1      2   0
#>   2      3   0
#>   3      4   0
#>   4     15   0
#>   5     35   0
#>   6     45   0
#>   7     73   0
#>   8     84   1
#>   9     77   0
#>   10    76   0
#>   11    96   1
#>   12    80   0
#>   13    88   0
#>   14    84   0
#>   15    85   0
#>   16    88   0
#>   17    81   0
#>   18    94   0
#>   19    71   0
#>   20    83   0
#>   21    79   0
#>   22    87   0
#>   23    76   1
#>   24    80   0
#>   25    78   1
#>   26    70   0
#>   27    71   0
#>   28    55   0
#>   29    80   0
#>   30    62   1
#>   31    57   0
#>   32    54   0
#>   33    57   0
#>   34    72   1
#>   35    66   0
#>   36    90   0
#>   37    77   0
#>   38    62   0
#>   39    75   1
#>   40    72   0
#>   41    89   0
#>   42    86   0
#>   43    96   0
#>   44    95   0
#>   45    82   0
#>   46    83   1
#>   47    81   0
#>   48    97   0
#>   49    94   1
#>   50   112   0
#>   51   116   0
#>   52   100   0
#>   53   104   0
#>   54   106   0
#>   55   118   0
#>   56   123   0
#>   57   120   0
#>   58   131   0
#>   59   130   0
#>   60   107   0
#>   61   126   1
#>   62   108   0
#>   63   138   4
#>   64   132   0
#>   65   143   3
#>   66   121   0
#>   67   154   1
#>   68   145   0
#>   69   132   2
#>   70   140   0
#>   71   158   4
#>   72   161   0
#>   73   166   0
#>   74   148   1
#>   75   145   2
#>   76   159   1
#>   77   155   0
#>   78   151   3
#>   79   132   3
#>   80   159   5
#>   81   163   3
#>   82   162   3
#>   83   141   4
#>   84   136   4
#>   85   165   1
#>   86   143   1
#>   87   160   3
#>   88   169   1
#>   89   170   7
#>   90   181   3
#>   91   164   6
#>   92   165   3
#>   93   150   5
#>   94   145   4
#>   95   149   7
#>   96   150   5
#>   97   160   8
#>   98   158   4
#>   99   150   2
#>   100  155   4
#>   101  159   4
#>   102  157   3
#>   103  166   3
#>   104  169   6
#>   105  147   3
#>   106  159   6
#>   107  137   7
#>   108  159   6
#>   109  155   1
#>   110  155   6
#>   111  164   2
#>   112  169   5
#>   113  162   4
#>   114  171   4
#>   115  134   8
#>   116  132   4
#>   117  145   5
#>   118  133   5
#>   119  165   5
#>   120  129   7
#>   121  169   4
#>   122  168   7
#>   123  166   2
#>   124  182   6
#>   125  157   8
#>   126  156   7
#>   127  148   6
#>   128  149   5
#>   129  145   2
#>   130  140   7
#>   131  134  10
#>   132  133   8
#>   133  144   7
#>   134  144   8
#>   135  151   9
#>   136  162  12
#>   137  116   8
#>   138  137   9
#>   139  166   8
#>   140  145   8
#>   141  121   6
#>   142  117   5
#>   143  144   7
#>   144  143  11
#>   145  135   5
#>   146  117   8
#>   147  139   9
#>   148  140   9
#>   149  127   9
#>   150  149  12
#>   151  152   5
#>   152  131   8
#>   153  132   9
#>   154  128  12
#>   155  135   9
#>   156  135  11
#>   157  151   6
#>   158  141  15
#>   159  141   8
#>   160  135  10
#>   161  130   7
#>   162  112   6
#>   163  125   8
#>   164  128  11
#>   165  118  12
#>   166  150   9
#>   167  115  11
#>   168  135   5
#>   169  107  13
#>   170  100  12
#>   171  120   8
#>   172  126   8
#>   173  118  11
#>   174  121   4
#>   175  121  13
#>   176  115   9
#>   177  103   9
#>   178  122  11
#>   179  112   8
#>   180  115   8
#>   181  112  12
#>   182   98  13
#>   183   96   7
#>   184  112   5
#>   185  127  12
#>   186   75  10
#>   187  104  16
#>   188  110   9
#>   189  108   5
#>   190   91   8
#>   191   97   3
#>   192   97  14
#>   193  113  10
#>   194   85  12
#>   195   88  11
#>   196   83   9
#>   197  115   0
#>   198  116   4
#>   199   98   7
#>   200  109  11
#>   201  109   9
#>   202   93   7
#>   203  102   8
#>   204   96   9
#>   205   85   7
#>   206   98  10
#>   207   97  14
#>   208   87  12
#>   209   83  11
#>   210   99  12
#>   211  102  13
#>   212   85  14
#>   213   81   9
#>   214   97   7
#>   215   87  14
#>   216   83  12
#>   217   99   8
#>   218   72  11
#>   219   95   9
#>   220   86  10
#>   221   87   9
#>   222   91  10
#>   223   73   7
#>   224   76  12
#>   225   84   7
#>   226  101  17
#>   227   82  12
#>   228   74   7
#>   229   71  16
#>   230   80   8
#>   231   81   9
#>   232   74  16
#>   233   72   9
#>   234   60  12
#>   235   64   6
#>   236   84   9
#>   237   73   6
#>   238   78   9
#>   239   87  12
#>   240   89   6
#>   241   76   8
#>   242   58   8
#>   243   74  12
#>   244   79  10
#>   245   81  12
#>   246   80   5
#>   247   82   7
#>   248   72  11
#>   249   76   4
#>   250   74  11
#>   251   75  12
#>   252   69  12
#>   253   69  13
#>   254   70   7
#>   255   75  13
#>   256   70   6
#>   257   67  12
#>   258   68   7
#>   259   69   7
#>   260   66  11
#>   261   54  19
#>   262   66  12
#>   263   58  13
#>   264   59   7
#>   265   65  12
#>   266   63  10
#>   267   67  10
#>   268   74  15
#>   269   54   7
#>   270   57  14
#>   271   56  11
#>   272   68   9
#>   273   65   7
#>   274   52   5
#>   275   54   6
#>   276   54   9
#>   277   60   5
#>   278   50  10
#>   279   43   9
#>   280   61   6
#>   281   61   7
#>   282   61  10
#>   283   66   5
#>   284   46   8
#>   285   59   7
#>   286   53   2
#>   287   51   6
#>   288   50  12
#>   289   46  10
#>   290   58   7
#>   291   54   6
#>   292   46   4
#>   293   54  13
#>   294   54   8
#>   295   54  10
#>   296   51   9
#>   297   62   9
#>   298   56   5
#>   299   46   8
#>   300   46   9
#>   301   56  15
#>   302   44   5
#>   303   37   6
#>   304   48   6
#>   305   59  12
#>   306   60   6
#>   307   36   4
#>   308   37   6
#>   309   49  11
#>   310   33   6
#>   311   47   5
#>   312   45   3
#>   313   44   6
#>   314   46  10
#>   315   35   9
#>   316   44   9
#>   317   51   9
#>   318   53   8
#>   319   46   7
#>   320   41   3
#>   321   36   6
#>   322   54   4
#>   323   51  11
#>   324   48   9
#>   325   35   8
#>   326   54   8
#>   327   41   9
#>   328   42   8
#>   329   49   5
#>   330   32   7
#>   331   33   8
#>   332   46   6
#>   333   53   3
#>   334   35   3
#>   335   40   9
#>   336   33   9
#>   337   36   4
#>   338   30   5
#>   339   52   4
#>   340   46   6
#>   341   36   9
#>   342   44  11
#>   343   40   5
#>   344   38  11
#>   345   50   7
#>   346   41   2
#>   347   39   8
#>   348   37   3
#>   349   31   7
#>   350   39   9
#>   351   29   7
#>   352   40   8
#>   353   37   6
#>   354   37   6
#>   355   29   9
#>   356   24   5
#>   357   33   4
#>   358   42   6
#>   359   40   4
#>   360   45   7
#>   361   43   7
#>   362   43   4
#>   363   36   6
#>   364   41   4
#>   365   29   6
#>   366   29   9
#>   367   23   9
#>   368   26   4
#>   369   33   8
#>   370   32   7
#>   371   35   7
#>   372   22   8
#>   373   23   6
#>   374   34   4
#>   375   31   3
#>   376   32   6
#>   377   35   7
#>   378   32   6
#>   379   36   7
#>   380   27   5
#>   381   30   4
#>   382   25   7
#>   383   31   6
#>   384   29   8
#>   385   27   8
#>   386   35   5
#>   387   28   6
#>   388   32   7
#>   389   34   4
#>   390   32   8
#>   391   27   3
#>   392   33   7
#>   393   32   6
#>   394   32  10
#>   395   27   6
#>   396   27  11
#>   397   23   7
#>   398   22   6
#>   399   41   3
#>   400   33   9
#>   401   32   5
#>   402   21   2
#>   403   14   4
#>   404   32   7
#>   405   26   3
#>   406   29  10
#>   407   28   5
#>   408   33   3
#>   409   25   9
#>   410   25   2
#>   411   24  10
#>   412   24  11
#>   413   24   3
#>   414   20  10
#>   415   18  11
#>   416   18   7
#>   417   21   7
#>   418   23   5
#>   419   24   5
#>   420   33   5
#>   421   23   4
#>   422   31   4
#>   423   18   6
#>   424   16   3
#>   425   28   2
#>   426   19   8
#>   427   29   7
#>   428   27   2
#>   429   21   7
#>   430   19   5
#>   431   26   6
#>   432   29   5
#>   433   25   1
#>   434   13   5
#>   435   22   2
#>   436   19   4
#>   437   24   3
#>   438   19   5
#>   439   18   6
#>   440   12   2
#>   441   14   6
#>   442   22   7
#>   443   15   6
#>   444   16   5
#>   445   33   7
#>   446   32   3
#>   447   17   4
#>   448   18   2
#>   449   21  10
#>   450   14   3
#>   451   20   1
#>   452   21   5
#>   453   14   8
#>   454   18   5
#>   455   23   5
#>   456   20   7
#>   457   15   5
#>   458   10   8
#>   459   17   5
#>   460   21   8
#>   461   18   3
#>   462   22   6
#>   463   19   3
#>   464   24   5
#>   465   24   5
#>   466   22   2
#>   467   17  11
#>   468   14   0
#>   469   11   3
#>   470   20   6
#>   471   24   3
#>   472   23   5
#>   473   17   7
#>   474   14   6
#>   475   18  10
#>   476   11   8
#>   477   17   3
#>   478   12   4
#>   479   18  10
#>   480   15   5
#>   481   12   5
#>   482   10  10
#>   483   20   6
#>   484   15   0
#>   485   23   6
#>   486   12   6
#>   487   16   3
#>   488   14   2
#>   489   18   6
#>   490   18   2
#>   491   15   6
#>   492   17   3
#>   493   20   3
#>   494   13   6
#>   495   13   5
#>   496    7   5
#>   497    9   3
#>   498   19   4
#>   499   10   3
#>   500   18   5
#>   501   15   5
#>   502   17   2
#>   503   17   3
#>   504   20   9
#>   505   10   3
#>   506   12   6
#>   507   13   6
#>   508   15   4
#>   509   16   6
#>   510   15   3
#>   511   12   5
#>   512    8   6
#>   513   13   6
#>   514   17   3
#>   515   18   6
#>   516    8   3
#>   517   18   3
#>   518   18   2
#>   519    8   6
#>   520   20   5
#>   521   14   2
#>   522   10   5
#>   523   16   6
#>   524   14   5
#>   525    8   6
#>   526   11   7
#>   527   12   2
#>   528   17   7
#>   529   11   6
#>   530   15   5
#>   531   15   9
#>   532   14   9
#>   533    8   3
#>   534   14   3
#>   535   13   4
#>   536   15   7
#>   537   12   4
#>   538    8   3
#>   539    8   4
#>   540    7   4
#>   541   18   4
#>   542   13   4
#>   543   17   8
#>   544   19   1
#>   545    7   5
#>   546   11   5
#>   547   10   2
#>   548   12   2
#>   549   11   3
#>   550    9   3
#>   551   13   5
#>   552    7   6
#>   553   12   5
#>   554   15   8
#>   555    4   4
#>   556    7   5
#>   557    9   1
#>   558   11   4
#>   559   17   2
#>   560    6   6
#>   561   11   4
#>   562    9  10
#>   563   11   6
#>   564   13   2
#>   565   13   5
#>   566   10   5
#>   567   10   6
#>   568    7   5
#>   569   11   3
#>   570   13   3
#>   571    5   3
#>   572    9   2
#>   573    7   1
#>   574   13  10
#>   575    8   1
#>   576   10   7
#>   577   10   7
#>   578    9   6
#>   579   13   6
#>   580   11   3
#>   581    7   1
#>   582   10   4
#>   583    7   5
#>   584    9   2
#>   585   10   6
#>   586    8   4
#>   587    6   6
#>   588   11   5
#>   589   11   3
#>   590   11   5
#>   591    9   5
#>   592    7   4
#>   593   10   4
#>   594    6   3
#>   595    8   4
#>   596    7   3
#>   597   12   2
#>   598    5   2
#>   599   12   1
#>   600    8   4
#>   601    9   2
#>   602    7   1
#>   603   11   3
#>   604   18   6
#>   605   13   3
#>   606    8   7
#>   607   10   5
#>   608    9   6
#>   609   11   4
#>   610    6   4
#>   611   15   5
#>   612   10   4
#>   613    8   1
#>   614    6   5
#>   615    5   6
#>   616    5   5
#>   617    6   5
#>   618   10   8
#>   619    8   5
#>   620    9   2
#>   621    4   3
#>   622   12   3
#>   623    8   7
#>   624   11   3
#>   625   11   5
#>   626    8   2
#>   627    6   3
#>   628    7   2
#>   629    7   5
#>   630   10   4
#>   631    6   2
#>   632   12   4
#>   633   13   5
#>   634    7   4
#>   635    7   4
#>   636    9   4
#>   637    7   5
#>   638   10   7
#>   639    6   4
#>   640    5   5
#>   641    8   7
#>   642    5   5
#>   643   10   2
#>   644   10   3
#>   645    8   7
#>   646    5   2
#>   647    7   1
#>   648    5   4
#>   649    4   6
#>   650    8   5
#>   651    6   8
#>   652   10   3
#>   653    7   4
#>   654    5   7
#>   655    5   3
#>   656    6   2
#>   657    7   4
#>   658    3   7
#>   659    6   5
#>   660    6   3
#>   661    9   5
#>   662    5   6
#>   663    4   5
#>   664    4   6
#>   665    8   3
#>   666    6   4
#>   667    7   6
#>   668    8   3
#>   669    3   5
#>   670    1   7
#>   671    4   5
#>   672    4   2
#>   673    9   2
#>   674    8   4
#>   675    6   2
#>   676    8   9
#>   677    2   2
#>   678    8   2
#>   679    5   4
#>   680    8   2
#>   681    4   4
#>   682    4   4
#>   683    2   2
#>   684    5   1
#>   685    4   3
#>   686    6   7
#>   687    3   5
#>   688    2   3
#>   689    5   2
#>   690   10   3
#>   691    5   6
#>   692    9   3
#>   693    8   2
#>   694    2   4
#>   695    6   4
#>   696    4   8
#>   697    6   2
#>   698    9   2
#>   699    7   6
#>   700    8   7
#>   701    2   6
#>   702    8   0
#>   703    6   4
#>   704    3   5
#>   705    6   5
#>   706    8   3
#>   707    2   6
#>   708    3   2
#>   709    3   9
#>   710    0   4
#>   711    5   2
#>   712    4   8
#>   713    5   1
#>   714   10   3
#>   715    5   2
#>   716    3   8
#>   717    6   3
#>   718    6   4
#>   719    3   2
#>   720    4   6
#>   721    3   2
#>   722    8   5
#>   723    7   0
#>   724    3   2
#>   725    5   4
#>   726    3   2
#>   727    3   3
#>   728    9   4
#>   729    5   4
#>   730    7   5
#>   731    2   3
#>   732    3   4
#>   733    4   5
#>   734    4   2
#>   735    5   2
#>   736    3   5
#>   737    0   5
#>   738    7   3
#>   739    2   4
#>   740    4   4
#>   741    2   2
#>   742    7   2
#>   743    1   2
#>   744    9   6
#>   745    0   5
#>   746    6   3
#>   747    6   3
#>   748    4   1
#>   749    3   3
#>   750    4   4
#>   751    0   4
#>   752    4   0
#>   753    4   3
#>   754    7   2
#>   755    4   2
#>   756    4   1
#>   757    7   2
#>   758    4   4
#>   759    4   2
#>   760    1   2
#>   761    7   4
#>   762    3   4
#>   763    3   6
#>   764    7   3
#>   765    4   3
#>   766    5   3
#>   767    2   7
#>   768    5   4
#>   769    3   2
#>   770    4   1
#>   771    6   3
#>   772    6   2
#>   773    4   2
#>   774    5   3
#>   775    4   5
#>   776    4   1
#>   777    4   2
#>   778    5   0
#>   779    4   1
#>   780    4   2
#>   781    4   5
#>   782    1   2
#>   783    2   3
#>   784    2   3
#>   785    1   1
#>   786    5   2
#>   787    7   4
#>   788    8   5
#>   789    3   2
#>   790    5   1
#>   791    2   1
#>   792    3   4
#>   793    4   1
#>   794    3   1
#>   795    4   2
#>   796    4   5
#>   797    3   1
#>   798    3   2
#>   799    4   3
#>   800    7   2
#>   801    1   4
#>   802    2   2
#>   803    1   4
#>   804    4   1
#>   805    3   2
#>   806    3   2
#>   807    3   0
#>   808    4   8
#>   809    2   3
#>   810    3   2
#>   811    3   1
#>   812    2   4
#>   813    3   4
#>   814    3   3
#>   815    2   5
#>   816    6   2
#>   817    1   3
#>   818    4   0
#>   819    2   4
#>   820    4   3
#>   821    3   2
#>   822    0   1
#>   823    2   1
#>   824    5   2
#>   825    6   1
#>   826    3   1
#>   827    5   2
#>   828    1   3
#>   829    4   5
#>   830    0   4
#>   831    1   1
#>   832    3   2
#>   833    4   2
#>   834    5   4
#>   835    6   5
#>   836    4   3
#>   837    3   5
#>   838    1   5
#>   839    0   1
#>   840    1   2
#>   841    2   3
#>   843    2   3
#>   844    6   3
#>   845    2   2
#>   846    2   2
#>   847    4   2
#>   848    0   2
#>   849    1   4
#>   850    4   4
#>   851    5   1
#>   852    2   1
#>   853    2   3
#>   854    3   5
#>   855    3   4
#>   856    2   3
#>   857    2   4
#>   858    2   2
#>   859    3   1
#>   860    2   5
#>   861    4   1
#>   862    3   3
#>   863    2   2
#>   864    1   2
#>   865    4   1
#>   866    1   1
#>   867    4   4
#>   868    2   1
#>   869    4   1
#>   870    2   2
#>   871    2   4
#>   872    1   2
#>   873    3   3
#>   874    2   3
#>   875    2   4
#>   876    1   2
#>   877    1   2
#>   878    3   3
#>   879    0   1
#>   880    1   3
#>   881    4   2
#>   882    4   7
#>   883    1   1
#>   884    3   4
#>   885    4   3
#>   886    3   1
#>   888    2   3
#>   889    2   2
#>   890    1   3
#>   891    2   3
#>   892    1   1
#>   893    0   5
#>   894    1   3
#>   895    5   5
#>   896    1   3
#>   897    2   4
#>   898    3   2
#>   899    3   2
#>   900    1   1
#>   901    1   5
#>   902    3   3
#>   903    2   4
#>   904    1   4
#>   905    2   1
#>   906    3   2
#>   907    2   1
#>   908    3   3
#>   909    1   0
#>   910    0   3
#>   911    3   4
#>   912    3   2
#>   913    1   2
#>   914    2   0
#>   915    2   1
#>   916    5   1
#>   917    0   4
#>   918    2   3
#>   919    2   2
#>   920    2   3
#>   921    3   2
#>   922    1   4
#>   923    2   3
#>   924    5   3
#>   925    2   3
#>   926    1   2
#>   927    1   1
#>   928    2   0
#>   929    2   3
#>   930    1   3
#>   931    1   2
#>   932    1   0
#>   933    1   1
#>   934    0   1
#>   935    5   4
#>   936    3   0
#>   937    2   2
#>   938    0   3
#>   939    1   2
#>   940    0   3
#>   941    1   1
#>   942    3   2
#>   943    0   3
#>   944    2   2
#>   945    1   3
#>   946    0   2
#>   947    1   0
#>   948    2   0
#>   949    0   3
#>   950    1   1
#>   951    3   2
#>   952    3   5
#>   953    5   2
#>   954    0   2
#>   955    2   3
#>   956    3   2
#>   957    2   4
#>   958    2   4
#>   959    1   2
#>   960    1   0
#>   961    1   4
#>   962    1   1
#>   963    0   4
#>   964    1   0
#>   965    3   2
#>   966    3   0
#>   967    0   3
#>   968    3   5
#>   969    1   1
#>   970    1   2
#>   971    2   1
#>   972    1   0
#>   973    3   3
#>   974    1   2
#>   975    0   1
#>   976    0   2
#>   977    2   1
#>   978    1   2
#>   979    1   1
#>   980    0   1
#>   981    1   3
#>   982    1   1
#>   983    0   2
#>   984    4   6
#>   985    1   3
#>   986    3   0
#>   987    1   0
#>   988    0   3
#>   989    1   0
#>   990    1   2
#>   991    0   1
#>   992    1   1
#>   993    0   3
#>   994    1   2
#>   995    1   0
#>   996    1   2
#>   997    1   3
#>   998    0   3
#>   999    1   0
#>   1000   1   4
#>   1001   2   2
#>   1002   2   3
#>   1003   1   1
#>   1005   1   1
#>   1006   0   2
#>   1007   2   4
#>   1008   0   3
#>   1009   3   1
#>   1010   2   1
#>   1011   3   1
#>   1012   2   2
#>   1013   4   1
#>   1014   2   1
#>   1015   2   4
#>   1017   1   4
#>   1018   2   2
#>   1019   1   3
#>   1020   1   1
#>   1021   1   0
#>   1022   1   3
#>   1023   1   1
#>   1024   0   1
#>   1025   1   2
#>   1026   2   0
#>   1027   1   2
#>   1028   2   2
#>   1029   1   1
#>   1030   1   4
#>   1031   1   1
#>   1032   2   5
#>   1033   0   1
#>   1034   2   3
#>   1035   0   1
#>   1036   3   3
#>   1037   3   1
#>   1038   1   2
#>   1039   0   3
#>   1040   2   1
#>   1041   1   1
#>   1042   0   3
#>   1044   1   3
#>   1045   1   2
#>   1046   1   2
#>   1047   1   0
#>   1048   0   2
#>   1049   1   0
#>   1051   2   3
#>   1052   2   1
#>   1053   0   1
#>   1054   1   0
#>   1055   1   1
#>   1056   3   1
#>   1057   1   2
#>   1058   2   1
#>   1059   1   2
#>   1060   1   3
#>   1061   0   1
#>   1062   2   2
#>   1063   1   7
#>   1064   1   4
#>   1065   1   0
#>   1066   1   0
#>   1067   1   0
#>   1068   0   2
#>   1070   1   1
#>   1073   0   3
#>   1074   1   2
#>   1075   1   1
#>   1076   0   3
#>   1077   1   2
#>   1078   1   2
#>   1079   1   0
#>   1080   1   4
#>   1081   1   4
#>   1082   1   1
#>   1083   2   0
#>   1084   1   2
#>   1085   0   1
#>   1086   1   1
#>   1087   1   1
#>   1088   1   1
#>   1089   0   2
#>   1090   2   1
#>   1091   2   3
#>   1092   2   2
#>   1093   1   2
#>   1094   2   2
#>   1095   0   1
#>   1096   1   1
#>   1097   0   2
#>   1098   1   1
#>   1099   2   0
#>   1100   2   0
#>   1101   2   3
#>   1102   1   2
#>   1103   1   1
#>   1104   0   1
#>   1105   0   1
#>   1106   5   1
#>   1107   0   1
#>   1108   2   0
#>   1109   0   3
#>   1110   1   1
#>   1111   2   1
#>   1112   0   1
#>   1113   1   0
#>   1114   1   1
#>   1117   1   0
#>   1118   3   0
#>   1119   0   2
#>   1120   0   4
#>   1121   4   2
#>   1122   0   1
#>   1123   0   2
#>   1124   0   1
#>   1125   0   1
#>   1126   3   1
#>   1127   0   3
#>   1128   1   0
#>   1129   0   1
#>   1130   2   4
#>   1131   1   0
#>   1132   0   1
#>   1133   0   3
#>   1134   0   4
#>   1135   1   3
#>   1136   0   1
#>   1137   0   1
#>   1138   1   3
#>   1139   2   1
#>   1140   1   0
#>   1141   0   4
#>   1142   1   1
#>   1143   1   3
#>   1144   2   1
#>   1145   2   0
#>   1147   1   0
#>   1148   1   3
#>   1149   0   2
#>   1150   1   2
#>   1151   2   1
#>   1152   1   2
#>   1153   0   2
#>   1154   0   1
#>   1156   4   2
#>   1158   0   1
#>   1159   0   1
#>   1160   1   0
#>   1161   3   1
#>   1162   2   1
#>   1164   0   3
#>   1165   3   2
#>   1166   4   0
#>   1167   2   0
#>   1168   1   0
#>   1169   1   1
#>   1170   1   0
#>   1171   2   1
#>   1173   2   2
#>   1174   0   1
#>   1175   1   1
#>   1176   1   2
#>   1178   2   1
#>   1179   1   0
#>   1180   0   1
#>   1181   1   4
#>   1182   1   3
#>   1183   1   2
#>   1184   2   1
#>   1185   2   0
#>   1186   1   1
#>   1187   3   2
#>   1190   0   2
#>   1191   1   0
#>   1192   1   1
#>   1193   0   3
#>   1195   2   0
#>   1196   1   1
#>   1199   2   2
#>   1200   2   1
#>   1201   1   2
#>   1202   0   1
#>   1203   1   2
#>   1204   1   1
#>   1205   0   4
#>   1206   3   1
#>   1207   0   3
#>   1208   1   1
#>   1209   1   1
#>   1210   1   2
#>   1211   0   1
#>   1212   2   1
#>   1213   1   0
#>   1217   1   1
#>   1218   0   1
#>   1220   1   0
#>   1221   1   0
#>   1222   1   2
#>   1223   1   2
#>   1224   2   1
#>   1225   1   0
#>   1226   1   3
#>   1227   0   1
#>   1230   0   1
#>   1231   1   1
#>   1232   0   3
#>   1233   0   1
#>   1234   0   1
#>   1236   1   1
#>   1237   1   1
#>   1238   1   1
#>   1239   1   0
#>   1240   0   1
#>   1241   2   2
#>   1242   0   4
#>   1243   1   1
#>   1244   1   1
#>   1245   1   0
#>   1246   0   1
#>   1248   0   2
#>   1249   0   2
#>   1250   0   1
#>   1252   0   1
#>   1254   1   0
#>   1255   0   1
#>   1256   1   0
#>   1257   0   1
#>   1258   0   2
#>   1259   3   1
#>   1261   1   0
#>   1262   0   1
#>   1263   0   1
#>   1265   0   2
#>   1266   1   0
#>   1268   1   1
#>   1269   1   1
#>   1271   1   0
#>   1272   1   4
#>   1273   1   0
#>   1275   0   1
#>   1276   1   1
#>   1277   1   1
#>   1279   0   1
#>   1282   0   1
#>   1283   1   0
#>   1284   1   0
#>   1286   1   0
#>   1287   2   0
#>   1288   2   1
#>   1290   0   3
#>   1291   1   0
#>   1293   0   1
#>   1294   0   1
#>   1296   1   0
#>   1297   2   2
#>   1298   0   1
#>   1302   1   0
#>   1303   0   2
#>   1306   0   1
#>   1307   3   1
#>   1309   1   1
#>   1310   0   1
#>   1311   0   2
#>   1313   0   1
#>   1314   0   1
#>   1318   0   1
#>   1319   0   1
#>   1321   0   2
#>   1323   0   1
#>   1326   1   0
#>   1327   0   1
#>   1328   0   1
#>   1329   2   1
#>   1330   1   1
#>   1331   1   0
#>   1332   0   1
#>   1333   0   1
#>   1334   0   2
#>   1336   0   3
#>   1337   1   0
#>   1339   2   0
#>   1340   0   2
#>   1341   0   2
#>   1342   0   1
#>   1343   0   1
#>   1344   0   2
#>   1345   0   1
#>   1346   0   2
#>   1347   0   1
#>   1348   0   1
#>   1349   0   1
#>   1352   0   1
#>   1353   1   1
#>   1357   0   2
#>   1359   0   2
#>   1360   0   3
#>   1361   1   0
#>   1363   0   3
#>   1364   2   0
#>   1365   1   1
#>   1366   1   1
#>   1368   1   0
#>   1369   1   1
#>   1370   0   1
#>   1372   1   0
#>   1373   0   2
#>   1374   0   1
#>   1376   1   0
#>   1377   1   0
#>   1380   1   0
#>   1381   0   1
#>   1386   2   0
#>   1387   0   1
#>   1388   1   1
#>   1389   2   1
#>   1390   1   0
#>   1391   0   1
#>   1392   1   2
#>   1393   0   1
#>   1395   0   1
#>   1397   0   1
#>   1399   0   1
#>   1403   1   0
#>   1404   0   1
#>   1405   0   1
#>   1407   0   1
#>   1408   2   1
#>   1409   1   1
#>   1410   2   1
#>   1412   1   0
#>   1416   1   1
#>   1417   0   1
#>   1419   1   0
#>   1420   0   1
#>   1422   0   4
#>   1423   1   1
#>   1424   1   1
#>   1425   1   1
#>   1426   1   1
#>   1431   1   0
#>   1432   1   0
#>   1434   2   0
#>   1435   1   0
#>   1437   0   1
#>   1438   1   0
#>   1439   0   1
#>   1440   0   1
#>   1441   1   1
#>   1446   0   2
#>   1447   0   1
#>   1448   0   3
#>   1449   1   1
#>   1451   0   2
#>   1452   2   1
#>   1456   0   1
#>   1460   0   1
#>   1461   1   1
#>   1462   2   0
#>   1463   0   1
#>   1464   1   0
#>   1467   1   2
#>   1468   0   1
#>   1469   0   1
#>   1471   0   1
#>   1472   1   1
#>   1473   1   1
#>   1476   3   0
#>   1478   1   0
#>   1484   0   1
#>   1486   0   2
#>   1487   1   0
#>   1488   0   1
#>   1489   0   1
#>   1490   0   1
#>   1491   0   1
#>   1492   1   1
#>   1495   1   0
#>   1499   0   1
#>   1500   0   1
#>   1502   0   1
#>   1503   1   2
#>   1504   1   0
#>   1508   0   1
#>   1512   0   1
#>   1514   0   1
#>   1516   1   1
#>   1519   1   0
#>   1521   1   0
#>   1528   0   2
#>   1529   2   0
#>   1531   1   1
#>   1532   0   2
#>   1534   1   0
#>   1536   0   1
#>   1540   0   2
#>   1541   0   1
#>   1543   0   1
#>   1545   0   1
#>   1548   1   0
#>   1550   0   1
#>   1551   1   0
#>   1553   0   1
#>   1554   1   1
#>   1555   0   2
#>   1556   0   1
#>   1558   0   1
#>   1559   1   0
#>   1560   0   2
#>   1563   1   0
#>   1567   1   0
#>   1569   1   0
#>   1571   0   1
#>   1573   1   1
#>   1574   0   2
#>   1576   2   2
#>   1579   0   3
#>   1580   1   0
#>   1581   1   0
#>   1584   0   1
#>   1594   0   1
#>   1597   0   1
#>   1598   0   2
#>   1600   0   1
#>   1602   0   1
#>   1603   0   1
#>   1606   1   0
#>   1608   0   1
#>   1611   1   0
#>   1613   0   1
#>   1616   0   1
#>   1617   0   1
#>   1622   0   1
#>   1623   0   1
#>   1628   0   1
#>   1635   0   1
#>   1642   0   1
#>   1649   0   1
#>   1650   1   0
#>   1656   0   1
#>   1658   0   1
#>   1661   0   1
#>   1662   1   0
#>   1663   0   1
#>   1665   0   1
#>   1666   1   0
#>   1669   0   1
#>   1677   0   1
#>   1681   0   1
#>   1687   1   0
#>   1689   0   1
#>   1691   0   1
#>   1692   0   1
#>   1697   1   1
#>   1702   0   1
#>   1707   0   1
#>   1710   0   1
#>   1713   1   0
#>   1720   1   2
#>   1721   0   2
#>   1723   0   1
#>   1727   1   0
#>   1730   0   1
#>   1735   1   1
#>   1739   1   0
#>   1740   1   0
#>   1745   2   0
#>   1767   0   1
#>   1776   0   2
#>   1777   0   1
#>   1778   1   0
#>   1789   0   1
#>   1790   0   1
#>   1792   0   1
#>   1804   1   0
#>   1805   1   0
#>   1806   0   2
#>   1809   1   0
#>   1812   1   0
#>   1816   1   0
#>   1817   0   1
#>   1820   1   0
#>   1823   1   0
#>   1833   0   1
#>   1834   1   0
#>   1835   0   1
#>   1837   1   0
#>   1842   0   1
#>   1855   1   1
#>   1859   1   0
#>   1865   0   1
#>   1867   0   1
#>   1869   1   0
#>   1871   0   2
#>   1875   1   0
#>   1877   0   2
#>   1880   1   0
#>   1882   0   1
#>   1906   1   0
#>   1914   1   0
#>   1916   0   1
#>   1917   0   1
#>   1925   1   0
#>   1934   1   0
#>   1946   0   1
#>   1957   1   0
#>   1960   0   1
#>   1962   0   1
#>   1966   1   0
#>   1970   0   1
#>   1971   0   1
#>   1972   1   0
#>   1973   0   1
#>   1975   0   1
#>   1978   0   1
#>   1980   0   1
#>   1992   1   0
#>   1994   1   0
#>   2015   0   1
#>   2016   0   2
#>   2027   1   0
#>   2028   0   1
#>   2029   0   1
#>   2033   1   0
#>   2053   2   0
#>   2055   1   0
#>   2062   0   1
#>   2078   0   1
#>   2087   0   1
#>   2093   0   1
#>   2129   1   0
#>   2150   1   0
#>   2177   1   0
#>   2184   0   1
#>   2187   1   0
#>   2191   1   0
#>   2201   1   0
#>   2219   1   0
#>   2231   0   1
#>   2241   1   0
#>   2256   1   0
#>   2260   1   0
#>   2301   0   1
#>   2330   0   1
#>   2372   0   1
#>   2389   1   0
#>   2420   0   1
#>   2429   1   0
#>   2453   0   1
#>   2456   0   1
#>   2462   1   0
#>   2485   1   0
#>   2516   0   1
#>   2621   0   1
#>   2635   1   0
#>   2653   0   1
#>   2692   0   1
#>   2769   0   1
#>   2770   0   1
#>   2775   0   1
#>   2870   1   0
#>   3025   1   0
#>   3076   0   1
#>   3078   1   0
#>   3094   0   1
#>   3102   0   1
#>   3183   0   1
#>   3253   0   1
#>   3284   1   0
#>   3322   1   0
#>   3366   1   0
#>   3422   1   0
#>   3785   1   0
#>   3881   0   1
#>   4918   1   0
summary(bank[bank$y == "no",c("duration")])
#>    Min. 1st Qu.  Median    Mean 3rd Qu.    Max. 
#>     0.0    95.0   164.0   221.2   279.0  4918.0
summary(bank[bank$y == "yes",c("duration")])
#>    Min. 1st Qu.  Median    Mean 3rd Qu.    Max. 
#>     8.0   244.0   426.0   537.3   725.0  3881.0

Ternyata nasabah kebanyakan menolak untuk melakukan investasi deposito berjangka ketika nasabah tersebut dihubungi dengan durasi 95-279 detik, sedangkan untuk nasabah yang menerima untuk melakukan investasi deposito berjangka memiliki durasi dengan rentang 244-725 detik.

Kita akan sederhanakan dataframe menjadi hanya kolom duration, deposit, dan count dari duration.

bank_dur_y <- as.data.frame(table(bank$duration, bank$y))
names(bank_dur_y) <- c("duration","deposit","count")
bank_dur_y$duration <- as.numeric(as.character(bank_dur_y$duration))
bank_dur_y

Ternyata ada durasi 0 di data, ini menandakan bahwa durasi 0 artinya nasabah tersebut mereject/menolak panggilan yang dilakukan selama kampanye pemasaran berlangsung.

Selanjutnya kita cek apakah ada nasabah yang melakukan subscribe deposito di durasi 0.

dyy <- bank_dur_y[bank_dur_y$deposit=="yes",]
dyy[dyy$duration==0,]

Ternyata memang tidak ada yang melakukan deposito di durasi 0, hal ini masuk akal karena tidak terjadi kontak ke nasabah selama kampanye berlangsung.

Apakah lama durasi mempengaruhi kecenderungan nasabah untuk melakukan investasi deposito?

Ternyata dari hasil analisis, ada kecenderungan bahwa lama durasi mempengaruhi seorang nasabah untuk melakukan investasi deposito terutama dengan durasi 244-725 detik. Durasi yang lama menandakan bahwa nasabah yang dihubungi sudah mulai tertarik dengan kampanye yang dilakukan.

Untuk melihat hasil visualisasinya, bisa menggunakan ggplot:

ggplot(bank_dur_y, aes(duration, count, fill =deposit))+
  geom_col(position = "dodge")

Terlihat garis biru (nasabah yes) lebih mendominasi di durasi yang lama.

Campaign

table(bank$campaign, bank$y)
#>     
#>         no   yes
#>   1  14983  2561
#>   2  11104  1401
#>   3   4903   618
#>   4   3205   317
#>   5   1625   139
#>   6   1199    92
#>   7    688    47
#>   8    508    32
#>   9    306    21
#>   10   252    14
#>   11   185    16
#>   12   151     4
#>   13   127     6
#>   14    89     4
#>   15    80     4
#>   16    77     2
#>   17    63     6
#>   18    51     0
#>   19    44     0
#>   20    42     1
#>   21    34     1
#>   22    23     0
#>   23    22     0
#>   24    19     1
#>   25    22     0
#>   26    13     0
#>   27    10     0
#>   28    16     0
#>   29    15     1
#>   30     8     0
#>   31    12     0
#>   32     8     1
#>   33     6     0
#>   34     5     0
#>   35     4     0
#>   36     4     0
#>   37     2     0
#>   38     3     0
#>   39     1     0
#>   41     2     0
#>   43     3     0
#>   44     1     0
#>   46     1     0
#>   50     2     0
#>   51     1     0
#>   55     1     0
#>   58     1     0
#>   63     1     0
summary(bank$campaign)
#>    Min. 1st Qu.  Median    Mean 3rd Qu.    Max. 
#>   1.000   1.000   2.000   2.764   3.000  63.000

Semakin kecil nilai campaign dalam hal ini berapa kali nasabah mengikuti kampanye sebelumnya, semakin besar pula kencenderungan nasabah untuk melakukan investasi deposito berjangka maupun menolak dalam kampanye kali ini.

Pdays

Akan dicek berapa banyak nasabah disetiap pdays yang ada.

pdays <- as.data.frame(table(bank$pdays, bank$y))
names(pdays) <- c("pdays","deposit","count")
pdays1 <- pdays[order(pdays$count,decreasing = T),]
pdays1

Kemudian kita tinjau berdasarkan jenis depositnya yakni yes dan no.

pdays1[pdays1$deposit %in% "yes",]
pdays1[pdays1$deposit %in% "no",]
  • Ternyata pdays terbanyak ada di pdays -1 yakni sebanyak 33570 untuk menolak melakukan investasi deposito dan 3384 nasabah yang melakukan investasi deposito, nilai -1 artinya nasabah belum pernah dihubungi sebelumnya. Dan berdasarkan data, nasabah di pdays -1 ini memiliki ketertarikan untuk melakukan investasi deposito berjangka jauh lebih tinggi dibanding yang sudah dihubungi sebelumnya.

  • Pdays dengan kecenderungan orang melakukan investasi deposito ada di rentang pdays 80-105. Di rentang pdays 178-196 juga ditemukan kecenderungan yang sama.

  • Dapat dikatakan kalau nasabah yang melakukan investasi deposito dan yang menolak melakukannya berpusat di pdays -1, atau dengan kata lain selama kampanye berlangsung, nasabah yang dihubungi berpusat di nasabah yang belum pernah dihubungi sebelumnya.

Poutcome

table(bank$poutcome, bank$y)
#>          
#>              no   yes
#>   failure  4283   618
#>   other    1533   307
#>   success   533   978
#>   unknown 33573  3386

Nasabah yang sudah pernah sukses mengikuti kampanye sebelumnya memiliki tingkat kesuksesan untuk melakukan investasi deposito berjangka yang lebih besar dibanding yang lainnya, akan tetapi nasabah di kampanye sebelumnya failure tetap ada kemungkinan mereka akan melakukan investasi deposito di kampanye ini.

Data berdasarkan Poutcome didominasi oleh kategori unkwown, yang mana data nasabah di kampanye sebelumnya tidak diketahui.

Question

Apakah ada hubungn age dengan balance terhadap pengaruh nasabah dalam melakukan investasi deposito berjangka?

yym <- bank[bank$y == "yes",]
plot(yym$age, yym$balance)
abline(lm(yym$balance~yym$age), col = "red")

Terlihat tidak ada hubungan antara balance/saldo dan umur nasabah di antara nasabah yang melakukan investasi deposito selama kampanye pemasaran berlangsung.

Apakah balance berdasarkan job mempengaruhi seseorang untuk melakukan investasi deposito berjangka?

Sebelum malihat lebih jauh hubungan balance dan y, terlebih dahulu cek data balance apakah terdistribusi normal atau tidak.

Akan dicek apakah ada outlier dalam data balance.

summary(bank$balance)
#>    Min. 1st Qu.  Median    Mean 3rd Qu.    Max. 
#>   -8019      72     448    1362    1428  102127
Q1 <- quantile(bank$balance,0.25)
Q3 <- quantile(bank$balance,0.75)
IQR <- Q3-Q1
Q1-(1.5*IQR)
#>   25% 
#> -1962
Q3+(1.5*IQR)
#>  75% 
#> 3462

Setelah mencari nilai batas whiskernya yakni -1962 dan 3462, akan dilakukan subseting pada kolom balance untuk melihat ada berapa outlier

nrow(bank[bank$balance > 3462 | bank$balance < -1962,])
#> [1] 4729

Atau bisa dengan code berikut:

length(boxplot.stats(bank$balance)$out)
#> [1] 4729

Karena terdapat 4729 outlier dan nilai mean sensitif terhadapt outlier, maka digunakan median untuk melihat pusat persebaran datanya dan sebagai acuan perbandingan yang menggantikan mean.

Selanjutnya kita akan melihat job apa saja yang memiliki median balance tertinggi.

bank_balance_job <- aggregate(balance~job, data = bank, FUN = "median")
bank_balance_job <- bank_balance_job[order(bank_balance_job$balance,decreasing = T),]
bank_balance_job

Ternyata median balance tertinggi ada di retired job, dan top 3 job dengan jumlah nasabah yang melakukan investasi deposito terbanyak tidak dipengaruhi oleh median balance dari masing-masing job.

Agar hasil data mudah dilihat, maka di buatkan visualisasi sebagai berikut.

ggplot(data = bank_balance_job, aes(balance, reorder(job,balance)))+
  geom_col()

Selanjutnya akan dilihat pengaruh median balance berdasarkan job terhadap kecenderungan nasabah untuk melakukan investasi deposito atau tidak.

bank_bal_job_y_med <- aggregate(balance~job+y, data = bank, FUN = "median")
bank_bal_job_y_med <- bank_bal_job_y_med[order(bank_bal_job_y_med$balance,decreasing = T),]
bank_bal_job_y_med
ggplot(data = bank_bal_job_y_med, aes(balance, reorder(job,balance), fill=y))+
  geom_bar(stat = 'identity', position = 'dodge')+
  # geom_text(aes(label = balance), position = position_dodge())+
  labs(y = "job")

Ternyata ada trend dimana semakin besar median balance semakin besar pula kemungkinan nasabah melakukan investasi deposito di hampir semua kategori job yang diobservasi, hanya di job nasabah dengan kategori student yang sulit dilihat adanya pengaruh balance terhadap kecenderungan nasabah melakukan investasi deposito atau tidak.

Apakah ada hubungan antara education dengan balance terhadap pengaruh nasabah untuk melakukan investasi deposito berjangka?

yym <- bank[bank$y == "yes",]
table(yym$education)
#> 
#>   primary secondary  tertiary   unknown 
#>       591      2450      1996       252
yym[,c("education","balance")]
aggregate(balance~education, data=yym, FUN=median)
aggregate(balance~job, data=yym, FUN=median)
aggregate(balance~education+job, data=yym, FUN=median)
table(yym$education)
#> 
#>   primary secondary  tertiary   unknown 
#>       591      2450      1996       252

Dari analisa data di atas, hasilnya semakin tinggi pendidikan seseorang (> primary) semakin tinggi pula balance yang mereka miliki, dan kecenderungan mereka akan melakukan subscribe deposito semakin besar terlihat jumlah nasabah yang subscribe deposito dengan pendidikan secondary ada sebanyak 2450, tertiary ada sebanyak 1996, sedangkan primary hanya 591.

Nasabah dengan karakteristik seperti apa yang cenderung untuk melakukan investasi deposito berjangka dalam kampanye kali ini?

yym[yym$education %in% c("secondary","tertiary") & yym$job %in% c("technician", "management", "blue-collar") & yym$balance >=0 & yym$loan == "no"& yym$default == "no"& yym$housing == "no", ]

Setelah dilakukan analisis berdasarkan data diatas, karakteristik nasabah yang cenderung untuk melakukan investasi deposito berjangka yakni nasabah dengan rentang umur 23-73, memiliki pendidikan secondary atau tertiary, jobnya antara blue collar, managemnet, atau technician, memiliki balance sama dengan atau lebih besar dari 0, tidak memiliki pinjaman baik itu pribadi dan rumah, dan tidak memiliki kredit macet.

round((1348/5289)*100,1)
#> [1] 25.5

Ternyata dari data nasabah yang melakukan investasi deposito berjangka ada sebanyak 25.5% nasabah berada dalam karakteristik data di atas. Jadi ini bisa dijadikan masukan untuk fokus menargetkan nasabah dengan kategori tersebut di kampanye kali ini maupun di kampanye selanjutnya.

Conclusion

  • Dari Analisis, Nasabah kelompok usia produktif lebih banyak yang melakukan investasi deposit berjangka tetapi yang tidak melakukannya juga banyak. Untuk usia muda di bawah 23 dan usai di atas 60 tahun ditemukan kecenderungan untuk melakukan investasi deposito lebih besar hal ini karena pada usia tua lebih memungkinkan memiliki uang lebih yang bisa di investasikan dan untuk usia muda mereka lebih tertarik untuk mencoba hal-hal yang berkaitan dengan investasi. Insight ini baik bagi bank untuk fokus pada nasabah kelompok usia tua untuk mendapatkan lebih banyak nasabah yang mengambil deposito berjangka karena secara finansial dan pengetahuan akan investasi sudah mapan.

  • Nasabah dengan jenis pekerjaan management, technician dan blue-collar lebih banyak mengambil investasi deposito berjangka. Akan tetapi setelah ditinjau berdasarkan median dari balance pekerjaan tersebut, justru retired dan housemaid memiliki kecenderungan untuk melakukan investasi deposito. Hal ini masuk akal karena retired/pensiunan dan housemaid/pembantu rumah tangga cenderung tidak menghabiskan uangnya dalam jumlah besar sehingga mereka lebih cenderung memilih uangnya yang bekerja dengan cara mengambil investasi deposito di bank atau investasi lainnya.

  • Semakin tinggi tingkat pendidikan nasabah, semakin tinggi pula tingakt kecenderungan mereka untuk melakukan investasi deposito berjangka.

  • Nasabah yang tidak tertarik untuk mengambil pinjaman perumahan dan pinjaman pribadi memiliki kecenderungan untuk mengambil investasi deposito berjangka.

  • Sebagian besar nasabah bank dalam kampanye kali ini dihubungi pada bulan Mei, Juni, Juli dan Agustus. Dan sebagian besar nasabah yang dihubungi pada bulan Mei ternyata tidak tertarik untuk mengambil investasi deposito berjangka. Sebaliknya sangat sedikit nasabah yang dihubungi di bulan Maret, September, Oktober dan Desember tetapi pada bulan-bulan ini justru peluang nasabah yang mengambil investasi deposito jauh lebih tinggi. Sehingga dari insight tersebut, sebaiknya bank menghubungi lebih banyak nasabah di bulan-bulan tersebut.

  • Semakin jarang nasabah itu dihubungi dan semakin sedikit nasabah tersebut mengikuti kampanye sebelumya, semakin besar pula kemungkinan nasabah tersebut akan mengambil investasi deposito berjangka.

  • Nasabah yang masuk kategori sukses pada kampanye sebelumnya, memiliki tingkat kesuksesan untuk melakukan investasi deposito berjangka yang lebih besar, akan tetapi nasabah di kampanye sebelumnya failure tetap ada kemungkinan mereka akan melakukan investasi deposito di kampanye ini.

  • Karakteristik nasabah yang cenderung untuk melakukan investasi deposito berjangka yakni nasabah dengan rentang umur 23-73, memiliki pendidikan secondary atau tertiary, jobnya antara blue collar, managemnet, atau technician, memiliki balance sama dengan atau lebih besar dari 0, tidak memiliki pinjaman baik itu pribadi dan rumah, dan tidak memiliki kredit macet.