Bab 1 STATISTIK DESKRIPTIF, ANALISIS DATA, DAN REGRESI LOGISTIK

1.1 Analisis Statistik Deskriptif dan EDA untuk Data Bank Indonesia

1.1.1 Dataset Yang Digunakan


1.1.2 Pemuatan dan Pembersihan Data

1.1.3 Histogram


1.1.4 Boxplot


1.1.5 Scatter Plot


1.2 Analisis Data Kategorik

Bagian ini menyajikan analisis data kategorik untuk dataset bank Indonesia (2022–2024) menggunakan uji asosiasi (Chi-Square dan Fisher’s Exact Test) dan visualisasi (mosaic plot dan bar chart interaktif). Analisis mengeksplorasi hubungan antara:

- TAHUN (2022, 2023, 2024) dan Kategori ASET (Kecil, Sedang, Besar). - KODE (kode bank) dan Kategori LABA (Rugi, Kecil, Besar).


1.3 Pemuatan Data


1.3.1 Pemeriksaan Tabel Kontingensi

Membuat dan memeriksa tabel kontingensi untuk memastikan tidak ada kategori kosong atau frekuensi nol yang menyebabkan error pada mosaic plot.

## Tabel TAHUN vs Kategori_ASET:
##       
##        Besar Sedang
##   2022     5      1
##   2023     5      1
##   2024     5      1
## 
## Tabel KODE vs Kategori_LABA:
##       
##        Besar Rugi
##   AGRO     0    0
##   AGRS     0    0
##   AMAR     0    0
##   ARTO     0    0
##   BABP     0    0
##   BACA     0    0
##   BANK     0    3
##   BBCA     3    0
##   BBHI     0    0
##   BBKP     0    3
##   BBMD     0    0
##   BBNI     0    0
##   BBRI     3    0
##   BBSI     0    0
##   BBTN     3    0
##   BBYB     0    0
##   BCIC     0    0
##   BDMN     0    0
##   BEKS     0    0
##   BGTG     0    0
##   BINA     0    0
##   BJBR     0    0
##   BJTM     0    0
##   BKSW     0    0
##   BMAS     0    0
##   BMRI     3    0
##   BNBA     0    0
##   BNGA     0    0
##   BNII     0    0
##   BNLI     0    0
##   BRIS     0    0
##   BSIM     0    0
##   BSWD     0    0
##   BTPN     0    0
##   BTPS     0    0
##   BVIC     0    0
##   DNAR     0    0
##   INPC     0    0
##   MASB     0    0
##   MAYA     0    0
##   MCOR     0    0
##   MEGA     0    0
##   NISP     0    0
##   NOBU     0    0
##   PNBN     0    0
##   PNBS     0    0
##   SDRA     0    0

1.3.2 Uji Asosiasi

Disini saya melakukan uji Chi-Square dan Fisher’s Exact Test untuk mengeksplorasi hubungan antara TAHUN vs Kategori_ASET dan KODE vs Kategori_LABA, serta menampilkan hasil dalam tabel interaktif.


1.3.3 Mosaic Plot

TAHUN vs Kategori_ASET: Kotak besar menunjukkan kombinasi dengan frekuensi tinggi (misalnya, banyak bank “Besar” pada 2024). Warna (dari shade = TRUE) menunjukkan residu Chi-Square, dengan warna biru/merah menandakan asosiasi signifikan.

KODE vs Kategori_LABA: Menunjukkan apakah bank tertentu (misalnya, BBCA) cenderung memiliki laba “Besar” atau “Rugi”. Plot ini membantu mengidentifikasi pola, misalnya, bank besar seperti BBCA sering berada di kategori “Besar”.


1.3.4 Bar Chart

# Kategori_ASET per TAHUN
plot_ly(data_bersih, x = ~TAHUN, color = ~Kategori_ASET, type = "histogram") %>%
  layout(title = "Distribusi Kategori ASET per Tahun",
         xaxis = list(title = "Tahun"),
         yaxis = list(title = "Jumlah Bank"),
         barmode = "stack")
# Kategori_LABA per KODE
plot_ly(data_bersih, x = ~KODE, color = ~Kategori_LABA, type = "histogram") %>%
  layout(title = "Distribusi Kategori LABA per Kode Bank",
         xaxis = list(title = "Kode Bank"),
         yaxis = list(title = "Jumlah Observasi"),
         barmode = "stack")

Kategori_ASET per TAHUN: Menunjukkan jumlah bank dalam kategori Kecil, Sedang, dan Besar setiap tahun. Hover menunjukkan jumlah bank per kategori. Stack mode memudahkan perbandingan proporsi.

Kategori_LABA per KODE: Menunjukkan apakah bank tertentu (misalnya, BBCA) lebih sering berada di kategori “Besar” atau “Rugi”. Interaktivitas memungkinkan zoom dan hover untuk detail.


1.3.5 Regresi Logistik

1.3.6 Pemuatan Data


1.3.7 Pembangunan Model Regresi Logistik

- Model: Menggunakan glm() dengan keluarga binomial dan link logit untuk regresi logistik, memprediksi probabilitas Laba_Positif berdasarkan ASET, ROA, dan DER.

- Koefisien: Menunjukkan arah dan besarnya hubungan antara variabel independen dan log-odds dari Laba_Positif. Koefisien positif berarti meningkatkan probabilitas laba positif.

- Odds Ratio: Diperoleh dengan exp(koefisien), menunjukkan perubahan odds Laba_Positif untuk setiap kenaikan satu unit variabel independen.

- P-Value: Menguji signifikansi statistik (p < 0.05 menunjukkan variabel signifikan).


1.3.8 Interpretasi Model

Interpretasi berdasarkan hasil model (nilai aktual bergantung pada data):

Koefisien:

- ASET: Jika koefisien = 0.0001 (misalnya), setiap kenaikan 1 IDR dalam aset meningkatkan log-odds laba positif sebesar 0.0001, menunjukkan efek kecil tetapi positif (karena skala aset besar).

- ROA: Jika koefisien = 1.5, setiap kenaikan 1% dalam ROA meningkatkan log-odds laba positif sebesar 1.5, menunjukkan efek kuat.

- DER: Jika koefisien = -0.2, setiap kenaikan 1 unit DER menurunkan log-odds laba positif sebesar 0.2, menunjukkan leverage tinggi mengurangi probabilitas laba.

Odds Ratio:

- ASET: Jika odds ratio = 1.0001, setiap kenaikan 1 IDR aset meningkatkan odds laba positif sebesar 0.01% (efek kecil).

- ROA: Jika odds ratio = 4.4817 (exp(1.5)), setiap kenaikan 1% ROA meningkatkan odds laba positif 4,48 kali, menunjukkan pengaruh besar.

- DER: Jika odds ratio = 0.8187 (exp(-0.2)), setiap kenaikan 1 unit DER mengurangi odds laba positif sebesar 18,13%.

Signifikansi:

  • Variabel dengan p-value < 0.05 (misalnya, ROA dengan p = 0.001) signifikan secara statistik, artinya berpengaruh nyata terhadap Laba_Positif.

  • Jika p-value > 0.05 (misalnya, ASET dengan p = 0.3), variabel tidak signifikan, mungkin karena skala besar atau variasi data.

1.3.9 Visualisasi Hasil

Scatter plot interaktif menunjukkan hubungan antaraROAdan probabilitas prediksiLaba_Positif`. Titik dengan ROA tinggi cenderung memiliki probabilitas laba positif mendekati 1, sedangkan ROA rendah atau negatif mendekati 0. Hover menunjukkan detail bank (kode, nama, tahun, probabilitas), memudahkan identifikasi bank seperti BBCA (kemungkinan probabilitas tinggi) atau BANK (probabilitas rendah).