1 PENDAHULUAN

1.1 Latar Belakang

Analisis regresi logistik adalah salah satu teknik statistik yang digunakan untuk memodelkan hubungan antara satu atau lebih variabel independen (prediktor) dengan variabel dependen yang bersifat dikotomis (biner). Dalam banyak kasus, variabel dependen ini mewakili dua kategori, seperti sukses/gagal dan ya/tidak. Regresi logistik memungkinkan untuk memperkirakan probabilitas kejadian tertentu berdasarkan nilai-nilai variabel prediktor.

Pada berbagai bidang penelitian regresi logistik telah menjadi alat yang sangat penting untuk analisis data. Misalnya, dalam sistem perbankan, regresi logistik dapat digunakan untuk memprediksi apakah seseorang mampu untuk membayar kredit berdasarkan pendapatan, usia, riwayat peminjaman, dan lainnya. Dalam perusahaan, digunakan untuk meprediksi keuntungan dan kerugian yang akan diperoleh.

Dalam penelitian ini, akan dibahas penerapan analisis regresi logistik untuk menunjukkan pengaruh profitabilitas (keuntungan) dan likuiditas (kelancaran keuangan) terhadap kebankrutan suatu perusahaan. Pada penerapan analisis regresi logistik, penting untuk memperhatikan pemilihan variabel penelitian, ukuran sampel yang sesuai, serta analisis yang dilakukan. Hal ini dilakukan agar hasil yang diperoleh lebih akurat dan dapat digunakan sebagai sumber wawasan bagi masyarakat luas

1.2 Tinjauan Pustaka

1.2.1 Analisis Regresi Logistik Biner

Analisis regresi logistik biner adalah bentuk regresi yang digunakan ketika variabel dependen bersifat biner (memiliki dua kategori, seperti sukses/gagal atau ya/tidak). Regresi logistik biner memungkinkan kita untuk memodelkan probabilitas kejadian suatu peristiwa sebagai fungsi dari satu atau lebih variabel independen. Model regresi logistik biner dinyatakan dalam bentuk logit sebagai berikut:

\[ π(x) = \frac {exp(\beta {_0} + \beta {_1} X {_2} + \beta {_1} X {_2} + ...+\beta {_x} X {_k})} {{1 + exp(\beta {_0} + \beta {_1} X {_2} + \beta {_1} X {_2} + ...+\beta {_x} X {_k})}} \] Keterangan: \[ π(x) : Peluang \quad kejadian \quad sukses \] \[ \beta {_0} : Koefisien \quad Regresi \] Menurut Roflin dkk. (2023) karena fungsi tersebut adalah fungsi non-linier maka dibutuhkan transformasi logistik untuk membuat fungsi tersebut linier agar dapat memodelkan hubungan variabel prediktor dan variabel respons. Selain itu, odds ratio-nya dapat dihitung dari model regresi logistik yang dihasilkan, yaitu:

\[ OR = \frac {exp(\beta {_0} + \beta {_1} X {_1}{_1} + \beta {_2} X {_2}{_2} + ...+\beta {_p} X {_1}{_p})} {1 + exp(\beta {_0} + \beta {_1} X {_1}{_1} + \beta {_2} X {_2}{_2} + ...+\beta {_p} X {_0}{_p})} \] Bentuk logit regresi logistik didapat dari hasil transformasi dari bentuk Odds Ratio:

\[ g(x) : ln \frac {π(x)} {1-π(x)} \]

1.3 Data

Data yang digunakan bersumber dari website kaggle yang berjudul “Company Bankruptcy Prediction” atau variabel-variabel prediktor yang berpengaruh terhadap kebankrutan suatu perusahaan. Dipilih 2 variabel prediktor yaitu Profitability (X1) dan Likuiditas (X2) terhadap Kebankrutan (Y) serta diambil 50 sampel untuk masing-masing variabel

1.4 Tujuan

Analisis regresi logistik dilakukan untuk mengetahui apakah profitabilitas dan likuiditas berpengaruh atau tidak terhadap kebankrutan perusahaan. Profitabilitas dan Likuiditas sebagai variabel prediktor kemudian Kebangkrutan sebagai variabel respons.

2 SOURCE CODE
2.1 Library
> library(knitr)
> library(rmarkdown)
> library(equatiomatic)
> library(generalhoslem)
> library(pscl)

2.2 Impor Data
> setwd("C:/Users/USER/Documents/Tugas Kuliah/File Rstud")
> perusahaan <- read.csv("perusahaan.csv", header=TRUE, sep=";")
> X1_lama <- perusahaan$ROA.A..before.interest.and...after.tax
> X1<-head(X1_lama,50)
> X2_lama <- perusahaan$Current.Ratio
> X2<-head(X2_lama,50)
> Y_lama <- perusahaan$Bankrupt.
> Y<-head(Y_lama,50)
> data_laprak2 <- data.frame(Y,X1,X2)
> data1 <- head(data_laprak2,50) |> round(4)
> data1
   Y     X1     X2
1  1 0.4244 0.0023
2  1 0.5382 0.0060
3  1 0.4990 0.0115
4  1 0.4513 0.0042
5  1 0.5384 0.0060
6  1 0.4152 0.0027
7  0 0.4457 0.0047
8  0 0.5709 0.0097
9  0 0.5451 0.0135
10 0 0.5509 0.0115
11 0 0.5675 0.0061
12 0 0.5497 0.0086
13 0 0.5516 0.0066
14 0 0.5333 0.0101
15 0 0.5758 0.0189
16 0 0.5711 0.0113
17 0 0.5602 0.0062
18 0 0.5904 0.0162
19 0 0.5598 0.0072
20 0 0.5437 0.0134
21 0 0.5456 0.0267
22 0 0.5645 0.0158
23 0 0.5637 0.0072
24 0 0.5481 0.0052
25 0 0.5614 0.0057
26 0 0.5037 0.0063
27 0 0.5636 0.0056
28 0 0.5931 0.0219
29 0 0.5639 0.0156
30 1 0.4702 0.0043
31 1 0.5360 0.0021
32 0 0.5445 0.0034
33 0 0.5707 0.0087
34 0 0.5448 0.0114
35 0 0.5509 0.0108
36 0 0.5645 0.0066
37 0 0.5164 0.0061
38 0 0.5413 0.0095
39 0 0.5395 0.0192
40 0 0.5480 0.0169
41 0 0.5716 0.0085
42 0 0.5627 0.0054
43 0 0.5669 0.0117
44 0 0.5759 0.0060
45 0 0.5534 0.0104
46 0 0.5490 0.0213
47 0 0.5635 0.0167
48 0 0.5633 0.0071
49 0 0.5505 0.0053
50 0 0.5597 0.0055
> str(data1)
'data.frame':   50 obs. of  3 variables:
 $ Y : num  1 1 1 1 1 1 0 0 0 0 ...
 $ X1: num  0.424 0.538 0.499 0.451 0.538 ...
 $ X2: num  0.0023 0.006 0.0115 0.0042 0.006 0.0027 0.0047 0.0097 0.0135 0.0115 ...
2.3 Analisis
2.3.1 Regresi
Logistik
> reglog <- glm(Y~X1+X2, family = binomial, data = data1)
> summary <- summary(reglog)
> coefficients(reglog)
(Intercept)          X1          X2 
   18.90803   -35.38435  -245.25926 

2.3.2 Uji Parsial
Parameter Model
> summary(reglog)

Call:
glm(formula = Y ~ X1 + X2, family = binomial, data = data1)

Coefficients:
            Estimate Std. Error z value Pr(>|z|)  
(Intercept)   18.908      7.948   2.379   0.0174 *
X1           -35.384     15.375  -2.301   0.0214 *
X2          -245.259    196.052  -1.251   0.2109  
---
Signif. codes:  0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1

(Dispersion parameter for binomial family taken to be 1)

    Null deviance: 43.967  on 49  degrees of freedom
Residual deviance: 23.753  on 47  degrees of freedom
AIC: 29.753

Number of Fisher Scoring iterations: 7

2.3.3 Uji Signifikansi
Keseluruhan Model
> pR2(reglog)
fitting null model for pseudo-r2
        llh     llhNull          G2    McFadden        r2ML        r2CU 
-11.8764284 -21.9834940  20.2141312   0.4597570   0.3325445   0.5685075 
> qchisq(0.95,2)
[1] 5.991465

2.3.4 Hasil
R-Squared
> Rsq <- 1 -(23.753/43.967)
> Rsq
[1] 0.4597539

2.3.5 Pembentukan tabel
berisi penduga parameter
> beta <- coef(reglog)
> OR_beta<- exp(beta)
> sk_OR<-exp(confint(reglog))
> cbind(beta,OR_beta,sk_OR)
                  beta       OR_beta         2.5 %       97.5 %
(Intercept)   18.90803  1.627996e+08  4.017406e+02 6.814228e+16
X1           -35.38435  4.293101e-16  2.953368e-32 7.522551e-05
X2          -245.25926 3.056732e-107 1.941678e-321 1.060432e+23

2.3.6 Klasifikasi
Model
> yp_hat<-fitted(reglog)
> kelas<-table(Y,yp_hat > 0.5)
> kelas
   
Y   FALSE TRUE
  0    41    1
  1     4    4

2.3.7 Uji Kelayakan
Model
> logitgof(data1$Y,fitted(reglog))

    Hosmer and Lemeshow test (binary model)

data:  data1$Y, fitted(reglog)
X-squared = 4.9336, df = 8, p-value = 0.7646

3 HASIL DAN PEMBAHASAN

3.1 Model Logit

\[ Logit(π̂)=18.908-35.384X_1-245.259X_2 \] • Jika seluruh variabel prediktor (profitabilitas dan likuiditas) bernilai 0, nilai logit dari variabel dependen (kebankrutan perusahaan) bernilai 18.908

• Setiap kenaikan 1 dari variabel prediktor profitabilitas nilai logit variabel dependen (kebankrutan perusahaan) akan turun sebesar 35.384.Karena koefisiennya negatif, ini menunjukkan bahwa profitabilitas yang lebih tinggi secara signifikan mengurangi kemungkinan kebangkrutan.

• Setiap kenaikan 1 dari variabel prediktor likuiditas nilai logit variabel dependen (kebankrutan perusahaan) akan turun sebesar 245.259. Karena koefisiennya negatif, ini menunjukkan bahwa likuiditas yang lebih tinggi juga secara signifikan mengurangi kemungkinan kebangkrutan.

3.2 Uji Parsial

\[ H0 : \beta_{i} = 0, \quad i=1,2 \] \[ H0 : Setidaknya \quad terdapat \quad satu \quad i \quad dimana \quad \ \beta_{i}≠ 0, \quad i=1,2 \]

> summary$coefficients[, "Pr(>|z|)"]
(Intercept)          X1          X2 
 0.01735483  0.02136829  0.21093819

• Intercept (0.01735483) < α (0.05) maka Tolak H0

• X1 (0.02136829) < α (0.05) maka Tolak H0

• X2 (0.21093819) > α (0.05) maka Terima H0

• Interpretasi : Dengan taraf nyata 5%, dapat disimpulkan bahwa variabel prediktor profitabilitas berpengaruh signifikan terhadap kebankrutan perusaahaan. Namun, likuiditas tidak berpengaruh signfikan terhadap kebankrutan perusahaan.

3.3 R-Square

> Rsq
[1] 0.4597539

Variabel prediktor profitabilitas dan likuiditas hanya menjelaskan pengaruh terhadap kebankrutan perusahaan sebanyak 46%, sisanya 54% dipengaruhi oleh variabel lain di luar model

3.4 Odds Ratio

> OR_beta
  (Intercept)            X1            X2 
 1.627996e+08  4.293101e-16 3.056732e-107

• Intercept (1.63 x 10^(-88)). Nilai yang sangat kecil menunjukkan bahwa odds dasar terjadinya kebangkrutan perusahaan ketika profitabilitas dan likuiditas adalah nol hampir mendekati nol. Dalam konteks bisnis, ini bisa mengindikasikan bahwa tanpa adanya profitabilitas dan likuiditas, kebangkrutan perusahaan hampir pasti terjadi.

• X1 (4.29 x 10^(-16)). Artinya setiap unit peningkatan dalam profitabilitas secara signifikan mengurangi odds kebangkrutan perusahaan. Dalam hal ini, karena nilai OR jauh lebih kecil dari 1, dapat dikatakan bahwa profitabilitas yang lebih tinggi sangat mengurangi kemungkinan kebangkrutan.

• X2 (3.05 x e^(-107)). Artinya setiap unit peningkatan dalam likuiditas juga secara signifikan mengurangi odds kebangkrutan perusahaan. Nilai OR yang sangat kecil ini menunjukkan bahwa likuiditas yang lebih tinggi juga sangat mengurangi kemungkinan kebangkrutan.

3.5 Klasifikasi Model

> kelas
   
Y   FALSE TRUE
  0    41    1
  1     4    4

4 KESIMPULAN

Berdasarkan analisis regresi logistik yang telah dilakukan menggunakan software R, didapatkan kesimpulan bahwa variabel prediktor Profitabilitas (X1) berpengaruh signifikan terhadap kebankrutan perusahaan. Hal ini berarti profitabilitas atau keuntugan yang rendah memiliki kemungkinan lebih besar untuk bankrut dibandingkan perusahaan yang memiliki profitabilitas tinggi. Di sisi lain, Likuiditas (X2) tidak berpengaruh signifikan terhadap kebankrutan perusahaan. Artinya, meskipun likuiditas atau kelancaran keuangan penting untuk perusahaan, namun dalam penelitian ini, likuiditas tidak secara langsung mempengaruhi kebangkrutan perusahaan. Kesimpulannya, profitabilitas atau keuntungan adalah faktor yang lebih penting daripada likuiditas atau kelancaran keuangan dalam memprediksi kebangkrutan perusahaan.

5 DAFTAR PUSTAKA

Harlan, Johan. 2018. Analisis Regresi Logistik. Depok: Gunadarma

Sumber Data: https://www.kaggle.com/datasets/fedesoriano/company-bankruptcy-prediction

Analisis Regresi Logistik

Nikita Rindiani Setyoningrum

2024-06-02

1 PENDAHULUAN

1.1 Latar Belakang

1.2 Tinjauan Pustaka

1.2.1 Analisis Regresi Logistik Biner

1.3 Data

1.4 Tujuan

2 SOURCE CODE

2.1 Library

2.2 Impor Data

2.3 Analisis

2.3.1 Regresi Logistik

2.3.2 Uji Parsial Parameter Model

2.3.3 Uji Signifikansi Keseluruhan Model

2.3.4 Hasil R-Squared

2.3.5 Pembentukan tabel berisi penduga parameter

2.3.6 Klasifikasi Model

2.3.7 Uji Kelayakan Model