Analisis regresi logistik adalah salah satu teknik statistik yang digunakan untuk memodelkan hubungan antara satu atau lebih variabel independen (prediktor) dengan variabel dependen yang bersifat dikotomis (biner). Dalam banyak kasus, variabel dependen ini mewakili dua kategori, seperti sukses/gagal dan ya/tidak. Regresi logistik memungkinkan untuk memperkirakan probabilitas kejadian tertentu berdasarkan nilai-nilai variabel prediktor.
Pada berbagai bidang penelitian regresi logistik telah menjadi alat yang sangat penting untuk analisis data. Misalnya, dalam sistem perbankan, regresi logistik dapat digunakan untuk memprediksi apakah seseorang mampu untuk membayar kredit berdasarkan pendapatan, usia, riwayat peminjaman, dan lainnya. Dalam perusahaan, digunakan untuk meprediksi keuntungan dan kerugian yang akan diperoleh.
Dalam penelitian ini, akan dibahas penerapan analisis regresi logistik untuk menunjukkan pengaruh profitabilitas (keuntungan) dan likuiditas (kelancaran keuangan) terhadap kebankrutan suatu perusahaan. Pada penerapan analisis regresi logistik, penting untuk memperhatikan pemilihan variabel penelitian, ukuran sampel yang sesuai, serta analisis yang dilakukan. Hal ini dilakukan agar hasil yang diperoleh lebih akurat dan dapat digunakan sebagai sumber wawasan bagi masyarakat luas
Analisis regresi logistik biner adalah bentuk regresi yang digunakan ketika variabel dependen bersifat biner (memiliki dua kategori, seperti sukses/gagal atau ya/tidak). Regresi logistik biner memungkinkan kita untuk memodelkan probabilitas kejadian suatu peristiwa sebagai fungsi dari satu atau lebih variabel independen. Model regresi logistik biner dinyatakan dalam bentuk logit sebagai berikut:
\[ π(x) = \frac {exp(\beta {_0} + \beta {_1} X {_2} + \beta {_1} X {_2} + ...+\beta {_x} X {_k})} {{1 + exp(\beta {_0} + \beta {_1} X {_2} + \beta {_1} X {_2} + ...+\beta {_x} X {_k})}} \] Keterangan: \[ π(x) : Peluang \quad kejadian \quad sukses \] \[ \beta {_0} : Koefisien \quad Regresi \] Menurut Roflin dkk. (2023) karena fungsi tersebut adalah fungsi non-linier maka dibutuhkan transformasi logistik untuk membuat fungsi tersebut linier agar dapat memodelkan hubungan variabel prediktor dan variabel respons. Selain itu, odds ratio-nya dapat dihitung dari model regresi logistik yang dihasilkan, yaitu:
\[ OR = \frac {exp(\beta {_0} + \beta {_1} X {_1}{_1} + \beta {_2} X {_2}{_2} + ...+\beta {_p} X {_1}{_p})} {1 + exp(\beta {_0} + \beta {_1} X {_1}{_1} + \beta {_2} X {_2}{_2} + ...+\beta {_p} X {_0}{_p})} \] Bentuk logit regresi logistik didapat dari hasil transformasi dari bentuk Odds Ratio:
\[ g(x) : ln \frac {π(x)} {1-π(x)} \]
Data yang digunakan bersumber dari website kaggle yang berjudul “Company Bankruptcy Prediction” atau variabel-variabel prediktor yang berpengaruh terhadap kebankrutan suatu perusahaan. Dipilih 2 variabel prediktor yaitu Profitability (X1) dan Likuiditas (X2) terhadap Kebankrutan (Y) serta diambil 50 sampel untuk masing-masing variabel
Analisis regresi logistik dilakukan untuk mengetahui apakah profitabilitas dan likuiditas berpengaruh atau tidak terhadap kebankrutan perusahaan. Profitabilitas dan Likuiditas sebagai variabel prediktor kemudian Kebangkrutan sebagai variabel respons.
> library(knitr)
> library(rmarkdown)
> library(equatiomatic)
> library(generalhoslem)
> library(pscl)
> setwd("C:/Users/USER/Documents/Tugas Kuliah/File Rstud")
> perusahaan <- read.csv("perusahaan.csv", header=TRUE, sep=";")
> X1_lama <- perusahaan$ROA.A..before.interest.and...after.tax
> X1<-head(X1_lama,50)
> X2_lama <- perusahaan$Current.Ratio
> X2<-head(X2_lama,50)
> Y_lama <- perusahaan$Bankrupt.
> Y<-head(Y_lama,50)
> data_laprak2 <- data.frame(Y,X1,X2)
> data1 <- head(data_laprak2,50) |> round(4)
> data1
Y X1 X2
1 1 0.4244 0.0023
2 1 0.5382 0.0060
3 1 0.4990 0.0115
4 1 0.4513 0.0042
5 1 0.5384 0.0060
6 1 0.4152 0.0027
7 0 0.4457 0.0047
8 0 0.5709 0.0097
9 0 0.5451 0.0135
10 0 0.5509 0.0115
11 0 0.5675 0.0061
12 0 0.5497 0.0086
13 0 0.5516 0.0066
14 0 0.5333 0.0101
15 0 0.5758 0.0189
16 0 0.5711 0.0113
17 0 0.5602 0.0062
18 0 0.5904 0.0162
19 0 0.5598 0.0072
20 0 0.5437 0.0134
21 0 0.5456 0.0267
22 0 0.5645 0.0158
23 0 0.5637 0.0072
24 0 0.5481 0.0052
25 0 0.5614 0.0057
26 0 0.5037 0.0063
27 0 0.5636 0.0056
28 0 0.5931 0.0219
29 0 0.5639 0.0156
30 1 0.4702 0.0043
31 1 0.5360 0.0021
32 0 0.5445 0.0034
33 0 0.5707 0.0087
34 0 0.5448 0.0114
35 0 0.5509 0.0108
36 0 0.5645 0.0066
37 0 0.5164 0.0061
38 0 0.5413 0.0095
39 0 0.5395 0.0192
40 0 0.5480 0.0169
41 0 0.5716 0.0085
42 0 0.5627 0.0054
43 0 0.5669 0.0117
44 0 0.5759 0.0060
45 0 0.5534 0.0104
46 0 0.5490 0.0213
47 0 0.5635 0.0167
48 0 0.5633 0.0071
49 0 0.5505 0.0053
50 0 0.5597 0.0055
> str(data1)
'data.frame': 50 obs. of 3 variables:
$ Y : num 1 1 1 1 1 1 0 0 0 0 ...
$ X1: num 0.424 0.538 0.499 0.451 0.538 ...
$ X2: num 0.0023 0.006 0.0115 0.0042 0.006 0.0027 0.0047 0.0097 0.0135 0.0115 ...
> reglog <- glm(Y~X1+X2, family = binomial, data = data1)
> summary <- summary(reglog)
> coefficients(reglog)
(Intercept) X1 X2
18.90803 -35.38435 -245.25926
> summary(reglog)
Call:
glm(formula = Y ~ X1 + X2, family = binomial, data = data1)
Coefficients:
Estimate Std. Error z value Pr(>|z|)
(Intercept) 18.908 7.948 2.379 0.0174 *
X1 -35.384 15.375 -2.301 0.0214 *
X2 -245.259 196.052 -1.251 0.2109
---
Signif. codes: 0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
(Dispersion parameter for binomial family taken to be 1)
Null deviance: 43.967 on 49 degrees of freedom
Residual deviance: 23.753 on 47 degrees of freedom
AIC: 29.753
Number of Fisher Scoring iterations: 7
> pR2(reglog)
fitting null model for pseudo-r2
llh llhNull G2 McFadden r2ML r2CU
-11.8764284 -21.9834940 20.2141312 0.4597570 0.3325445 0.5685075
> qchisq(0.95,2)
[1] 5.991465
> Rsq <- 1 -(23.753/43.967)
> Rsq
[1] 0.4597539
> beta <- coef(reglog)
> OR_beta<- exp(beta)
> sk_OR<-exp(confint(reglog))
> cbind(beta,OR_beta,sk_OR)
beta OR_beta 2.5 % 97.5 %
(Intercept) 18.90803 1.627996e+08 4.017406e+02 6.814228e+16
X1 -35.38435 4.293101e-16 2.953368e-32 7.522551e-05
X2 -245.25926 3.056732e-107 1.941678e-321 1.060432e+23
> yp_hat<-fitted(reglog)
> kelas<-table(Y,yp_hat > 0.5)
> kelas
Y FALSE TRUE
0 41 1
1 4 4
> logitgof(data1$Y,fitted(reglog))
Hosmer and Lemeshow test (binary model)
data: data1$Y, fitted(reglog)
X-squared = 4.9336, df = 8, p-value = 0.7646
\[ Logit(π̂)=18.908-35.384X_1-245.259X_2 \] • Jika seluruh variabel prediktor (profitabilitas dan likuiditas) bernilai 0, nilai logit dari variabel dependen (kebankrutan perusahaan) bernilai 18.908
• Setiap kenaikan 1 dari variabel prediktor profitabilitas nilai logit variabel dependen (kebankrutan perusahaan) akan turun sebesar 35.384.Karena koefisiennya negatif, ini menunjukkan bahwa profitabilitas yang lebih tinggi secara signifikan mengurangi kemungkinan kebangkrutan.
• Setiap kenaikan 1 dari variabel prediktor likuiditas nilai logit variabel dependen (kebankrutan perusahaan) akan turun sebesar 245.259. Karena koefisiennya negatif, ini menunjukkan bahwa likuiditas yang lebih tinggi juga secara signifikan mengurangi kemungkinan kebangkrutan.
\[ H0 : \beta_{i} = 0, \quad i=1,2 \] \[ H0 : Setidaknya \quad terdapat \quad satu \quad i \quad dimana \quad \ \beta_{i}≠ 0, \quad i=1,2 \]
> summary$coefficients[, "Pr(>|z|)"]
(Intercept) X1 X2
0.01735483 0.02136829 0.21093819
• Intercept (0.01735483) < α (0.05) maka Tolak H0
• X1 (0.02136829) < α (0.05) maka Tolak H0
• X2 (0.21093819) > α (0.05) maka Terima H0
• Interpretasi : Dengan taraf nyata 5%, dapat disimpulkan bahwa variabel prediktor profitabilitas berpengaruh signifikan terhadap kebankrutan perusaahaan. Namun, likuiditas tidak berpengaruh signfikan terhadap kebankrutan perusahaan.
> Rsq
[1] 0.4597539
Variabel prediktor profitabilitas dan likuiditas hanya menjelaskan pengaruh terhadap kebankrutan perusahaan sebanyak 46%, sisanya 54% dipengaruhi oleh variabel lain di luar model
> OR_beta
(Intercept) X1 X2
1.627996e+08 4.293101e-16 3.056732e-107
• Intercept (1.63 x 10^(-88)). Nilai yang sangat kecil menunjukkan bahwa odds dasar terjadinya kebangkrutan perusahaan ketika profitabilitas dan likuiditas adalah nol hampir mendekati nol. Dalam konteks bisnis, ini bisa mengindikasikan bahwa tanpa adanya profitabilitas dan likuiditas, kebangkrutan perusahaan hampir pasti terjadi.
• X1 (4.29 x 10^(-16)). Artinya setiap unit peningkatan dalam profitabilitas secara signifikan mengurangi odds kebangkrutan perusahaan. Dalam hal ini, karena nilai OR jauh lebih kecil dari 1, dapat dikatakan bahwa profitabilitas yang lebih tinggi sangat mengurangi kemungkinan kebangkrutan.
• X2 (3.05 x e^(-107)). Artinya setiap unit peningkatan dalam likuiditas juga secara signifikan mengurangi odds kebangkrutan perusahaan. Nilai OR yang sangat kecil ini menunjukkan bahwa likuiditas yang lebih tinggi juga sangat mengurangi kemungkinan kebangkrutan.
> kelas
Y FALSE TRUE
0 41 1
1 4 4
Berdasarkan analisis regresi logistik yang telah dilakukan menggunakan software R, didapatkan kesimpulan bahwa variabel prediktor Profitabilitas (X1) berpengaruh signifikan terhadap kebankrutan perusahaan. Hal ini berarti profitabilitas atau keuntugan yang rendah memiliki kemungkinan lebih besar untuk bankrut dibandingkan perusahaan yang memiliki profitabilitas tinggi. Di sisi lain, Likuiditas (X2) tidak berpengaruh signifikan terhadap kebankrutan perusahaan. Artinya, meskipun likuiditas atau kelancaran keuangan penting untuk perusahaan, namun dalam penelitian ini, likuiditas tidak secara langsung mempengaruhi kebangkrutan perusahaan. Kesimpulannya, profitabilitas atau keuntungan adalah faktor yang lebih penting daripada likuiditas atau kelancaran keuangan dalam memprediksi kebangkrutan perusahaan.
Harlan, Johan. 2018. Analisis Regresi Logistik. Depok: Gunadarma
Sumber Data: https://www.kaggle.com/datasets/fedesoriano/company-bankruptcy-prediction