Penerapan Regresi Logistik dalam Klasifikasi Tingkat Kedalaman Kemiskinan Provinsi di Indonesia Tahun 2020
Pendahuluan
Latar Belakang
Kemiskinan merupakan salah satu persoalan serius yang dihadapi dan perlu ditanggulangi oleh pemerintah di suatu negara, baik negara berkembang maupun negara maju. Menurut BPS, Kemiskinan merupakan ketidakmampuan dari sisi ekonomi untuk memenuhi kebutuhan dasar makanan dan bukan makanan yang diukur dari sisi pengeluaran (sirusa.bps.go.id, 2021).
Tingkat kemiskinan di Indonesia disebabkan oleh beberapa faktor, yaitu pertumbuhan ekonomi, inflasi, pengangguran, dan pendidikan. Pertumbuhan ekonomi akan mempengaruhi kenaikan pendapatan di suatu wilayah. Konsumsi barang dan jasa juga meningkat karena dipengaruhi oleh meningkatnya pendapatan dari masyarakat. Untuk memenuhi peningkatan kebutuhan konsumsi barang dan jasa, dibutuhkan adanya peningkatan produksi. Adapun cara untuk meningkatkan produksi yaitu dengan cara meningkatkan kualitas dari pekerja. Jumlah penggangguran bisa diminimalkan dengan meningkatkan kualitas dari pekerjanya. Jumlah kemiskinan menurun apabila jumlah pengangguran juga menurun.
Selain melihat jumlah penduduk miskin (P0), kemiskinan dapat diteliti dari nilai Kedalaman kemiskinan (P1) dan Keparahan Kemisikinan (P2). Kedalaman Kemiskinan sendiri adalah ukuran rata-rata kesenjangan pengeluaran masing-masing penduduk miskin terhadap garis kemiskinan.
Hendayanti (2020) melakukan penelitian Penentuan Ketepatan Klasifikasi Tingkat Kedalaman Kemiskinan Provinsi-Provinsi di Indonsia. Pada penelitian tersebut menggunakan variabel terikat berubah kategorik dari kedalaman kemiskinan dimana nilai kedalaman kemiskinan dikategorkan tinggi dan rendah. Dari hasil penelitian tersebut terlihat rata-rata lama sekolah dan harapan lama sekolah berpengaruh nyata terhadap kedalaman kemsikinan.
Tujuan
Adapaun Tujuan dari Penelitian ini adalah:
- Melihat gambaran umum kedalaman kemiskinan Provinsi-Provinsi di Indonesia
- Mengetahui pengaruh pertumbuhan ekonomi, rata-rata lama sekolah, dan tingkat pengangguran terbuka terhadap kedalaman kemiskinan
- Melihat tingkat klasifikasi kedalaman kemiskinan
Metode Penelitian
Analisis Deskriptif
Analisis deskriptif digunakan untuk mendeskripsikan atau menggambarkan data secara umum. Dalam penelitian ini analisis deskriptif bertujuan untuk melihat karakteristik variabel-variabel penjelas meliputi pertumbuhan ekonomi, rata-rata lama sekolah dan tingkat pengangguran terbuka diduga mempengaruhi tingkat kedalaman kemiskinan Provinsi-Provinsi di Indonesia
Analisis Logistik Biner
Analisis Inferensia yang digunakan pada penelitiian ini adalah Analisis Logistik Biner.
Regresi logistik biner adalah suatu metode analisis data yang digunakan untuk mencari hubungan antara variabel respon yang bersifat dikotomus dengan variabel penjelas yang bersifat dikotomus atau polikotomus. Variabel respon terdiri dari dua kategori yaitu “sukses” dan “gagal” sehingga distribusi yang diikuti adalah distribusi Bernoulli untuk setiap observasi tunggal. Fungsi probabilitas regresi logistik dinotasikan P(Y=1|X) = p. Transformasi dari model regresi logistik sebagai berikut:
Sehingga model logistik yang terbentuk adalah sebagai berikut:
dimana:
Adapun variabel yang digunakan dalam regresi ini adalah:
P1: Merupakan nilai 1 dan 0 dari Indeks Kedalaman Kemisikinan. Dimana Nilai 1 adalah nilai Kedalaman Kemiskinan Tinggi yang merupakan nilai diatas rata-rata Indeks Kedalaman Kemiskinan Provinsi-Provinsi Indonesia, sedangkan nilai 0 adalah Kedalaman Kemiskinan Rendah yang merupakan Nilai yang dibawah rata-rata Indeks Kedalaman Kemiskinan Provinsi-Provinsi Indonesia.
PE: Pertumbuhan Ekonomi Provinsi-Provinsi Indonesia
RLS: Rata-Rata Lama Sekolah Provinsi-Provinsi Indonesia
TPT : Tingkat Pengangguran Terbuka Provinsi-Provinsi Indonesia
Hasil
Eksplorasi Data
Data yang digunakan dalam penelitian ini diambil dari web BPS www.bps.go.id. Seluruh data menggunakan data Tahun 2020.
Berikut package R yang digunakan untuk mengolah data:
Package
library(readxl)
library(broom)
library(caret)
library(DataExplorer)
library(grid)
library(InformationValue)
library(ISLR)
library(pscl)
library(tidyverse)
library(kableExtra)Input Data
#read data
data_paper<- read_excel("D:\\S2 Bismillah\\02_SEMESTER 1\\_STA581 SAINS DATA\\PRAKTIKUM\\Tugas paper\\data_paper_SD.xlsx")dim(data_paper)## [1] 34 5
Eksplore Data
glimpse(data_paper)## Rows: 34
## Columns: 5
## $ Provinsi <chr> "ACEH", "SUMATERA UTARA", "SUMATERA BARAT", "RIAU", "JAMBI...
## $ P1 <dbl> 1, 0, 0, 0, 0, 1, 1, 1, 0, 0, 0, 0, 0, 1, 0, 0, 0, 1, 1, 0...
## $ PE <dbl> -0.37, -1.07, -1.60, -1.12, -0.46, -0.11, -0.02, -1.67, -2...
## $ RLS <dbl> 9.71, 9.83, 9.34, 9.47, 8.97, 8.68, 9.20, 8.51, 8.49, 10.2...
## $ TPT <dbl> 6.59, 6.91, 6.88, 6.32, 5.13, 5.51, 4.07, 4.67, 5.25, 10.3...
summary(data_paper)## Provinsi P1 PE RLS
## Length:34 Min. :0.0000 Min. :-9.3100 Min. : 6.960
## Class :character 1st Qu.:0.0000 1st Qu.:-2.3825 1st Qu.: 8.495
## Mode :character Median :0.0000 Median :-1.1150 Median : 9.145
## Mean :0.4118 Mean :-1.2521 Mean : 9.082
## 3rd Qu.:1.0000 3rd Qu.:-0.6425 3rd Qu.: 9.650
## Max. :1.0000 Max. : 4.9200 Max. :11.170
## TPT
## Min. : 3.320
## 1st Qu.: 4.580
## Median : 5.570
## Mean : 6.034
## 3rd Qu.: 6.853
## Max. :10.950
Ringkasan
data_paper$P1 <- as.factor(data_paper$P1)
glimpse(data_paper)## Rows: 34
## Columns: 5
## $ Provinsi <chr> "ACEH", "SUMATERA UTARA", "SUMATERA BARAT", "RIAU", "JAMBI...
## $ P1 <fct> 1, 0, 0, 0, 0, 1, 1, 1, 0, 0, 0, 0, 0, 1, 0, 0, 0, 1, 1, 0...
## $ PE <dbl> -0.37, -1.07, -1.60, -1.12, -0.46, -0.11, -0.02, -1.67, -2...
## $ RLS <dbl> 9.71, 9.83, 9.34, 9.47, 8.97, 8.68, 9.20, 8.51, 8.49, 10.2...
## $ TPT <dbl> 6.59, 6.91, 6.88, 6.32, 5.13, 5.51, 4.07, 4.67, 5.25, 10.3...
summary(data_paper)## Provinsi P1 PE RLS TPT
## Length:34 0:20 Min. :-9.3100 Min. : 6.960 Min. : 3.320
## Class :character 1:14 1st Qu.:-2.3825 1st Qu.: 8.495 1st Qu.: 4.580
## Mode :character Median :-1.1150 Median : 9.145 Median : 5.570
## Mean :-1.2521 Mean : 9.082 Mean : 6.034
## 3rd Qu.:-0.6425 3rd Qu.: 9.650 3rd Qu.: 6.853
## Max. : 4.9200 Max. :11.170 Max. :10.950
Kedalaman Kemiskinan
plot_bar(data_paper$P1) Terdapat 20 provinsi dengan kedamalan kemiskinan rendah dan 14 provinsi kedalaman kemiskinan tinggi.
Pertumbuhan Ekonomi
ggplot(data_paper, aes(PE, Provinsi)) + geom_bar(stat="identity") Pertumbuhan Ekonomi Tahun 2020 terendah pada Provinsi Bali yaitu -9,31 persen dan tertingi pada Provinsi Maluku Utara 4,92 persen. Hanya 3 provinsi yang memiliki pertumbuhan positif yaitu Sulawesi Tengah, Papua dan Maluku Utara.
Rata-Rata Lama Sekolah
ggplot(data_paper, aes(RLS, Provinsi)) + geom_bar(stat="identity") Rata-Rata Lama Sekolah Tahun 2020 terendah berada pada Provinsi Papua 6,96 tahun dan tertinggi berada pada Provinsi DKI Jakrta yaitu 11.17 Tahun.
Tingkat Pengangguran Terbuka
ggplot(data_paper, aes(TPT, Provinsi)) + geom_bar(stat="identity") Tingkat Pengangguran Terbuka Tahun 2020 terendah berada pada Provinsi Sulawesi Barat 3,32 persen dan tertinggi berada pada Provinsi DKI Jakarta yaitu 10,95 persen.
Regresi Logistik
logit <- glm(P1~PE+RLS+TPT, data=data_paper, family = "binomial")
summary(logit)##
## Call:
## glm(formula = P1 ~ PE + RLS + TPT, family = "binomial", data = data_paper)
##
## Deviance Residuals:
## Min 1Q Median 3Q Max
## -1.9974 -0.7242 -0.1183 0.8436 1.8793
##
## Coefficients:
## Estimate Std. Error z value Pr(>|z|)
## (Intercept) 0.1043 5.1207 0.020 0.9838
## PE 0.2428 0.2390 1.016 0.3097
## RLS 0.6217 0.6912 0.900 0.3684
## TPT -1.0305 0.4694 -2.196 0.0281 *
## ---
## Signif. codes: 0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
##
## (Dispersion parameter for binomial family taken to be 1)
##
## Null deviance: 46.070 on 33 degrees of freedom
## Residual deviance: 33.238 on 30 degrees of freedom
## AIC: 41.238
##
## Number of Fisher Scoring iterations: 5
Berdasarkan output dari regresi logistik diatas diperoleh bahwa Tingkat Pengangguran Terbuka berpengaruh secara nyata terhadap Kedalaman Kemiskinan.
Interpretasi Hasil
logit$coefficient## (Intercept) PE RLS TPT
## 0.1042753 0.2428227 0.6217349 -1.0305003
hasil β3=-1.0305 (negatif) berarti peningkatan satu persen pengganguran terbuka berhubungan dengan meningkatnya log-odds kedalaman kemiskinan tinggi sebesar 1,0305.
Untuk memudahkan interpretasi, seringkali digunakan rasio odds, yaitu rasio antara dua odds.
exp(logit$coefficients)## (Intercept) PE RLS TPT
## 1.1099060 1.2748426 1.8621559 0.3568284
Pada ilustrasi ini, terlihat bahwa nilai rasio odds untuk peubah tingkat pengangguran terbuka adalah 0,3568. Hal ini dapat diartikan bahwa ketika tingkat pengangguran terbuka meningkat 1 persen maka kemungkinan meningkatnya kedalaman kemiskinan meningkat sebesar 0,3568 kali dibadingkan sebelumnya
sama halnya intreprestasi untuk pertumbuhan ekonomi dan rata-rata Lama sekolah, namun berdasarkan uji parsial variabel ini tidak berpengaruh nayata.
Pseudo R2
pscl::pR2(logit)["McFadden"]## fitting null model for pseudo-r2
## McFadden
## 0.278516
R-Square dari model ini adalah 27,85 persen
Confusion Matrix
Sensitivitas (atau True Positive Rate) adalah persentase pengamatan (aktual) yang diprediksi dengan benar oleh model, sedangkan spesifisitas adalah persentase dari 0 (aktual) yang diprediksi dengan benar.
melakukan pengujian menggunakan data itu sendiri kedalam model
ini sesuai dengan tujuan yang ketiga dari penelitian ini untuk melihat tingkat pengklafisikasian data
data_paper$pred <- predict(logit, data_paper, type="response")
data_paper$P1_pred <- ifelse(data_paper$pred > 0.80, "1", "0")
data_paper$P1_pred <- as.factor(data_paper$P1_pred)
(conf.mat<-caret::confusionMatrix(data_paper$P1_pred, data_paper$P1, positive="1"))## Confusion Matrix and Statistics
##
## Reference
## Prediction 0 1
## 0 19 12
## 1 1 2
##
## Accuracy : 0.6176
## 95% CI : (0.4356, 0.7783)
## No Information Rate : 0.5882
## P-Value [Acc > NIR] : 0.434982
##
## Kappa : 0.1053
##
## Mcnemar's Test P-Value : 0.005546
##
## Sensitivity : 0.14286
## Specificity : 0.95000
## Pos Pred Value : 0.66667
## Neg Pred Value : 0.61290
## Prevalence : 0.41176
## Detection Rate : 0.05882
## Detection Prevalence : 0.08824
## Balanced Accuracy : 0.54643
##
## 'Positive' Class : 1
##
Terlihat 21 data terklasifikasikan dengan baik dimana 19 untuk kedalaman rendah dan 2 untuk kedalaman tinggi. Sedangkan 13 data belum terklasifikasikan dengan baik dimana terdapat 12 terklasifikasikan tinggi namun namun prediksi dari model rendah, sedangkan 1 terklaisifkasikan rendah namun prediksi dari model tinggi
tingkat akurasi dari model adalah 61,76 persen
Berikut tabel untuk melihat kedalaman masing-masing provinsi dan hasil prediksi dari model:
data_p1 <- data.frame(data_paper$Provinsi, data_paper$P1, data_paper$P1_pred)
data_p1 %>% kbl() %>% kable_styling() %>% scroll_box(height = "200px")| data_paper.Provinsi | data_paper.P1 | data_paper.P1_pred |
|---|---|---|
| ACEH | 1 | 0 |
| SUMATERA UTARA | 0 | 0 |
| SUMATERA BARAT | 0 | 0 |
| RIAU | 0 | 0 |
| JAMBI | 0 | 0 |
| SUMATERA SELATAN | 1 | 0 |
| BENGKULU | 1 | 1 |
| LAMPUNG | 1 | 0 |
| KEP. BANGKA BELITUNG | 0 | 0 |
| KEP. RIAU | 0 | 0 |
| DKI JAKARTA | 0 | 0 |
| JAWA BARAT | 0 | 0 |
| JAWA TENGAH | 0 | 0 |
| DI YOGYAKARTA | 1 | 0 |
| JAWA TIMUR | 0 | 0 |
| BANTEN | 0 | 0 |
| BALI | 0 | 0 |
| NUSA TENGGARA BARAT | 1 | 0 |
| NUSA TENGGARA TIMUR | 1 | 0 |
| KALIMANTAN BARAT | 0 | 0 |
| KALIMANTAN TENGAH | 0 | 0 |
| KALIMANTAN SELATAN | 0 | 0 |
| KALIMANTAN TIMUR | 0 | 0 |
| KALIMANTAN UTARA | 0 | 0 |
| SULAWESI UTARA | 0 | 0 |
| SULAWESI TENGAH | 1 | 1 |
| SULAWESI SELATAN | 0 | 0 |
| SULAWESI TENGGARA | 1 | 0 |
| GORONTALO | 1 | 0 |
| SULAWESI BARAT | 1 | 0 |
| MALUKU | 1 | 0 |
| MALUKU UTARA | 0 | 1 |
| PAPUA BARAT | 1 | 0 |
| PAPUA | 1 | 0 |
Membagi Data
Dalam rangka melakukan pengujian model, dilakukan pengambilan sampel dari data. Pengambilan sampel ini dibagi menjadi 2 bagian data sehingga akan diperoleh dua bagian data,yaitu data train untuk membentuk model, dan data test untuk menguji model yang telah dibuat.
Pembagian tidak dilakukan diawal mengingat, pertama jumlah data yang cukup sedikit dan kedua tujuan dari penelitian untuk melihat tingkat klasifikasi sehingga diperlukan seluruh data masuk dalam model.
data_paper## # A tibble: 34 x 7
## Provinsi P1 PE RLS TPT pred P1_pred
## <chr> <fct> <dbl> <dbl> <dbl> <dbl> <fct>
## 1 ACEH 1 -0.37 9.71 6.59 0.323 0
## 2 SUMATERA UTARA 0 -1.07 9.83 6.91 0.238 0
## 3 SUMATERA BARAT 0 -1.6 9.34 6.88 0.173 0
## 4 RIAU 0 -1.12 9.47 6.32 0.312 0
## 5 JAMBI 0 -0.46 8.97 5.13 0.570 0
## 6 SUMATERA SELATAN 1 -0.11 8.68 5.51 0.449 0
## 7 BENGKULU 1 -0.02 9.2 4.07 0.836 1
## 8 LAMPUNG 1 -1.67 8.51 4.67 0.544 0
## 9 KEP. BANGKA BELITUNG 0 -2.3 8.49 5.25 0.358 0
## 10 KEP. RIAU 0 -3.8 10.2 10.3 0.00594 0
## # ... with 24 more rows
set.seed(5815)
sample <- sample(nrow(data_paper),floor(nrow(data_paper)*0.7))
train <- data_paper[sample,]
train## # A tibble: 23 x 7
## Provinsi P1 PE RLS TPT pred P1_pred
## <chr> <fct> <dbl> <dbl> <dbl> <dbl> <fct>
## 1 BANTEN 0 -3.38 9.22 10.6 0.00260 0
## 2 KALIMANTAN BARAT 0 -1.82 7.9 5.81 0.196 0
## 3 BALI 0 -9.31 9.31 5.63 0.102 0
## 4 JAWA BARAT 0 -2.44 8.96 10.5 0.00335 0
## 5 PAPUA BARAT 1 -0.77 10 6.8 0.295 0
## 6 KALIMANTAN UTARA 0 -1.11 9.3 4.97 0.621 0
## 7 KALIMANTAN TENGAH 0 -1.4 8.95 4.58 0.648 0
## 8 MALUKU 1 -0.92 10.2 7.57 0.171 0
## 9 GORONTALO 1 -0.02 8.26 4.28 0.695 0
## 10 KALIMANTAN TIMUR 0 -2.85 9.99 6.87 0.189 0
## # ... with 13 more rows
test <- data_paper[-sample,]
test## # A tibble: 11 x 7
## Provinsi P1 PE RLS TPT pred P1_pred
## <chr> <fct> <dbl> <dbl> <dbl> <dbl> <fct>
## 1 RIAU 0 -1.12 9.47 6.32 0.312 0
## 2 JAMBI 0 -0.46 8.97 5.13 0.570 0
## 3 LAMPUNG 1 -1.67 8.51 4.67 0.544 0
## 4 KEP. BANGKA BELITUNG 0 -2.3 8.49 5.25 0.358 0
## 5 JAWA TENGAH 0 -2.65 8.19 6.48 0.107 0
## 6 JAWA TIMUR 0 -2.39 8.31 5.84 0.210 0
## 7 NUSA TENGGARA TIMUR 1 -0.83 8.09 4.28 0.628 0
## 8 KALIMANTAN SELATAN 0 -1.81 8.69 4.74 0.546 0
## 9 SULAWESI UTARA 0 -0.99 9.74 7.37 0.158 0
## 10 SULAWESI TENGAH 1 4.86 9.09 3.77 0.955 1
## 11 SULAWESI BARAT 1 -2.42 8.33 3.32 0.782 0
Data telah dibagi menjadi dua yaitu train dan test untuk selanjutnya dilakukan evaluasi
Evaluasi Model
Dilakukan pemodelan ulang dari data train
logit_train <- glm(P1~PE+RLS+TPT, data=train, family = "binomial")
summary(logit_train)##
## Call:
## glm(formula = P1 ~ PE + RLS + TPT, family = "binomial", data = train)
##
## Deviance Residuals:
## Min 1Q Median 3Q Max
## -1.9555 -0.8455 -0.1924 0.8534 1.5847
##
## Coefficients:
## Estimate Std. Error z value Pr(>|z|)
## (Intercept) 0.3899 5.6587 0.069 0.9451
## PE 0.2041 0.2401 0.850 0.3951
## RLS 0.4521 0.7324 0.617 0.5371
## TPT -0.7574 0.4602 -1.646 0.0998 .
## ---
## Signif. codes: 0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
##
## (Dispersion parameter for binomial family taken to be 1)
##
## Null deviance: 31.492 on 22 degrees of freedom
## Residual deviance: 23.812 on 19 degrees of freedom
## AIC: 31.812
##
## Number of Fisher Scoring iterations: 5
Confusion Matrix Data Test
Sensitivitas (atau True Positive Rate) adalah persentase pengamatan (aktual) yang diprediksi dengan benar oleh model, sedangkan spesifisitas adalah persentase dari 0 (aktual) yang diprediksi dengan benar.
melakukan pengujian menggunakan data test kedalam model yang menggunakan data train
test$pred <- predict(logit_train, test, type="response")
test$P1_pred <- ifelse(test$pred > 0.80, "1", "0")
test$P1_pred <- as.factor(test$P1_pred)
(conf.mat<-caret::confusionMatrix(test$P1_pred, test$P1, positive="1"))## Confusion Matrix and Statistics
##
## Reference
## Prediction 0 1
## 0 7 3
## 1 0 1
##
## Accuracy : 0.7273
## 95% CI : (0.3903, 0.9398)
## No Information Rate : 0.6364
## P-Value [Acc > NIR] : 0.3883
##
## Kappa : 0.2979
##
## Mcnemar's Test P-Value : 0.2482
##
## Sensitivity : 0.25000
## Specificity : 1.00000
## Pos Pred Value : 1.00000
## Neg Pred Value : 0.70000
## Prevalence : 0.36364
## Detection Rate : 0.09091
## Detection Prevalence : 0.09091
## Balanced Accuracy : 0.62500
##
## 'Positive' Class : 1
##
broom::tidy(conf.mat)## # A tibble: 14 x 6
## term class estimate conf.low conf.high p.value
## <chr> <chr> <dbl> <dbl> <dbl> <dbl>
## 1 accuracy <NA> 0.727 0.390 0.940 0.388
## 2 kappa <NA> 0.298 NA NA NA
## 3 mcnemar <NA> NA NA NA 0.248
## 4 sensitivity 1 0.25 NA NA NA
## 5 specificity 1 1 NA NA NA
## 6 pos_pred_value 1 1 NA NA NA
## 7 neg_pred_value 1 0.7 NA NA NA
## 8 precision 1 1 NA NA NA
## 9 recall 1 0.25 NA NA NA
## 10 f1 1 0.4 NA NA NA
## 11 prevalence 1 0.364 NA NA NA
## 12 detection_rate 1 0.0909 NA NA NA
## 13 detection_prevalence 1 0.0909 NA NA NA
## 14 balanced_accuracy 1 0.625 NA NA NA
Receiver Operating Characteristics (ROC) Curve
Receiver Operating Characteristics (ROC) curve melacak persentase true positive saat cut-off peluang prediksi diturunkan dari 1 menjadi 0. Model yang baik akan memperlihat kurva yang lebih curam, artinya True Positive Rate meningkat lebih cepat dibandingkan dengan False Positive Rate ketika cut-off menurun. Dengan kata lain, semakin besar luas area di bawah kurva ROC maka kemampuan prediksi yang dihasilkan oleh model semakin baik.
plotROC(test$P1=="1", test$pred)Kesimpulan dan Saran
Kesimpulan
Kedalaman kemiskinan Provinsi-Provinsi di Indonesia dipengaruhi secara nyata oleh tingkat pengangguran terbuka
Model dapat mengkasifikasikan sebesar 61,76 persen Provinsi-Provinsi di Indonesia
Saran
ROC Curve dari data test dan train menghasilkan nilai yang sangat baik yaitu 0,9464 namun hasil R-Square masih sangat rendah, sehingga perlu dilakukan penambahan variabel lain yang mempengaruhi kedalaman kemiskinan Provinsi-Provinsi di Indonesia
Daftar Pusataka
Agresti A. (2002). Categorical Data Analysis. New York : John Willey and Sons.
Anisa,R., Dito, G.A., dan Nurussadad,A.A.. (2021). Logistik Regresion. [11 Maret 2021]. https://rpubs.com/nurussadad/STA581-05-regresi-logistik
Hendayanti,N.P.N, Nurhidayati,M. (2020). Regresi Logistik Biner dalam Penentuan Ketepatan Klasifikasi Tingkat Kedalaman Kemiskinan Provinsi-Provinsi di Indonesia. http://ecampus.iainbatusangkar.ac.id/ojs/index.php/sainstek/article/view/2483
Nurussadad, A.A. (2021). Visualisasi Data dengan ggplot2. [29 Maret 2021]. https://rpubs.com/nurussadad/STA581-04-ggplot2
RStudio . tanpa tahun . Data Visualization with ggplot2 Cheat Sheet [30 Maret 2021]. https://rstudio.com/wp-content/uploads/2015/03/ggplot2-cheatsheet.pdf
Satria June Adwendi, IPB University, sjadwendi@apps.ipb.ac.id↩︎