Penerapan Regresi Logistik dalam Klasifikasi Tingkat Kedalaman Kemiskinan Provinsi di Indonesia Tahun 2020

Pendahuluan

Latar Belakang

Kemiskinan merupakan salah satu persoalan serius yang dihadapi dan perlu ditanggulangi oleh pemerintah di suatu negara, baik negara berkembang maupun negara maju. Menurut BPS, Kemiskinan merupakan ketidakmampuan dari sisi ekonomi untuk memenuhi kebutuhan dasar makanan dan bukan makanan yang diukur dari sisi pengeluaran (sirusa.bps.go.id, 2021).

Tingkat kemiskinan di Indonesia disebabkan oleh beberapa faktor, yaitu pertumbuhan ekonomi, inflasi, pengangguran, dan pendidikan. Pertumbuhan ekonomi akan mempengaruhi kenaikan pendapatan di suatu wilayah. Konsumsi barang dan jasa juga meningkat karena dipengaruhi oleh meningkatnya pendapatan dari masyarakat. Untuk memenuhi peningkatan kebutuhan konsumsi barang dan jasa, dibutuhkan adanya peningkatan produksi. Adapun cara untuk meningkatkan produksi yaitu dengan cara meningkatkan kualitas dari pekerja. Jumlah penggangguran bisa diminimalkan dengan meningkatkan kualitas dari pekerjanya. Jumlah kemiskinan menurun apabila jumlah pengangguran juga menurun.

Selain melihat jumlah penduduk miskin (P0), kemiskinan dapat diteliti dari nilai Kedalaman kemiskinan (P1) dan Keparahan Kemisikinan (P2). Kedalaman Kemiskinan sendiri adalah ukuran rata-rata kesenjangan pengeluaran masing-masing penduduk miskin terhadap garis kemiskinan.

Hendayanti (2020) melakukan penelitian Penentuan Ketepatan Klasifikasi Tingkat Kedalaman Kemiskinan Provinsi-Provinsi di Indonsia. Pada penelitian tersebut menggunakan variabel terikat berubah kategorik dari kedalaman kemiskinan dimana nilai kedalaman kemiskinan dikategorkan tinggi dan rendah. Dari hasil penelitian tersebut terlihat rata-rata lama sekolah dan harapan lama sekolah berpengaruh nyata terhadap kedalaman kemsikinan.

Tujuan

Adapaun Tujuan dari Penelitian ini adalah:

  1. Melihat gambaran umum kedalaman kemiskinan Provinsi-Provinsi di Indonesia
  1. Mengetahui pengaruh pertumbuhan ekonomi, rata-rata lama sekolah, dan tingkat pengangguran terbuka terhadap kedalaman kemiskinan
  1. Melihat tingkat klasifikasi kedalaman kemiskinan

Metode Penelitian

Analisis Deskriptif

Analisis deskriptif digunakan untuk mendeskripsikan atau menggambarkan data secara umum. Dalam penelitian ini analisis deskriptif bertujuan untuk melihat karakteristik variabel-variabel penjelas meliputi pertumbuhan ekonomi, rata-rata lama sekolah dan tingkat pengangguran terbuka diduga mempengaruhi tingkat kedalaman kemiskinan Provinsi-Provinsi di Indonesia

Analisis Logistik Biner

Analisis Inferensia yang digunakan pada penelitiian ini adalah Analisis Logistik Biner.

Regresi logistik biner adalah suatu metode analisis data yang digunakan untuk mencari hubungan antara variabel respon yang bersifat dikotomus dengan variabel penjelas yang bersifat dikotomus atau polikotomus. Variabel respon terdiri dari dua kategori yaitu “sukses” dan “gagal” sehingga distribusi yang diikuti adalah distribusi Bernoulli untuk setiap observasi tunggal. Fungsi probabilitas regresi logistik dinotasikan P(Y=1|X) = p. Transformasi dari model regresi logistik sebagai berikut:

Sehingga model logistik yang terbentuk adalah sebagai berikut:

dimana:

Adapun variabel yang digunakan dalam regresi ini adalah:

P1: Merupakan nilai 1 dan 0 dari Indeks Kedalaman Kemisikinan. Dimana Nilai 1 adalah nilai Kedalaman Kemiskinan Tinggi yang merupakan nilai diatas rata-rata Indeks Kedalaman Kemiskinan Provinsi-Provinsi Indonesia, sedangkan nilai 0 adalah Kedalaman Kemiskinan Rendah yang merupakan Nilai yang dibawah rata-rata Indeks Kedalaman Kemiskinan Provinsi-Provinsi Indonesia.

PE: Pertumbuhan Ekonomi Provinsi-Provinsi Indonesia

RLS: Rata-Rata Lama Sekolah Provinsi-Provinsi Indonesia

TPT : Tingkat Pengangguran Terbuka Provinsi-Provinsi Indonesia

Hasil

Eksplorasi Data

Data yang digunakan dalam penelitian ini diambil dari web BPS www.bps.go.id. Seluruh data menggunakan data Tahun 2020.

Berikut package R yang digunakan untuk mengolah data:

Package

library(readxl)
library(broom)
library(caret)
library(DataExplorer)
library(grid)
library(InformationValue)
library(ISLR)
library(pscl)
library(tidyverse)
library(kableExtra)

Input Data

#read data
data_paper<- read_excel("D:\\S2 Bismillah\\02_SEMESTER 1\\_STA581 SAINS DATA\\PRAKTIKUM\\Tugas paper\\data_paper_SD.xlsx")
dim(data_paper)
## [1] 34  5

Eksplore Data

glimpse(data_paper)
## Rows: 34
## Columns: 5
## $ Provinsi <chr> "ACEH", "SUMATERA UTARA", "SUMATERA BARAT", "RIAU", "JAMBI...
## $ P1       <dbl> 1, 0, 0, 0, 0, 1, 1, 1, 0, 0, 0, 0, 0, 1, 0, 0, 0, 1, 1, 0...
## $ PE       <dbl> -0.37, -1.07, -1.60, -1.12, -0.46, -0.11, -0.02, -1.67, -2...
## $ RLS      <dbl> 9.71, 9.83, 9.34, 9.47, 8.97, 8.68, 9.20, 8.51, 8.49, 10.2...
## $ TPT      <dbl> 6.59, 6.91, 6.88, 6.32, 5.13, 5.51, 4.07, 4.67, 5.25, 10.3...
summary(data_paper)
##    Provinsi               P1               PE               RLS        
##  Length:34          Min.   :0.0000   Min.   :-9.3100   Min.   : 6.960  
##  Class :character   1st Qu.:0.0000   1st Qu.:-2.3825   1st Qu.: 8.495  
##  Mode  :character   Median :0.0000   Median :-1.1150   Median : 9.145  
##                     Mean   :0.4118   Mean   :-1.2521   Mean   : 9.082  
##                     3rd Qu.:1.0000   3rd Qu.:-0.6425   3rd Qu.: 9.650  
##                     Max.   :1.0000   Max.   : 4.9200   Max.   :11.170  
##       TPT        
##  Min.   : 3.320  
##  1st Qu.: 4.580  
##  Median : 5.570  
##  Mean   : 6.034  
##  3rd Qu.: 6.853  
##  Max.   :10.950

Ringkasan

data_paper$P1 <- as.factor(data_paper$P1)
glimpse(data_paper)
## Rows: 34
## Columns: 5
## $ Provinsi <chr> "ACEH", "SUMATERA UTARA", "SUMATERA BARAT", "RIAU", "JAMBI...
## $ P1       <fct> 1, 0, 0, 0, 0, 1, 1, 1, 0, 0, 0, 0, 0, 1, 0, 0, 0, 1, 1, 0...
## $ PE       <dbl> -0.37, -1.07, -1.60, -1.12, -0.46, -0.11, -0.02, -1.67, -2...
## $ RLS      <dbl> 9.71, 9.83, 9.34, 9.47, 8.97, 8.68, 9.20, 8.51, 8.49, 10.2...
## $ TPT      <dbl> 6.59, 6.91, 6.88, 6.32, 5.13, 5.51, 4.07, 4.67, 5.25, 10.3...
summary(data_paper)
##    Provinsi         P1           PE               RLS              TPT        
##  Length:34          0:20   Min.   :-9.3100   Min.   : 6.960   Min.   : 3.320  
##  Class :character   1:14   1st Qu.:-2.3825   1st Qu.: 8.495   1st Qu.: 4.580  
##  Mode  :character          Median :-1.1150   Median : 9.145   Median : 5.570  
##                            Mean   :-1.2521   Mean   : 9.082   Mean   : 6.034  
##                            3rd Qu.:-0.6425   3rd Qu.: 9.650   3rd Qu.: 6.853  
##                            Max.   : 4.9200   Max.   :11.170   Max.   :10.950

Kedalaman Kemiskinan

plot_bar(data_paper$P1)

Terdapat 20 provinsi dengan kedamalan kemiskinan rendah dan 14 provinsi kedalaman kemiskinan tinggi.

Pertumbuhan Ekonomi

ggplot(data_paper, aes(PE, Provinsi)) + geom_bar(stat="identity")  

Pertumbuhan Ekonomi Tahun 2020 terendah pada Provinsi Bali yaitu -9,31 persen dan tertingi pada Provinsi Maluku Utara 4,92 persen. Hanya 3 provinsi yang memiliki pertumbuhan positif yaitu Sulawesi Tengah, Papua dan Maluku Utara.

Rata-Rata Lama Sekolah

ggplot(data_paper, aes(RLS, Provinsi)) + geom_bar(stat="identity")  

Rata-Rata Lama Sekolah Tahun 2020 terendah berada pada Provinsi Papua 6,96 tahun dan tertinggi berada pada Provinsi DKI Jakrta yaitu 11.17 Tahun.

Tingkat Pengangguran Terbuka

ggplot(data_paper, aes(TPT, Provinsi)) + geom_bar(stat="identity")  

Tingkat Pengangguran Terbuka Tahun 2020 terendah berada pada Provinsi Sulawesi Barat 3,32 persen dan tertinggi berada pada Provinsi DKI Jakarta yaitu 10,95 persen.

Regresi Logistik

logit <- glm(P1~PE+RLS+TPT, data=data_paper, family = "binomial")
summary(logit)
## 
## Call:
## glm(formula = P1 ~ PE + RLS + TPT, family = "binomial", data = data_paper)
## 
## Deviance Residuals: 
##     Min       1Q   Median       3Q      Max  
## -1.9974  -0.7242  -0.1183   0.8436   1.8793  
## 
## Coefficients:
##             Estimate Std. Error z value Pr(>|z|)  
## (Intercept)   0.1043     5.1207   0.020   0.9838  
## PE            0.2428     0.2390   1.016   0.3097  
## RLS           0.6217     0.6912   0.900   0.3684  
## TPT          -1.0305     0.4694  -2.196   0.0281 *
## ---
## Signif. codes:  0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
## 
## (Dispersion parameter for binomial family taken to be 1)
## 
##     Null deviance: 46.070  on 33  degrees of freedom
## Residual deviance: 33.238  on 30  degrees of freedom
## AIC: 41.238
## 
## Number of Fisher Scoring iterations: 5

Berdasarkan output dari regresi logistik diatas diperoleh bahwa Tingkat Pengangguran Terbuka berpengaruh secara nyata terhadap Kedalaman Kemiskinan.

Interpretasi Hasil

logit$coefficient
## (Intercept)          PE         RLS         TPT 
##   0.1042753   0.2428227   0.6217349  -1.0305003

hasil β3=-1.0305 (negatif) berarti peningkatan satu persen pengganguran terbuka berhubungan dengan meningkatnya log-odds kedalaman kemiskinan tinggi sebesar 1,0305.

Untuk memudahkan interpretasi, seringkali digunakan rasio odds, yaitu rasio antara dua odds.

exp(logit$coefficients)
## (Intercept)          PE         RLS         TPT 
##   1.1099060   1.2748426   1.8621559   0.3568284

Pada ilustrasi ini, terlihat bahwa nilai rasio odds untuk peubah tingkat pengangguran terbuka adalah 0,3568. Hal ini dapat diartikan bahwa ketika tingkat pengangguran terbuka meningkat 1 persen maka kemungkinan meningkatnya kedalaman kemiskinan meningkat sebesar 0,3568 kali dibadingkan sebelumnya

sama halnya intreprestasi untuk pertumbuhan ekonomi dan rata-rata Lama sekolah, namun berdasarkan uji parsial variabel ini tidak berpengaruh nayata.

Pseudo R2

pscl::pR2(logit)["McFadden"]
## fitting null model for pseudo-r2
## McFadden 
## 0.278516

R-Square dari model ini adalah 27,85 persen

Confusion Matrix

Sensitivitas (atau True Positive Rate) adalah persentase pengamatan (aktual) yang diprediksi dengan benar oleh model, sedangkan spesifisitas adalah persentase dari 0 (aktual) yang diprediksi dengan benar.

melakukan pengujian menggunakan data itu sendiri kedalam model

ini sesuai dengan tujuan yang ketiga dari penelitian ini untuk melihat tingkat pengklafisikasian data

data_paper$pred <- predict(logit, data_paper, type="response")

data_paper$P1_pred <- ifelse(data_paper$pred > 0.80, "1", "0")
data_paper$P1_pred <- as.factor(data_paper$P1_pred)
(conf.mat<-caret::confusionMatrix(data_paper$P1_pred, data_paper$P1, positive="1"))
## Confusion Matrix and Statistics
## 
##           Reference
## Prediction  0  1
##          0 19 12
##          1  1  2
##                                           
##                Accuracy : 0.6176          
##                  95% CI : (0.4356, 0.7783)
##     No Information Rate : 0.5882          
##     P-Value [Acc > NIR] : 0.434982        
##                                           
##                   Kappa : 0.1053          
##                                           
##  Mcnemar's Test P-Value : 0.005546        
##                                           
##             Sensitivity : 0.14286         
##             Specificity : 0.95000         
##          Pos Pred Value : 0.66667         
##          Neg Pred Value : 0.61290         
##              Prevalence : 0.41176         
##          Detection Rate : 0.05882         
##    Detection Prevalence : 0.08824         
##       Balanced Accuracy : 0.54643         
##                                           
##        'Positive' Class : 1               
## 

Terlihat 21 data terklasifikasikan dengan baik dimana 19 untuk kedalaman rendah dan 2 untuk kedalaman tinggi. Sedangkan 13 data belum terklasifikasikan dengan baik dimana terdapat 12 terklasifikasikan tinggi namun namun prediksi dari model rendah, sedangkan 1 terklaisifkasikan rendah namun prediksi dari model tinggi

tingkat akurasi dari model adalah 61,76 persen

Berikut tabel untuk melihat kedalaman masing-masing provinsi dan hasil prediksi dari model:

data_p1 <- data.frame(data_paper$Provinsi, data_paper$P1, data_paper$P1_pred)
data_p1 %>%  kbl() %>%  kable_styling()  %>% scroll_box(height = "200px")
data_paper.Provinsi data_paper.P1 data_paper.P1_pred
ACEH 1 0
SUMATERA UTARA 0 0
SUMATERA BARAT 0 0
RIAU 0 0
JAMBI 0 0
SUMATERA SELATAN 1 0
BENGKULU 1 1
LAMPUNG 1 0
KEP. BANGKA BELITUNG 0 0
KEP. RIAU 0 0
DKI JAKARTA 0 0
JAWA BARAT 0 0
JAWA TENGAH 0 0
DI YOGYAKARTA 1 0
JAWA TIMUR 0 0
BANTEN 0 0
BALI 0 0
NUSA TENGGARA BARAT 1 0
NUSA TENGGARA TIMUR 1 0
KALIMANTAN BARAT 0 0
KALIMANTAN TENGAH 0 0
KALIMANTAN SELATAN 0 0
KALIMANTAN TIMUR 0 0
KALIMANTAN UTARA 0 0
SULAWESI UTARA 0 0
SULAWESI TENGAH 1 1
SULAWESI SELATAN 0 0
SULAWESI TENGGARA 1 0
GORONTALO 1 0
SULAWESI BARAT 1 0
MALUKU 1 0
MALUKU UTARA 0 1
PAPUA BARAT 1 0
PAPUA 1 0

Membagi Data

Dalam rangka melakukan pengujian model, dilakukan pengambilan sampel dari data. Pengambilan sampel ini dibagi menjadi 2 bagian data sehingga akan diperoleh dua bagian data,yaitu data train untuk membentuk model, dan data test untuk menguji model yang telah dibuat.

Pembagian tidak dilakukan diawal mengingat, pertama jumlah data yang cukup sedikit dan kedua tujuan dari penelitian untuk melihat tingkat klasifikasi sehingga diperlukan seluruh data masuk dalam model.

data_paper
## # A tibble: 34 x 7
##    Provinsi             P1       PE   RLS   TPT    pred P1_pred
##    <chr>                <fct> <dbl> <dbl> <dbl>   <dbl> <fct>  
##  1 ACEH                 1     -0.37  9.71  6.59 0.323   0      
##  2 SUMATERA UTARA       0     -1.07  9.83  6.91 0.238   0      
##  3 SUMATERA BARAT       0     -1.6   9.34  6.88 0.173   0      
##  4 RIAU                 0     -1.12  9.47  6.32 0.312   0      
##  5 JAMBI                0     -0.46  8.97  5.13 0.570   0      
##  6 SUMATERA SELATAN     1     -0.11  8.68  5.51 0.449   0      
##  7 BENGKULU             1     -0.02  9.2   4.07 0.836   1      
##  8 LAMPUNG              1     -1.67  8.51  4.67 0.544   0      
##  9 KEP. BANGKA BELITUNG 0     -2.3   8.49  5.25 0.358   0      
## 10 KEP. RIAU            0     -3.8  10.2  10.3  0.00594 0      
## # ... with 24 more rows
set.seed(5815)
sample <- sample(nrow(data_paper),floor(nrow(data_paper)*0.7))

train <- data_paper[sample,]
train
## # A tibble: 23 x 7
##    Provinsi          P1       PE   RLS   TPT    pred P1_pred
##    <chr>             <fct> <dbl> <dbl> <dbl>   <dbl> <fct>  
##  1 BANTEN            0     -3.38  9.22 10.6  0.00260 0      
##  2 KALIMANTAN BARAT  0     -1.82  7.9   5.81 0.196   0      
##  3 BALI              0     -9.31  9.31  5.63 0.102   0      
##  4 JAWA BARAT        0     -2.44  8.96 10.5  0.00335 0      
##  5 PAPUA BARAT       1     -0.77 10     6.8  0.295   0      
##  6 KALIMANTAN UTARA  0     -1.11  9.3   4.97 0.621   0      
##  7 KALIMANTAN TENGAH 0     -1.4   8.95  4.58 0.648   0      
##  8 MALUKU            1     -0.92 10.2   7.57 0.171   0      
##  9 GORONTALO         1     -0.02  8.26  4.28 0.695   0      
## 10 KALIMANTAN TIMUR  0     -2.85  9.99  6.87 0.189   0      
## # ... with 13 more rows
test <- data_paper[-sample,]
test
## # A tibble: 11 x 7
##    Provinsi             P1       PE   RLS   TPT  pred P1_pred
##    <chr>                <fct> <dbl> <dbl> <dbl> <dbl> <fct>  
##  1 RIAU                 0     -1.12  9.47  6.32 0.312 0      
##  2 JAMBI                0     -0.46  8.97  5.13 0.570 0      
##  3 LAMPUNG              1     -1.67  8.51  4.67 0.544 0      
##  4 KEP. BANGKA BELITUNG 0     -2.3   8.49  5.25 0.358 0      
##  5 JAWA TENGAH          0     -2.65  8.19  6.48 0.107 0      
##  6 JAWA TIMUR           0     -2.39  8.31  5.84 0.210 0      
##  7 NUSA TENGGARA TIMUR  1     -0.83  8.09  4.28 0.628 0      
##  8 KALIMANTAN SELATAN   0     -1.81  8.69  4.74 0.546 0      
##  9 SULAWESI UTARA       0     -0.99  9.74  7.37 0.158 0      
## 10 SULAWESI TENGAH      1      4.86  9.09  3.77 0.955 1      
## 11 SULAWESI BARAT       1     -2.42  8.33  3.32 0.782 0

Data telah dibagi menjadi dua yaitu train dan test untuk selanjutnya dilakukan evaluasi

Evaluasi Model

Dilakukan pemodelan ulang dari data train

logit_train <- glm(P1~PE+RLS+TPT, data=train, family = "binomial")
summary(logit_train)
## 
## Call:
## glm(formula = P1 ~ PE + RLS + TPT, family = "binomial", data = train)
## 
## Deviance Residuals: 
##     Min       1Q   Median       3Q      Max  
## -1.9555  -0.8455  -0.1924   0.8534   1.5847  
## 
## Coefficients:
##             Estimate Std. Error z value Pr(>|z|)  
## (Intercept)   0.3899     5.6587   0.069   0.9451  
## PE            0.2041     0.2401   0.850   0.3951  
## RLS           0.4521     0.7324   0.617   0.5371  
## TPT          -0.7574     0.4602  -1.646   0.0998 .
## ---
## Signif. codes:  0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
## 
## (Dispersion parameter for binomial family taken to be 1)
## 
##     Null deviance: 31.492  on 22  degrees of freedom
## Residual deviance: 23.812  on 19  degrees of freedom
## AIC: 31.812
## 
## Number of Fisher Scoring iterations: 5

Confusion Matrix Data Test

Sensitivitas (atau True Positive Rate) adalah persentase pengamatan (aktual) yang diprediksi dengan benar oleh model, sedangkan spesifisitas adalah persentase dari 0 (aktual) yang diprediksi dengan benar.

melakukan pengujian menggunakan data test kedalam model yang menggunakan data train

test$pred <- predict(logit_train, test, type="response")

test$P1_pred <- ifelse(test$pred > 0.80, "1", "0")
test$P1_pred <- as.factor(test$P1_pred)
(conf.mat<-caret::confusionMatrix(test$P1_pred, test$P1, positive="1"))
## Confusion Matrix and Statistics
## 
##           Reference
## Prediction 0 1
##          0 7 3
##          1 0 1
##                                           
##                Accuracy : 0.7273          
##                  95% CI : (0.3903, 0.9398)
##     No Information Rate : 0.6364          
##     P-Value [Acc > NIR] : 0.3883          
##                                           
##                   Kappa : 0.2979          
##                                           
##  Mcnemar's Test P-Value : 0.2482          
##                                           
##             Sensitivity : 0.25000         
##             Specificity : 1.00000         
##          Pos Pred Value : 1.00000         
##          Neg Pred Value : 0.70000         
##              Prevalence : 0.36364         
##          Detection Rate : 0.09091         
##    Detection Prevalence : 0.09091         
##       Balanced Accuracy : 0.62500         
##                                           
##        'Positive' Class : 1               
## 
broom::tidy(conf.mat)
## # A tibble: 14 x 6
##    term                 class estimate conf.low conf.high p.value
##    <chr>                <chr>    <dbl>    <dbl>     <dbl>   <dbl>
##  1 accuracy             <NA>    0.727     0.390     0.940   0.388
##  2 kappa                <NA>    0.298    NA        NA      NA    
##  3 mcnemar              <NA>   NA        NA        NA       0.248
##  4 sensitivity          1       0.25     NA        NA      NA    
##  5 specificity          1       1        NA        NA      NA    
##  6 pos_pred_value       1       1        NA        NA      NA    
##  7 neg_pred_value       1       0.7      NA        NA      NA    
##  8 precision            1       1        NA        NA      NA    
##  9 recall               1       0.25     NA        NA      NA    
## 10 f1                   1       0.4      NA        NA      NA    
## 11 prevalence           1       0.364    NA        NA      NA    
## 12 detection_rate       1       0.0909   NA        NA      NA    
## 13 detection_prevalence 1       0.0909   NA        NA      NA    
## 14 balanced_accuracy    1       0.625    NA        NA      NA

Receiver Operating Characteristics (ROC) Curve

Receiver Operating Characteristics (ROC) curve melacak persentase true positive saat cut-off peluang prediksi diturunkan dari 1 menjadi 0. Model yang baik akan memperlihat kurva yang lebih curam, artinya True Positive Rate meningkat lebih cepat dibandingkan dengan False Positive Rate ketika cut-off menurun. Dengan kata lain, semakin besar luas area di bawah kurva ROC maka kemampuan prediksi yang dihasilkan oleh model semakin baik.

plotROC(test$P1=="1", test$pred)

Kesimpulan dan Saran

Kesimpulan

Kedalaman kemiskinan Provinsi-Provinsi di Indonesia dipengaruhi secara nyata oleh tingkat pengangguran terbuka

Model dapat mengkasifikasikan sebesar 61,76 persen Provinsi-Provinsi di Indonesia

Saran

ROC Curve dari data test dan train menghasilkan nilai yang sangat baik yaitu 0,9464 namun hasil R-Square masih sangat rendah, sehingga perlu dilakukan penambahan variabel lain yang mempengaruhi kedalaman kemiskinan Provinsi-Provinsi di Indonesia

Daftar Pusataka

Agresti A. (2002). Categorical Data Analysis. New York : John Willey and Sons.

Anisa,R., Dito, G.A., dan Nurussadad,A.A.. (2021). Logistik Regresion. [11 Maret 2021]. https://rpubs.com/nurussadad/STA581-05-regresi-logistik

Hendayanti,N.P.N, Nurhidayati,M. (2020). Regresi Logistik Biner dalam Penentuan Ketepatan Klasifikasi Tingkat Kedalaman Kemiskinan Provinsi-Provinsi di Indonesia. http://ecampus.iainbatusangkar.ac.id/ojs/index.php/sainstek/article/view/2483

Nurussadad, A.A. (2021). Visualisasi Data dengan ggplot2. [29 Maret 2021]. https://rpubs.com/nurussadad/STA581-04-ggplot2

RStudio . tanpa tahun . Data Visualization with ggplot2 Cheat Sheet [30 Maret 2021]. https://rstudio.com/wp-content/uploads/2015/03/ggplot2-cheatsheet.pdf


  1. Satria June Adwendi, IPB University, ↩︎