1 PENDAHULUAN
1.1 Latar Belakang
Setiap negara pasti akan memperhatikan pembangunan dibidang pendidikan, karena untuk mencetak dan meningkatkan SDM yang cerdas dan terampil di perlukan pendidikan yang baik. Oleh karena itu, sejak tahun 1994 pemerintah telah penerapkan program wajib belajar pendidikan dasar 9 tahun dengan harapan semakin baik tingkat pendidikan akan semakin baik pula tingkat kesejahteraan. Selanjutnya program wajib belajar ditambah menjadi 12 tahun, hal ini seiring dengan perkembangan teknologi yang menuntut pendidikan dan keterampilan yang semakin tinggi. Sejak tahun 2010 program wajib belajar mengalami perubahan menjadi hak belajar, karena setiap warga negara mempunyai hak yang sama untuk memperoleh pendidikan yang bermutu, sesuai dengan yang diamanatkan UU No. 20 Tahun 2003 tentang Sistem Pendidikan Nasional.
Pada Renstra Kemendikbud 2020–2024 disebutkan bahwa, secara garis besar arah kebijakan Kementerian Pendidikan dan Kebudayaan (Kemendikbud) salah satunya adalah optimalisasi angka partisipasi pendidikan. Kondisi yang ingin dicapai dalam peningkatan angka partisipasi pendidikan adalah: (1) Angka partisipasi pendidikan anak usia dini meningkat; (2) Wajib belajar sembilan tahun tuntas dan wajib belajar duabelas tahun meningkat; dan (3) Angka partisipasi pendidikan tinggi meningkat. Terkait dengan program wajib belajar dua belas tahun, pemerintah telah menyusun beberapa strategi yang tertuang dalam Restra tersebut, salah satu diantaranya adalah dengan memenuhi kebutuhan daya tampung untuk semua jenjang pendidikan melalui pembangunan sekolah dan rehabilitasi fasilitas yang rusak. Hal tersebut untuk menjamin akses pendidikan yang mudah dan murah.
Pengertian dari Angka Partisipasi Sekolah menurut BPS (www.bps.go.id) adalah rasio anak yang sekolah pada kelompok umur tertentu terhadap jumlah penduduk pada kelompok umur yang sama. Partisipasi sekolah berbanding terbalik dengan putus sekolah. Angka putus sekolah menggambarkan tingkat putus sekolah pada suatu jenjang pendidikan dan merupakan proporsi anak usia sekolah yang sudah tidak sekolah lagi atau tidak menamatkan suatu jenjang pendidikan tertentu. Fenomena putus sekolah ini dapat disebabkan oleh beberapa faktor, antara lain kurangnya kesadaran orang tua akan pentingnya pendidikan anak, keterbatasan ekonomi, keadaan geografis yang kurang menguntungkan, keterbatasan akses menuju ke sekolah, jarak sekolah yang jauh atau minimnya fasilitas pendidikan di suatu daerah (BPS, 2019). Terkait dengan keterbatasan akses dan fasilitas sekolah biasanya dapat tergambar dari daerah perkotaan atau daerah perdesaan.
Ada tiga kelompok usia sekolah yang menjadi perhatian dalam program wajib belajar dua belas tahun sesuai dengan jenjang pendidikan, yaitu kelompok usia 7-12, 13-15, dan 16-18 tahun. Perkembangan angka partisipasi sekolah (APS) di Indonesia untuk kelompok usia 7-12 dan 13-15 tahun cukup baik, namun untuk kelompok usia 16-18 tahun masih perlu ditingkatkan. Berdasarkan data BPS (www.bps.go.id), APS untuk kelompok usia 7-12 dan 13-15 tahun sudah mencapai lebih dari 95 persen, sedangkan untuk kelompok usia 16-18 tahun masih dibawah 75 persen. Selama periode 3 tahun terakhir, terjadi peningkatan APS 16-18 tahun yaitu 71,42 persen pada tahun 2017 meningkat menjadi 71,99 persen pada tahun 2018 kemudian meningkat lagi pada tahun 2019 menjadi 72,36 persen.
Berdasarkan penjelasan di atas, angka putus sekolah khususnya untuk kelompok 16-18 tahun masih relatif tinggi, permasalahan tersebut yang menjadi perhatian pada penelitian ini. Tujuan utama penelitian ini adalah untuk mengidentifikasi variabel yang mempengaruhi angka putus sekolah pada usia 7–18 tahun menggunakan analisis regresi logistik. Menurut Irwan Gani dan Siti Amalia (2015), regresi logistik adalah salah satu bentuk model regresi nonlinier yang menggunakan fungsi eksponensial dalam pendugaan parameternya. Variabel dependen menggunakan data kategorik dan variabel independen bisa benbentuk numerik dan/atau kategorik.
2 TINJAUAN PUSTAKA
2.1 Statistika Deskriptif
Statistika deskriptif adalah metode-metode yang berkaitan dengan pengumpulan, pengolahan, dan penyajian suatu daya sehingga menghasilkan informasi yang bermanfaat. Statistika deskriptif merupakan ilmu statistika yang hanya menolah, menyajikan data tanpa mengambil keputusan untuk populasi. Statistika deskriptif hanya melihat gambaran secara umum dari data yang didapatkan (Walpole, 1997). Statistika deskriptif ditunjukkan melalui ukuran penyebaran data, ukuran pemusatan data, grafik, diagram, histogram, dan lain-lain untuk memberikan informasi yang mudah dipahami.
2.2 Regresi Logistik
Menurut Irwan Gani dan Siti Amalia (2015), regresi logistik adalah salah satu bentuk model regresi nonlinier yang menggunakan fungsi eksponensial dalam pendugaan parameternya. Variabel dependen menggunakan data kategorik dan variabel independen bisa benbentuk numerik dan/atau kategorik. Model parameter dapat diduga dengan menggunkan metode maksimum likelihood, yaitu suatu prosedur pencarian satu atau lebih parameter yang secara statistik memberikan distribusi atau kemungkinan terbesar dari suatu paramater θ. Agresti (2007) menyatakan bahwa variabel dalam regresi logistik dapat berupa kategori atau kualitatif. Menurut Hosmer dan Lemeshow (2000), tujuan melakukan analisis data menggunakan regresi logistik adalah untuk mendapatkan model terbaik dan sederhana, namun model tersebut sejalan dengan tinjauan dari ilmu biologi untuk menjelaskan hubungan di antara hasil variabel respon dengan variabel prediktor.
Regresi logistik biner adalah suatu metode analisis data yang digunakan untuk mencari hubungan antara variabel respon (y) yang bersifat biner (dichotomus) dengan variabel prediktor (x) yang bersifat kategorik atau kontinu. Hasil respon variabel dichotomus memiliki dua kriteria, yaitu:
- y = 1 mewakili kemungkinan sukses dengan probabilitas π(x)
- y = 0 mewakili kemungkinan gagal dengan probabilitas 1−π(x)
dengan variabel respon (y) mengikuti distribusi Bernoulli untuk setiap observasi tunggal.
2.3 Data
Data yang digunakan adalah data sekunder. Data sekunder merupakan sumber data penelitian yang diperoleh peneliti secara tidak langsung melalui media perantara (diperoleh dan dicatat oleh pihak lain) (Indrianto dan Supomo, 2013).
Variabel-variabel yang menjadi objek penelitian adalah anak usia sekolah (7-18 tahun) sebagai variabel dependen dan enam variabel yang mempengaruhinya (variabel Independen). Definisi variabel operasional tersebut adalah sebagai berikut:
- Variabel tak bebas adalah anak usia sekolah (Y), dengan kategori :
- Putus sekolah = 1
- Tidak putus sekolah = 0
- Variabel bebas
- Pendidikan kepala rumah tangga (X1 = edu), dengan kategori
- tamat SMP ke bawah = 1
- tamat SMA ke atas = 0
- Kepemilikan Kartu Indonesia Pintar/Program Indonesia Pintar
(KIP/PIP) (X2 = smart), dengan kategori
- tidak memiliki KIP/PIP = 1
- memiliki KIP/PIP = 0
- Jumlah anggota rumah tangga (X3 = hs), dengan kategori
- orang atau lebih = 1
- 5 orang atau kurang = 0
- Aktivitas bekerja (X4 = work), dengan kategori
- tidak bekerja = 1
- bekerja = 0
- Kemiskinan (X5 = pov), dengan kategori
- miskin = 1
- tidak miskin = 0
- Daerah tempat tinggal (X6 = city), dengan kategori
- pedesaan = 1
- perkotaan = 0
- Pendidikan kepala rumah tangga (X1 = edu), dengan kategori
Menurut Nachrowi dan Usman (2002), bentuk model regresi logistik adalah: \[ f(X) = \frac{e^{\beta_0 + \beta_1X_1 + \beta_2X_2 + \ldots + \beta_pX_p}}{{1 + e^{\beta_0 + \beta_1X_1 + \beta_2X_2 + \ldots + \beta_pX_p}}} \]
3 Source Code
3.1 Library yang dibutuhkan
> #Library
> library(plotrix)
> library(readxl)
> library(car)
> library(pscl)
> library(generalhoslem)Library yang digunakan adalah plotrix sebagai package
untuk membentuk piechart, car untuk menghitung VIF
masing-masing prediktor, read_excel untuk membaca file
excel
3.2 Memanggil Data dan Membentuk Data Frame
> library(readxl)
> data <- read_excel("E:/ars03/Documents/DATA.xlsx")
>
> X1 <- as.factor(data$PendidikanBapak)
> X2 <- as.factor(data$KIP)
> X3 <- data$JumlahAnggotaKeluarga
> X4 <- as.factor(data$AktivitasBekerja)
> X5 <- as.factor(data$Kemiskinan)
> X6 <- as.factor(data$DaerahTempatTinggal)
> Y <- as.factor(data$UsiaSekolah)
> df <- data.frame(X1,X2,X3,X4,X5,X6,Y)
>
> str(df)
'data.frame': 500 obs. of 7 variables:
$ X1: Factor w/ 2 levels "0","1": 2 1 2 2 1 1 1 2 1 1 ...
$ X2: Factor w/ 2 levels "0","1": 2 1 1 1 1 1 1 1 2 1 ...
$ X3: num 14 18 10 15 12 11 15 17 16 11 ...
$ X4: Factor w/ 2 levels "0","1": 1 2 1 1 2 1 1 1 2 2 ...
$ X5: Factor w/ 2 levels "0","1": 1 1 1 1 2 2 2 1 1 1 ...
$ X6: Factor w/ 2 levels "0","1": 2 2 1 1 1 2 2 1 1 2 ...
$ Y : Factor w/ 2 levels "0","1": 2 1 1 1 1 1 1 2 2 2 ...Data dipanggil dengan perintah read.csv() dengan
ketentuan baris pertama sebagai identitas variabel yang ditandai dengan
header = TRUE dan setiap kolom dipisahkan dengan tanda koma (,).
Gambaran banyaknya observasi dan karakteristik variabel ditampilkan
dengan perintah str().
3.3 Pie Chart Proporsi Usia Sekolah Siswa
> UsiaSekolah <- table(df$Y)
> UsiaSekolah
0 1
242 258
>
> kat = c("Putus Sekolah = ","Tidak Putus Sekolah = ")
> persentase = round(UsiaSekolah/sum(UsiaSekolah)*100)
> kat = paste(kat,persentase)
> kat = paste(kat,'%',sep ='')
> pie3D(UsiaSekolah,labels=kat,col=c('light blue','blue'),
+ main="Persentase Usia Sekolah Siswa")3.4 Analisis Regresi Logistik
> model <- glm(Y~X1+X2+X3+X4+X5+X6, data = df, family = binomial)
> summary(model)
Call:
glm(formula = Y ~ X1 + X2 + X3 + X4 + X5 + X6, family = binomial,
data = df)
Deviance Residuals:
Min 1Q Median 3Q Max
-1.4132 -1.1672 0.9634 1.1211 1.3597
Coefficients:
Estimate Std. Error z value Pr(>|z|)
(Intercept) -0.230843 0.406619 -0.568 0.5702
X11 0.189606 0.180844 1.048 0.2944
X21 -0.202121 0.180593 -1.119 0.2631
X3 0.001894 0.026456 0.072 0.9429
X41 0.382232 0.180992 2.112 0.0347 *
X51 -0.001082 0.181219 -0.006 0.9952
X61 0.163896 0.181330 0.904 0.3661
---
Signif. codes: 0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
(Dispersion parameter for binomial family taken to be 1)
Null deviance: 692.64 on 499 degrees of freedom
Residual deviance: 684.97 on 493 degrees of freedom
AIC: 698.97
Number of Fisher Scoring iterations: 4Pembentukan model regresi logistik dilakukan dengan menggunakan
perintah glm() yang nantinya disimpan dengan nama
model, kemudidan untuk memunculkan ringkasan dari model
yang telah dibentuk, digunakan perintah summary().
4 Hasil dan Pembahasan
4.1 Statistika Deskriptif
Berdasarkan Data yang digunakan, diperoleh pie chart bagi hasil tes Usia Sekolah Siswa sebagai berikut.
> pie3D(UsiaSekolah,labels=kat,col=c('light blue','blue'),
+ main="Persentase Usia Sekolah Siswa")Dari pie chart di atas, dapat diketahui bahwa terdapat 48% orang siswa yang putus sekolah. Sisanya sebanyak 52% tidak putus sekolah.
4.2 Analisis Regresi Logistik
Model Analisis Regresi Loogistik menghasilkan output sebagai berikut
> model <- glm(Y~X1+X2+X3+X4+X5+X6, data = df, family = binomial)
> summary(model)
Call:
glm(formula = Y ~ X1 + X2 + X3 + X4 + X5 + X6, family = binomial,
data = df)
Deviance Residuals:
Min 1Q Median 3Q Max
-1.4132 -1.1672 0.9634 1.1211 1.3597
Coefficients:
Estimate Std. Error z value Pr(>|z|)
(Intercept) -0.230843 0.406619 -0.568 0.5702
X11 0.189606 0.180844 1.048 0.2944
X21 -0.202121 0.180593 -1.119 0.2631
X3 0.001894 0.026456 0.072 0.9429
X41 0.382232 0.180992 2.112 0.0347 *
X51 -0.001082 0.181219 -0.006 0.9952
X61 0.163896 0.181330 0.904 0.3661
---
Signif. codes: 0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
(Dispersion parameter for binomial family taken to be 1)
Null deviance: 692.64 on 499 degrees of freedom
Residual deviance: 684.97 on 493 degrees of freedom
AIC: 698.97
Number of Fisher Scoring iterations: 44.2.1 Asumsi Non Multikolinieritas
> reglog1 <- glm(X1~X2+X3+X4+X5+X6, family = binomial, data =df)
> summary(reglog1)
Call:
glm(formula = X1 ~ X2 + X3 + X4 + X5 + X6, family = binomial,
data = df)
Deviance Residuals:
Min 1Q Median 3Q Max
-1.326 -1.197 1.052 1.149 1.277
Coefficients:
Estimate Std. Error z value Pr(>|z|)
(Intercept) 0.51227 0.38913 1.316 0.188
X21 -0.06440 0.17955 -0.359 0.720
X3 -0.02437 0.02630 -0.927 0.354
X41 -0.01412 0.18004 -0.078 0.937
X51 -0.21022 0.17999 -1.168 0.243
X61 -0.01484 0.18033 -0.082 0.934
(Dispersion parameter for binomial family taken to be 1)
Null deviance: 692.64 on 499 degrees of freedom
Residual deviance: 690.38 on 494 degrees of freedom
AIC: 702.38
Number of Fisher Scoring iterations: 3
> pR2(reglog1)
fitting null model for pseudo-r2
llh llhNull G2 McFadden r2ML
-3.451901e+02 -3.463175e+02 2.254979e+00 3.255652e-03 4.499803e-03
r2CU
6.001787e-03
> R2_1 <- 1/(1-0.004499803)
> R2_1
[1] 1.00452
>
> reglog2 <- glm(X2~X1+X3+X4+X5+X6, family = binomial, data =df)
> summary(reglog2)
Call:
glm(formula = X2 ~ X1 + X3 + X4 + X5 + X6, family = binomial,
data = df)
Deviance Residuals:
Min 1Q Median 3Q Max
-1.228 -1.158 -1.090 1.194 1.271
Coefficients:
Estimate Std. Error z value Pr(>|z|)
(Intercept) -0.034986 0.393721 -0.089 0.929
X11 -0.064382 0.179550 -0.359 0.720
X3 -0.003212 0.026260 -0.122 0.903
X41 0.094603 0.179673 0.527 0.599
X51 -0.059373 0.179915 -0.330 0.741
X61 0.085178 0.179972 0.473 0.636
(Dispersion parameter for binomial family taken to be 1)
Null deviance: 692.86 on 499 degrees of freedom
Residual deviance: 692.09 on 494 degrees of freedom
AIC: 704.09
Number of Fisher Scoring iterations: 3
> pR2(reglog2)
fitting null model for pseudo-r2
llh llhNull G2 McFadden r2ML
-3.460469e+02 -3.464296e+02 7.652906e-01 1.104540e-03 1.529410e-03
r2CU
2.039606e-03
> R2_2 <- 1/(1-0.00152941)
> R2_2
[1] 1.001532
>
> reg3 <- lm(X3~X1+X2+X4+X5+X6, data=df)
> summary(reg3)
Call:
lm(formula = X3 ~ X1 + X2 + X4 + X5 + X6, data = df)
Residuals:
Min 1Q Median 3Q Max
-5.9799 -2.9800 -0.2431 3.0572 6.0611
Coefficients:
Estimate Std. Error t value Pr(>|t|)
(Intercept) 12.979915 0.370011 35.080 <2e-16 ***
X11 -0.283529 0.307413 -0.922 0.357
X21 -0.037315 0.307146 -0.121 0.903
X41 -0.379740 0.307472 -1.235 0.217
X51 -0.336509 0.307897 -1.093 0.275
X61 -0.003904 0.308472 -0.013 0.990
---
Signif. codes: 0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
Residual standard error: 3.43 on 494 degrees of freedom
Multiple R-squared: 0.006971, Adjusted R-squared: -0.00308
F-statistic: 0.6935 on 5 and 494 DF, p-value: 0.6285
> pR2(reglog3)
Error in pR2(reglog3): object 'reglog3' not found
> R2_3 <- 1/(1-0.009893448)
> R2_3
[1] 1.009992
>
> reglog4 <- glm(X4~X1+X2+X3+X5+X6, family = binomial, data =df)
> summary(reglog4)
Call:
glm(formula = X4 ~ X1 + X2 + X3 + X5 + X6, family = binomial,
data = df)
Deviance Residuals:
Min 1Q Median 3Q Max
-1.366 -1.204 1.036 1.141 1.290
Coefficients:
Estimate Std. Error z value Pr(>|z|)
(Intercept) 0.39306 0.39004 1.008 0.314
X11 -0.01410 0.18003 -0.078 0.938
X21 0.09462 0.17967 0.527 0.598
X3 -0.03262 0.02632 -1.240 0.215
X51 -0.05266 0.18037 -0.292 0.770
X61 0.17473 0.18039 0.969 0.333
(Dispersion parameter for binomial family taken to be 1)
Null deviance: 692.35 on 499 degrees of freedom
Residual deviance: 689.51 on 494 degrees of freedom
AIC: 701.51
Number of Fisher Scoring iterations: 3
> pR2(reglog4)
fitting null model for pseudo-r2
llh llhNull G2 McFadden r2ML
-3.447534e+02 -3.461735e+02 2.840228e+00 4.102319e-03 5.664354e-03
r2CU
7.556506e-03
> R2_4 <- 1/(1-0.005665354)
> R2_4
[1] 1.005698
>
> reglog5 <- glm(X5~X1+X2+X3+X4+X6, family = binomial, data =df)
> summary(reglog5)
Call:
glm(formula = X5 ~ X1 + X2 + X3 + X4 + X6, family = binomial,
data = df)
Deviance Residuals:
Min 1Q Median 3Q Max
-1.287 -1.125 -1.021 1.215 1.388
Coefficients:
Estimate Std. Error z value Pr(>|z|)
(Intercept) 0.36169 0.39106 0.925 0.355
X11 -0.21030 0.17999 -1.168 0.243
X21 -0.05942 0.17991 -0.330 0.741
X3 -0.02894 0.02636 -1.098 0.272
X41 -0.05263 0.18037 -0.292 0.770
X61 0.09408 0.18060 0.521 0.602
(Dispersion parameter for binomial family taken to be 1)
Null deviance: 691.35 on 499 degrees of freedom
Residual deviance: 688.46 on 494 degrees of freedom
AIC: 700.46
Number of Fisher Scoring iterations: 3
> pR2(reglog5)
fitting null model for pseudo-r2
llh llhNull G2 McFadden r2ML
-3.442298e+02 -3.456730e+02 2.886505e+00 4.175196e-03 5.756378e-03
r2CU
7.684415e-03
> R2_5 <- 1/(1-0.005756378)
> R2_5
[1] 1.00579
>
> reglog6 <- glm(X6~X1+X2+X3+X4+X5, family = binomial, data =df)
> summary(reglog6)
Call:
glm(formula = X6 ~ X1 + X2 + X3 + X4 + X5, family = binomial,
data = df)
Deviance Residuals:
Min 1Q Median 3Q Max
-1.182 -1.105 -1.034 1.249 1.335
Coefficients:
Estimate Std. Error z value Pr(>|z|)
(Intercept) -0.3418476 0.3985638 -0.858 0.391
X11 -0.0147505 0.1803373 -0.082 0.935
X21 0.0851712 0.1799722 0.473 0.636
X3 -0.0003341 0.0263686 -0.013 0.990
X41 0.1746972 0.1803869 0.968 0.333
X51 0.0941205 0.1806081 0.521 0.602
(Dispersion parameter for binomial family taken to be 1)
Null deviance: 689.27 on 499 degrees of freedom
Residual deviance: 687.81 on 494 degrees of freedom
AIC: 699.81
Number of Fisher Scoring iterations: 3
> pR2(reglog6)
fitting null model for pseudo-r2
llh llhNull G2 McFadden r2ML
-3.439051e+02 -3.446351e+02 1.459877e+00 2.118004e-03 2.915495e-03
r2CU
3.897440e-03
> R2_6 <- 1/(1-0.002915495)
> R2_6
[1] 1.002924
>
> tabel<-data.frame(R2_1,R2_2,R2_3,R2_4,R2_5,R2_6)
> tabel
R2_1 R2_2 R2_3 R2_4 R2_5 R2_6
1 1.00452 1.001532 1.009992 1.005698 1.00579 1.002924
>
> vif(model)
X1 X2 X3 X4 X5 X6
1.004552 1.002183 1.007229 1.005847 1.005906 1.002562 Menghitung nilai VIF disimpan dalam R2 untuk setiap
variabel dan disimpan seluruhnya dalam tabel. Untuk
mengetahui nilai VIF bagi masing-masing prediktor, juga dapat digunakan
perintah vif() dari package car seperti di
bawah.
Diperoleh nilai VIF seluruh variabel prediktor mendekati 1 atau lebih kecil dari 10. Oleh karena itu, diperoleh kesimpulan bahwa tidak terjadi multikolinieritas antar variabel prediktor yang satu dengan yang lainnya.
4.2.2 Uji Signifikansi Keseluruhan Model
> reglog<-glm(Y~X1+X2+X3+X4+X5+X6,family=binomial,data=df)
> pR2(reglog)
fitting null model for pseudo-r2
llh llhNull G2 McFadden r2ML
-342.48719251 -346.31754657 7.66070813 0.01106024 0.01520464
r2CU
0.02027978
> qchisq(0.95,5)
[1] 11.0705Melakukan regresi logistik pada variabel target (Y) dengan
menggunakan variabel prediktor (X1, X2, X3, X4, X5, X6). Model regresi
logistik tersebut disimpan dalam reglog. Menghitung pseudo
R-squared (pR2) dari model regresi logistik yang telah dibangun
reglog dan disimpan dalam pR2. Selanjutnya
menghitung chisquare menggunakan qchisq pada tingkat
signifikansi 0.05 dengan derajat kebebasan 5
Pada output di atas diperoleh nilai G2 sebesar 7,6607 dengan nilai chisquare tabel sebesar 11.0701. Berdasarkan hal tersebut mengartikan bahwa nilai G2 lebih kecil dibandingkan dengan nilai chisquare sehingga dapat diputuskan gagal tolak H0. Maka dapat disimpulkan bahwa model tidak signifikan atau variabel prediktor tidak berpengaruh terhadap putus sekolah atau tidaknya siswa.
4.2.3 Uji Parsial Parameter Model
> summary(reglog)
Call:
glm(formula = Y ~ X1 + X2 + X3 + X4 + X5 + X6, family = binomial,
data = df)
Deviance Residuals:
Min 1Q Median 3Q Max
-1.4132 -1.1672 0.9634 1.1211 1.3597
Coefficients:
Estimate Std. Error z value Pr(>|z|)
(Intercept) -0.230843 0.406619 -0.568 0.5702
X11 0.189606 0.180844 1.048 0.2944
X21 -0.202121 0.180593 -1.119 0.2631
X3 0.001894 0.026456 0.072 0.9429
X41 0.382232 0.180992 2.112 0.0347 *
X51 -0.001082 0.181219 -0.006 0.9952
X61 0.163896 0.181330 0.904 0.3661
---
Signif. codes: 0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
(Dispersion parameter for binomial family taken to be 1)
Null deviance: 692.64 on 499 degrees of freedom
Residual deviance: 684.97 on 493 degrees of freedom
AIC: 698.97
Number of Fisher Scoring iterations: 4Berdasarkan output di atas dapat dilihat p-value untuk variabel X4 (Aktivitas Bekerja) diperoleh 0.0347 \(<\alpha\) maka tolak H0 dan sisanya \(>\alpha\) maka gagal tolak H0
Dengan taraf nyata 5% secara parsial dapat disimpulkan bahwa variabel X4 (Aktivitas Bekerja) berpengaruh signifikan dan variabel sisanya tidak berpengaruh signifikan terhadap putus sekolah atau tidaknya siswa
4.2.4 Odds Ratio
> beta <- coef(reglog)
> OR <- exp(beta)
> SK <- exp(confint(reglog))
> data.frame(beta, OR, SK)
beta OR X2.5.. X97.5..
(Intercept) -0.230842619 0.7938644 0.3566389 1.760128
X11 0.189606090 1.2087734 0.8482392 1.724258
X21 -0.202120864 0.8169962 0.5729766 1.163567
X3 0.001894217 1.0018960 0.9512404 1.055312
X41 0.382231918 1.4655519 1.0286526 2.092192
X51 -0.001081880 0.9989187 0.7001622 1.425363
X61 0.163895898 1.1780917 0.8258881 1.682042Koefisien penduga disimpan dalam vektor beta dengan perintah
coef(). Setelah itu, menghitung Odds ratio bagi
masing-masing penduga parameter dengan menggunakan perhitungan
exp() dan menentukan selang kepercayaan bagi Odds ratio
menggunakan perintah confint().
Variabel X1 (Pendidikan Bapak) Dalam kategori Pendidikan Bapak, setiap peningkatan 1 unit (misalnya dari SD ke SMP, atau dari SMP ke SMA) akan mengurangi kemungkinan seorang siswa putus sekolah (Y=1) sebesar sekitar 20.6%. Dengan kata lain, siswa dengan tingkat pendidikan Bapak yang lebih tinggi memiliki peluang yang lebih rendah untuk putus sekolah dibandingkan dengan siswa dengan tingkat pendidikan Bapak yang lebih rendah.
Variabel X2 (KIP) Dalam kategori KIP, setiap peningkatan 1 unit akan meningkatkan kemungkinan seorang siswa putus sekolah (Y=1) sebesar sekitar 20.9%. Siswa yang menerima bantuan KIP memiliki peluang yang lebih tinggi untuk putus sekolah dibandingkan dengan siswa yang tidak menerima bantuan tersebut.
Variabel X3 (Jumlah Anggota Keluarga) Setiap peningkatan 1 anggota dalam jumlah anggota keluarga tidak memiliki dampak yang signifikan terhadap kemungkinan seorang siswa putus sekolah. Nilai OR yang mendekati 1 menunjukkan bahwa variabel ini tidak memiliki pengaruh yang kuat terhadap kemungkinan putus sekolah.
Variabel X4 (Aktivitas Bekerja) Dalam kategori Aktivitas Bekerja, setiap peningkatan 1 unit akan meningkatkan kemungkinan seorang siswa putus sekolah (Y=1) sebesar sekitar 46.6%. Siswa yang memiliki aktivitas bekerja memiliki peluang yang lebih tinggi untuk putus sekolah dibandingkan dengan siswa yang tidak bekerja.
Variabel X5 (Kemiskinan) Dalam kategori Kemiskinan, tidak ada pengaruh yang signifikan terhadap kemungkinan seorang siswa putus sekolah. Nilai OR yang mendekati 1 menunjukkan bahwa variabel ini tidak memiliki pengaruh yang kuat terhadap kemungkinan putus sekolah.
Variabel X6 (Daerah Tempat Tinggal) Dalam kategori Daerah Tempat Tinggal, setiap peningkatan 1 unit (misalnya dari daerah pedesaan ke daerah perkotaan) akan meningkatkan kemungkinan seorang siswa putus sekolah (Y=1) sebesar sekitar 17.8%. Siswa yang tinggal di daerah tertentu memiliki peluang yang lebih tinggi untuk putus sekolah dibandingkan dengan siswa yang tinggal di daerah lain.
4.2.5 Klasifikasi
> yp_hat<-fitted(reglog)
> df$yp_hat<-yp_hat
> head(df)
X1 X2 X3 X4 X5 X6 Y yp_hat
1 1 1 14 0 0 1 1 0.4867675
2 0 0 18 1 0 1 0 0.5864675
3 1 0 10 0 0 0 0 0.4944266
4 1 0 15 0 0 0 0 0.4967942
5 0 0 12 1 1 0 0 0.5431519
6 0 0 11 0 1 1 0 0.4882041
> class<-table(df$Y,df$yp_hat>0.5)
> class
FALSE TRUE
0 132 110
1 114 144Nilai prediksi disimpan dalam yp_hat dari
fitted(reglog), kemudian menambahkan kolom baru bernama
yp_hat ke dalam dataframe df yang berisi nilai
prediksi yp_hat dari model. Selanjutnya untuk membuat tabel
kontingensi antara variabel target (Y) dan prediksi biner
yp_hat > 0.5) dalam class.
Pada output diatas diperoleh class tabel sebagai klasifikasi dari model.
4.2.6 Uji Kelayakan Model
> logitgof(df$Y,fitted(reglog))
Hosmer and Lemeshow test (binary model)
data: df$Y, fitted(reglog)
X-squared = 13.346, df = 8, p-value = 0.1005Melakukan uji goodness-of-fit (kecocokan model) pada model regresi
logistik yang telah ditentukan reglog dengan menggunakan
variabel target (df$Y) dan nilai prediksi fitted(reglog)
dengan function logitgof.
Berdasarkan output di atas diperoleh nilai p-value (0,1005) lebih besar dari 0,05, maka H0 diterima. Sehingga dapat disimpulkan bahwa model yang terbentuk layak digunakan.
5 Kesimpulan
Berdasarkan pembahasan di atas, diperoleh kesimpulan bahwa enam variabel yang diteliti berpengaruh nyata terhadap anak putus sekolah dengan tingkat signifikansi = 0,05. Variabel tersebut adalah pendidikan bapak, kepemilikan Kartu/Program Indonesia Pintar, jumlah anggota rumah tangga, aktivitas bekerja, anak yang tinggal di rumah tangga miskin, dan daerah tempat tinggal yaitu daerah perkotaan dan perdesaan. Variabel yang paling dominan dengan nilai odds ratio sebesar 1,4655519 adalah aktivitas anak yang melakukan pekerjaan. Artinya anak yang bekerja mempunyai kecenderungan untuk putus sekolah sebesar 1,4655519 kali dibandingkan dengan anak yang tidak bekerja. Persamaan regresi logistik yang dihasilkan dalam penelitian ini, dapat digunakan untuk memprediksi probalitas anak putus sekolah dengan kondisi tertentu.
Dari hasil temuan tersebut, diharapkan pemerintah dapat memperhatikan aktivitas anak yang melakukan pekerjaan atau mencari uang di umur yang masih muda, menyalurkan dan menambah anggaran untuk masyarakat yang membutuhkan agar angka putus sekolah dapat ditekan. Masyarakat juga diharapkan dapat mendukung program hak belajar 12 tahun.
6 Daftar Pustaka
Hakim, Abdul. “Faktor Penyebab Anak Putus Sekolah.” Jurnal Pendidikan 21.2 (2020): 122-132.
Cahyani, N. K. A. S., Suciptawati, N. L. P., &Sukarsa, K. G. (2019). Identifikasi faktor yang memengaruhi anak putus sekolah di Kabupaten Badung. EJurnal Matematika, Vol. 8(4), 289. https://doi.org/10.24843/mtk.2019.v08.i04.p267.
Hasanah, Y. M., &Safruddin. (2017). Evaluasi program wajib belajar 12 tahun pemerintah daerah Kota Yogyakarta. Jurnal Akuntabilitas Manajemen Pendidikan, Vol. 5(2), 228–239.
Irwan Gani & Siti Amalia.(2015). Alat analisis data: Aplikasi statistik untuk penelitian bidang ekonomi dan sosial (Revisi). Andi.
Kamsihyati, Titik, Sutomo, S. F. (2016). Kajian faktor-faktor penyebab anak putus sekolah di Desa Jangrana Kecamatan Kesugihan Kabupaten Cilacap. Geo Edukasi, Vol. 5(1), 16–21.
Malik, H. K., & Sumarno, S.(2016). Kepedulian orang tua terhadap pendidikan anak untuk menyelesaikan program wajar 9 tahun. Jurnal Pendidikan Dan Pemberdayaan Masyarakat, Vol. 3(1), 38. https://doi.org/10.21831/jppm.v3i1.8061.
Mujiati, M., Nasir, N., & Ashari, A. (2018). Faktor-faktor penyebab siswa putus sekolah. Didaktis: Jurnal Pendidikan Dan Ilmu Pengetahuan, Vol. 18(3), 271–281. https://doi.org/10.30651/didaktis.v18i3.1870.