| title: “Laporan Praktikum Komputasi Statistika : Analisis Regresi Logistik (Studi Kasus : Faktor-Faktor Yang Mempengaruhi Partisipasi Kerja Perempuan Menikah Indonesia)” |
| author: “Raden Roro Diandra Pradnya Paramitha” |
| date: “27 Mei 2023” |
| output: |
| prettydoc::html_pretty: |
| theme: leonids |
| highlight: github |
| toc: true |
| number_sections: true |
Regresi Logistik adalah metode analisis statistik yang menggambarkan hubungan antara variabel respon dari dua atau lebih kategori dan satu atau lebih variabel penjelas pada skala kategori atau interval. Regresi logistik biasanya digunakan untuk memprediksi kemungkinan atau peluang suatu peristiwa dengan menggunakan fungsi logit kurva logistik. Regresi logistik dibagi menjadi dua tipe, yaitu regresi logistik sederhana dan regresi logistik berganda. Regresi logistik sederhana adalah regresi logistik yang terdiri dari 1 variabel independen yang bersifat kuantitatif atau kualitatif dan 1 variabel dependen yang bersifat kualitatif. Regresi logistik berganda adalah regresi logistik yang terdiri dari lebih dari 1 variabel independen yang bersifat kuantitatif dan/atau kualitatif dan minimal 1 variabel dependen yang bersifat kualitatif.
Pada project laporan praktikum Komputasi Statistika ini, akan diambil materi regresi logistik, yang berjudul “Faktor-Faktor Yang Mempengaruhi Partisipasi Kerja Perempuan Menikah Indonesia” di mana variabel independennya adalah usia sebagai X1, pendidikan sebagai X2, lokasi tinggal sebagai X3, status bekerja pasangan sebagai X4, penghasilan pasangan sebagai X5, jumlah anak sebagai X6, keberadaan balita sebagai X7, dan pengeluaran rumah tangga sebagai X8, sedangkan yang menjadi variabel dependennya adalah partisipasi kerja perempuan menikah Indonesia.
Regresi Logistik menurut Hosmer dan Lemeshow adalah metode analisis
statistik yang menggambarkan hubungan antara variabel respon dari dua
atau lebih kategori dan satu atau lebih variabel penjelas pada skala
kategori atau interval. Agestri mengartikan regresi logistik sebagai
regresi non-linier yang digunakan untuk memperhitungkan hubungan
non-linier antara X dan Y, distribusi Y yang tidak biasa, dan keragaman
non-stasioner dari respons yang tidak dapat dijelaskan oleh model
regresi linier konvensional. Jadi, regresi logistik adalah regresi
non-linier yang menggambarkan hubungan antara variabel respon dari dua
atau lebih kategori dan satu atau lebih variabel penjelas pada skala
kategori atau interval. Model regresi logistik dibagi menjadi dua yaitu
regresi logistik sederhana dan regresi logistik berganda. Regresi
logistik sederhana adalah model regresi logistik untuk prediktor X
dengan variabel respons biner Y. Nilai variabel Y = 1 menunjukkan adanya
fitur dan Y = 0 menunjukkan tidak ada fitur. Sedangkan model regresi
logistik berganda adalah model statistik yang digunakan untuk menguji
efek dari variabel dependen kategoris tunggal dan satu atau lebih
variabel independen kontinyu atau dikotomis. Regresi logistik baik itu
sederhana maupun berganda digunakan untuk memprediksi kemungkinan atau
peluang suatu peristiwa dengan menggunakan fungsi logit kurva
logistik.
Rumus dari regresi logistik adalah sebagai berikut.
\[\frac{\ln(\pi_{i})}{(1-\pi_{i})} =\beta_{0}+\beta_{1}x\]
library(readxl)
Regresi_Logistik_Laprak_Komstat <- read_excel("Regresi Logistik Laprak Komstat.xlsx")
View(Regresi_Logistik_Laprak_Komstat)
Laprak <- Regresi_Logistik_Laprak_Komstat
Regresi_Logit_Laprak <- glm(formula = Laprak$Y ~ Laprak$X1 + Laprak$X2 + Laprak$X3 +
Laprak$X4 + Laprak$X5 + Laprak$X6 + Laprak$X7 + Laprak$X8,
family = binomial(link = "logit"), data = Laprak)
summary(Regresi_Logit_Laprak)
##
## Call:
## glm(formula = Laprak$Y ~ Laprak$X1 + Laprak$X2 + Laprak$X3 +
## Laprak$X4 + Laprak$X5 + Laprak$X6 + Laprak$X7 + Laprak$X8,
## family = binomial(link = "logit"), data = Laprak)
##
## Deviance Residuals:
## Min 1Q Median 3Q Max
## -2.1243 -0.9842 0.1223 0.9807 1.6705
##
## Coefficients:
## Estimate Std. Error z value Pr(>|z|)
## (Intercept) -1.143e+01 1.687e+03 -0.007 0.9946
## Laprak$X1 -1.388e-01 6.810e-02 -2.039 0.0415 *
## Laprak$X2 1.625e-01 1.208e-01 1.345 0.1788
## Laprak$X3 -5.771e-01 1.093e+00 -0.528 0.5974
## Laprak$X4 1.653e+01 1.687e+03 0.010 0.9922
## Laprak$X5 1.412e-07 3.385e-07 0.417 0.6765
## Laprak$X6 3.854e-01 3.939e-01 0.979 0.3278
## Laprak$X7 -3.352e+00 1.491e+00 -2.248 0.0245 *
## Laprak$X8 -1.019e-07 1.240e-07 -0.822 0.4111
## ---
## Signif. codes: 0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
##
## (Dispersion parameter for binomial family taken to be 1)
##
## Null deviance: 58.224 on 41 degrees of freedom
## Residual deviance: 45.858 on 33 degrees of freedom
## AIC: 63.858
##
## Number of Fisher Scoring iterations: 15
library(generalhoslem)
## Warning: package 'generalhoslem' was built under R version 4.2.3
## Loading required package: reshape
## Warning: package 'reshape' was built under R version 4.2.3
## Loading required package: MASS
logitgof(Laprak$Y, fitted(Regresi_Logit_Laprak))
## Warning in logitgof(Laprak$Y, fitted(Regresi_Logit_Laprak)): At least one cell
## in the expected frequencies table is < 1. Chi-square approximation may be
## incorrect.
##
## Hosmer and Lemeshow test (binary model)
##
## data: Laprak$Y, fitted(Regresi_Logit_Laprak)
## X-squared = 6.3819, df = 8, p-value = 0.6045
Pertama-tama, masukkan data ke dalam Microsoft Excel. Setelah data dimasukkan, maka langkah selanjutnya adalah mengimport ke dalam R Studio. Setelah mengimportnya, maka data tersebut diberi nama “Laprak”. Lalu, lakukan analisis regresi logistik dengan menggunakan fungsi glm(). Dan yang terakhir, untuk melihat hasilnya, gunakan fungsi summary(). Untuk menguji hasil kelayakan model, maka gunakan fungsi logitgof().
Berdasarkan hasil analisis regresi logistik yang diamati, diperoleh persamaan sebagai berikut. \[\frac{\ln(\pi_{i})}{(1-\pi_{i})} =-11.43+0.138x{1}+0.1625x{2}-0.5771x{3}+16.53x{4}+0.0000001412x{5}+0.3854x{6}-3.352x{7}-0.0000001019x{7}\]
Jika usia meningkat sebanyak 1 tahun, maka kecenderungan terjadinya partisipasi kerja perempuan menikah Indonesia akan meningkat exp(0.138) kali lipat. Artinya, semakin tua perempuan tersebut, maka potensi terjadinya partisipasi kerja perempuan menikah Indonesia akan meningkat. Jika tingkat pendidikan meningkat sebanyak 1 tingkat, maka kecenderungan terjadinya partisipasi kerja perempuan menikah Indonesia akan meningkat exp(0.1625) kali lipat. Artinya, semakin tinggi tingkat pendidikan perempuan tersebut, maka potensi terjadinya partisipasi kerja perempuan menikah Indonesia akan meningkat. Jika lokasi tinggal adalah di perkotaan, maka kecenderungan terjadinya partisipasi kerja perempuan menikah Indonesia akan menurun exp(0.577) kali lipat. Artinya, semakin banyak perepmuan yang tinggal di daerah perkotaan, maka potensi terjadinya partisipasi kerja perempuan menikah Indonesia akan menurun. Jika pasangan perempuan tersebut bekerja, maka kecenderungan terjadinya partisipasi kerja perempuan menikah Indonesia akan meningkat exp(16.53) kali lipat. Artinya, jika pasangan perempuan tersebut bekerja, maka partisipasi kerja perempuan menikah Indonesia ikut meningkat. Jika penghasilan pasangan meningkat sebanyak 1 rupiah, maka kecenderungan terjadinya partisipasi kerja perempuan menikah Indonesia akan meningkat exp(0.0000001412) kali lipat. Artinya, semakin banyak penghasilan pasangan, maka potensi terjadinya partisipasi kerja perempuan menikah Indonesia akan meningkat. Jika jumlah anak meningkat sebanyak 1 anak, maka kecenderungan terjadinya partisipasi kerja perempuan menikah Indonesia akan meningkat exp(0.3854) kali lipat. Artinya, semakin banyak anak yang dimiliki perempuan tersebut, maka potensi terjadinya partisipasi kerja perempuan menikah Indonesia akan meningkat. Jika keberadaan balita meningkat sebanyak 1, maka kecenderungan terjadinya partisipasi kerja perempuan menikah Indonesia akan menurun exp(3.352) kali lipat. Artinya, semakin tinggi keberadaan balita, maka potensi terjadinya partisipasi kerja perempuan menikah Indonesia akan menurun. Jika pengeluaran rumah tangga meningkat sebanyak 1 rupiah, maka kecenderungan terjadinya partisipasi kerja perempuan menikah Indonesia akan menurun exp(0.0000001019) kali lipat. Artinya, semakin tinggi tingkat pengeluaran rumah tangga, maka potensi terjadinya partisipasi kerja perempuan menikah Indonesia akan menurun. Diketahui hasil nilai X-squared saat uji kelayakan model adalah 6.3819, sedangkan nilai p-valuenya adalah 0.6045. Karena nilai p-valuenya lebih dari 5%, maka model ini layak untuk digunakan.
Berdasarkan hasil analisis regresi logistik yang telah dilakukan, dapat disimpulkan bahwa faktor yang berpengaruh secara signifikan terhadap partisipasi kerja perempuan menikah Indonesia adalah usia dan keberadaan balita dengan nilai p-value masing-masing adalah 0.0415 dan 0.0245.
Resimati, Hikmah N. 2018. Faktor-Faktor Yang Mempengaruhi Partisipasi Kerja Perempuan Menikah Indonesia. Skripsi S1. Yogyakarta : Program Studi Pendidikan Ekonomi Fakultas Ekonomi Universitas Negeri Yogyakarta.
Tampil, Y. A, Komalig, H, dan Langi, Y. 2017. “Analisis Regresi Logistik Untuk Menentukan Faktor-Faktor Yang Mempengaruhi Indeks Prestasi Kumulatif (IPK) Mahasiswa FMIPA Universitas Sam Ratulangi Manado”. JdC, hlm. 56-62.
Pratama, Reza N. 2018. Regresi Logistik Untuk Mempengaruhi Faktor-Faktor Yang Mempengaruhi Penerimaan Mahasiswa Melalui Jalur Masuk Perguruan Tinggi SNMPTN FMIPA Universitas Brawijaya. Skripsi S1. Malang : Program Studi Statistika Jurusan Statistika Fakultas Matematika dan Ilmu Pengetahuan Alam Universitas Brawijaya.
Matasina, E. 2020. “Penerapan Regresi Logistik Untuk Kasus Infeksi Saluran Pernapasan Akut (ISPA) Pada Balita”. Jurnal Diferensial, hlm. 56-66.