title: “Laporan Praktikum Komputasi Statistika : Analisis Regresi Logistik (Studi Kasus : Faktor-Faktor Yang Mempengaruhi Partisipasi Kerja Perempuan Menikah Indonesia)”

author: “Raden Roro Diandra Pradnya Paramitha”

date: “27 Mei 2023”

output:

prettydoc::html_pretty:

theme: leonids

highlight: github

toc: true

number_sections: true

PENDAHULUAN

Latar Belakang

Regresi Logistik adalah metode analisis statistik yang menggambarkan hubungan antara variabel respon dari dua atau lebih kategori dan satu atau lebih variabel penjelas pada skala kategori atau interval. Regresi logistik biasanya digunakan untuk memprediksi kemungkinan atau peluang suatu peristiwa dengan menggunakan fungsi logit kurva logistik. Regresi logistik dibagi menjadi dua tipe, yaitu regresi logistik sederhana dan regresi logistik berganda. Regresi logistik sederhana adalah regresi logistik yang terdiri dari 1 variabel independen yang bersifat kuantitatif atau kualitatif dan 1 variabel dependen yang bersifat kualitatif. Regresi logistik berganda adalah regresi logistik yang terdiri dari lebih dari 1 variabel independen yang bersifat kuantitatif dan/atau kualitatif dan minimal 1 variabel dependen yang bersifat kualitatif.

Pada project laporan praktikum Komputasi Statistika ini, akan diambil materi regresi logistik, yang berjudul “Faktor-Faktor Yang Mempengaruhi Partisipasi Kerja Perempuan Menikah Indonesia” di mana variabel independennya adalah usia sebagai X1, pendidikan sebagai X2, lokasi tinggal sebagai X3, status bekerja pasangan sebagai X4, penghasilan pasangan sebagai X5, jumlah anak sebagai X6, keberadaan balita sebagai X7, dan pengeluaran rumah tangga sebagai X8, sedangkan yang menjadi variabel dependennya adalah partisipasi kerja perempuan menikah Indonesia.

TINJAUAN PUSTAKA

Regresi Logistik

Regresi Logistik menurut Hosmer dan Lemeshow adalah metode analisis statistik yang menggambarkan hubungan antara variabel respon dari dua atau lebih kategori dan satu atau lebih variabel penjelas pada skala kategori atau interval. Agestri mengartikan regresi logistik sebagai regresi non-linier yang digunakan untuk memperhitungkan hubungan non-linier antara X dan Y, distribusi Y yang tidak biasa, dan keragaman non-stasioner dari respons yang tidak dapat dijelaskan oleh model regresi linier konvensional. Jadi, regresi logistik adalah regresi non-linier yang menggambarkan hubungan antara variabel respon dari dua atau lebih kategori dan satu atau lebih variabel penjelas pada skala kategori atau interval. Model regresi logistik dibagi menjadi dua yaitu regresi logistik sederhana dan regresi logistik berganda. Regresi logistik sederhana adalah model regresi logistik untuk prediktor X dengan variabel respons biner Y. Nilai variabel Y = 1 menunjukkan adanya fitur dan Y = 0 menunjukkan tidak ada fitur. Sedangkan model regresi logistik berganda adalah model statistik yang digunakan untuk menguji efek dari variabel dependen kategoris tunggal dan satu atau lebih variabel independen kontinyu atau dikotomis. Regresi logistik baik itu sederhana maupun berganda digunakan untuk memprediksi kemungkinan atau peluang suatu peristiwa dengan menggunakan fungsi logit kurva logistik.
Rumus dari regresi logistik adalah sebagai berikut.

\[\frac{\ln(\pi_{i})}{(1-\pi_{i})} =\beta_{0}+\beta_{1}x\]

SOURCE CODE

library(readxl)
Regresi_Logistik_Laprak_Komstat <- read_excel("Regresi Logistik Laprak Komstat.xlsx")
View(Regresi_Logistik_Laprak_Komstat)
Laprak <- Regresi_Logistik_Laprak_Komstat
Regresi_Logit_Laprak <- glm(formula = Laprak$Y ~ Laprak$X1 + Laprak$X2 + Laprak$X3 + 
    Laprak$X4 + Laprak$X5 + Laprak$X6 + Laprak$X7 + Laprak$X8, 
    family = binomial(link = "logit"), data = Laprak)
summary(Regresi_Logit_Laprak)

## 
## Call:
## glm(formula = Laprak$Y ~ Laprak$X1 + Laprak$X2 + Laprak$X3 + 
##     Laprak$X4 + Laprak$X5 + Laprak$X6 + Laprak$X7 + Laprak$X8, 
##     family = binomial(link = "logit"), data = Laprak)
## 
## Deviance Residuals: 
##     Min       1Q   Median       3Q      Max  
## -2.1243  -0.9842   0.1223   0.9807   1.6705  
## 
## Coefficients:
##               Estimate Std. Error z value Pr(>|z|)  
## (Intercept) -1.143e+01  1.687e+03  -0.007   0.9946  
## Laprak$X1   -1.388e-01  6.810e-02  -2.039   0.0415 *
## Laprak$X2    1.625e-01  1.208e-01   1.345   0.1788  
## Laprak$X3   -5.771e-01  1.093e+00  -0.528   0.5974  
## Laprak$X4    1.653e+01  1.687e+03   0.010   0.9922  
## Laprak$X5    1.412e-07  3.385e-07   0.417   0.6765  
## Laprak$X6    3.854e-01  3.939e-01   0.979   0.3278  
## Laprak$X7   -3.352e+00  1.491e+00  -2.248   0.0245 *
## Laprak$X8   -1.019e-07  1.240e-07  -0.822   0.4111  
## ---
## Signif. codes:  0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
## 
## (Dispersion parameter for binomial family taken to be 1)
## 
##     Null deviance: 58.224  on 41  degrees of freedom
## Residual deviance: 45.858  on 33  degrees of freedom
## AIC: 63.858
## 
## Number of Fisher Scoring iterations: 15

library(generalhoslem)

## Warning: package 'generalhoslem' was built under R version 4.2.3

## Loading required package: reshape

## Warning: package 'reshape' was built under R version 4.2.3

## Loading required package: MASS

logitgof(Laprak$Y, fitted(Regresi_Logit_Laprak))

## Warning in logitgof(Laprak$Y, fitted(Regresi_Logit_Laprak)): At least one cell
## in the expected frequencies table is < 1. Chi-square approximation may be
## incorrect.

## 
##  Hosmer and Lemeshow test (binary model)
## 
## data:  Laprak$Y, fitted(Regresi_Logit_Laprak)
## X-squared = 6.3819, df = 8, p-value = 0.6045

Pertama-tama, masukkan data ke dalam Microsoft Excel. Setelah data dimasukkan, maka langkah selanjutnya adalah mengimport ke dalam R Studio. Setelah mengimportnya, maka data tersebut diberi nama “Laprak”. Lalu, lakukan analisis regresi logistik dengan menggunakan fungsi glm(). Dan yang terakhir, untuk melihat hasilnya, gunakan fungsi summary(). Untuk menguji hasil kelayakan model, maka gunakan fungsi logitgof().

HASIL DAN PEMBAHASAN

Berdasarkan hasil analisis regresi logistik yang diamati, diperoleh persamaan sebagai berikut. \[\frac{\ln(\pi_{i})}{(1-\pi_{i})} =-11.43+0.138x{1}+0.1625x{2}-0.5771x{3}+16.53x{4}+0.0000001412x{5}+0.3854x{6}-3.352x{7}-0.0000001019x{7}\]

Jika usia meningkat sebanyak 1 tahun, maka kecenderungan terjadinya partisipasi kerja perempuan menikah Indonesia akan meningkat exp(0.138) kali lipat. Artinya, semakin tua perempuan tersebut, maka potensi terjadinya partisipasi kerja perempuan menikah Indonesia akan meningkat. Jika tingkat pendidikan meningkat sebanyak 1 tingkat, maka kecenderungan terjadinya partisipasi kerja perempuan menikah Indonesia akan meningkat exp(0.1625) kali lipat. Artinya, semakin tinggi tingkat pendidikan perempuan tersebut, maka potensi terjadinya partisipasi kerja perempuan menikah Indonesia akan meningkat. Jika lokasi tinggal adalah di perkotaan, maka kecenderungan terjadinya partisipasi kerja perempuan menikah Indonesia akan menurun exp(0.577) kali lipat. Artinya, semakin banyak perepmuan yang tinggal di daerah perkotaan, maka potensi terjadinya partisipasi kerja perempuan menikah Indonesia akan menurun. Jika pasangan perempuan tersebut bekerja, maka kecenderungan terjadinya partisipasi kerja perempuan menikah Indonesia akan meningkat exp(16.53) kali lipat. Artinya, jika pasangan perempuan tersebut bekerja, maka partisipasi kerja perempuan menikah Indonesia ikut meningkat. Jika penghasilan pasangan meningkat sebanyak 1 rupiah, maka kecenderungan terjadinya partisipasi kerja perempuan menikah Indonesia akan meningkat exp(0.0000001412) kali lipat. Artinya, semakin banyak penghasilan pasangan, maka potensi terjadinya partisipasi kerja perempuan menikah Indonesia akan meningkat. Jika jumlah anak meningkat sebanyak 1 anak, maka kecenderungan terjadinya partisipasi kerja perempuan menikah Indonesia akan meningkat exp(0.3854) kali lipat. Artinya, semakin banyak anak yang dimiliki perempuan tersebut, maka potensi terjadinya partisipasi kerja perempuan menikah Indonesia akan meningkat. Jika keberadaan balita meningkat sebanyak 1, maka kecenderungan terjadinya partisipasi kerja perempuan menikah Indonesia akan menurun exp(3.352) kali lipat. Artinya, semakin tinggi keberadaan balita, maka potensi terjadinya partisipasi kerja perempuan menikah Indonesia akan menurun. Jika pengeluaran rumah tangga meningkat sebanyak 1 rupiah, maka kecenderungan terjadinya partisipasi kerja perempuan menikah Indonesia akan menurun exp(0.0000001019) kali lipat. Artinya, semakin tinggi tingkat pengeluaran rumah tangga, maka potensi terjadinya partisipasi kerja perempuan menikah Indonesia akan menurun. Diketahui hasil nilai X-squared saat uji kelayakan model adalah 6.3819, sedangkan nilai p-valuenya adalah 0.6045. Karena nilai p-valuenya lebih dari 5%, maka model ini layak untuk digunakan.

KESIMPULAN

Berdasarkan hasil analisis regresi logistik yang telah dilakukan, dapat disimpulkan bahwa faktor yang berpengaruh secara signifikan terhadap partisipasi kerja perempuan menikah Indonesia adalah usia dan keberadaan balita dengan nilai p-value masing-masing adalah 0.0415 dan 0.0245.

DAFTAR PUSTAKA

Resimati, Hikmah N. 2018. Faktor-Faktor Yang Mempengaruhi Partisipasi Kerja Perempuan Menikah Indonesia. Skripsi S1. Yogyakarta : Program Studi Pendidikan Ekonomi Fakultas Ekonomi Universitas Negeri Yogyakarta.

Tampil, Y. A, Komalig, H, dan Langi, Y. 2017. “Analisis Regresi Logistik Untuk Menentukan Faktor-Faktor Yang Mempengaruhi Indeks Prestasi Kumulatif (IPK) Mahasiswa FMIPA Universitas Sam Ratulangi Manado”. JdC, hlm. 56-62.

Pratama, Reza N. 2018. Regresi Logistik Untuk Mempengaruhi Faktor-Faktor Yang Mempengaruhi Penerimaan Mahasiswa Melalui Jalur Masuk Perguruan Tinggi SNMPTN FMIPA Universitas Brawijaya. Skripsi S1. Malang : Program Studi Statistika Jurusan Statistika Fakultas Matematika dan Ilmu Pengetahuan Alam Universitas Brawijaya.

Matasina, E. 2020. “Penerapan Regresi Logistik Untuk Kasus Infeksi Saluran Pernapasan Akut (ISPA) Pada Balita”. Jurnal Diferensial, hlm. 56-66.