Library:
> # install.packages("knitr")
> # install.packages("rmarkdown")
> # install.packages("prettydoc")
> # install.packages("equatiomatic")1 PENDAHULUAN
1.1 Latar Belakang
Sebagai perusahaan yang terus berkembang, PT Makmur Jaya memiliki reputasi yang kuat dan menawarkan berbagai peluang kerja yang menarik bagi para pencari kerja. Namun, dengan tingkat persaingan yang tinggi dalam dunia kerja saat ini, proses seleksi karyawan menjadi semakin penting untuk memastikan bahwa perusahaan mempekerjakan individu yang paling berkualifikasi dan sesuai dengan kebutuhan perusahaan
Lama pendidikan terakhir seseorang adalah salah satu indikator yang sering dipertimbangkan oleh perusahaan dalam proses seleksi karyawan. Pendidikan yang lebih tinggi sering dianggap sebagai aset berharga yang dapat mencerminkan pemahaman yang lebih mendalam tentang bidang pekerjaan dan kemampuan yang diperoleh dari proses pendidikan tersebut. Oleh karena itu, diperkirakan bahwa lama pendidikan terakhir dapat berpengaruh positif terhadap peluang diterima dalam melamar kerja.
Selain lama pendidikan terakhir, lama pengalaman kerja juga menjadi faktor yang penting dalam proses seleksi karyawan. Pengalaman kerja dapat memberikan wawasan praktis, keterampilan yang dikembangkan, dan pemahaman tentang lingkungan kerja yang relevan dengan posisi yang dilamar. Sehingga, diperkirakan bahwa lama pengalaman kerja yang lebih panjang dapat meningkatkan peluang seseorang diterima dalam melamar kerja.
Selanjutnya, jenis kelamin juga menjadi faktor yang mungkin mempengaruhi keputusan penerimaan dalam proses seleksi karyawan. Meskipun seharusnya tidak ada diskriminasi berdasarkan jenis kelamin, namun faktor-faktor sosial dan budaya tertentu masih bisa mempengaruhi pandangan perusahaan terhadap jenis kelamin pelamar. Oleh karena itu, penting untuk menyelidiki apakah jenis kelamin pelamar dapat memengaruhi peluang diterima dalam melamar kerja.
Hasil penelitian ini diharapkan dapat memberikan pedoman yang lebih baik bagi calon pelamar untuk mempersiapkan diri mereka secara efektif dan bagi perusahaan untuk mengoptimalkan proses seleksi karyawan mereka.
1.2 Rumusan Masalah
Apakah terdapat hubungan antara diterimanya seseorang untuk bekerja di PT. Makmur Jaya terhadap lama pendidikan terakhir, lama pengalaman kerja dan jenis kelamin?
1.3 Tujuan Penelitian
Untuk mengetahui hubungan antara diterimanya seseorang bekerja di PT. Makmur Jaya terhadap lama pendidikan terakhir, lama pengalaman kerja dan jenis kelamin
1.4 Data Penelitian
Keterangan:
Y = Diterima atau tidaknya seseorang bekerja (1 jika diterima bekerja dan 0 jika tidak diterima)
X1 = lama pendidikan terakhir (tahun)
X2 = lama pengalaman kerja (tahun)
X3 = jenis kelamin (1 jika pelamarnya laki-laki dan 0 jika pelamarnya perempuan)
2 TINJAUAN PUSTAKA
2.1 Asumsi Multikolinearitas
Asumsi multikolinearitas tidak boleh dilanggar karena dapat memberikan efek yang fatal yaitu model menjadi non identified yang berarti parameter dalam model tidak dapat diestimasi dan keluaran dalam bentuk jalur tidak dapat ditampilkan, atau jika parameter berhasil diestimasi dan keluaran diagram jalur berhasil ditampilkan tetapi hasilnya akan bias. Metode untuk menguji adanya multikoliniearitas dapat dilihat dari nilai tolerance value atau variance inflation factor (VIF) dengan rumus:
atau
Batas tolerance value adalah 0.10 atau nilai VIF adalah 10. Jika VIF lebih dari 10 dan nilai tolerance kurang dari 0.1, maka terjadi multikoliniearitas yang tinggi antar variabel bebas dengan variabel bebas lainnya. Namun apabila VIF kurang dari 10 dan nilai tolerance lebih dari 0.10, maka dapat diartikan tidak terdapat multikolinieritas. Regresi yang baik memiliki VIF sekitar angka 1 dan mempunyai nilai tolerance mendekati 1.
2.2 Analisis Regresi Logistik Biner
Model regresi logistik biner digunakan untuk menganalisis hubungan antara satu variabel respon dan beberapa variabel prediktor, dengan variabel responnya berupa data kualitatif dikotomi yaitu bernilai 1 untuk menyatakan keberadaan sebuah karakteristik dan bernilai 0 untuk menyatakan ketidakberadaan sebuah karakteristik.
Model regresi logistik biner digunakan jika variabel responnya menghasilkan dua kategori bernilai 0 dan 1, sehingga mengikuti distribusi Bernoulli sebagai berikut:
dimana : 𝜋𝑖 = peluang kejadian ke-i
𝑦𝑖 = peubah acak ke-i yang terdiri dari 0 dan 1
Bentuk model regresi logistik dengan satu variabel prediktor adalah :
Untuk mempermudah menaksir parameter regresi, maka 𝜋(x) pada persamaan diatas ditransformasikan sehingga menghasilkan bentuk logit regresi logistik, sebagai berikut :
2.3 Pendugaan Parameter
Penyelesaian untuk mengestimasi parameter yang belum diketahui dapat menggunakan metode Maximum Likelihood Estimation (MLE). Pada dasarnya metode maximum likelihood memberikan nilai estimasi 𝛽 untuk memaksimumkan fungsi likelihood. Secara sistematis, fungsi likelihood untuk model regresi logistik biner adalah sebagai berikut:
dimana : 𝑦𝑖 = pengamatan pada variabel ke-i
𝜋(𝑥𝑖) = peluang untuk variabel prediktor ke-i
Untuk memudahkan perhitungan maka dilakukan pendekatan log
likelihood, didefinisikan sebagai:
Untuk mendapatkan nilai penafsiran koefisien regresi logistik (𝛽̂) dilakukan dengan membuat turunan pertama 𝐿(𝛽) terhadap 𝛽 dan disamakan dengan 0.
2.4 Uji Hipotesis Simultan
Uji model dilakukan untuk memeriksa peranan variabel prediktor terhadap variabel respon secara serentak atau secara keseluruhan. Uji serentak ini disebut juga uji model chi square. Hipotesis untuk uji ini adalah sebagai berikut :
𝐻0:𝛽1 = 𝛽2 = ⋯ = 𝛽𝑖 = 0
𝐻1: paling sedikit ada satu parameter 𝛽𝑖 ≠ 0 Statistik uji G atau
Likelihood Ratio Test :
dimana : 𝑛1 = banyaknya observasi yang berkategori 1
𝑛0 = banyaknya observasi yang berkategori 0
Statistik uji G mengikuti distribusi chi-square, sehingga untuk memperoleh keputusan dilakukan perbandingan dengan nilai 𝜒2 tabel, dengan derajat bebas (db) = k-1, k merupakan banyaknya variabel prediktor. Kriteria penolakan (tolak 𝐻0) jika nilai 𝐺 > 𝜒2(𝑑𝑏,𝛼) atau jika P-value < α.
2.5 Uji Hipotesis Parsial
Pengujian parsial digunakan untuk menguji pengaruh setiap 𝛽𝑖 secara individual dalam model yang diperoleh. Hasil pengujian secara parsial/individual akan menunjukkan apakah suatu variabel prediktor layak untuk masuk dalam model atau tidak. Hipotesis yang digunakan untuk setiap variabel adalah sebagai berikut :
𝐻0:𝛽𝑖 = 0
𝐻1:𝛽𝑖 ≠ 0
Statistik uji Wald (W) :
dan
dimana : 𝑆𝐸(𝛽̂𝑖) = dugaan galat baku untuk koefisien 𝛽𝑖
𝛽̂𝑖 = nilai dugaan untuk parameter (𝛽𝑖)
Rasio yang dihasilkan dari statistik uji dibawah hipotesis 𝐻0 akan mengikuti sebaran normal baku, sehingga untuk memperoleh keputusan dilakukan perbandingan dengan distribusi normal baku (Z). Kriteria penolakan (tolak 𝐻0) jika nilai 𝑊 > 𝑍𝛼⁄2 atau 𝑝-𝑣𝑎𝑙𝑢𝑒 < 𝛼.
2.6 Odds Ratio
Secara umum, rasio peluang (odds ratio) merupakan sekumpulan peluang yang dibagi oleh peluang lainnya. Nilai odds ratio didefinisikan sebagai berikut:
Bila nilai ψ = 1, maka antara kedua variabel tersebut tidak terdapat hubungan. Bila nilai ψ < 1, maka antara kedua variabel terdapat hubungan negatif terhadap perubahan kategori dari nilai x dan demikian sebaliknya bila 𝜓 >1.
2.7 Uji Kecocokan Model
Uji Hosmer-Lemeshow pada regresi logistik adalah sebuah metode yang digunakan untuk menguji kecocokan (goodness-of-fit) antara model regresi logistik yang telah dibangun dengan data yang diamati. Tujuan dari uji ini adalah untuk mengevaluasi seberapa baik model regresi logistik dapat memprediksi hasil observasi dengan membandingkan antara nilai yang diprediksi oleh model dengan nilai yang diamati.
\(H_0\) : Model yang digunakan sesuai dengan data
\(H_1\) : Model yang digunakan tidak sesuai dengan data
Dimana:
Jika nilai p-value yang dihasilkan dari uji Hosmer-Lemeshow cukup tinggi (biasanya di atas ambang signifikansi yang ditetapkan), maka kita dapat menerima hipotesis nol bahwa model secara umum cocok dengan data.
2.8 Uji Ketepatan Klasifikasi
Uji ketepatan klasifikasi pada regresi logistik digunakan untuk mengevaluasi seberapa baik model regresi logistik dapat mengklasifikasikan data ke dalam kategori yang benar berdasarkan prediksi yang dihasilkan oleh model. Uji ini memberikan informasi tentang seberapa akurat model dalam memprediksi hasil yang diamati.
3 SOURCE CODE, HASIL DAN PEMBAHASAN
> # Library
> library(readxl)
> library(pscl)
> library(ResourceSelection)> #menginput data
> data<-read_excel("D:/Kuliah/semester 4/KOMPUTASI STATISTIKA/Data Rpubs Praktikum.xlsx")
> head(data)
# A tibble: 6 × 5
Pelamar Education Experience Sex Hired
<dbl> <dbl> <dbl> <dbl> <dbl>
1 1 6 6 1 1
2 2 6 3 1 1
3 3 8 3 0 1
4 4 8 10 0 1
5 5 4 5 1 1
6 6 6 1 1 1
> str(data)
tibble [40 × 5] (S3: tbl_df/tbl/data.frame)
$ Pelamar : num [1:40] 1 2 3 4 5 6 7 8 9 10 ...
$ Education : num [1:40] 6 6 8 8 4 6 8 4 6 6 ...
$ Experience: num [1:40] 6 3 3 10 5 1 5 10 12 2 ...
$ Sex : num [1:40] 1 1 0 0 1 1 1 1 0 0 ...
$ Hired : num [1:40] 1 1 1 1 1 1 1 1 1 1 ...
>
> Y<-data$Hired
> X1<-data$Education
> X2<-data$Experience
> X3<-data$Sex
>
> #data frame
> data_logistik<-data.frame(Y,X1,X2,X3)
> data_logistik
Y X1 X2 X3
1 1 6 6 1
2 1 6 3 1
3 1 8 3 0
4 1 8 10 0
5 1 4 5 1
6 1 6 1 1
7 1 8 5 1
8 1 4 10 1
9 1 6 12 0
10 1 6 2 0
11 0 4 0 1
12 0 4 1 0
13 0 4 2 1
14 0 4 4 0
15 0 6 1 0
16 0 4 2 1
17 0 8 5 1
18 0 4 2 0
19 0 6 7 0
20 0 6 4 0
21 0 8 0 1
22 0 4 0 0
23 0 4 1 1
24 0 4 5 1
25 0 6 0 1
26 0 4 9 0
27 0 8 1 0
28 0 6 1 1
29 1 6 6 1
30 1 6 3 1
31 1 8 3 0
32 1 8 10 0
33 1 4 5 1
34 1 6 1 1
35 1 8 5 1
36 1 4 10 1
37 1 6 12 0
38 1 6 2 0
39 0 4 0 1
40 0 4 10 13.1 Asumsi Multikolinearitas
> reglog_x1<-lm(X1~X2+X3, data=data_logistik)
> vif_x1<-1/(1-summary(reglog_x1)$r.squared)
> reglog_x2<-lm(X2~X1+X3, data=data_logistik)
> vif_x2<-1/(1-summary(reglog_x2)$r.squared)
> reglog_x3<-lm(X3~X1+X2, data=data_logistik)
> vif_x3<-1/(1-summary(reglog_x3)$r.squared)
> nilai_VIF<-data.frame(vif_x1,vif_x2,vif_x3)
> nilai_VIF
vif_x1 vif_x2 vif_x3
1 1.040014 1.025556 1.063484VIF atau Variance Inflation Factors dilakukan pada setiap variabel prediktor. Pada perhitungan VIF diatas, nilai VIF pada masing masing variabel prediktor menghasilkan nilai kurang dari 10. Itu berarti bahwa tidak terjadi multikolinieritas antar variabel prediktor atau tidak saling berkorelasi. Sehingga data-data ini dapat digunakan dan analisis bisa dilanjutkan.
3.2 Analisis Regresi Logistik Biner
> #membuat model reglog
> model_reglog<-glm(Y~X1+X2+X3, family="binomial", data=data_logistik)
> summary(model_reglog)
Call:
glm(formula = Y ~ X1 + X2 + X3, family = "binomial", data = data_logistik)
Coefficients:
Estimate Std. Error z value Pr(>|z|)
(Intercept) -5.6999 2.1282 -2.678 0.0074 **
X1 0.6727 0.2909 2.312 0.0208 *
X2 0.3115 0.1223 2.547 0.0109 *
X3 1.0378 0.8469 1.225 0.2204
---
Signif. codes: 0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
(Dispersion parameter for binomial family taken to be 1)
Null deviance: 55.452 on 39 degrees of freedom
Residual deviance: 40.975 on 36 degrees of freedom
AIC: 48.975
Number of Fisher Scoring iterations: 4Dengan menggunakan function glm(), diperoleh model regresi logistik sebagi berikut: \[g(x)= -5.6999 + 0.6727 X1 + 0.3115 X2 + 1.0378 X3\]
Interpretasi masing-masing parameter yaitu:
-5.6999 ( \(\beta_0\) ), berarti ketika seluruh variabel prediktor bernilai 0 (konstan) maka terjadinya kejadian diterima bekerja di PT. Makmur Jaya sebesar -5.6999 atau tidak akan terjadi.
0,6727 ( \(\beta_1\) ), berarti ketika lama pendidikan terakhir bertambah 1 tahun dan variabel lain bernilai konstan maka terjadinya kejadian diterima bekerja di PT. Makmur Jaya naik sebesar 0,6727
0,3115 ( \(\beta_2\) ), berarti ketika lama pengalaman kerja bertambah 1 tahun dan variabel lain bernilai konstan maka terjadinya kejadian diterima bekerja di PT. Makmur Jaya naik sebesar 0,3115
1,0378 ( \(\beta_3\) ), berarti yang melamar pekerjaan adalah laki-laki maka terjadinya kejadian diterima bekerja di PT. Makmur Jaya naik sebesar 1,0378
> #pseudo r-square
> Rsq<-1-(40.975/55.452)
> Rsq
[1] 0.2610726Didapatkan nilai R-square sebesar 0.2610726, dari nilai ini dapat diketahui bahwa variabel lama pendidikan terakhir (\(X1\)), lama pengalaman kerja (\(X2\)) dan jenis kelamin (\(X3\)) dapat menjelaskan potensi diterimanya seseorang untuk bekerja di PT. Makmur Jaya sebesar 26,10726%. Sedangkan 73.89274% dijelaskan oleh variabel lain yang tidak dijelaskan pada model diatas.
3.3 Uji Hipotesis Simultan
> uji_simultan<-pR2(model_reglog)
fitting null model for pseudo-r2
> uji_simultan
llh llhNull G2 McFadden r2ML r2CU
-20.4874054 -27.7258872 14.4769637 0.2610730 0.3036648 0.4048864
>
> qchisq(0.95, 2)
[1] 5.991465\(H_0\): variabel prediktor tidak berpengaruh terhadap variabel respon
\(H_1\): variabel prediktor berpengaruh terhadap variabel respon
Keputusan: \(G^2 (14.4769637) > X^2 (5.991465)\), maka \(H_0\) ditolak
Kesimpulan: Dengan taraf nyata 5% dapat disimpulkan bahwa lama pendidikan terakhir, lama pengalaman kerja dan jenis kelamin berpengaruh terhadap diterimanya seseorang untuk bekerja di PT. Makmur Jaya
3.4 Uji Hipotesis Parsial
> uji_parsial <- summary (model_reglog)
> uji_parsial
Call:
glm(formula = Y ~ X1 + X2 + X3, family = "binomial", data = data_logistik)
Coefficients:
Estimate Std. Error z value Pr(>|z|)
(Intercept) -5.6999 2.1282 -2.678 0.0074 **
X1 0.6727 0.2909 2.312 0.0208 *
X2 0.3115 0.1223 2.547 0.0109 *
X3 1.0378 0.8469 1.225 0.2204
---
Signif. codes: 0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
(Dispersion parameter for binomial family taken to be 1)
Null deviance: 55.452 on 39 degrees of freedom
Residual deviance: 40.975 on 36 degrees of freedom
AIC: 48.975
Number of Fisher Scoring iterations: 4Lama Pendidikan Terakhir \((X1)\)
Hipotesis:
\(H_0:\) X1 tidak berpengaruh terhadap Y
\(H_1:\) X1 berpengaruh terhadap
Keputusan: \(p-value (0.0208) > \alpha (0,05)\) , maka \(H_0\) diterima.
Kesimpulan: Dengan taraf nyata 5% dapat disimpulkan bahwa lama pendidikan terakhir tidak berpengaruh terhadap diterimanya seseorang untuk bekerja di PT. Makmur Jaya
Lama Pengalaman Kerja \((X2)\)
Hipotesis:
\(H_0:\) X2 tidak berpengaruh terhadap Y
\(H1:\) X2 berpengaruh terhadap Y
Keputusan:\(p-value (0.0109) < \alpha (0,05)\) , maka \(H_0\) ditolak.
Kesimpulan: Dengan taraf nyata 5% dapat disimpulkan bahwa lama pengalaman kerja berpengaruh terhadap diterimanya seseorang untuk bekerja di PT. Makmur Jaya
Jenis Kelamin \(X3\)
Hipotesis:
\(H_0:\) X3 tidak berpengaruh terhadap Y
\(H_1:\) X3 berpengaruh terhadap Y
Keputusan: \(p-value (0.2204 ) > \alpha (0,05)\) , maka \(H_0\) diterima.
Kesimpulan: Dengan taraf nyata 5% dapat disimpulkan bahwa jenis kelamin tidak berpengaruh terhadap diterimanya seseorang untuk bekerja di PT. Makmur Jaya
3.5 Odds Ratio
> beta<-(coef(model_reglog))
> beta
(Intercept) X1 X2 X3
-5.6999005 0.6727348 0.3115104 1.0378438
>
> OR_beta<- exp(beta)
> OR_beta
(Intercept) X1 X2 X3
0.003346298 1.959589102 1.365485969 2.823123101
>
> cbind(beta, OR_beta)
beta OR_beta
(Intercept) -5.6999005 0.003346298
X1 0.6727348 1.959589102
X2 0.3115104 1.365485969
X3 1.0378438 2.823123101Lama Pendidikan Terakhir \((X1)\)
Apabila lama pendidikan terakhir bertambah 1 tahun, maka kecendrungan diterima untuk bekerja di PT. Makmur Jaya meningkat sebesar 1.959589102 atau 2 kali lipat
Lama Pengalaman Kerja \((X2)\)
Apabila lama pengalaman kerja bertambah 1 tahun, maka kecendrungan diterima untuk bekerja di PT. Makmur Jaya meningkat sebesar 1.365485969 atau 1 kali lipat
Jenis Kelamin \((X3)\)
Apabila jeis kelamin seseorang laki-laki 1, maka kecendrungan diterima untuk bekerja di PT. Makmur Jaya meningkat sebesar 2.823123101 atau 3 kali lipat
3.6 Uji Kecocokan Model
> library(ResourceSelection)
> HLT<- hoslem.test(data_logistik$Y, fitted(model_reglog))
> HLT
Hosmer and Lemeshow goodness of fit (GOF) test
data: data_logistik$Y, fitted(model_reglog)
X-squared = 4.5284, df = 8, p-value = 0.8066Hipotesis:
\(H_0\) : Model yang digunakan sesuai dengan data
\(H_1\) : Model yang digunakan tidak sesuai dengan data
Keputusan: \(p-value (0.8066 ) > \alpha (0,05)\) , maka \(H_0\) diterima.
Kesimpulan: Dengan taraf nyata 5% dapat disimpulkan bahwa model yang digunakan sesuai dengan data.
3.7 Uji Ketepatan Model
> #tabel klasifikasi
> cross_tab<-table(data_logistik$Y, fitted(model_reglog)>0.5)
> cross_tab
FALSE TRUE
0 16 4
1 6 14
>
> ketepatan<- ((14+4)/40)*100
> print(paste(ketepatan, "%"))
[1] "45 %"Berdasarkan pembentukan tabel ketetapan klasifikasi yang merupakan tabel frekuensi dua arah antara variabel respon dan prediktor, maka diperoleh tingkat akurasi model sebesar 45%
4 KESIMPULAN
Berdasarkan hasil pengujian diatas variabel lama pendidikan terakhir, lama pengalaman kerja dan jenis kelamin secara simultan berpengaruh terhadap diterimanya seseorang untuk bekerja di PT. Makmur Jaya. Dan secara parsial lama pendidikan terakhir dan jenis kelamin tidak berpengaruh terhadap diterimanya seseorang untuk bekerja di PT. Makmur Jaya. Sedangkan variabel lama pengalaman kerja berpengaruh terhadap diterimanya seseorang untuk bekerja di PT. Makmur Jaya.
5 DAFTAR PUSTAKA
Hosmer Jr, D. W., Lemeshow, S., & Sturdivant, R. X. (2013). Applied logistic regression. John Wiley & Sons.
Tampil, Y. A., Komalig, H. & Langi, Y., 2017. Analisis Regresi Logistik Untuk Menentukan Faktor-Faktor yang Mempengaruhi Indeks Prestasi Kumulatif (IPK) Mahasiswa FMIPA Universitas Sam Ratulangi Manado. Volume 6.