Notes Theme, silakan gunakan salah satu theme berikut: - cayman (package prettydoc) - architect (package prettydoc) - united (default di RMarkdown)

Library:

> # install.packages("knitr")
> # install.packages("rmarkdown")
> # install.packages("prettydoc")
> # install.packages("equatiomatic")

1 PENDAHULUAN

1.1 Latar Belakang

Prestasi akademik mahasiswa merupakan salah satu indikator utama keberhasilan proses pendidikan di perguruan tinggi. Faktor-faktor yang mempengaruhi prestasi akademik sangat beragam, mencakup aspek personal, lingkungan, dan keterlibatan dalam berbagai kegiatan. Dalam konteks mahasiswa Matematika di Institut Agama Islam Negeri (IAIN) Purwokerto, terdapat beberapa variabel yang diduga memiliki pengaruh signifikan terhadap prestasi akademik mereka. Tiga di antaranya adalah penerimaan beasiswa, keterlibatan dalam pondok pesantren, dan partisipasi dalam organisasi mahasiswa.

Beasiswa sering kali dianggap sebagai bentuk dukungan finansial yang dapat meringankan beban ekonomi mahasiswa, sehingga mereka dapat lebih fokus pada studi. Namun, seberapa besar beasiswa ini benar-benar berdampak pada prestasi akademik masih perlu diteliti lebih lanjut. Selain itu, kehidupan di pondok pesantren yang disiplin dan berbasis nilai-nilai keagamaan juga diyakini mampu membentuk karakter dan etos belajar mahasiswa. Akan tetapi, perlu dilakukan penelitian untuk mengukur pengaruh kehidupan pesantren ini secara empiris terhadap prestasi akademik.

Keterlibatan dalam organisasi mahasiswa juga memainkan peran penting dalam perkembangan soft skills dan jaringan sosial mahasiswa. Organisasi memberikan ruang bagi mahasiswa untuk mengembangkan kemampuan kepemimpinan, kerjasama tim, dan keterampilan manajemen waktu yang dapat berdampak positif pada prestasi akademik. Namun, tidak semua mahasiswa yang aktif berorganisasi menunjukkan peningkatan dalam prestasi akademik, yang menandakan adanya variabel-variabel lain yang berperan.

Dalam penelitian ini, digunakan metode analisis regresi logistik biner untuk mengidentifikasi pengaruh masing-masing faktor tersebut terhadap prestasi akademik mahasiswa Matematika di IAIN Purwokerto. Regresi logistik biner dipilih karena mampu menangani variabel dependen yang bersifat dikotomis, yaitu prestasi akademik yang dikategorikan sebagai tinggi atau rendah. Dengan analisis ini, diharapkan dapat diperoleh pemahaman yang lebih mendalam mengenai seberapa besar pengaruh beasiswa, kehidupan di pondok pesantren, dan keaktifan dalam organisasi terhadap prestasi akademik mahasiswa. Hasil dari penelitian ini diharapkan dapat memberikan kontribusi penting bagi pengembangan kebijakan pendidikan di IAIN Purwokerto, khususnya dalam upaya meningkatkan kualitas pendidikan dan prestasi akademik mahasiswa.

1.2 Tinjauan

1.2.1 Analisis Regresi Logistik Biner

Regresi merupakan sebuah model statistik yang digunakan untuk menggambarkan hubungan antara sebuah variabel respon (dependen) dan satu atau lebih variabel prediktor (independen). Sedangkan regresi logistik adalah jika variabel responnya merupakan variabel diskrit yang memiliki dua atau lebih nilai yang mungkin, selanjutnya apabila variabel responnya adalah variabel diskrit yang memiliki dua nilai yang mungkin disebut regresi logistik biner.

Perbedaan antara regresi logistik dengan regresi linier adalah variabel respon dalam regresi linier adalah variabel kontinu, sedangkan dalam regresi logistik adalah binary atau dichotomous (David W. Hosmer and Stanley Lemeshow, 2000)

Regresi logistik digunakan untuk mencari hubungan antara variabel respon yang bersifat dichotomous (berskala nominal atau biner) atau bersifat polychotomous (berskala nominal atau biner) dengan satu atau lebih variabel prediktor. Sedangkan variabel prediktor ini bersifat kontinu atau kategorik (Agresti, 1990).

model regresi logistik dapat ditulis sebagai berikut :

\[ g(X)=ln[\frac{\pi(x)}{1-\pi(x)}]=\beta_{0}+\beta_{1}X_{1}+\beta_{2}X_{2}+...+\beta_{k}X_{k} \]

1.2.2 Pengecekan Asumsi Non Multikolinieritas

Uji multikolinearitas bertujuan untuk mengidentifikasi adanya hubungan antar variabel independen dalam sebuah model regresi. Menurut Ghozali (2018, p. 105), tujuan utama dari uji multikolinearitas adalah untuk memastikan bahwa model regresi yang digunakan tidak memiliki korelasi yang signifikan antar variabel bebas. Model regresi yang ideal adalah model yang variabel-variabel independennya tidak saling berkorelasi. Untuk mendeteksi adanya multikolinearitas, digunakan dua indikator utama, yaitu nilai tolerance dan Variance Inflation Factor (VIF). Jika Nilai VIF < 10 menunjukkan bahwa tidak terdapat multikolinearitas yang signifikan dalam model tersebut. Sebaliknya, jika nilai VIF > 10, yang memiliki arti bahwa terdapat multikolinearitas dalam data.

Rumus VIF sebagai berikut:

\[ VIF = \frac{1}{1-R^{2}} \] Apabila nilai VIF lebih besar dari 10 dapat disimpulkan bahwa terdapat multikolinieritas antar peubah-peubah prediktor (Kutner dkk, 2004).

1.2.3 Pengujian Parameter Model

Menurut (Ferdinand, 2014, p.239), uji F digunakan untuk menilai kecocokan model regresi yang ada. Kecocokan di sini merujuk pada kemampuan model regresi untuk menjelaskan pengaruh variabel independen (seperti kualitas layanan) terhadap variabel dependen (seperti kepuasan pelanggan). Dengan menggunakan tabel ANOVA, model regresi dianggap cocok jika nilai F-hitung (Sig.) kurang dari 0,05. Dengan kata lain, jika nilai probabilitas yang dihasilkan oleh uji F tersebut kurang dari 0,05, maka model regresi dianggap memiliki kecocokan yang signifikan. Pengujian yang digunakan adalah uji hosmer-lemeshow.

1.2.3.1 Uji Simultan

Uji signifikan parameter secara simultan digunakan untuk mengetahui variabel prediktor signifikan secara serentak terhadap variabel respon atau tidak.

Hipotesis \[ H_{0}:\beta_{j1}=\beta_{j2}=...=\beta_{jk}=0;\beta_{jk}=0 \]

\[ vs \]

\[ H_{1}:\beta_{jk} \ne 0 \] Pengambilan daerah Keputusan, yaitu tolak H0 jika p-value < alpha dan terima H0 jika p-value > alpha.

Apabila keputusannya tolak H0, maka model yang mengandung variabel prediktor berpengaruh signifikan secara serentak terhadap variabel respon.

1.2.3.2 Uji Parsial

Uji signifikan parameter model parsial digunakan untuk mengetahui masing-masing variabel prediktor signifikan terhadap model atau tidak.

Hipotesis \[ H_{0}:\beta_{j}=0, j = 1,2,...,k \]

\[ vs \]

\[ H_{1}:\beta_{j} \ne 0, j =1,2,...,k \] Pengambilan daerah Keputusan, yaitu tolak H0 jika p-value < alpha dan terima H0 jika p-value > alpha.

Apabila keputusannya tolak H0, maka variabel prediktor berpengaruh signifikan secara parsial terhadap variabel respon.

1.2.4 Interpretasi Model

Agar memudahkan dalam menginterpretasikan model digunakan nilai odds ratio. Dengan rumus Odds ratio (OR) sebagai berikut:

\[ OR=\frac{Odds \ A} {Odds \ B}=\frac{\frac{\pi_A}{(1-\pi_A)}}{\frac{\pi_B}{(1-\pi_B)}} \] Keputusan tidak terdapat hubungan antara variabel predictor diambil jika nilai odds ratio sama dengan 1. Jika nilai odds ratio kurang dari 1, maka antara variabel prediktor dan variabel respon terdapat hubungan negatif setiap kali perubahan nilai variabel bebas (x). Dan jika odds ratio lebih dari 1 maka antara variabel prediktor dengan variabel respon terdapat hubungan positif setiap kali perubahan nilai variabel bebas (x).

1.3 Data

Data ini saya dapat dari sebuah jurnal yang berjudul “Analisis Regresi Logistik Biner Untuk Mengetahui Pengaruh Mahasiswa yang Menerima Beasiswa, Pondok Pesantren,dan Organisasi Terhadap Prestasi Akademik Mahasiswa Matematika IAIN Purwokerto”, dimana data tersebut diambil dari mahasiswa prodi matematika Institut Agama Islam Negeri(IAIN) Purwokerto. Namun saya tidak mengambil variabel asal_sekolah karena ingin berfokus pada saat menjadi mahasiswa. cuplikan datanya:

1.4 Tujuan

Tujuan dari analisis regresi logistik biner pada kasus ini adalah untuk memahami seberapa signifikan pengaruh mahasiswa yang menerima beasiswa, keikutsertaan dalam pondok pesantren, dan partisipasi mahasiswa mengikuti organisasi terhadap prestasi akademik mahasiswa Matematika di IAIN Purwokerto. Dengan mengevaluasi hubungan antara variabel-variabel ini dan prestasi akademik, sehingga nantinya analisis ini bisamemberikan wawasan yang berharga bagi institusi untuk meningkatkan efektivitas program beasiswa, pengelolaan waktu mahasiswa, dan dukungan untuk kegiatan ekstrakurikuler guna meningkatkan prestasi akademik mahasiswa.

2 SOURCE CODE

2.1 Library

> library(readr)
> library(generalhoslem)
> library(pscl)

2.2 Impor Data

> #Mengimpor File dari CSV
> Data_mahasiswa=read.csv("C:/kuliah/Laprak2/Data mahasiswa.csv")
> Data_mahasiswa
   X1 X2 X3 Y
1   0  1  1 0
2   1  1  1 1
3   0  1  1 1
4   0  0  1 1
5   0  1  1 1
6   0  1  1 1
7   0  1  1 1
8   1  1  1 1
9   0  1  1 1
10  0  1  1 0
11  0  1  1 1
12  0  1  1 1
13  0  1  1 1
14  0  0  1 1
15  0  1  1 1
16  0  1  1 1
17  0  1  1 0
18  0  1  1 1
19  0  1  1 1
20  1  0  1 1
21  0  1  1 0
22  0  1  1 1
23  0  0  1 0
24  0  1  1 1
25  0  1  1 1
26  0  1  1 1
27  0  1  1 1
28  0  1  1 1
29  1  1  1 1
30  0  0  1 1
31  0  1  1 1
32  0  1  1 1
33  0  1  1 1
34  0  1  1 0
35  0  1  1 0
36  0  1  1 1
37  0  1  1 0
38  1  0  1 1
39  0  1  1 1
40  0  0  1 1
41  1  1  1 1
42  0  0  1 1
43  0  1  0 1
44  0  0  0 1
45  1  0  0 1
46  0  1  0 1
47  0  0  1 1
48  0  1  1 1
49  0  1  0 1
50  0  1  0 1
51  0  0  1 0
52  1  1  0 1
53  0  1  0 1
54  0  0  1 1
55  1  0  1 1
56  0  1  0 1
57  0  1  1 0
58  1  1  1 1
59  0  1  1 0
60  0  1  1 1
61  0  1  0 1
62  1  1  1 1
63  1  1  0 1
64  0  0  0 1
65  0  1  1 1
66  1  1  0 1
67  0  0  1 1
68  0  1  1 1
69  0  0  1 1
70  0  1  1 1
71  0  1  0 1
72  0  1  1 1
73  0  1  1 1
74  0  0  0 1
75  0  0  1 1
76  0  0  0 0
77  0  1  1 1
78  1  1  1 1
79  0  0  1 1

Data di import dari file excel dengan rincian variabel sebagai berikut:

  • \(Y\) = mahasiswa memiliki prestasi akademik (0=Tidak; 1=Ya)

  • \(X1\) = mahasiswa menerima beasiswa (0=Tidak; 1=Ya)

  • \(X2\) = mahasiswa mengikuti pondok pesantren (0=Tidak; 1=Ya)

  • \(X3\) =mahasiswa berpartisipasi ikut organisasi(0=Tidak; 1=Ya)

2.3 Uji Non Multikolinieritas

> Reglog_1 <- lm(Y ~ X1 + X2 + X3, family=binomial, data = Data_mahasiswa)
> library(car)
> vif(Reglog_1)
      X1       X2       X3 
1.009568 1.003096 1.011996 

2.4 Model Regresi Logistik

> #Model Regresi Logistik
> modelreglog=glm(Y~X1+X2+X3, family=binomial, data=Data_mahasiswa)
> summary(modelreglog)

Call:
glm(formula = Y ~ X1 + X2 + X3, family = binomial, data = Data_mahasiswa)

Coefficients:
              Estimate Std. Error z value Pr(>|z|)  
(Intercept)    2.40949    1.15720   2.082   0.0373 *
X1            16.98912 1717.23037   0.010   0.9921  
X2            -0.01735    0.74370  -0.023   0.9814  
X3            -1.05660    1.09991  -0.961   0.3367  
---
Signif. codes:  0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1

(Dispersion parameter for binomial family taken to be 1)

    Null deviance: 67.306  on 78  degrees of freedom
Residual deviance: 61.017  on 75  degrees of freedom
AIC: 69.017

Number of Fisher Scoring iterations: 17

2.5 Pengujian Parameter

> #Uji Simultan
> pR2(modelreglog)
fitting null model for pseudo-r2
         llh      llhNull           G2     McFadden         r2ML         r2CU 
-30.50825884 -33.65309505   6.28967241   0.09344865   0.07652921   0.13345884 
> qchisq(0.95,2)
[1] 5.991465
> #Uji Parsial
> summary(modelreglog)

Call:
glm(formula = Y ~ X1 + X2 + X3, family = binomial, data = Data_mahasiswa)

Coefficients:
              Estimate Std. Error z value Pr(>|z|)  
(Intercept)    2.40949    1.15720   2.082   0.0373 *
X1            16.98912 1717.23037   0.010   0.9921  
X2            -0.01735    0.74370  -0.023   0.9814  
X3            -1.05660    1.09991  -0.961   0.3367  
---
Signif. codes:  0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1

(Dispersion parameter for binomial family taken to be 1)

    Null deviance: 67.306  on 78  degrees of freedom
Residual deviance: 61.017  on 75  degrees of freedom
AIC: 69.017

Number of Fisher Scoring iterations: 17

2.6 Odds Ratio

> beta=exp(coef(modelreglog))
> beta
 (Intercept)           X1           X2           X3 
1.112827e+01 2.389348e+07 9.828018e-01 3.476340e-01 
> OR_beta<-exp(beta)
> OR_beta
 (Intercept)           X1           X2           X3 
68068.221987          Inf     2.671932     1.415714 
> cbind(beta,OR_beta)
                    beta      OR_beta
(Intercept) 1.112827e+01 68068.221987
X1          2.389348e+07          Inf
X2          9.828018e-01     2.671932
X3          3.476340e-01     1.415714

##Koefisien Determinasi

> rsqr=1-(61.017/67.306)
> rsqr
[1] 0.09343892

2.7 Pengujian Kesesuaian Model

> #Uji Kesesuaian Model
> logitgof(Data_mahasiswa$Y, fitted(modelreglog))

    Hosmer and Lemeshow test (binary model)

data:  Data_mahasiswa$Y, fitted(modelreglog)
X-squared = 2.2157, df = 3, p-value = 0.5289
> qchisq(0.95,2)
[1] 5.991465

3 HASIL DAN PEMBAHASAN

3.1 Model Regresi Logistik

Berdasarkan Data yang digunakan, hasil output di atas diperoleh model regresi logistik biner sebagai berikut:

\[ \hat{Y}=2.409493+16.98912X_{1}-0.01735X_{2}-1.05660X_{3} \] - 2.409493 artinya, ketika seluruh variabel prediktor bernilai konstan maka Mahasiswa yang berprestasi di bidang akademik akan naik sebesar 2.409493 satuan.

  • 16.98912 artinya, ketika variabel beasiswa(X1) bernilai 1 dan variabel prediktor lainnya bernilai konstan maka mahasiswa yang berprestasi di bidang akademik akan naik sebesar 16.98912 satuan.

  • 0.01735 artinya, ketika variabel pondok_pesantren(X2) bernilai 1 dan variabel prediktor lainnya bernilai konstan maka mahasiswa yang berprestasi di bidang akademik akan turun sebesar 0.01735 satuan.

  • 1.05660 artinya, ketika variabel organisasi(X3) bernilai 1 dan variabel prediktor lainnya bernilai konstan maka mahasiswa yang berprestasi di bidang akademik akan turun sebesar 1.05660 satuan.

3.2 Interpretasi Non Multikolinieritas

Berdasarkan hasil pengujian, diperoleh nilai VIF variabel beasiswa, pondok pesantren,dan organisasi secara berturut-turut sebesar 1.009568; 1.003096; 1.011996. Karena nilai tersebut kurang dari 10, maka dapat disimpulkan bahwa tidak terjadi multikolinieritas dalam model.

3.3 Interpretasi Pengujian Parameter

3.3.1 Uji Simultan

Berdasarkan hasil uji simultan yang telah dilakukan, diperoleh nilai rasio likelihood sebesar 6.28967241 dan nilai Chi-Square tabel sebesar 5.991465. Karena 6.28967241 > 5.991465 maka tolak HO sehingga dapat disimpulkan bahwa ketiga variabel prediktor secara simultan berpengaruh signifikan terhadap mahasiswa yang berprestasi di bidang akademik(variabel respon).

3.3.2 Uji Parsial

  1. Variabel Prediktor X1 diperoleh p-value = 0.9921 Karena p-value > 0.05 maka tolak HO, dan dapat disimpulkan bahwa dengan tingkat kepercayaan 95% sudah cukup bukti untuk menyatakan variabel beasiswa berpengaruh signifikan terhadap variabel prestasi_akademik.

  2. Variabel Prediktor X2 diperoleh p-value = 0.9814 Karena p-value > 0.05 maka tolak HO, dan dapat disimpulkan bahwa dengan tingkat kepercayaan 95% sudah cukup bukti untuk menyatakan variabel pondok_pesantren berpengaruh signifikan terhadap variabel prestasi_akademik.

  3. Variabel Prediktor X3 diperoleh p-value = 0.3367 Karena p-value > 0.05 maka tolak HO, dan dapat disimpulkan bahwa dengan tingkat kepercayaan 95% sudah cukup bukti untuk menyatakan variabel jumlah anak berpengaruh signifikan terhadap variabel prestasi_akademik.

3.4 Odds Ratio

Berdarakan output odds ratio di atas dapat disimpulkan bahwa:

  • Variabel beasiswa(X1) memiliki odds ratio sebesar 11.182 yang berarti mahasiswa yang berprestasi di bidang akademik meningkat 2.389348e+07 kali pada setiap peningkatan satu unit X1.

  • Variabel pondok_pesantren(X2) memiliki odds ratio sebesar 2.389348e+07 yang berarti mahasiswa yang berprestasi di bidang akademik meningkat 0.9828018 kali pada setiap peningkatan satu unit X2.

  • Variabel organisasi(X3) memiliki odds ratio sebesar 2.651962 yang berarti mahasiswa yang berprestasi di bidang akademik meningkat 0.3476340 kali pada setiap peningkatan satu unit X3.

3.5 Interpretasi Koefisien Determinasi

Dari pengujian di atas diperoleh nilai koefisien determinasi sebesar 0.093438922 yang dapat diartikan bahwa ketiga variabel prediktor mampu menjelaskan 9% variabel respon kepesertaan asuransi kesehatan dan 92% lainnya dijelaskan oleh variabel lain di luar pengujian.

3.6 Interpretasi Uji Kesesuaian Model

Untuk mengetahui sudah sesuai atau belum suatu model dapat menggunakan uji Hosmer & Lemeshow. Berdasarkan hasil perhitungan yang ada diperoleh p-value yaitu 0.5289 dimana p-value > (0.05) maka keputusan yang diambil adalah terima H0 sehingga dapat dikatakan bahwa model tersebut sudah cukup untuk menggambarkan data.

4 KESIMPULAN

Berdasarkan hasil pengujian analisis regresi logistik biner yang telah dilakukan di atas dapat diambil kesimpulan bahwa dari ketiga variabel prediktor yaitu variabel beasiswa, pondok_pesantren,dan organisasi memberikan pengaruh secara signifikan terhadap variabel respon mahasiswa yang berprestasi di bidang akademik.

5 DAFTAR PUSTAKA

Agresti, A. (1990). Categorical Data Analysis. John Wiley and Sons, Inc.

Hosmer Jr, D. W., Lemeshow, S., & Sturdivant, R. X. (2013). Applied logistic regression. John Wiley & Sons.

Hosmer, David W, and Lemeshow, Stanley. (2000). Applied Logistic Regression Second Edition. John Wiley & Sons, Inc : New York.

Mutijah. (2017). ANALISIS REGRESI LOGISTIK BINER TERHADAP FAKTOR PENGARUH PRESTASI AKADEMIK MAHASISWA TADRIS MATEMATIKA IAIN PURWOKERTO. JPA, 18(1).

Nisva, T. M. T & Ratnasari, V. (2020). Analisis Regresi Logistik Biner pada Faktor-Faktor yang Mempengaruhi Jenis Perceraian di Kabupaten Lumajang. Inferensi, 3(1).