1 Import Data

#Mengambil data dari laman UCLA
mydata<- read.csv("https://stats.idre.ucla.edu/stat/data/binary.csv")
# Tampilkan beberapa data pertama
head(mydata)

##   admit gre  gpa rank
## 1     0 380 3.61    3
## 2     1 660 3.67    3
## 3     1 800 4.00    1
## 4     1 640 3.19    4
## 5     0 520 2.93    4
## 6     1 760 3.00    2

Dataset ini di ambil dari laman UCLA yang berisi data penerimaan mahasiswa pascasarjana. variabel yang digunakan yaitu:

admit: Status diterima (0= ditolak, 1= diterima)

gre:graduate record examinations

gpa: graduate point average

rank: peringkat universitas asal mahasiswa (institution rank)

2 Persiapan Data

#mengubah variabel rank menjadi kategori/faktor
mydata$rank <- factor(mydata$rank)
#Menampilkan Struktur data
str(mydata)

## 'data.frame':    400 obs. of  4 variables:
##  $ admit: int  0 1 1 1 0 1 1 0 1 0 ...
##  $ gre  : int  380 660 800 640 520 760 560 400 540 700 ...
##  $ gpa  : num  3.61 3.67 4 3.19 2.93 3 2.98 3.08 3.39 3.92 ...
##  $ rank : Factor w/ 4 levels "1","2","3","4": 3 3 1 4 4 2 1 2 3 2 ...

Variabel rank diubah menjadi faktor karena merupakan variabel kategori.

3 Regresi Logistik

3.1 Pemodelan Regresi Logistik

#Membentuk model Regresi Logistik
mylogit <- glm(admit~gre + gpa + rank, data=mydata, family=binomial(link="logit"))
# Menampilkan ringkasan hasil model
summary(mylogit)

## 
## Call:
## glm(formula = admit ~ gre + gpa + rank, family = binomial(link = "logit"), 
##     data = mydata)
## 
## Coefficients:
##              Estimate Std. Error z value Pr(>|z|)    
## (Intercept) -3.989979   1.139951  -3.500 0.000465 ***
## gre          0.002264   0.001094   2.070 0.038465 *  
## gpa          0.804038   0.331819   2.423 0.015388 *  
## rank2       -0.675443   0.316490  -2.134 0.032829 *  
## rank3       -1.340204   0.345306  -3.881 0.000104 ***
## rank4       -1.551464   0.417832  -3.713 0.000205 ***
## ---
## Signif. codes:  0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
## 
## (Dispersion parameter for binomial family taken to be 1)
## 
##     Null deviance: 499.98  on 399  degrees of freedom
## Residual deviance: 458.52  on 394  degrees of freedom
## AIC: 470.52
## 
## Number of Fisher Scoring iterations: 4

Berdasarkan output dari model logistik, bagian Call menunjukkan model yang digunakan, yaitu regresi logistik denagan variabel dependen(admit) serta variabel independen (gre, gpa, dan rank). Nilai deviance digunakan sebagai ukuran kecocokan model. Terlihat bahwa nilai Null Deviance sebesar 499.98 menurun menjadi Residual Deviance sebesar 458.52 setelah variabel independen dimasukkan ke dalam model. Penurunan nilai deviance ini menunjukkan bahwa model yang dibentuk lebih baik dibandingkan model tanpa prediktor.

Hasil pengujian menunjukkan bahwa variabel gre dan gpa berpengaruh signifikan terhadap peluang diterimanya mahasiswa karena memiliki nilai p-value kurang dari 0.05. Koefisien gre sebesar 0.002 menunjukkan bahwa setiap kenaikan 1 poin GRE akan meningkatkan log odds diterima sebesar 0.002. Sementara itu, koefisien gpa sebesar 0.804 menunjukkan bahwa setiap kenaikan 1 unit GPA akan meningkatkan log odds diterima sebesar 0.804. Hal ini berarti semakin tinggi nilai GRE dan GPA, maka peluang mahasiswa untuk diterima juga semakin besar.

Pada variabel rank, seluruh koefisien bernilai negatif, yaitu rank2 sebesar -0,675, rank3 sebesar -1,340, dan rank4 sebesar -1,551. Hasil tersebut menunjukkan bahwa calon mahasiswa yang berasal dari universitas dengan peringkat lebih rendah memiliki peluang diterima yang lebih kecil dibandingkan calon mahasiswa dari universitas rank 1 sebagai kategori acuan. Dengan demikian, dapat disimpulkan bahwa nilai GRE, GPA, dan peringkat universitas asal berpengaruh terhadap peluang diterimanya mahasiswa pada program pascasarjana.

3.2 Uji Simultan Logit

#memanggil packages pscl
library(pscl)

## Warning: package 'pscl' was built under R version 4.5.3

## Classes and Methods for R originally developed in the
## Political Science Computational Laboratory
## Department of Political Science
## Stanford University (2002-2015),
## by and under the direction of Simon Jackman.
## hurdle and zeroinfl functions by Achim Zeileis.

#Menghitung Pseudo R-square model logit
pR2(mylogit)

## fitting null model for pseudo-r2

##           llh       llhNull            G2      McFadden          r2ML 
## -229.25874624 -249.98825878   41.45902508    0.08292194    0.09845702 
##          r2CU 
##    0.13799580

#Menghitung nilai Chi-Square pada taraf signifikan 5% dengan df=3
qchisq(0.95,3)

## [1] 7.814728

Berdasarkan hasil uji simultan diperoleh nilai G² sebesar 41.459 dengan nilai χ² tabel sebesar 7.815. Karena nilai G² > χ² tabel, maka tolak H0. Artinya, variabel gre, gpa, dan rank secara simultan berpengaruh signifikan terhadap peluang diterimanya mahasiswa. Nilai McFadden R² sebesar 0.0829 menunjukkan bahwa model mampu menjelaskan sekitar 8.29% variasi peluang diterima mahasiswa.

3.3 Uji Parsial Logit

# menampilkan hasil uji parsial
summary(mylogit)

## 
## Call:
## glm(formula = admit ~ gre + gpa + rank, family = binomial(link = "logit"), 
##     data = mydata)
## 
## Coefficients:
##              Estimate Std. Error z value Pr(>|z|)    
## (Intercept) -3.989979   1.139951  -3.500 0.000465 ***
## gre          0.002264   0.001094   2.070 0.038465 *  
## gpa          0.804038   0.331819   2.423 0.015388 *  
## rank2       -0.675443   0.316490  -2.134 0.032829 *  
## rank3       -1.340204   0.345306  -3.881 0.000104 ***
## rank4       -1.551464   0.417832  -3.713 0.000205 ***
## ---
## Signif. codes:  0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
## 
## (Dispersion parameter for binomial family taken to be 1)
## 
##     Null deviance: 499.98  on 399  degrees of freedom
## Residual deviance: 458.52  on 394  degrees of freedom
## AIC: 470.52
## 
## Number of Fisher Scoring iterations: 4

Berdasarkan hasil uji parsial, variabel gre, gpa, dan rank memiliki nilai p-value kurang dari 0.05 sehingga berpengaruh signifikan terhadap peluang diterimanya mahasiswa. Variabel gre dan gpa memiliki koefisien positif, yang menunjukkan bahwa semakin tinggi nilai GRE dan GPA maka peluang mahasiswa untuk diterima semakin besar. Sementara itu, variabel rank2, rank3, dan rank4 memiliki koefisien negatif, yang berarti mahasiswa dari universitas dengan peringkat lebih rendah memiliki peluang diterima yang lebih kecil dibandingkan universitas rank 1 sebagai kategori acuan.

3.4 Kecocokan Model Logit

#Memanggil package ResourceSelection
library(ResourceSelection)

## Warning: package 'ResourceSelection' was built under R version 4.5.3

## ResourceSelection 0.3-6   2023-06-27

# Uji Hosmer Lemeshow
hoslem.test(mylogit$y, fitted(mylogit))

## 
##  Hosmer and Lemeshow goodness of fit (GOF) test
## 
## data:  mylogit$y, fitted(mylogit)
## X-squared = 11.085, df = 8, p-value = 0.1969

# Menghitung Chi-Square tabel
qchisq(0.95, 3)

## [1] 7.814728

Berdasarkan hasil uji Hosmer-Lemeshow diperoleh nilai χ² hitung sebesar 11.085 dengan p-value sebesar 0.1969. Karena nilai p-value > 0.05, maka gagal tolak H0, yang berarti model regresi logistik sesuai dengan data. Dengan demikian, model layak digunakan untuk menganalisis peluang diterimanya mahasiswa.

3.5 Klasifikasi Logit

#Menghasilkan probabilitas prediksi
mydata$prob <- predict(mylogit, type="response")
#Menampilkan data
head(mydata)

##   admit gre  gpa rank      prob
## 1     0 380 3.61    3 0.1726265
## 2     1 660 3.67    3 0.2921750
## 3     1 800 4.00    1 0.7384082
## 4     1 640 3.19    4 0.1783846
## 5     0 520 2.93    4 0.1183539
## 6     1 760 3.00    2 0.3699699

#Mengubah probabilitas menjadi kelas
mydata$pred_class<-ifelse(mydata$prob>0.5,1,0)
#Menampilkan hasil klasifikasi
head(mydata)

##   admit gre  gpa rank      prob pred_class
## 1     0 380 3.61    3 0.1726265          0
## 2     1 660 3.67    3 0.2921750          0
## 3     1 800 4.00    1 0.7384082          1
## 4     1 640 3.19    4 0.1783846          0
## 5     0 520 2.93    4 0.1183539          0
## 6     1 760 3.00    2 0.3699699          0

3.6 Kinerja Model Logit

#Memanggil package caret
library(caret)

## Warning: package 'caret' was built under R version 4.5.3

## Loading required package: ggplot2

## Warning: package 'ggplot2' was built under R version 4.5.3

## Loading required package: lattice

## Warning: package 'lattice' was built under R version 4.5.3

#Membuat confusion matrix
confusionMatrix(as.factor(mydata$pred_class),as.factor(mydata$admit))

## Confusion Matrix and Statistics
## 
##           Reference
## Prediction   0   1
##          0 254  97
##          1  19  30
##                                          
##                Accuracy : 0.71           
##                  95% CI : (0.6628, 0.754)
##     No Information Rate : 0.6825         
##     P-Value [Acc > NIR] : 0.1293         
##                                          
##                   Kappa : 0.1994         
##                                          
##  Mcnemar's Test P-Value : 8.724e-13      
##                                          
##             Sensitivity : 0.9304         
##             Specificity : 0.2362         
##          Pos Pred Value : 0.7236         
##          Neg Pred Value : 0.6122         
##              Prevalence : 0.6825         
##          Detection Rate : 0.6350         
##    Detection Prevalence : 0.8775         
##       Balanced Accuracy : 0.5833         
##                                          
##        'Positive' Class : 0              
##

Berdasarkan hasil confusion matrix, diperoleh nilai akurasi sebesar 71%, yang menunjukkan bahwa model mampu mengklasifikasikan data dengan cukup baik. Nilai sensitivitas sebesar 93.04% menunjukkan model sangat baik dalam memprediksi kelas 0 (tidak diterima), sedangkan nilai spesifisitas sebesar 23.62% menunjukkan kemampuan model dalam memprediksi kelas 1 (diterima) masih rendah.

3.7 Uji Kebaikan Model Logit

#Memanggil package modEvA
library(modEvA)

## Warning: package 'modEvA' was built under R version 4.5.3

## 
## Attaching package: 'modEvA'

## The following objects are masked from 'package:caret':
## 
##     confusionMatrix, RMSE, varImp

#Menghitung R-square GLM
RsqGLM(mylogit)

## Warning in RsqGLM(mylogit): this function is DEPRECATED; using pseudoRsq() instead.

## $CoxSnell
## [1] 0.09845702
## 
## $Nagelkerke
## [1] 0.1379958
## 
## $McFadden
## [1] 0.08292194
## 
## $Tjur
## [1] 0.1017865
## 
## $sqPearson
## [1] 0.1014337

#Memanggil package DescTools
library(DescTools)

## Warning: package 'DescTools' was built under R version 4.5.3

## 
## Attaching package: 'DescTools'

## The following objects are masked from 'package:modEvA':
## 
##     AUC, RMSE

## The following objects are masked from 'package:caret':
## 
##     MAE, RMSE

#Menghitung Nagelkerke R-square
PseudoR2(mylogit, which = "Nagelkerke")

## Nagelkerke 
##  0.1379958

Berdasarkan hasil uji kebaikan model, diperoleh nilai Cox and Snell R² sebesar 0.0985, Nagelkerke R² sebesar 0.1380, dan McFadden R² sebesar 0.0829. Nilai Nagelkerke R² menunjukkan bahwa model mampu menjelaskan sekitar 13.8% variasi peluang diterimanya mahasiswa, sedangkan sisanya dijelaskan oleh faktor lain di luar model.

3.8 Odds Ratio Model Logit

#Menghitung Odds Ratio
exp(coef(mylogit))

## (Intercept)         gre         gpa       rank2       rank3       rank4 
##   0.0185001   1.0022670   2.2345448   0.5089310   0.2617923   0.2119375

Berdasarkan hasil Odds Ratio, variabel gre memiliki nilai OR sebesar 1.002 yang menunjukkan bahwa setiap kenaikan 1 poin GRE akan meningkatkan peluang diterima sebesar 1.002 kali. Variabel gpa memiliki nilai OR sebesar 2.235, yang berarti setiap kenaikan 1 unit GPA akan meningkatkan peluang diterima sekitar 2.235 kali. Sementara itu, variabel rank2, rank3, dan rank4 memiliki nilai OR kurang dari 1, yaitu masing-masing sebesar 0.509; 0.262; dan 0.212. Hal ini menunjukkan bahwa mahasiswa dari universitas dengan peringkat lebih rendah memiliki peluang diterima yang lebih kecil dibandingkan mahasiswa dari universitas rank 1 sebagai kategori acuan.

4 Regresi Probit

4.1 Pemodelan Regresi Probit

#Membentuk Model Regresi Probit
probit<-glm(admit~gre+gpa+rank, data=mydata, family = binomial(link="probit"))
#Menampilkan ringkasan model probit
summary(probit)

## 
## Call:
## glm(formula = admit ~ gre + gpa + rank, family = binomial(link = "probit"), 
##     data = mydata)
## 
## Coefficients:
##              Estimate Std. Error z value Pr(>|z|)    
## (Intercept) -2.386836   0.673946  -3.542 0.000398 ***
## gre          0.001376   0.000650   2.116 0.034329 *  
## gpa          0.477730   0.197197   2.423 0.015410 *  
## rank2       -0.415399   0.194977  -2.131 0.033130 *  
## rank3       -0.812138   0.208358  -3.898 9.71e-05 ***
## rank4       -0.935899   0.245272  -3.816 0.000136 ***
## ---
## Signif. codes:  0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
## 
## (Dispersion parameter for binomial family taken to be 1)
## 
##     Null deviance: 499.98  on 399  degrees of freedom
## Residual deviance: 458.41  on 394  degrees of freedom
## AIC: 470.41
## 
## Number of Fisher Scoring iterations: 4

Berdasarkan hasil regresi probit, variabel gre, gpa, dan rank berpengaruh signifikan terhadap peluang diterimanya mahasiswa karena memiliki nilai p-value kurang dari 0.05. Nilai Residual Deviance sebesar 458.41 lebih kecil dibanding Null Deviance sebesar 499.98, yang menunjukkan bahwa model probit lebih baik dibanding model tanpa prediktor. Selain itu, variabel gre dan gpa berpengaruh positif terhadap peluang diterima, sedangkan variabel rank berpengaruh negatif, sehingga mahasiswa dari universitas dengan peringkat lebih rendah memiliki peluang diterima yang lebih kecil dibandingkan rank 1.

4.2 Uji Multikolinearitas Probit

#memnggil Package car
library(car)

## Warning: package 'car' was built under R version 4.5.3

## Loading required package: carData

## Warning: package 'carData' was built under R version 4.5.3

## 
## Attaching package: 'car'

## The following object is masked from 'package:DescTools':
## 
##     Recode

#Menghitung VIF model probit
vif(probit)

##          GVIF Df GVIF^(1/(2*Df))
## gre  1.150809  1        1.072758
## gpa  1.165792  1        1.079719
## rank 1.026361  3        1.004346

Berdasarkan hasil uji multikolinearitas, variabel gre memiliki nilai VIF sebesar 1.073, variabel gpa sebesar 1.080, dan variabel rank sebesar 1.004. Karena seluruh nilai VIF kurang dari 10, maka dapat disimpulkan bahwa tidak terjadi multikolinearitas pada model probit.

4.3 Uji Simultan Probit

#memanggil packages pscl
library(pscl)
# Menghitung pseudo R-square
pR2(probit)

## fitting null model for pseudo-r2

##           llh       llhNull            G2      McFadden          r2ML 
## -229.20658569 -249.98825878   41.56334618    0.08313060    0.09869212 
##          r2CU 
##    0.13832531

# Menghitung Chi-Square tabel
qchisq(0.95, 3)

## [1] 7.814728

Berdasarkan hasil uji simultan pada model probit, diperoleh nilai G² sebesar 41.563 dengan nilai McFadden R² sebesar 0.0831. Selain itu, nilai Cox and Snell R² sebesar 0.0987 dan Nagelkerke R² sebesar 0,1383 menunjukkan bahwa model mampu menjelaskan sekitar 13.83% variasi peluang diterimanya mahasiswa. Karena nilai G² cukup besar, maka variabel gre, gpa, dan rank secara simultan berpengaruh terhadap peluang diterimanya mahasiswa.

4.4 Uji Parsial Probit

# Menampilkan hasil uji parsial
summary(probit)

## 
## Call:
## glm(formula = admit ~ gre + gpa + rank, family = binomial(link = "probit"), 
##     data = mydata)
## 
## Coefficients:
##              Estimate Std. Error z value Pr(>|z|)    
## (Intercept) -2.386836   0.673946  -3.542 0.000398 ***
## gre          0.001376   0.000650   2.116 0.034329 *  
## gpa          0.477730   0.197197   2.423 0.015410 *  
## rank2       -0.415399   0.194977  -2.131 0.033130 *  
## rank3       -0.812138   0.208358  -3.898 9.71e-05 ***
## rank4       -0.935899   0.245272  -3.816 0.000136 ***
## ---
## Signif. codes:  0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
## 
## (Dispersion parameter for binomial family taken to be 1)
## 
##     Null deviance: 499.98  on 399  degrees of freedom
## Residual deviance: 458.41  on 394  degrees of freedom
## AIC: 470.41
## 
## Number of Fisher Scoring iterations: 4

Berdasarkan hasil uji parsial pada model probit, variabel gre, gpa, dan rank memiliki nilai p-value kurang dari 0.05 sehingga berpengaruh signifikan terhadap peluang diterimanya mahasiswa. Variabel gre dan gpa memiliki koefisien positif, yang menunjukkan bahwa semakin tinggi nilai GRE dan GPA maka peluang diterima semakin besar. Sementara itu, variabel rank2, rank3, dan rank4 memiliki koefisien negatif, sehingga mahasiswa dari universitas dengan peringkat lebih rendah memiliki peluang diterima yang lebih kecil dibandingkan mahasiswa dari universitas rank 1 sebagai kategori acuan.

4.5 Kecocokan Model Probit

#Memanggil package ResourceSelection
library(ResourceSelection)
# Uji Hosmer Lemeshow
hoslem.test(probit$y, fitted(probit))

## 
##  Hosmer and Lemeshow goodness of fit (GOF) test
## 
## data:  probit$y, fitted(probit)
## X-squared = 12.609, df = 8, p-value = 0.126

#Menghitung Chi-Square tabel
qchisq(0.95, 3)

## [1] 7.814728

Berdasarkan hasil uji Hosmer-Lemeshow pada model probit, diperoleh nilai χ² hitung sebesar 12.609 dengan p-value sebesar 0.126. Karena nilai p-value > 0.05, maka H0 diterima, sehingga dapat disimpulkan bahwa model probit telah sesuai (fit) dengan data dan layak digunakan untuk analisis.

4.6 Klasifikasi Probit

#Menghasilkan probabilitas prediksi
mydata$prob_probit <- predict(probit, type = "response")
#Menampilkan data
head(mydata)

##   admit gre  gpa rank      prob pred_class prob_probit
## 1     0 380 3.61    3 0.1726265          0   0.1706387
## 2     1 660 3.67    3 0.2921750          0   0.2953523
## 3     1 800 4.00    1 0.7384082          1   0.7338689
## 4     1 640 3.19    4 0.1783846          0   0.1792051
## 5     0 520 2.93    4 0.1183539          0   0.1135853
## 6     1 760 3.00    2 0.3699699          0   0.3731217

#Mengubah probabilitas menjadi kelas
mydata$pred_class<-ifelse(mydata$prob>0.5, 1, 0)
#Menampilkan hasil klasifikasi
head(mydata)

##   admit gre  gpa rank      prob pred_class prob_probit
## 1     0 380 3.61    3 0.1726265          0   0.1706387
## 2     1 660 3.67    3 0.2921750          0   0.2953523
## 3     1 800 4.00    1 0.7384082          1   0.7338689
## 4     1 640 3.19    4 0.1783846          0   0.1792051
## 5     0 520 2.93    4 0.1183539          0   0.1135853
## 6     1 760 3.00    2 0.3699699          0   0.3731217

4.7 Kinerja Model Probit

#Memanggil package caret
library(caret)
#Membuat confusion matrix
caret::confusionMatrix(
  as.factor(mydata$pred_class),
  as.factor(mydata$admit)
)

## Confusion Matrix and Statistics
## 
##           Reference
## Prediction   0   1
##          0 254  97
##          1  19  30
##                                          
##                Accuracy : 0.71           
##                  95% CI : (0.6628, 0.754)
##     No Information Rate : 0.6825         
##     P-Value [Acc > NIR] : 0.1293         
##                                          
##                   Kappa : 0.1994         
##                                          
##  Mcnemar's Test P-Value : 8.724e-13      
##                                          
##             Sensitivity : 0.9304         
##             Specificity : 0.2362         
##          Pos Pred Value : 0.7236         
##          Neg Pred Value : 0.6122         
##              Prevalence : 0.6825         
##          Detection Rate : 0.6350         
##    Detection Prevalence : 0.8775         
##       Balanced Accuracy : 0.5833         
##                                          
##        'Positive' Class : 0              
##

Berdasarkan hasil confusion matrix pada model probit, diperoleh nilai akurasi sebesar 71%, yang menunjukkan bahwa model mampu mengklasifikasikan data dengan cukup baik. Nilai sensitivitas sebesar 93,04% menunjukkan bahwa model sangat baik dalam memprediksi kelas 0 (tidak diterima), sedangkan nilai spesifisitas sebesar 23,62% menunjukkan kemampuan model dalam memprediksi kelas 1 (diterima) masih rendah.

4.8 Uji Kebaikan Model Probit

#Memanggil package modEvA
library(modEvA)
#Menghitung R-square GLM
RsqGLM(probit)

## Warning in RsqGLM(probit): this function is DEPRECATED; using pseudoRsq() instead.

## NOTE: Tjur R-squared applies only to binomial (binary, 0-1 response) models

## $CoxSnell
## [1] 0.09869212
## 
## $Nagelkerke
## [1] 0.1383253
## 
## $McFadden
## [1] 0.0831306
## 
## $Tjur
## [1] NA
## 
## $sqPearson
## [1] 0.1013327

#Memanggil package DescTools
library(DescTools)
#Menghitung Nagelkerke R-square
PseudoR2(probit, which = "Nagelkerke")

## Nagelkerke 
##  0.1383253

Berdasarkan hasil uji kebaikan model probit, diperoleh nilai Cox and Snell R² sebesar 0.0987, Nagelkerke R² sebesar 0.1383, dan McFadden R² sebesar 0.0831. Nilai Nagelkerke R² menunjukkan bahwa model mampu menjelaskan sekitar 13.83% variasi peluang diterimanya mahasiswa, sedangkan sisanya dijelaskan oleh faktor lain di luar model.

4.9 Odds Ratio

exp(coef(probit))

## (Intercept)         gre         gpa       rank2       rank3       rank4 
##  0.09192003  1.00137654  1.61241015  0.66007659  0.44390794  0.39223302

4.10 Marginal Effect Probit

#Memanggil package margins
library(margins)

## Warning: package 'margins' was built under R version 4.5.3

#Menghitung marginal effect
summary(margins(probit))

##  factor     AME     SE       z      p   lower   upper
##     gpa  0.1552 0.0628  2.4723 0.0134  0.0322  0.2783
##     gre  0.0004 0.0002  2.1486 0.0317  0.0000  0.0009
##   rank2 -0.1564 0.0736 -2.1237 0.0337 -0.3007 -0.0121
##   rank3 -0.2868 0.0734 -3.9078 0.0001 -0.4306 -0.1429
##   rank4 -0.3213 0.0799 -4.0231 0.0001 -0.4778 -0.1647

Berdasarkan hasil estimasi marginal effect, variabel gpa memiliki pengaruh positif dan signifikan terhadap probabilitas diterimanya mahasiswa. Nilai AME sebesar 0.1552 dengan p-value 0.0134 menunjukkan bahwa setiap kenaikan 1 unit GPA akan meningkatkan probabilitas diterima sebesar 15.52%, dengan asumsi variabel lain konstan. Variabel gre juga berpengaruh positif dan signifikan dengan nilai AME sebesar 0.0004 dan p-value 0.0317. Namun, meskipun signifikan secara statistik, pengaruh GRE terhadap probabilitas diterima relatif sangat kecil, yaitu hanya meningkatkan peluang diterima sebesar 0.04% untuk setiap kenaikan 1 poin GRE.

Sementara itu, variabel rank menunjukkan pengaruh negatif dan signifikan terhadap probabilitas diterima. Mahasiswa dari universitas rank 2 memiliki probabilitas diterima lebih rendah sebesar 15.64% dibandingkan rank 1. Selanjutnya, mahasiswa dari rank 3 memiliki probabilitas diterima lebih rendah sebesar 28.68%, sedangkan mahasiswa dari rank 4 memiliki probabilitas diterima lebih rendah sebesar 32.13% dibandingkan rank 1. Hasil ini menunjukkan bahwa semakin rendah kualitas atau peringkat universitas asal mahasiswa, maka probabilitas diterima juga semakin kecil.

Secara keseluruhan, hasil analisis menunjukkan bahwa variabel GPA memberikan pengaruh positif terbesar terhadap peluang diterima mahasiswa. Variabel GRE juga berpengaruh positif tetapi dengan efek yang sangat kecil. Di sisi lain, variabel rank memiliki pengaruh negatif yang cukup kuat, di mana penurunan probabilitas diterima semakin besar pada rank 3 dan rank 4. Seluruh variabel dalam model signifikan pada taraf signifikansi 5%.

5 Perbandingan Model

5.1 Perbandingan AIC

# Membandingkan nilai AIC
AIC(mylogit, probit)

##         df      AIC
## mylogit  6 470.5175
## probit   6 470.4132

Berdasarkan perbandingan nilai AIC, model regresi probit memiliki nilai AIC sebesar 470.4132, sedangkan model regresi logistik memiliki nilai AIC sebesar 470.5175. Karena model dengan nilai AIC lebih kecil dianggap lebih baik, maka model probit sedikit lebih baik dibandingkan model logistik dalam menjelaskan peluang diterimanya mahasiswa. Namun, selisih nilai AIC kedua model sangat kecil sehingga keduanya memiliki performa yang hampir sama.

5.2 Kesimpulan

Berdasarkan hasil analisis, baik model regresi logistik maupun regresi probit menunjukkan hasil yang relatif serupa dalam menganalisis peluang diterimanya mahasiswa pascasarjana. Variabel gre, gpa, dan rank terbukti berpengaruh signifikan terhadap status penerimaan mahasiswa. Variabel gre dan gpa memiliki pengaruh positif, yang berarti semakin tinggi nilai GRE dan GPA maka peluang mahasiswa untuk diterima juga semakin besar. Sebaliknya, variabel rank memiliki pengaruh negatif, sehingga mahasiswa yang berasal dari universitas dengan peringkat lebih rendah memiliki peluang diterima yang lebih kecil dibandingkan mahasiswa dari universitas rank 1.

Hasil pengujian simultan menunjukkan bahwa seluruh variabel independen secara bersama-sama berpengaruh signifikan terhadap peluang diterima mahasiswa, baik pada model logit maupun probit. Selain itu, hasil uji Hosmer-Lemeshow menunjukkan bahwa kedua model telah sesuai (fit) dengan data karena memiliki nilai p-value lebih besar dari 0.05. Nilai akurasi klasifikasi pada kedua model juga sama, yaitu sebesar 71%, sehingga keduanya memiliki kemampuan klasifikasi yang cukup baik.

Berdasarkan perbandingan nilai AIC, model probit memiliki nilai AIC sedikit lebih kecil dibandingkan model logistik, yaitu 470.4132 dibandingkan 470.5175. Hal ini menunjukkan bahwa model probit sedikit lebih baik dalam menjelaskan data. Namun, karena selisih nilai AIC kedua model sangat kecil, maka secara umum kedua model memiliki performa yang hampir sama dan sama-sama layak digunakan dalam analisis peluang diterimanya mahasiswa pascasarjana.

Perbandingan Regresi Logistik dan Regresi Probit

Nia Andini (2403111444)

2026-05-20