Dalam studi ini, dianalisis jumlah kejadian keterlambatan mahasiswa dalam satu semester (Y) sebagai data hitungan. Variabel yang diduga memengaruhi adalah jam belajar (X₁), jumlah organisasi yang diikuti (X₂), dan jarak tempat tinggal ke kampus (X₃). Semakin sedikit jam belajar, semakin banyak aktivitas organisasi, dan semakin jauh jarak tempuh diduga meningkatkan jumlah keterlambatan. Karena variabel respon berupa count data (bilangan bulat ≥ 0), maka digunakan regresi Poisson.

Load Data

data <- read.csv("D:/Youtube/Regresi/Count Regression/pois.csv")

head(data)
##   X  X1 X2   X3  Y
## 1 1 3.4  4  3.7 12
## 2 2 3.8  4 14.3 26
## 3 3 5.6  4  5.5  5
## 4 4 4.1  0  7.7  4
## 5 5 4.1  1  1.4  0
## 6 6 5.7  0  8.7  3

Pembentukan Model Regresi Poisson

model_pois <- glm(Y ~ X1 + X2 + X3,
                  family = poisson(link = "log"),
                  data = data)

summary(model_pois)
## 
## Call:
## glm(formula = Y ~ X1 + X2 + X3, family = poisson(link = "log"), 
##     data = data)
## 
## Coefficients:
##              Estimate Std. Error z value Pr(>|z|)    
## (Intercept)  1.564845   0.191298   8.180 2.84e-16 ***
## X1          -0.298435   0.041629  -7.169 7.56e-13 ***
## X2           0.370092   0.023726  15.599  < 2e-16 ***
## X3           0.085455   0.008384  10.193  < 2e-16 ***
## ---
## Signif. codes:  0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
## 
## (Dispersion parameter for poisson family taken to be 1)
## 
##     Null deviance: 546.16  on 119  degrees of freedom
## Residual deviance: 112.54  on 116  degrees of freedom
## AIC: 540.33
## 
## Number of Fisher Scoring iterations: 4

Berdasarkan Output diatas diperoleh persamaan sebagai berikut

\[ ln(\mu)= 1.56 -0.29X_1+0.37X_2+0.085 X_3\]

exp(coef(model_pois))
## (Intercept)          X1          X2          X3 
##   4.7819346   0.7419784   1.4478673   1.0892130

Intercept (4.7819)

Nilai ini menunjukkan bahwa ketika semua variabel independen (X₁, X₂, X₃) bernilai nol, maka rata-rata jumlah kejadian (Y) adalah sekitar 4.78 kali (baseline rate).

X₁ (Jam Belajar) = 0.7419

Setiap kenaikan 1 jam belajar akan mengalikan jumlah kejadian sebesar 0.7419 kali. Artinya Terjadi penurunan sebesar (1 - 0.7419) × 100% ≈ 25.81% Semakin banyak jam belajar → keterlambatan menurun

X₂ (Jumlah Organisasi) = 1.4479

Setiap penambahan 1 organisasi akan meningkatkan jumlah kejadian sebesar 1.4479 kali. Artinya Terjadi kenaikan sebesar (1.4479 - 1) × 100% ≈ 44.79% Semakin banyak organisasi → keterlambatan meningkat

X₃ (Jarak) = 1.0892

Setiap kenaikan 1 km jarak akan meningkatkan jumlah kejadian sebesar 1.0892 kali. Artinya:Terjadi kenaikan sebesar (1.0892 - 1) × 100% ≈ 8.92% Semakin jauh jarak → keterlambatan meningkat

Uji Asumsi Equidispersion

library(AER)
## Loading required package: car
## Loading required package: carData
## Loading required package: lmtest
## Loading required package: zoo
## 
## Attaching package: 'zoo'
## The following objects are masked from 'package:base':
## 
##     as.Date, as.Date.numeric
## Loading required package: sandwich
## Loading required package: survival
dispersiontest(model_pois)
## 
##  Overdispersion test
## 
## data:  model_pois
## z = -1.5439, p-value = 0.9387
## alternative hypothesis: true dispersion is greater than 1
## sample estimates:
## dispersion 
##  0.8434569

Karena p-value > 0.05 maka Model lolos Uji Asumsi Equidispersion

Pseudo R²

library(pscl)
## Classes and Methods for R originally developed in the
## Political Science Computational Laboratory
## Department of Political Science
## Stanford University (2002-2015),
## by and under the direction of Simon Jackman.
## hurdle and zeroinfl functions by Achim Zeileis.
pR2(model_pois)
## fitting null model for pseudo-r2
##          llh      llhNull           G2     McFadden         r2ML         r2CU 
## -266.1636722 -482.9731961  433.6190479    0.4489059    0.9730425    0.9733532