Dalam studi ini, dianalisis jumlah kejadian keterlambatan mahasiswa dalam satu semester (Y) sebagai data hitungan. Variabel yang diduga memengaruhi adalah jam belajar (X₁), jumlah organisasi yang diikuti (X₂), dan jarak tempat tinggal ke kampus (X₃). Semakin sedikit jam belajar, semakin banyak aktivitas organisasi, dan semakin jauh jarak tempuh diduga meningkatkan jumlah keterlambatan. Karena variabel respon berupa count data (bilangan bulat ≥ 0), maka digunakan regresi Poisson.
data <- read.csv("D:/Youtube/Regresi/Count Regression/pois.csv")
head(data)
## X X1 X2 X3 Y
## 1 1 3.4 4 3.7 12
## 2 2 3.8 4 14.3 26
## 3 3 5.6 4 5.5 5
## 4 4 4.1 0 7.7 4
## 5 5 4.1 1 1.4 0
## 6 6 5.7 0 8.7 3
model_pois <- glm(Y ~ X1 + X2 + X3,
family = poisson(link = "log"),
data = data)
summary(model_pois)
##
## Call:
## glm(formula = Y ~ X1 + X2 + X3, family = poisson(link = "log"),
## data = data)
##
## Coefficients:
## Estimate Std. Error z value Pr(>|z|)
## (Intercept) 1.564845 0.191298 8.180 2.84e-16 ***
## X1 -0.298435 0.041629 -7.169 7.56e-13 ***
## X2 0.370092 0.023726 15.599 < 2e-16 ***
## X3 0.085455 0.008384 10.193 < 2e-16 ***
## ---
## Signif. codes: 0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
##
## (Dispersion parameter for poisson family taken to be 1)
##
## Null deviance: 546.16 on 119 degrees of freedom
## Residual deviance: 112.54 on 116 degrees of freedom
## AIC: 540.33
##
## Number of Fisher Scoring iterations: 4
Berdasarkan Output diatas diperoleh persamaan sebagai berikut
\[ ln(\mu)= 1.56 -0.29X_1+0.37X_2+0.085 X_3\]
exp(coef(model_pois))
## (Intercept) X1 X2 X3
## 4.7819346 0.7419784 1.4478673 1.0892130
Nilai ini menunjukkan bahwa ketika semua variabel independen (X₁, X₂, X₃) bernilai nol, maka rata-rata jumlah kejadian (Y) adalah sekitar 4.78 kali (baseline rate).
Setiap kenaikan 1 jam belajar akan mengalikan jumlah kejadian sebesar 0.7419 kali. Artinya Terjadi penurunan sebesar (1 - 0.7419) × 100% ≈ 25.81% Semakin banyak jam belajar → keterlambatan menurun
Setiap penambahan 1 organisasi akan meningkatkan jumlah kejadian sebesar 1.4479 kali. Artinya Terjadi kenaikan sebesar (1.4479 - 1) × 100% ≈ 44.79% Semakin banyak organisasi → keterlambatan meningkat
Setiap kenaikan 1 km jarak akan meningkatkan jumlah kejadian sebesar 1.0892 kali. Artinya:Terjadi kenaikan sebesar (1.0892 - 1) × 100% ≈ 8.92% Semakin jauh jarak → keterlambatan meningkat
library(AER)
## Loading required package: car
## Loading required package: carData
## Loading required package: lmtest
## Loading required package: zoo
##
## Attaching package: 'zoo'
## The following objects are masked from 'package:base':
##
## as.Date, as.Date.numeric
## Loading required package: sandwich
## Loading required package: survival
dispersiontest(model_pois)
##
## Overdispersion test
##
## data: model_pois
## z = -1.5439, p-value = 0.9387
## alternative hypothesis: true dispersion is greater than 1
## sample estimates:
## dispersion
## 0.8434569
Karena p-value > 0.05 maka Model lolos Uji Asumsi Equidispersion
library(pscl)
## Classes and Methods for R originally developed in the
## Political Science Computational Laboratory
## Department of Political Science
## Stanford University (2002-2015),
## by and under the direction of Simon Jackman.
## hurdle and zeroinfl functions by Achim Zeileis.
pR2(model_pois)
## fitting null model for pseudo-r2
## llh llhNull G2 McFadden r2ML r2CU
## -266.1636722 -482.9731961 433.6190479 0.4489059 0.9730425 0.9733532