Kami dari kelompok T mata kuliah analisis Data Kategorik pada report ini akan menganalisis data yang diambil dari skripsi “Perbandingan Fungsi Pembobot Pada Model GWNBR dalam Kasus Demam Berdarah Dengue Di Kabupaten Mojokerto, Wardatul Magfiroh (2019)”. Dengan menggunakan data ini kami akan menganalisa pada dua tipe data yaitu dengan model regresi poisson dan distribusi binomial negatif

Model Regresi Poisson

Struktur data yang digunakan :

library(readxl)
GLM_ADK <- read_excel("GLM ADK.xlsx")
View(GLM_ADK)
GLM_ADK
## # A tibble: 18 x 7
##        Y    X1    X2    X3    X4    X5    X6
##    <dbl> <dbl> <dbl> <dbl> <dbl> <dbl> <dbl>
##  1    21  86.9  75.7  2184  76    0.05  1.71
##  2     4  90.7  23     902  63    0.09  2.26
##  3    15  94.9  68.4  1618  40.8  0.04  2.09
##  4     1  89.1  67.5  2604  36.4  0.08  2.51
##  5    20  90.8  68.2  1123  79.1  0.06  3.41
##  6     4  91.3  53.4  1350  65.6  0.17  3.37
##  7     4  89.4  64.1  1524  48.5  0.06  1.72
##  8     4  86.8  60.8  1206  42.0  0.12  2.49
##  9     8  91.3  28.3  1550  42.5  0.08  2.26
## 10     6  95.8  68.5  2198  55.5  0.15  2.37
## 11    11  79.0  75.2  3016  45.9  0.12  1.87
## 12     7  84.5  66.7  1455  69.7  0.06  1.79
## 13    10  92.6  78.2  1323  62.5  0.17  2.01
## 14    12  76.1  56.5  1642  53.3  0.9   1.9 
## 15    21  94.8  49.8  2178  38    0.06  1.55
## 16    20  80.0  74.7  3172  35.4  0.07  1.61
## 17     0 100    72.3  1048  33.8  0.08  2.88
## 18    14  83.4  55.9  1948  57.0  0.1   1.57

Setelah memanggil data lakukan analisis

library(MASS)
attach(GLM_ADK)
ModelPoisson <- glm(Y~X1+X2+X3+X4+X5+X6, data = GLM_ADK, family = poisson)
summary(ModelPoisson)
## 
## Call:
## glm(formula = Y ~ X1 + X2 + X3 + X4 + X5 + X6, family = poisson, 
##     data = GLM_ADK)
## 
## Deviance Residuals: 
##     Min       1Q   Median       3Q      Max  
## -3.2632  -1.6414  -0.2663   0.5220   3.7611  
## 
## Coefficients:
##               Estimate Std. Error z value Pr(>|z|)    
## (Intercept) -0.3858742  1.9281768  -0.200  0.84138    
## X1           0.0156957  0.0182397   0.861  0.38950    
## X2          -0.0018900  0.0064538  -0.293  0.76964    
## X3           0.0005250  0.0001923   2.731  0.00632 ** 
## X4           0.0234020  0.0066100   3.540  0.00040 ***
## X5           0.2870713  0.4904813   0.585  0.55836    
## X6          -0.3955895  0.1723514  -2.295  0.02172 *  
## ---
## Signif. codes:  0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
## 
## (Dispersion parameter for poisson family taken to be 1)
## 
##     Null deviance: 93.190  on 17  degrees of freedom
## Residual deviance: 63.158  on 11  degrees of freedom
## AIC: 144.88
## 
## Number of Fisher Scoring iterations: 5

Berdasarkan model poisson tersebut dapat kita ketahui bahwa masih terdapat beberapa variabel yang tidak berpengaruj signifikan terhadap model karena nilai p-value > 5% .

Distribusi Binomial Negatif

ModelNB <- glm.nb(Y~X1+X2+X3+X4+X5+X6, data = GLM_ADK, init.theta = 3.4686005, link = log)
summary(ModelNB)
## 
## Call:
## glm.nb(formula = Y ~ X1 + X2 + X3 + X4 + X5 + X6, data = GLM_ADK, 
##     init.theta = 3.468606147, link = log)
## 
## Deviance Residuals: 
##     Min       1Q   Median       3Q      Max  
## -2.0583  -0.9586  -0.2353   0.3316   1.7170  
## 
## Coefficients:
##               Estimate Std. Error z value Pr(>|z|)  
## (Intercept) -0.8820104  3.9689123  -0.222   0.8241  
## X1           0.0173099  0.0376903   0.459   0.6460  
## X2          -0.0026113  0.0116605  -0.224   0.8228  
## X3           0.0005906  0.0003715   1.590   0.1119  
## X4           0.0300906  0.0132460   2.272   0.0231 *
## X5           0.2936463  0.9825237   0.299   0.7650  
## X6          -0.4336999  0.3270676  -1.326   0.1848  
## ---
## Signif. codes:  0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
## 
## (Dispersion parameter for Negative Binomial(3.4686) family taken to be 1)
## 
##     Null deviance: 29.680  on 17  degrees of freedom
## Residual deviance: 20.812  on 11  degrees of freedom
## AIC: 127.02
## 
## Number of Fisher Scoring iterations: 1
## 
## 
##               Theta:  3.47 
##           Std. Err.:  1.71 
## 
##  2 x log-likelihood:  -111.019

Berdasarkan output tersebut dapat diketahui bahwa masih terdapat beberapa variabel yang tidak berpengaruj signifikan terhadap model karena nilai p-value > 5%