Library:
> # install.packages("knitr")
> # install.packages("rmarkdown")
> # install.packages("prettydoc")
> # install.packages("equatiomatic")1 PENDAHULUAN
1.1 Latar Belakang
Model Regresi Logistik merupakan alat statistik yang berguna untuk memodelkan hubungan antara variabel independen dengan variabel dependen biner, dengan fokus pada penjelasan faktor-faktor yang mempengaruhi kemungkinan kejadian atau non-kejadian suatu peristiwa. Model regresi logistik adalah model yang hanya memiliki 2 nilai yang mungkin, yaitu 0 dan 1, kondisi ini diartikan sebagai “sukses” atau “gagal” pada analisis regresi logistik (Azizah & Chandra, 2017). Model Regresi Logistik banyak digunakan dalam berbagai bidang, seperti kedokteran, ekonomi, ilmu sosial, dan kesehatan masyarakat. Fokus pada model regresi logistik dalam konteks gizi masyarakat memungkinkan untuk mengidentifikasi dan memahami pengaruh dari variabel independen, seperti pendapatan per kapita, tingkat pendidikan, dan status pekerjaan terhadap status gizi penduduk.
Dalam analisis gizi masyarakat, Model Regresi Logistik dapat memberikan wawasan yang penting tentang faktor-faktor yang berkontribusi terhadap tingkat gizi yang buruk atau baik. Dengan menggunakan model ini, kita dapat mengestimasi pengaruh masing-masing variabel independen terhadap probabilitas terjadinya status gizi tertentu. Hasil analisis ini dapat membantu dalam mengidentifikasi variabel yang paling signifikan dalam mempengaruhi status gizi, serta memahami bagaimana variabel-variabel tersebut saling berinteraksi.
Dalam konteks model regresi logistik untuk menganalisis status gizi masyarakat, dapat diharapkan bahwa pendapatan per kapita, tingkat pendidikan, dan status pekerjaan akan menjadi variabel yang signifikan dalam mempengaruhi status gizi. Pendapatan per kapita dapat mempengaruhi akses terhadap makanan bergizi, tingkat pendidikan dapat mempengaruhi pemahaman tentang gizi dan pola makan yang sehat, dan status pekerjaan dapat mencerminkan stabilitas ekonomi dan akses terhadap sumber daya gizi.
Dengan menggunakan Model Regresi Logistik, dapat disusun model yang dapat memberikan estimasi koefisien regresi dan interpretasi statistik yang membantu dalam memahami pengaruh variabel-variabel tersebut terhadap status gizi. Informasi ini dapat memberikan pemahaman yang lebih baik tentang faktor-faktor yang berperan dalam masalah gizi dan membantu dalam merancang intervensi atau kebijakan yang lebih efektif untuk meningkatkan status gizi masyarakat secara keseluruhan.
2 TINJAUAN PUSTAKA
2.1 Regresi Logistik
Regresi logistik adalah salah satu metode analisis statistik yang digunakan untuk memodelkan hubungan variabel independent terhadap variabel dependent yang bersakala data nominal/ordinal (Muflihah, 2017). Model regresi logistik yang variabel responnya memiliki dua kategori disebut model regresi logistik biner. Sedangkan model regresi logistik yang variabel responnya memiliki lebih dari dua kategori disebut model regresi logistik polytomous. Model regresi logistik biner digunakan jika variabel responnya menghasilkan dua kategori bernilai 0 dan 1, sehingga mengikuti distribusi Bernoulli. Sebaran Bernoulli.
2.2 R Square
Menghitung R square dimaksudkan untuk mengetahui persentase kekuatan hubungan antara variabel independen terhadap variabel dependen baik secara parsial maupun simultan (Kasmad dkk, 2020). Nilai R-square berkisar antara 0 hingga 1, di mana semakin tinggi nilainya, semakin baik model tersebut menjelaskan variasi dalam data. Nilai R-square 0 menunjukkan bahwa model tidak menjelaskan variabilitas sedikit pun, sementara 1 menunjukkan bahwa model mampu menjelaskan seluruh variabilitas dalam data.
2.3 Uji Signifikansi Keseluruhan Model
Pengujian signifikansi model secara keseluruhan menggunakan uji rasio likelihood. Pengujian ini dilakukan dengan cara memodelkan semua variabel prediktor yang signifikan bertujuan untuk mengetahui apakah variabel prediktor berpengaruh nyata atau tidak (Daruyani dkk, 2013).
Hipotesis :
\(H_0\): Model tidak signifkan \((β_1=β_2=...=β_i=0)\)
\(H_1:\) Model signifikan (Setidaknya terdapat satu parameter \(β_i≠0\))
Keputusan : Tolak H0 apabila nilai statistik G > \(χ^2_(db;α)\) atau p-value < \(α (0.05)\)
2.4 Uji Parsial Parameter Model
Uji Parsial digunakan untuk mengetahui peubah mana yang berpengaruh signifikan. Pada Uji Partial Ratio Likelihoodhipotesis yang digunakan sebagai berikut:
\(H_0\): Tidak terdapat pengaruh antara \(X_i\) terhadap Y (\(β_j=0, j:1,...,p)\)
\(H_1\): Setidaknya terdapat satu parameter \(β_j≠0\) yang berpengaruh terhadap Y
Keputusan : Tolak H0 apabila nilai statistik G > \(χ^2_(db;α)\) atau p-value < \(α (0.05)\)
(Prasanti dkk, 2015)
2.5 Odds Ratio
Odd ratio mengindikasikan seberapa mungkin kategori tertentu terjadi pada variabel pertama dibandingkan dengan variabel yang kedua. Karena nilai odds ratio diperoleh dari pembagian dua buah odds yang tidak pernah bersifat negatif, maka odds ratio selalu bernilai lebih dari atau sama dengan nol.Perhatikan odds ratio = 1 terjadi hanya jika kedua odds bernilai sama. Dengan demikian jika odds ratio = 1 kita katakan bahwa resiko kedua grup sama besar (Nengsih, 2013). \[ ψ=exp(β ̂_jk) \]
2.6 Uji Kelayakan Model
Uji kelayakan model digunakan untuk memvalidasi model statistik dan menentukan sejauh mana model tersebut cocok dengan data yang ada. Uji kelayakan model memberikan wawasan tentang apakah model dapat memberikan hasil yang dapat dipercaya dan dapat digunakan untuk membuat generalisasi atau prediksi. Selain itu, uji kelayakan model juga membantu dalam memperbaiki atau mengoreksi model yang tidak memenuhi asumsi yang diperlukan. Pengujian kelayakan model regresi diukur dengan memanfaatkan Hosmer and Lemeshow’s Goodness of Fit Test.
Hipotesis :
\(H_0\) : Model layak
\(H_1\) : Model tidak layak
Keputusan : Tolak \(H_0\) jika nilai p-value < \(α (0.05)\)
3 SOURCE CODE
3.1 Library
> #Menginstall package yang akan dibutuhkan untuk model regresi logistik
> library(readr)
> library(generalhoslem)
> library(pscl)> # Library
> # install.packages("readr")
> # install.packages("generalhoslem")
> # install.packages("pscl")3.2 Data
Data yang digunakan berasal dari skripsi dengan judul “MODEL REGRESI LOGISTIK UNTUK MENUNJUKKAN PENGARUH PENDAPATAN PER KAPITA, TINGKAT PENDIDIKAN, DAN STATUS PEKERJAAN TERHADAP STATUS GIZI MASYARAKAT KOTA SURAKARTA”
Keterangan :
Y : Status Gizi (0 : Gizi kurang & 1 : Gizi Normal atau Berlebih)
X1 : Pendapatan per kaptita (interval)
X2 : Tingkat Pendidikan
0 : Tidak Sekolah
1 : SD
2 : SMP
3 : SMA
4 : Perguruan Tinggi
X3 : Status Pekerjaan
0 : Tidak Bekerja
1 : Buruh
2 : Wiraswasta
3 : Swasta
4 : PNS
> #Mengimport data
> dataproject <- read_csv("D:/PUNYA SOFHIA/KULIAH/SEMESTER 4/PRAKTIKUM KOMSTAT/dataproject.csv")
> str(dataproject)
spc_tbl_ [41 × 4] (S3: spec_tbl_df/tbl_df/tbl/data.frame)
$ status_gizi : num [1:41] 1 0 1 0 1 1 1 1 1 0 ...
$ pendapatan : num [1:41] 163 201 1167 400 625 ...
$ tingkat_pendidikan: num [1:41] 3 3 4 4 4 3 2 3 3 3 ...
$ status_pekerjaan : num [1:41] 2 2 3 0 4 2 2 3 2 3 ...
- attr(*, "spec")=
.. cols(
.. status_gizi = col_double(),
.. pendapatan = col_double(),
.. tingkat_pendidikan = col_double(),
.. status_pekerjaan = col_double()
.. )
- attr(*, "problems")=<externalptr>
> Y <- as.factor(dataproject$status_gizi)
> X1 <- dataproject$pendapatan
> X2 <- as.factor(dataproject$tingkat_pendidikan)
> X3 <- as.factor(dataproject$status_pekerjaan)
> str(Y)
Factor w/ 2 levels "0","1": 2 1 2 1 2 2 2 2 2 1 ...Data yang sudah ada pada file CSV diberi nama ‘dataproject’. Setelah itu, nama kolomnya diubah dan diberi inisial Y, X1, X2, dan X3. Tujuannya adalah untuk mempermudah dan mempersingkat selama pengodingan.
> #Membentuk data frame
> df_project<-data.frame(X1,X2,X3,Y)
> str(df_project)
'data.frame': 41 obs. of 4 variables:
$ X1: num 163 201 1167 400 625 ...
$ X2: Factor w/ 5 levels "0","1","2","3",..: 4 4 5 5 5 4 3 4 4 4 ...
$ X3: Factor w/ 5 levels "0","1","2","3",..: 3 3 4 1 5 3 3 4 3 4 ...
$ Y : Factor w/ 2 levels "0","1": 2 1 2 1 2 2 2 2 2 1 ...Setelah nama kolom sudah didefinisikan sebelumnya, maka dibuat dalam data frame yang diberi nama ‘df_project’.
3.2.1 Analisis Regresi Logistik
> #Analisis Regresi Logistik
> reglogistik<-glm(Y~X1+X2+X3,family=binomial,data=df_project)
> summary(reglogistik)
Call:
glm(formula = Y ~ X1 + X2 + X3, family = binomial, data = df_project)
Deviance Residuals:
Min 1Q Median 3Q Max
-2.1801 0.0000 0.4283 0.8360 1.2400
Coefficients:
Estimate Std. Error z value Pr(>|z|)
(Intercept) 1.699e+01 1.075e+04 0.002 0.999
X1 1.318e-03 1.424e-03 0.925 0.355
X21 -1.901e+01 1.585e+04 -0.001 0.999
X22 2.891e-01 1.138e+04 0.000 1.000
X23 -1.930e+01 1.075e+04 -0.002 0.999
X24 -1.770e+01 1.075e+04 -0.002 0.999
X31 2.057e+01 4.448e+03 0.005 0.996
X32 1.946e+00 2.199e+00 0.885 0.376
X33 2.519e+00 2.016e+00 1.249 0.212
X34 1.664e+00 1.816e+00 0.916 0.360
(Dispersion parameter for binomial family taken to be 1)
Null deviance: 43.156 on 40 degrees of freedom
Residual deviance: 33.783 on 31 degrees of freedom
AIC: 53.783
Number of Fisher Scoring iterations: 183.2.2 R square
> #R square
> reg_1 <- lm(X1~X2+X3, data=df_project)
> summary(reg_1)
Call:
lm(formula = X1 ~ X2 + X3, data = df_project)
Residuals:
Min 1Q Median 3Q Max
-459.94 -176.94 -56.34 148.92 935.03
Coefficients:
Estimate Std. Error t value Pr(>|t|)
(Intercept) 390.82 415.19 0.941 0.354
X21 540.81 511.78 1.057 0.299
X22 -69.86 378.61 -0.185 0.855
X23 89.97 354.63 0.254 0.801
X24 162.20 381.99 0.425 0.674
X31 -164.63 267.99 -0.614 0.543
X32 84.18 255.37 0.330 0.744
X33 -20.85 222.76 -0.094 0.926
X34 231.06 224.86 1.028 0.312
Residual standard error: 327.4 on 32 degrees of freedom
Multiple R-squared: 0.2503, Adjusted R-squared: 0.06286
F-statistic: 1.335 on 8 and 32 DF, p-value: 0.26223.2.3 Uji Signifikansi Keseluruhan Model
> #Uji Signifikansi Keseluruhan Model
> pR2(reglogistik)
fitting null model for pseudo-r2
llh llhNull G2 McFadden r2ML r2CU
-16.8914996 -21.5778846 9.3727701 0.2171846 0.2043566 0.3139292
> qchisq(0.95,2)
[1] 5.9914653.2.4 Uji Parsial Parameter Model
> #Uji Parsial Parameter Model
> summary(reglogistik)
Call:
glm(formula = Y ~ X1 + X2 + X3, family = binomial, data = df_project)
Deviance Residuals:
Min 1Q Median 3Q Max
-2.1801 0.0000 0.4283 0.8360 1.2400
Coefficients:
Estimate Std. Error z value Pr(>|z|)
(Intercept) 1.699e+01 1.075e+04 0.002 0.999
X1 1.318e-03 1.424e-03 0.925 0.355
X21 -1.901e+01 1.585e+04 -0.001 0.999
X22 2.891e-01 1.138e+04 0.000 1.000
X23 -1.930e+01 1.075e+04 -0.002 0.999
X24 -1.770e+01 1.075e+04 -0.002 0.999
X31 2.057e+01 4.448e+03 0.005 0.996
X32 1.946e+00 2.199e+00 0.885 0.376
X33 2.519e+00 2.016e+00 1.249 0.212
X34 1.664e+00 1.816e+00 0.916 0.360
(Dispersion parameter for binomial family taken to be 1)
Null deviance: 43.156 on 40 degrees of freedom
Residual deviance: 33.783 on 31 degrees of freedom
AIC: 53.783
Number of Fisher Scoring iterations: 183.2.5 Odds Ratio
> #Odds Ratio
> beta<-(coef(reglogistik))
> beta
(Intercept) X1 X21 X22 X23
16.994439845 0.001318063 -19.014246811 0.289135630 -19.300697235
X24 X31 X32 X33 X34
-17.697626312 20.574921363 1.945548895 2.518688480 1.664177334
> OR_beta<-exp(beta)
> OR_beta
(Intercept) X1 X21 X22 X23 X24
2.402102e+07 1.001319e+00 5.523540e-09 1.335273e+00 4.147761e-09 2.060718e-08
X31 X32 X33 X34
8.621341e+08 6.997472e+00 1.241231e+01 5.281327e+00
> cbind(beta,OR_beta)
beta OR_beta
(Intercept) 16.994439845 2.402102e+07
X1 0.001318063 1.001319e+00
X21 -19.014246811 5.523540e-09
X22 0.289135630 1.335273e+00
X23 -19.300697235 4.147761e-09
X24 -17.697626312 2.060718e-08
X31 20.574921363 8.621341e+08
X32 1.945548895 6.997472e+00
X33 2.518688480 1.241231e+01
X34 1.664177334 5.281327e+003.2.6 Membentuk Klasifikasi
> #Membentuk klasifikasi
> yp_hat<-fitted(reglogistik)
> df_project$yp_hat<-yp_hat
> df_project
X1 X2 X3 Y yp_hat
1 163 3 2 1 0.4635985
2 201 3 2 0 0.4760738
3 1167 4 3 1 0.9662252
4 400 4 0 0 0.4561228
5 625 4 4 1 0.8562861
6 1500 3 2 1 0.8342961
7 116 2 2 1 1.0000000
8 283 3 3 1 0.6423188
9 750 3 2 1 0.6519992
10 0 3 3 0 0.5529090
11 500 3 2 0 0.5740325
12 525 4 4 1 0.8392926
13 360 2 0 1 1.0000000
14 1000 4 4 0 0.9071273
15 540 3 3 0 0.7158941
16 800 3 3 0 0.7802084
17 363 2 3 1 1.0000000
18 1000 4 4 1 0.9071273
19 325 3 4 0 0.4467750
20 500 3 3 1 0.7050499
21 100 2 1 1 1.0000000
22 120 3 1 1 1.0000000
23 375 3 3 1 0.6696726
24 500 2 1 1 1.0000000
25 767 1 1 1 1.0000000
26 200 2 3 1 1.0000000
27 267 3 3 1 0.6374593
28 300 3 3 1 0.6474502
29 350 3 3 1 0.6623430
30 475 0 2 1 1.0000000
31 1325 3 4 1 0.7510748
32 357 4 4 1 0.8071410
33 225 3 1 1 1.0000000
34 400 4 3 1 0.9123544
35 667 4 0 1 0.5438772
36 933 4 4 1 0.8994152
37 333 4 3 1 0.9050308
38 625 3 3 0 0.7381201
39 500 3 3 1 0.7050499
40 713 3 3 1 0.7599143
41 750 3 4 1 0.5857606
> kelas<-table(df_project$Y,df_project$yp_hat>0.5)
> kelas
FALSE TRUE
0 3 6
1 1 313.2.7 Uji Kelayakan Model
> #Uji Kelayakan Model
> logitgof(df_project$Y,fitted(reglogistik))
Hosmer and Lemeshow test (binary model)
data: df_project$Y, fitted(reglogistik)
X-squared = 5.9108, df = 8, p-value = 0.65724 HASIL DAN PEMBAHASAN
4.1 Analisis Regresi Logistik
> #Analisis Regresi Logistik
> reglogistik<-glm(Y~X1+X2+X3,family=binomial,data=df_project)
> summary(reglogistik)
Call:
glm(formula = Y ~ X1 + X2 + X3, family = binomial, data = df_project)
Deviance Residuals:
Min 1Q Median 3Q Max
-2.1801 0.0000 0.4283 0.8360 1.2400
Coefficients:
Estimate Std. Error z value Pr(>|z|)
(Intercept) 1.699e+01 1.075e+04 0.002 0.999
X1 1.318e-03 1.424e-03 0.925 0.355
X21 -1.901e+01 1.585e+04 -0.001 0.999
X22 2.891e-01 1.138e+04 0.000 1.000
X23 -1.930e+01 1.075e+04 -0.002 0.999
X24 -1.770e+01 1.075e+04 -0.002 0.999
X31 2.057e+01 4.448e+03 0.005 0.996
X32 1.946e+00 2.199e+00 0.885 0.376
X33 2.519e+00 2.016e+00 1.249 0.212
X34 1.664e+00 1.816e+00 0.916 0.360
(Dispersion parameter for binomial family taken to be 1)
Null deviance: 43.156 on 40 degrees of freedom
Residual deviance: 33.783 on 31 degrees of freedom
AIC: 53.783
Number of Fisher Scoring iterations: 18Dari output yang diperoleh, maka didapatkan model regresi logistik \[g(x) = 16.99 + 0.00138X1 - 19.01X21 + 0.2891X22 - 19.30X23 - 17.70X24 + 20.57X31 + 1.946X32 + 2.519X33 + 1.664X34\]
4.2 R square
> #R square
> reg_1 <- lm(X1~X2+X3, data=df_project)
> summary(reg_1)
Call:
lm(formula = X1 ~ X2 + X3, data = df_project)
Residuals:
Min 1Q Median 3Q Max
-459.94 -176.94 -56.34 148.92 935.03
Coefficients:
Estimate Std. Error t value Pr(>|t|)
(Intercept) 390.82 415.19 0.941 0.354
X21 540.81 511.78 1.057 0.299
X22 -69.86 378.61 -0.185 0.855
X23 89.97 354.63 0.254 0.801
X24 162.20 381.99 0.425 0.674
X31 -164.63 267.99 -0.614 0.543
X32 84.18 255.37 0.330 0.744
X33 -20.85 222.76 -0.094 0.926
X34 231.06 224.86 1.028 0.312
Residual standard error: 327.4 on 32 degrees of freedom
Multiple R-squared: 0.2503, Adjusted R-squared: 0.06286
F-statistic: 1.335 on 8 and 32 DF, p-value: 0.2622Dari output, didapatkan Nilai R-square sebesar 0.2503 menunjukkan bahwa sekitar 25.03% variasi dalam X1 dapat dijelaskan oleh variabel X2 dan X3 dalam model. Nilai Adjusted R-square sebesar 0.06286 menunjukkan bahwa sekitar 6.29% variasi dalam X1 dapat dijelaskan oleh variabel X2 dan X3 dalam model setelah mempertimbangkan jumlah variabel independen dan ukuran sampel.
Artinya, model regresi ini memiliki kemampuan yang terbatas dalam menjelaskan variasi dalam variabel dependen X1 dengan menggunakan variabel independen X2 dan X3. Dalam hal ini, sekitar 25.03% variasi dalam X1 dapat dijelaskan oleh model regresi ini.
4.3 Uji Signifikansi Keseluruhan Model
> #Uji Signifikansi Keseluruhan Model
> pR2(reglogistik)
fitting null model for pseudo-r2
llh llhNull G2 McFadden r2ML r2CU
-16.8914996 -21.5778846 9.3727701 0.2171846 0.2043566 0.3139292
> qchisq(0.95,2)
[1] 5.991465Keputusan : Statistik Uji (\(G^2 = 9.37277\)) > (\(χ^2_(2;0.95) = 5.99146\)) maka tolak \(H_0\) Kesimpulan : Dengan taraf nyata 5% dapat disimpulkan bahwa model linear logistik tersebut signifikan atau setidaknya terdapat satu variabel yang berpengaruh terhadap status gizi (Y).
4.4 Uji Parsial Parameter Model
> #Uji Parsial Parameter Model
> summary(reglogistik)
Call:
glm(formula = Y ~ X1 + X2 + X3, family = binomial, data = df_project)
Deviance Residuals:
Min 1Q Median 3Q Max
-2.1801 0.0000 0.4283 0.8360 1.2400
Coefficients:
Estimate Std. Error z value Pr(>|z|)
(Intercept) 1.699e+01 1.075e+04 0.002 0.999
X1 1.318e-03 1.424e-03 0.925 0.355
X21 -1.901e+01 1.585e+04 -0.001 0.999
X22 2.891e-01 1.138e+04 0.000 1.000
X23 -1.930e+01 1.075e+04 -0.002 0.999
X24 -1.770e+01 1.075e+04 -0.002 0.999
X31 2.057e+01 4.448e+03 0.005 0.996
X32 1.946e+00 2.199e+00 0.885 0.376
X33 2.519e+00 2.016e+00 1.249 0.212
X34 1.664e+00 1.816e+00 0.916 0.360
(Dispersion parameter for binomial family taken to be 1)
Null deviance: 43.156 on 40 degrees of freedom
Residual deviance: 33.783 on 31 degrees of freedom
AIC: 53.783
Number of Fisher Scoring iterations: 18Keputusan : Karena p-value dari Pendapatan (X1) 0.355 > α(0.05) maka terima \(H_0\)
Kesimpulan : Dengan taraf nyata 5% maka dapat disimpulkan bahwa pendapatan (X1) tidak berpengaruh signifikan terhadap status gizi (Y).
4.5 Odds Ratio
> #Odds Ratio
> beta<-(coef(reglogistik))
> beta
(Intercept) X1 X21 X22 X23
16.994439845 0.001318063 -19.014246811 0.289135630 -19.300697235
X24 X31 X32 X33 X34
-17.697626312 20.574921363 1.945548895 2.518688480 1.664177334
> OR_beta<-exp(beta)
> OR_beta
(Intercept) X1 X21 X22 X23 X24
2.402102e+07 1.001319e+00 5.523540e-09 1.335273e+00 4.147761e-09 2.060718e-08
X31 X32 X33 X34
8.621341e+08 6.997472e+00 1.241231e+01 5.281327e+00
> cbind(beta,OR_beta)
beta OR_beta
(Intercept) 16.994439845 2.402102e+07
X1 0.001318063 1.001319e+00
X21 -19.014246811 5.523540e-09
X22 0.289135630 1.335273e+00
X23 -19.300697235 4.147761e-09
X24 -17.697626312 2.060718e-08
X31 20.574921363 8.621341e+08
X32 1.945548895 6.997472e+00
X33 2.518688480 1.241231e+01
X34 1.664177334 5.281327e+00- Pendapatan (X1) Apabila pendapatan bertambah 1 satuan, maka kecenderungan status gizi normal meningkat 1.00132 atau sekitar 1 kali lipat
> #Membentuk klasifikasi
> yp_hat<-fitted(reglogistik)
> df_project$yp_hat<-yp_hat
> df_project
X1 X2 X3 Y yp_hat
1 163 3 2 1 0.4635985
2 201 3 2 0 0.4760738
3 1167 4 3 1 0.9662252
4 400 4 0 0 0.4561228
5 625 4 4 1 0.8562861
6 1500 3 2 1 0.8342961
7 116 2 2 1 1.0000000
8 283 3 3 1 0.6423188
9 750 3 2 1 0.6519992
10 0 3 3 0 0.5529090
11 500 3 2 0 0.5740325
12 525 4 4 1 0.8392926
13 360 2 0 1 1.0000000
14 1000 4 4 0 0.9071273
15 540 3 3 0 0.7158941
16 800 3 3 0 0.7802084
17 363 2 3 1 1.0000000
18 1000 4 4 1 0.9071273
19 325 3 4 0 0.4467750
20 500 3 3 1 0.7050499
21 100 2 1 1 1.0000000
22 120 3 1 1 1.0000000
23 375 3 3 1 0.6696726
24 500 2 1 1 1.0000000
25 767 1 1 1 1.0000000
26 200 2 3 1 1.0000000
27 267 3 3 1 0.6374593
28 300 3 3 1 0.6474502
29 350 3 3 1 0.6623430
30 475 0 2 1 1.0000000
31 1325 3 4 1 0.7510748
32 357 4 4 1 0.8071410
33 225 3 1 1 1.0000000
34 400 4 3 1 0.9123544
35 667 4 0 1 0.5438772
36 933 4 4 1 0.8994152
37 333 4 3 1 0.9050308
38 625 3 3 0 0.7381201
39 500 3 3 1 0.7050499
40 713 3 3 1 0.7599143
41 750 3 4 1 0.5857606
> kelas<-table(df_project$Y,df_project$yp_hat>0.5)
> kelas
FALSE TRUE
0 3 6
1 1 31- Dari 9 amatan dengan Y=0 (gizi tidak normal), terdapat 6 yang diklasifikasikan dengan benar
- Dari 32 amatan dengan Y=1 (gizi normal), terdapat 31 diantaranya diklasifikasikan dengan benar
- Tingkat akurasi model sebesar \((3+31)/41*100%\) = 89%
4.6 Uji Kelayakan Model
> #Uji Kelayakan Model
> logitgof(df_project$Y,fitted(reglogistik))
Hosmer and Lemeshow test (binary model)
data: df_project$Y, fitted(reglogistik)
X-squared = 5.9108, df = 8, p-value = 0.6572Keputusan : Karena p-value(0.6572) > α(0.05) maka terima \(H_0\)
Kesimpulan : Dengan taraf nyata 5% dapat disimpulkan bahwa model yang terbentuk layak digunakan.
5 KESIMPULAN
- Dapat diketahui model regresi logistik pada kasus ini : \[g(x) = 16.99 + 0.00138X_1 - 19.01X_21 + 0.2891X_22 - 19.30X_23 - 17.70X_24 + 20.57X_31 + 1.946X_32 + 2.519X_33 + 1.664X_34\] model tersebut sudah terbukti layak digunakan.
- Pendapatan per kapita tidak berpengaruh secara signifikan terhadap status gizi. Perlu dilakukan uji lebih lanjut untuk mengetahui variabel mana yang berpengaruh signifikan terhadap status gizi,
6 DAFTAR PUSTAKA
Azizah, S. M., & Chandra, N. E. (2017). MODEL REGRESI LOGISTIK PADA FAKTOR-FAKTOR YANGMEMPENGARUHI IMUNISASI LENGKAP BALITA. Ilmiah Teknosains, 73-76.
Carolina, J., L., V. C., & Tobing. (2019). PENGARUH PROFITABILITAS, LIKUIDITAS, SOLVABILITASDAN UKURAN PERUSAHAAN TERHADAP KETEPATAN WAKTUPENYAMPAIAN LAPORAN KEUANGAN PADA PERUSAHAAN MANUFAKTUR DI BEI. AKUNTANSI BARELANG, 45-54.
Kasmad, Ahidin, U., Jati, W., Rusnaeni, N., Jamaludin, & Hanny, R. (2020). Membangkitkan Kreativitas Mahasiswa Pada Masa Dan Pasca Pandemi COVID-19. Tangerang: The Department of Management, The Faculty of Economic, Pamulang University.
Muflihah, I. Z. (2017). ANALISIS FINANCIAL DISTRESS PERUSAHAAN MANUFAKTUR DI INDONESIAdengan REGRESI LOGISTIK. Majalah Ekonomi , 254-269.
Nengsih, T. A. (2013). Analisis Minat Masyarakat Terhadap Baitul Mal Watamwil di Kota Jambi . Ekonomi Islam, 33-38.
Prasanti, T. A., Wuryandari, T., & Rusgiyono, A. (2015). APLIKASI REGRESI DATA PANEL UNTUK PEMODELAN TINGKAT PENGANGGURAN TERBUKA KABUPATEN/KOTADI PROVINSI JAWA TENGAH. GAUSSIAN, 687-696.