Library:

> # install.packages("knitr")
> # install.packages("rmarkdown")
> # install.packages("prettydoc")
> # install.packages("equatiomatic")

1 PENDAHULUAN

1.1 Latar Belakang

Model Regresi Logistik merupakan alat statistik yang berguna untuk memodelkan hubungan antara variabel independen dengan variabel dependen biner, dengan fokus pada penjelasan faktor-faktor yang mempengaruhi kemungkinan kejadian atau non-kejadian suatu peristiwa. Model regresi logistik adalah model yang hanya memiliki 2 nilai yang mungkin, yaitu 0 dan 1, kondisi ini diartikan sebagai “sukses” atau “gagal” pada analisis regresi logistik (Azizah & Chandra, 2017). Model Regresi Logistik banyak digunakan dalam berbagai bidang, seperti kedokteran, ekonomi, ilmu sosial, dan kesehatan masyarakat. Fokus pada model regresi logistik dalam konteks gizi masyarakat memungkinkan untuk mengidentifikasi dan memahami pengaruh dari variabel independen, seperti pendapatan per kapita, tingkat pendidikan, dan status pekerjaan terhadap status gizi penduduk.

Dalam analisis gizi masyarakat, Model Regresi Logistik dapat memberikan wawasan yang penting tentang faktor-faktor yang berkontribusi terhadap tingkat gizi yang buruk atau baik. Dengan menggunakan model ini, kita dapat mengestimasi pengaruh masing-masing variabel independen terhadap probabilitas terjadinya status gizi tertentu. Hasil analisis ini dapat membantu dalam mengidentifikasi variabel yang paling signifikan dalam mempengaruhi status gizi, serta memahami bagaimana variabel-variabel tersebut saling berinteraksi.

Dalam konteks model regresi logistik untuk menganalisis status gizi masyarakat, dapat diharapkan bahwa pendapatan per kapita, tingkat pendidikan, dan status pekerjaan akan menjadi variabel yang signifikan dalam mempengaruhi status gizi. Pendapatan per kapita dapat mempengaruhi akses terhadap makanan bergizi, tingkat pendidikan dapat mempengaruhi pemahaman tentang gizi dan pola makan yang sehat, dan status pekerjaan dapat mencerminkan stabilitas ekonomi dan akses terhadap sumber daya gizi.

Dengan menggunakan Model Regresi Logistik, dapat disusun model yang dapat memberikan estimasi koefisien regresi dan interpretasi statistik yang membantu dalam memahami pengaruh variabel-variabel tersebut terhadap status gizi. Informasi ini dapat memberikan pemahaman yang lebih baik tentang faktor-faktor yang berperan dalam masalah gizi dan membantu dalam merancang intervensi atau kebijakan yang lebih efektif untuk meningkatkan status gizi masyarakat secara keseluruhan.

2 TINJAUAN PUSTAKA

2.1 Regresi Logistik

Regresi logistik adalah salah satu metode analisis statistik yang digunakan untuk memodelkan hubungan variabel independent terhadap variabel dependent yang bersakala data nominal/ordinal (Muflihah, 2017). Model regresi logistik yang variabel responnya memiliki dua kategori disebut model regresi logistik biner. Sedangkan model regresi logistik yang variabel responnya memiliki lebih dari dua kategori disebut model regresi logistik polytomous. Model regresi logistik biner digunakan jika variabel responnya menghasilkan dua kategori bernilai 0 dan 1, sehingga mengikuti distribusi Bernoulli. Sebaran Bernoulli.

2.2 R Square

Menghitung R square dimaksudkan untuk mengetahui persentase kekuatan hubungan antara variabel independen terhadap variabel dependen baik secara parsial maupun simultan (Kasmad dkk, 2020). Nilai R-square berkisar antara 0 hingga 1, di mana semakin tinggi nilainya, semakin baik model tersebut menjelaskan variasi dalam data. Nilai R-square 0 menunjukkan bahwa model tidak menjelaskan variabilitas sedikit pun, sementara 1 menunjukkan bahwa model mampu menjelaskan seluruh variabilitas dalam data.

2.3 Uji Signifikansi Keseluruhan Model

Pengujian signifikansi model secara keseluruhan menggunakan uji rasio likelihood. Pengujian ini dilakukan dengan cara memodelkan semua variabel prediktor yang signifikan bertujuan untuk mengetahui apakah variabel prediktor berpengaruh nyata atau tidak (Daruyani dkk, 2013).

Hipotesis :

\(H_0\): Model tidak signifkan \((β_1=β_2=...=β_i=0)\)

\(H_1:\) Model signifikan (Setidaknya terdapat satu parameter \(β_i≠0\))

Keputusan : Tolak H0 apabila nilai statistik G > \(χ^2_(db;α)\) atau p-value < \(α (0.05)\)

2.4 Uji Parsial Parameter Model

Uji Parsial digunakan untuk mengetahui peubah mana yang berpengaruh signifikan. Pada Uji Partial Ratio Likelihoodhipotesis yang digunakan sebagai berikut:

\(H_0\): Tidak terdapat pengaruh antara \(X_i\) terhadap Y (\(β_j=0, j:1,...,p)\)

\(H_1\): Setidaknya terdapat satu parameter \(β_j≠0\) yang berpengaruh terhadap Y

Keputusan : Tolak H0 apabila nilai statistik G > \(χ^2_(db;α)\) atau p-value < \(α (0.05)\)

(Prasanti dkk, 2015)

2.5 Odds Ratio

Odd ratio mengindikasikan seberapa mungkin kategori tertentu terjadi pada variabel pertama dibandingkan dengan variabel yang kedua. Karena nilai odds ratio diperoleh dari pembagian dua buah odds yang tidak pernah bersifat negatif, maka odds ratio selalu bernilai lebih dari atau sama dengan nol.Perhatikan odds ratio = 1 terjadi hanya jika kedua odds bernilai sama. Dengan demikian jika odds ratio = 1 kita katakan bahwa resiko kedua grup sama besar (Nengsih, 2013). \[ ψ=exp⁡(β ̂_jk) \]

2.6 Uji Kelayakan Model

Uji kelayakan model digunakan untuk memvalidasi model statistik dan menentukan sejauh mana model tersebut cocok dengan data yang ada. Uji kelayakan model memberikan wawasan tentang apakah model dapat memberikan hasil yang dapat dipercaya dan dapat digunakan untuk membuat generalisasi atau prediksi. Selain itu, uji kelayakan model juga membantu dalam memperbaiki atau mengoreksi model yang tidak memenuhi asumsi yang diperlukan. Pengujian kelayakan model regresi diukur dengan memanfaatkan Hosmer and Lemeshow’s Goodness of Fit Test.

Hipotesis :

\(H_0\) : Model layak

\(H_1\) : Model tidak layak

Keputusan : Tolak \(H_0\) jika nilai p-value < \(α (0.05)\)

3 SOURCE CODE

3.1 Library

> #Menginstall package yang akan dibutuhkan untuk model regresi logistik
> library(readr)
> library(generalhoslem)
> library(pscl)

> # Library
> # install.packages("readr")
> # install.packages("generalhoslem")
> # install.packages("pscl")

3.2 Data

Data yang digunakan berasal dari skripsi dengan judul “MODEL REGRESI LOGISTIK UNTUK MENUNJUKKAN PENGARUH PENDAPATAN PER KAPITA, TINGKAT PENDIDIKAN, DAN STATUS PEKERJAAN TERHADAP STATUS GIZI MASYARAKAT KOTA SURAKARTA”

Keterangan :

Y : Status Gizi (0 : Gizi kurang & 1 : Gizi Normal atau Berlebih)
X1 : Pendapatan per kaptita (interval)
X2 : Tingkat Pendidikan

0 : Tidak Sekolah

1 : SD

2 : SMP

3 : SMA

4 : Perguruan Tinggi
X3 : Status Pekerjaan

0 : Tidak Bekerja

1 : Buruh

2 : Wiraswasta

3 : Swasta

4 : PNS

> #Mengimport data
> dataproject <- read_csv("D:/PUNYA SOFHIA/KULIAH/SEMESTER 4/PRAKTIKUM KOMSTAT/dataproject.csv")
> str(dataproject)
spc_tbl_ [41 × 4] (S3: spec_tbl_df/tbl_df/tbl/data.frame)
 $ status_gizi       : num [1:41] 1 0 1 0 1 1 1 1 1 0 ...
 $ pendapatan        : num [1:41] 163 201 1167 400 625 ...
 $ tingkat_pendidikan: num [1:41] 3 3 4 4 4 3 2 3 3 3 ...
 $ status_pekerjaan  : num [1:41] 2 2 3 0 4 2 2 3 2 3 ...
 - attr(*, "spec")=
  .. cols(
  ..   status_gizi = col_double(),
  ..   pendapatan = col_double(),
  ..   tingkat_pendidikan = col_double(),
  ..   status_pekerjaan = col_double()
  .. )
 - attr(*, "problems")=<externalptr> 
> Y <- as.factor(dataproject$status_gizi)
> X1 <- dataproject$pendapatan
> X2 <- as.factor(dataproject$tingkat_pendidikan)
> X3 <- as.factor(dataproject$status_pekerjaan)
> str(Y)
 Factor w/ 2 levels "0","1": 2 1 2 1 2 2 2 2 2 1 ...

Data yang sudah ada pada file CSV diberi nama ‘dataproject’. Setelah itu, nama kolomnya diubah dan diberi inisial Y, X1, X2, dan X3. Tujuannya adalah untuk mempermudah dan mempersingkat selama pengodingan.

> #Membentuk data frame
> df_project<-data.frame(X1,X2,X3,Y)
> str(df_project)
'data.frame':   41 obs. of  4 variables:
 $ X1: num  163 201 1167 400 625 ...
 $ X2: Factor w/ 5 levels "0","1","2","3",..: 4 4 5 5 5 4 3 4 4 4 ...
 $ X3: Factor w/ 5 levels "0","1","2","3",..: 3 3 4 1 5 3 3 4 3 4 ...
 $ Y : Factor w/ 2 levels "0","1": 2 1 2 1 2 2 2 2 2 1 ...

Setelah nama kolom sudah didefinisikan sebelumnya, maka dibuat dalam data frame yang diberi nama ‘df_project’.

3.2.1 Analisis Regresi Logistik

> #Analisis Regresi Logistik
> reglogistik<-glm(Y~X1+X2+X3,family=binomial,data=df_project)
> summary(reglogistik)

Call:
glm(formula = Y ~ X1 + X2 + X3, family = binomial, data = df_project)

Deviance Residuals: 
    Min       1Q   Median       3Q      Max  
-2.1801   0.0000   0.4283   0.8360   1.2400  

Coefficients:
              Estimate Std. Error z value Pr(>|z|)
(Intercept)  1.699e+01  1.075e+04   0.002    0.999
X1           1.318e-03  1.424e-03   0.925    0.355
X21         -1.901e+01  1.585e+04  -0.001    0.999
X22          2.891e-01  1.138e+04   0.000    1.000
X23         -1.930e+01  1.075e+04  -0.002    0.999
X24         -1.770e+01  1.075e+04  -0.002    0.999
X31          2.057e+01  4.448e+03   0.005    0.996
X32          1.946e+00  2.199e+00   0.885    0.376
X33          2.519e+00  2.016e+00   1.249    0.212
X34          1.664e+00  1.816e+00   0.916    0.360

(Dispersion parameter for binomial family taken to be 1)

    Null deviance: 43.156  on 40  degrees of freedom
Residual deviance: 33.783  on 31  degrees of freedom
AIC: 53.783

Number of Fisher Scoring iterations: 18

3.2.2 R square

> #R square
> reg_1 <- lm(X1~X2+X3, data=df_project)
> summary(reg_1)

Call:
lm(formula = X1 ~ X2 + X3, data = df_project)

Residuals:
    Min      1Q  Median      3Q     Max 
-459.94 -176.94  -56.34  148.92  935.03 

Coefficients:
            Estimate Std. Error t value Pr(>|t|)
(Intercept)   390.82     415.19   0.941    0.354
X21           540.81     511.78   1.057    0.299
X22           -69.86     378.61  -0.185    0.855
X23            89.97     354.63   0.254    0.801
X24           162.20     381.99   0.425    0.674
X31          -164.63     267.99  -0.614    0.543
X32            84.18     255.37   0.330    0.744
X33           -20.85     222.76  -0.094    0.926
X34           231.06     224.86   1.028    0.312

Residual standard error: 327.4 on 32 degrees of freedom
Multiple R-squared:  0.2503,    Adjusted R-squared:  0.06286 
F-statistic: 1.335 on 8 and 32 DF,  p-value: 0.2622

3.2.3 Uji Signifikansi Keseluruhan Model

> #Uji Signifikansi Keseluruhan Model
> pR2(reglogistik)
fitting null model for pseudo-r2
        llh     llhNull          G2    McFadden        r2ML        r2CU 
-16.8914996 -21.5778846   9.3727701   0.2171846   0.2043566   0.3139292 
> qchisq(0.95,2)
[1] 5.991465

3.2.4 Uji Parsial Parameter Model

> #Uji Parsial Parameter Model
> summary(reglogistik)

Call:
glm(formula = Y ~ X1 + X2 + X3, family = binomial, data = df_project)

Deviance Residuals: 
    Min       1Q   Median       3Q      Max  
-2.1801   0.0000   0.4283   0.8360   1.2400  

Coefficients:
              Estimate Std. Error z value Pr(>|z|)
(Intercept)  1.699e+01  1.075e+04   0.002    0.999
X1           1.318e-03  1.424e-03   0.925    0.355
X21         -1.901e+01  1.585e+04  -0.001    0.999
X22          2.891e-01  1.138e+04   0.000    1.000
X23         -1.930e+01  1.075e+04  -0.002    0.999
X24         -1.770e+01  1.075e+04  -0.002    0.999
X31          2.057e+01  4.448e+03   0.005    0.996
X32          1.946e+00  2.199e+00   0.885    0.376
X33          2.519e+00  2.016e+00   1.249    0.212
X34          1.664e+00  1.816e+00   0.916    0.360

(Dispersion parameter for binomial family taken to be 1)

    Null deviance: 43.156  on 40  degrees of freedom
Residual deviance: 33.783  on 31  degrees of freedom
AIC: 53.783

Number of Fisher Scoring iterations: 18

3.2.5 Odds Ratio

> #Odds Ratio
> beta<-(coef(reglogistik))
> beta
  (Intercept)            X1           X21           X22           X23 
 16.994439845   0.001318063 -19.014246811   0.289135630 -19.300697235 
          X24           X31           X32           X33           X34 
-17.697626312  20.574921363   1.945548895   2.518688480   1.664177334 
> OR_beta<-exp(beta)
> OR_beta
 (Intercept)           X1          X21          X22          X23          X24 
2.402102e+07 1.001319e+00 5.523540e-09 1.335273e+00 4.147761e-09 2.060718e-08 
         X31          X32          X33          X34 
8.621341e+08 6.997472e+00 1.241231e+01 5.281327e+00 
> cbind(beta,OR_beta)
                     beta      OR_beta
(Intercept)  16.994439845 2.402102e+07
X1            0.001318063 1.001319e+00
X21         -19.014246811 5.523540e-09
X22           0.289135630 1.335273e+00
X23         -19.300697235 4.147761e-09
X24         -17.697626312 2.060718e-08
X31          20.574921363 8.621341e+08
X32           1.945548895 6.997472e+00
X33           2.518688480 1.241231e+01
X34           1.664177334 5.281327e+00

3.2.6 Membentuk Klasifikasi

> #Membentuk klasifikasi
> yp_hat<-fitted(reglogistik)
> df_project$yp_hat<-yp_hat
> df_project
     X1 X2 X3 Y    yp_hat
1   163  3  2 1 0.4635985
2   201  3  2 0 0.4760738
3  1167  4  3 1 0.9662252
4   400  4  0 0 0.4561228
5   625  4  4 1 0.8562861
6  1500  3  2 1 0.8342961
7   116  2  2 1 1.0000000
8   283  3  3 1 0.6423188
9   750  3  2 1 0.6519992
10    0  3  3 0 0.5529090
11  500  3  2 0 0.5740325
12  525  4  4 1 0.8392926
13  360  2  0 1 1.0000000
14 1000  4  4 0 0.9071273
15  540  3  3 0 0.7158941
16  800  3  3 0 0.7802084
17  363  2  3 1 1.0000000
18 1000  4  4 1 0.9071273
19  325  3  4 0 0.4467750
20  500  3  3 1 0.7050499
21  100  2  1 1 1.0000000
22  120  3  1 1 1.0000000
23  375  3  3 1 0.6696726
24  500  2  1 1 1.0000000
25  767  1  1 1 1.0000000
26  200  2  3 1 1.0000000
27  267  3  3 1 0.6374593
28  300  3  3 1 0.6474502
29  350  3  3 1 0.6623430
30  475  0  2 1 1.0000000
31 1325  3  4 1 0.7510748
32  357  4  4 1 0.8071410
33  225  3  1 1 1.0000000
34  400  4  3 1 0.9123544
35  667  4  0 1 0.5438772
36  933  4  4 1 0.8994152
37  333  4  3 1 0.9050308
38  625  3  3 0 0.7381201
39  500  3  3 1 0.7050499
40  713  3  3 1 0.7599143
41  750  3  4 1 0.5857606
> kelas<-table(df_project$Y,df_project$yp_hat>0.5)
> kelas
   
    FALSE TRUE
  0     3    6
  1     1   31

3.2.7 Uji Kelayakan Model

> #Uji Kelayakan Model
> logitgof(df_project$Y,fitted(reglogistik))

    Hosmer and Lemeshow test (binary model)

data:  df_project$Y, fitted(reglogistik)
X-squared = 5.9108, df = 8, p-value = 0.6572

4 HASIL DAN PEMBAHASAN

4.1 Analisis Regresi Logistik

> #Analisis Regresi Logistik
> reglogistik<-glm(Y~X1+X2+X3,family=binomial,data=df_project)
> summary(reglogistik)

Call:
glm(formula = Y ~ X1 + X2 + X3, family = binomial, data = df_project)

Deviance Residuals: 
    Min       1Q   Median       3Q      Max  
-2.1801   0.0000   0.4283   0.8360   1.2400  

Coefficients:
              Estimate Std. Error z value Pr(>|z|)
(Intercept)  1.699e+01  1.075e+04   0.002    0.999
X1           1.318e-03  1.424e-03   0.925    0.355
X21         -1.901e+01  1.585e+04  -0.001    0.999
X22          2.891e-01  1.138e+04   0.000    1.000
X23         -1.930e+01  1.075e+04  -0.002    0.999
X24         -1.770e+01  1.075e+04  -0.002    0.999
X31          2.057e+01  4.448e+03   0.005    0.996
X32          1.946e+00  2.199e+00   0.885    0.376
X33          2.519e+00  2.016e+00   1.249    0.212
X34          1.664e+00  1.816e+00   0.916    0.360

(Dispersion parameter for binomial family taken to be 1)

    Null deviance: 43.156  on 40  degrees of freedom
Residual deviance: 33.783  on 31  degrees of freedom
AIC: 53.783

Number of Fisher Scoring iterations: 18

Dari output yang diperoleh, maka didapatkan model regresi logistik \[g(x) = 16.99 + 0.00138X1 - 19.01X21 + 0.2891X22 - 19.30X23 - 17.70X24 + 20.57X31 + 1.946X32 + 2.519X33 + 1.664X34\]

4.2 R square

> #R square
> reg_1 <- lm(X1~X2+X3, data=df_project)
> summary(reg_1)

Call:
lm(formula = X1 ~ X2 + X3, data = df_project)

Residuals:
    Min      1Q  Median      3Q     Max 
-459.94 -176.94  -56.34  148.92  935.03 

Coefficients:
            Estimate Std. Error t value Pr(>|t|)
(Intercept)   390.82     415.19   0.941    0.354
X21           540.81     511.78   1.057    0.299
X22           -69.86     378.61  -0.185    0.855
X23            89.97     354.63   0.254    0.801
X24           162.20     381.99   0.425    0.674
X31          -164.63     267.99  -0.614    0.543
X32            84.18     255.37   0.330    0.744
X33           -20.85     222.76  -0.094    0.926
X34           231.06     224.86   1.028    0.312

Residual standard error: 327.4 on 32 degrees of freedom
Multiple R-squared:  0.2503,    Adjusted R-squared:  0.06286 
F-statistic: 1.335 on 8 and 32 DF,  p-value: 0.2622

Dari output, didapatkan Nilai R-square sebesar 0.2503 menunjukkan bahwa sekitar 25.03% variasi dalam X1 dapat dijelaskan oleh variabel X2 dan X3 dalam model. Nilai Adjusted R-square sebesar 0.06286 menunjukkan bahwa sekitar 6.29% variasi dalam X1 dapat dijelaskan oleh variabel X2 dan X3 dalam model setelah mempertimbangkan jumlah variabel independen dan ukuran sampel.

Artinya, model regresi ini memiliki kemampuan yang terbatas dalam menjelaskan variasi dalam variabel dependen X1 dengan menggunakan variabel independen X2 dan X3. Dalam hal ini, sekitar 25.03% variasi dalam X1 dapat dijelaskan oleh model regresi ini.

4.3 Uji Signifikansi Keseluruhan Model

> #Uji Signifikansi Keseluruhan Model
> pR2(reglogistik)
fitting null model for pseudo-r2
        llh     llhNull          G2    McFadden        r2ML        r2CU 
-16.8914996 -21.5778846   9.3727701   0.2171846   0.2043566   0.3139292 
> qchisq(0.95,2)
[1] 5.991465

Keputusan : Statistik Uji (\(G^2 = 9.37277\)) > (\(χ^2_(2;0.95) = 5.99146\)) maka tolak \(H_0\) Kesimpulan : Dengan taraf nyata 5% dapat disimpulkan bahwa model linear logistik tersebut signifikan atau setidaknya terdapat satu variabel yang berpengaruh terhadap status gizi (Y).

4.4 Uji Parsial Parameter Model

> #Uji Parsial Parameter Model
> summary(reglogistik)

Call:
glm(formula = Y ~ X1 + X2 + X3, family = binomial, data = df_project)

Deviance Residuals: 
    Min       1Q   Median       3Q      Max  
-2.1801   0.0000   0.4283   0.8360   1.2400  

Coefficients:
              Estimate Std. Error z value Pr(>|z|)
(Intercept)  1.699e+01  1.075e+04   0.002    0.999
X1           1.318e-03  1.424e-03   0.925    0.355
X21         -1.901e+01  1.585e+04  -0.001    0.999
X22          2.891e-01  1.138e+04   0.000    1.000
X23         -1.930e+01  1.075e+04  -0.002    0.999
X24         -1.770e+01  1.075e+04  -0.002    0.999
X31          2.057e+01  4.448e+03   0.005    0.996
X32          1.946e+00  2.199e+00   0.885    0.376
X33          2.519e+00  2.016e+00   1.249    0.212
X34          1.664e+00  1.816e+00   0.916    0.360

(Dispersion parameter for binomial family taken to be 1)

    Null deviance: 43.156  on 40  degrees of freedom
Residual deviance: 33.783  on 31  degrees of freedom
AIC: 53.783

Number of Fisher Scoring iterations: 18

Keputusan : Karena p-value dari Pendapatan (X1) 0.355 > α(0.05) maka terima \(H_0\)

Kesimpulan : Dengan taraf nyata 5% maka dapat disimpulkan bahwa pendapatan (X1) tidak berpengaruh signifikan terhadap status gizi (Y).

4.5 Odds Ratio

> #Odds Ratio
> beta<-(coef(reglogistik))
> beta
  (Intercept)            X1           X21           X22           X23 
 16.994439845   0.001318063 -19.014246811   0.289135630 -19.300697235 
          X24           X31           X32           X33           X34 
-17.697626312  20.574921363   1.945548895   2.518688480   1.664177334 
> OR_beta<-exp(beta)
> OR_beta
 (Intercept)           X1          X21          X22          X23          X24 
2.402102e+07 1.001319e+00 5.523540e-09 1.335273e+00 4.147761e-09 2.060718e-08 
         X31          X32          X33          X34 
8.621341e+08 6.997472e+00 1.241231e+01 5.281327e+00 
> cbind(beta,OR_beta)
                     beta      OR_beta
(Intercept)  16.994439845 2.402102e+07
X1            0.001318063 1.001319e+00
X21         -19.014246811 5.523540e-09
X22           0.289135630 1.335273e+00
X23         -19.300697235 4.147761e-09
X24         -17.697626312 2.060718e-08
X31          20.574921363 8.621341e+08
X32           1.945548895 6.997472e+00
X33           2.518688480 1.241231e+01
X34           1.664177334 5.281327e+00

Pendapatan (X1) Apabila pendapatan bertambah 1 satuan, maka kecenderungan status gizi normal meningkat 1.00132 atau sekitar 1 kali lipat

> #Membentuk klasifikasi
> yp_hat<-fitted(reglogistik)
> df_project$yp_hat<-yp_hat
> df_project
     X1 X2 X3 Y    yp_hat
1   163  3  2 1 0.4635985
2   201  3  2 0 0.4760738
3  1167  4  3 1 0.9662252
4   400  4  0 0 0.4561228
5   625  4  4 1 0.8562861
6  1500  3  2 1 0.8342961
7   116  2  2 1 1.0000000
8   283  3  3 1 0.6423188
9   750  3  2 1 0.6519992
10    0  3  3 0 0.5529090
11  500  3  2 0 0.5740325
12  525  4  4 1 0.8392926
13  360  2  0 1 1.0000000
14 1000  4  4 0 0.9071273
15  540  3  3 0 0.7158941
16  800  3  3 0 0.7802084
17  363  2  3 1 1.0000000
18 1000  4  4 1 0.9071273
19  325  3  4 0 0.4467750
20  500  3  3 1 0.7050499
21  100  2  1 1 1.0000000
22  120  3  1 1 1.0000000
23  375  3  3 1 0.6696726
24  500  2  1 1 1.0000000
25  767  1  1 1 1.0000000
26  200  2  3 1 1.0000000
27  267  3  3 1 0.6374593
28  300  3  3 1 0.6474502
29  350  3  3 1 0.6623430
30  475  0  2 1 1.0000000
31 1325  3  4 1 0.7510748
32  357  4  4 1 0.8071410
33  225  3  1 1 1.0000000
34  400  4  3 1 0.9123544
35  667  4  0 1 0.5438772
36  933  4  4 1 0.8994152
37  333  4  3 1 0.9050308
38  625  3  3 0 0.7381201
39  500  3  3 1 0.7050499
40  713  3  3 1 0.7599143
41  750  3  4 1 0.5857606
> kelas<-table(df_project$Y,df_project$yp_hat>0.5)
> kelas
   
    FALSE TRUE
  0     3    6
  1     1   31

Dari 9 amatan dengan Y=0 (gizi tidak normal), terdapat 6 yang diklasifikasikan dengan benar
Dari 32 amatan dengan Y=1 (gizi normal), terdapat 31 diantaranya diklasifikasikan dengan benar
Tingkat akurasi model sebesar \((3+31)/41*100%\) = 89%

4.6 Uji Kelayakan Model

> #Uji Kelayakan Model
> logitgof(df_project$Y,fitted(reglogistik))

    Hosmer and Lemeshow test (binary model)

data:  df_project$Y, fitted(reglogistik)
X-squared = 5.9108, df = 8, p-value = 0.6572

Keputusan : Karena p-value(0.6572) > α(0.05) maka terima \(H_0\)

Kesimpulan : Dengan taraf nyata 5% dapat disimpulkan bahwa model yang terbentuk layak digunakan.

5 KESIMPULAN

Dapat diketahui model regresi logistik pada kasus ini : \[g(x) = 16.99 + 0.00138X_1 - 19.01X_21 + 0.2891X_22 - 19.30X_23 - 17.70X_24 + 20.57X_31 + 1.946X_32 + 2.519X_33 + 1.664X_34\] model tersebut sudah terbukti layak digunakan.
Pendapatan per kapita tidak berpengaruh secara signifikan terhadap status gizi. Perlu dilakukan uji lebih lanjut untuk mengetahui variabel mana yang berpengaruh signifikan terhadap status gizi,

6 DAFTAR PUSTAKA

Azizah, S. M., & Chandra, N. E. (2017). MODEL REGRESI LOGISTIK PADA FAKTOR-FAKTOR YANGMEMPENGARUHI IMUNISASI LENGKAP BALITA. Ilmiah Teknosains, 73-76.

Carolina, J., L., V. C., & Tobing. (2019). PENGARUH PROFITABILITAS, LIKUIDITAS, SOLVABILITASDAN UKURAN PERUSAHAAN TERHADAP KETEPATAN WAKTUPENYAMPAIAN LAPORAN KEUANGAN PADA PERUSAHAAN MANUFAKTUR DI BEI. AKUNTANSI BARELANG, 45-54.

Kasmad, Ahidin, U., Jati, W., Rusnaeni, N., Jamaludin, & Hanny, R. (2020). Membangkitkan Kreativitas Mahasiswa Pada Masa Dan Pasca Pandemi COVID-19. Tangerang: The Department of Management, The Faculty of Economic, Pamulang University.

Muflihah, I. Z. (2017). ANALISIS FINANCIAL DISTRESS PERUSAHAAN MANUFAKTUR DI INDONESIAdengan REGRESI LOGISTIK. Majalah Ekonomi , 254-269.

Nengsih, T. A. (2013). Analisis Minat Masyarakat Terhadap Baitul Mal Watamwil di Kota Jambi . Ekonomi Islam, 33-38.

Prasanti, T. A., Wuryandari, T., & Rusgiyono, A. (2015). APLIKASI REGRESI DATA PANEL UNTUK PEMODELAN TINGKAT PENGANGGURAN TERBUKA KABUPATEN/KOTADI PROVINSI JAWA TENGAH. GAUSSIAN, 687-696.

Model Regresi Logistik Untuk Menunjukkan Pengaruh Terhadap Gizi Masyarakat Kota Surakarta

Sofhia Az-Zahra

5/29/2023