TUGAS PRAKTIKUM STA1343 - PADK

Pendahuluan

Menurut Agresti (2002), regresi logistik biner merupakan metode yang digunakan untuk menganalisis faktor-faktor yang berpengaruh (variabel independen) terhadap variabel dependen yang berupa data kualitatif dikotomi yang bernilai 1 untuk menyatakan keberadaan sebuah karakteristik dan bernilai 0 untuk menyatakan ketidakberadaan sebuah karakteristik. Metode regresi logistik biner menghasilkan model akhir yang nantinya digunakan untuk mengetahui ketepatan klasifikasinya. Secara umum, model regresi logistik daat dituliskan sebagai berikut:

\(logit[\pi(x)] = \alpha + \beta1x1 + \beta2x2 + ... + \beta kxk\)

dengan \(\pi(x)\) menunjukkan peluang terjadinya kategori sukses \((y = 1)\) pada peubah bebas (Agresti 2002).

Pra-Processing Data

Memanggil Packager R yang Digunakan

library(rcompanion)
library(car)
## Loading required package: carData
library(dplyr)
## 
## Attaching package: 'dplyr'
## The following object is masked from 'package:car':
## 
##     recode
## The following objects are masked from 'package:stats':
## 
##     filter, lag
## The following objects are masked from 'package:base':
## 
##     intersect, setdiff, setequal, union

Impor Data

Data yang digunakan merupakan data keselamatan penumpang Kapal Titanic dalam format csv.

titanic <- data.frame(read.csv("C:/SEMESTER 5/PADK/titanic_clean.csv"))
data1 <- head(titanic)
kableExtra::kable(data1, align = rep('c',9))
X Survived Pclass Sex Age SibSp Parch Fare Embarked
1 0 3 male 22.00000 1 0 7.2500 S
2 1 1 female 38.00000 1 0 71.2833 C
3 1 3 female 26.00000 0 0 7.9250 S
4 1 1 female 35.00000 1 0 53.1000 S
5 0 3 male 35.00000 0 0 8.0500 S
6 0 3 male 29.69912 0 0 8.4583 Q

Peubah yang akan digunakan dalam analisis data penumpang Kapal Titanic ini adalah peubah Survived sebagai peubah respon, dan peubah Sex, Pclass, dan Age sebagai peubah predictor atau penjelas. Pra-processing data yang perlu dilakukan adalah sebagai berikut:

titanic$sex <- ifelse(titanic$Sex == "male", 1, 0)

Indeksasi peubah Sex merupakan pra-processing data yang pertama kali dilakukan. Peubah ini menjelaskan jenis kelamin penumpang. Indeksasi yang dilakukan adalah sebagai berikut:

  1. Laki-laki (male): 1
  2. Perempuan (female): 0
titanic$Pclass1 <- ifelse(titanic$Pclass == "1", 1, 0) 
titanic$Pclass2 <- ifelse(titanic$Pclass == "2", 1, 0) 

Kedua, melakukan indeksasi pada peubah Pclass, dimana peubah ini menjelaskan 3 status kelas penumpang Kapal Titanic. Indeksasi (class1, class2) yang dlakukan adalah sebagai berikut:

  1. Kelas Tumpangan 1: 1,0
  2. Kelas Tumpangan 2: 0,1
  3. Kelas Tumpangan 3: 0,0

Eksplorasi Data

BELOMMM

Regresi Logiatik dengan Peubah Dummy

Model Regresi Logistik

Regresi logistik pertama yang diujikan merupakan regresi logistik dengan menggunakan peubah dummy untuk peubah-peubah yang bertipe kategorik.

titan.dummy <- glm(Survived~as.factor(Sex)+Pclass1+Pclass2+Age, data = titanic, family = binomial(link = "logit"))
summary(titan.dummy)
## 
## Call:
## glm(formula = Survived ~ as.factor(Sex) + Pclass1 + Pclass2 + 
##     Age, family = binomial(link = "logit"), data = titanic)
## 
## Deviance Residuals: 
##     Min       1Q   Median       3Q      Max  
## -2.6469  -0.6630  -0.4203   0.6292   2.4285  
## 
## Coefficients:
##                     Estimate Std. Error z value Pr(>|z|)    
## (Intercept)         1.217701   0.242100   5.030 4.91e-07 ***
## as.factor(Sex)male -2.603906   0.186871 -13.934  < 2e-16 ***
## Pclass1             2.321885   0.240989   9.635  < 2e-16 ***
## Pclass2             1.206879   0.224586   5.374 7.71e-08 ***
## Age                -0.033530   0.007385  -4.540 5.62e-06 ***
## ---
## Signif. codes:  0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
## 
## (Dispersion parameter for binomial family taken to be 1)
## 
##     Null deviance: 1182.82  on 888  degrees of freedom
## Residual deviance:  804.68  on 884  degrees of freedom
## AIC: 814.68
## 
## Number of Fisher Scoring iterations: 5

Berdasarkan summary di atas, dapat diperoleh persamaan regresi logistik sebagai berikut:

\(logit[\pi(x)] = 1.22 - 2.6c1 + 2.32c2 + 1.2c3 - 0.03x\)

dengan \(c1\) (peubah dummy jenis kelamin), \(c2\) dan \(c3\) (peubah dummy tingkatan kelas penumpang), dan \(x\) menjelaskan peubah usia.

Uji Simultan

Uji smultan digunakan untuk menguji signifikansi peubah-peubah penjelas pada model secara bersamaan terhadap peubah respon. Uji yang dilakukan berupa uji simultan LRT (Likelihood Ratio Test) dengan hipotesis sebagai berikut:

\(H0: \beta 1 = \beta 2 = \beta 3 = \beta 4 = 0\)

\(H1: minimal terdapat satu \beta i ≠ 0\)

nagelkerke(titan.dummy) 
## $Models
##                                                                                                       
## Model: "glm, Survived ~ as.factor(Sex) + Pclass1 + Pclass2 + Age, binomial(link = \"logit\"), titanic"
## Null:  "glm, Survived ~ 1, binomial(link = \"logit\"), titanic"                                       
## 
## $Pseudo.R.squared.for.model.vs.null
##                              Pseudo.R.squared
## McFadden                             0.319696
## Cox and Snell (ML)                   0.346464
## Nagelkerke (Cragg and Uhler)         0.470959
## 
## $Likelihood.ratio.test
##  Df.diff LogLik.diff  Chisq    p.value
##       -4     -189.07 378.14 1.4666e-80
## 
## $Number.of.observations
##           
## Model: 889
## Null:  889
## 
## $Messages
## [1] "Note: For models fit with REML, these statistics are based on refitting with ML"
## 
## $Warnings
## [1] "None"

Berdasarkan hasil uji simultan (LRT) di atas, dapat dilihat bahwa nilai p-value < 0.05, sehingga, dapat disimpulkan bahwa terdapat cukup bukti untuk menyatakan bahwa setidaknya terdapat satu peubah penjelas yang memberikan pengaruh signifikan terhadap keselamatan para penumpang Kapal Titanic pada taraf nyata 5%.

Uji Parsial

Signifikansi peubah penjelas diuji lebih lanjut melalui uji parsial. Uji yang digunakan merupakan uji parsial Wald. Uji ini dilakukan terhadap setiap peubah penjelas dalam model, dengan hipotesis sebagai berikut:

\(H0: \beta j = 0\)

\(H1: \beta j ≠ 0, j = 1,2,3,4\)

Anova(titan.dummy, type="II", test="Wald")
## Analysis of Deviance Table (Type II tests)
## 
## Response: Survived
##                Df   Chisq Pr(>Chisq)    
## as.factor(Sex)  1 194.164  < 2.2e-16 ***
## Pclass1         1  92.830  < 2.2e-16 ***
## Pclass2         1  28.878   7.71e-08 ***
## Age             1  20.614   5.62e-06 ***
## ---
## Signif. codes:  0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1

Berdasarkan hasil uji parsial Wald di atas, dapat dilihat bahwa setiap peubah penjelas memiliki nilai p-value < 0.05, sehingga, dapat disimpulkan bahwa peubah \(c1\), \(c2\), \(c3\), dan \(x\) masing- masing berpengaruh signifikan terhadap keselamatan para penumpang Kapal Titanic pada taraf nyata 5%.

Dugaan Peluang Peubah Respon

Perlu dibentuk suatu fungsi dengan menginputkan nilai koefisien , , , , dan secara manual dalam mempermudah perhitungan nilai dugaan peluang.

phi.x.1 <- function(c1, c2, c3, x){
  intercept = -1.22 ; beta.c1 = -2.6 ; beta.c2 = 2.32; beta.c3 = 1.2; 
  beta1 = -0.03
  pers <- intercept + beta.c1*c1 + beta.c2*c2 + beta.c3*c3 + beta1*x
  phi.x <- exp(pers)/(1+exp(pers))
  return(list(nilai.log.odds=pers, dugaan.peluang=phi.x))
}

Perlu dilakukan standarisasi nilai peubah Age untuk menghitung nilai dugaan peluang masing-masing kombinasi peubah dummy yang mungkin, karena peubah tersebut bertipe numerik pada model. Usia yang relevan untuk dimasukkan dalam peubah ini merupakan median dari keseluruhan data.

summary(titanic$Age)
##    Min. 1st Qu.  Median    Mean 3rd Qu.    Max. 
##    0.42   22.00   29.70   29.65   35.00   80.00

Berdasarkan hasil output di atas, dapat dilihat bahwa nilai median dari usia adalah 29.7, namun utuk mempermudah perhitungan, nilai median tersebut akan dibulatkan menjadi 30. Nilai inilah yang akan digunakan pada peubah Age. Dugaan peluang selamat setiap kombinasi peubah respon dummy dapat dilihat pada tabel berikut:

mc1 <- phi.x.1(1,1,0,30)
fc1 <- phi.x.1(0,1,0,30)
mc2 <- phi.x.1(1,0,1,30)
fc2 <- phi.x.1(0,0,1,30)
mc3 <- phi.x.1(1,0,0,30)
fc3 <- phi.x.1(0,0,0,30)

gol <- c("Male Class 1", "Female Class 1", "Male Class 2", "Female Class 2",
         "Male Class 3", "Female Class 3")
usia <- c(rep("30 tahun", 6))
logit1 <- c(mc1$nilai.log.odds, fc1$nilai.log.odds, mc2$nilai.log.odds, 
          fc2$nilai.log.odds, mc3$nilai.log.odds, fc3$nilai.log.odds)
prob <- c(mc1$dugaan.peluang, fc1$dugaan.peluang, mc2$dugaan.peluang, 
          fc2$dugaan.peluang, mc3$dugaan.peluang, fc3$dugaan.peluang)
dugaan1 <- data.frame(cbind(gol, usia, logit1, round(prob,2)))
colnames(dugaan1) <- c("Golongan", "Usia", "logit", "Dugaan Peluang")
dugaan1$`Dugaan Selamat` <- ifelse(dugaan1$`Dugaan Peluang` >= 0.5, "Selamat", 
                                   "Tidak Selamat")
kableExtra::kable(dugaan1, align = rep("c",3), 
                  caption = "Pendugaan Peluang Penumpang Selamat dalam Tragedi Titanic")
Pendugaan Peluang Penumpang Selamat dalam Tragedi Titanic
Golongan Usia logit Dugaan Peluang Dugaan Selamat
Male Class 1 30 tahun -2.4 0.08 Tidak Selamat
Female Class 1 30 tahun 0.2 0.55 Selamat
Male Class 2 30 tahun -3.52 0.03 Tidak Selamat
Female Class 2 30 tahun -0.92 0.28 Tidak Selamat
Male Class 3 30 tahun -4.72 0.01 Tidak Selamat
Female Class 3 30 tahun -2.12 0.11 Tidak Selamat

Berdasarkan tabel di atas, dengan nilai cut off respon pada angka 0.5, dapat dilihat bahwa hanya penumpang berjenis kelamin perempuan dengan kelas tumpangan 1 yang diduga selamat dalam tragedi Titanic. Selain itu, secara umum dapat diamati bahwa dugaan peluang penumpang selamat berjenis kelamin perempuan lebih tinggi dibandingkan penumpang laki-laki.

Odds Ratio Antarlevel Peubah

Nilai odd rato antarlevel tiap peubah dapat dihitung dengan menggunakan syntax berikut ini:

male <- phi.x.1(1,0,0,0)
female <- phi.x.1(0,0,0,0)
sel_sex <- male$nilai.log.odds-female$nilai.log.odds
or_sex <- exp(sel_sex)

c1 <- phi.x.1(0,1,0,0)
c3 <- phi.x.1(0,0,0,0)
sel_c1c3 <- c1$nilai.log.odds-c3$nilai.log.odds
or_c1c3 <- exp(sel_c1c3)

c2 <- phi.x.1(0,0,1,0)
sel_c1c2 <- c1$nilai.log.odds-c2$nilai.log.odds
or_c1c2 <- exp(sel_c1c2)

sel_c2c3 <- c2$nilai.log.odds-c3$nilai.log.odds
or_c2c3 <- exp(sel_c2c3)

rasio <- c("Male to Female", "Class 1 to Class 3", "Class 1 to Class 2", 
           "Class 2 to Class 3")
int.model1 <- c(male$nilai.log.odds, c1$nilai.log.odds, c1$nilai.log.odds, 
                c2$nilai.log.odds)
int.comp1 <- c(female$nilai.log.odds, c3$nilai.log.odds, c2$nilai.log.odds, 
               c3$nilai.log.odds)
sel_int <- c(sel_sex, sel_c1c3, sel_c1c2, sel_c2c3)
or <- c(or_sex, or_c1c3, or_c1c2, or_c2c3)
odds_rasio1 <- cbind(rasio, int.model1, int.comp1, sel_int, round(or,2))
colnames(odds_rasio1) <- c("Perbandingan", "Intersep Model", 
                           "Intersep Pembanding", "Selisih Intersep", "Odds Ratio")
kableExtra::kable(odds_rasio1, align = rep("c",3), 
                  caption = "Perhitungan Odds Ratio Antarlevel Peubah")
Perhitungan Odds Ratio Antarlevel Peubah
Perbandingan Intersep Model Intersep Pembanding Selisih Intersep Odds Ratio
Male to Female -3.82 -1.22 -2.6 0.07
Class 1 to Class 3 1.1 -1.22 2.32 10.18
Class 1 to Class 2 1.1 -0.02 1.12 3.06
Class 2 to Class 3 -0.02 -1.22 1.2 3.32

Interpretasi:

  1. Berdasarkan usia dan jenis kelas tumpangan tertentu, dugaan odds seorang penumpang laki-laki untuk selamat adalah sebesar 0.07 kali dugaan odds selamat penumpang perempuan dalam tragedi Titanic.
  2. Berdasarkan usia dan jenis kelamin tertentu, dugaan odds penumpang pada kelas 1 untuk selamat adalah sebesar 10.18 kali dugaan odds selamat penumpang pada kelas 3 dalam tragedi Titanic.
  3. Berdasarkan usia dan jenis kelamin tertentu, dugaan odds penumpang pada kelas 1 untuk selamat adalah sebesar 3.06 kali dugaan odds selamat penumpang pada kelas 2 dalam tragedi Titanic.
  4. Berdasarkan usia dan jenis kelamin tertentu, dugaan odds penumpang pada kelas 2 untuk selamat adalah sebesar 3.32 kali dugaan odds selamat penumpang pada kelas 3 dalam tragedi Titanic.

Regresi Logistik Tanpa Peubah Dummy

Model Regresi Logistik

Setelah dilakukan analisis regresi logistik menggunakan peubah dummy, berikut dicobakan juga proses analisis regresi logistik tanpa peubah dummy untuk seluruh peubah penjelas yang bertipe kategorik.

titan.nodummy <- glm(Survived~Sex+Pclass+Age, data = titanic, 
                       family = binomial(link = "logit"))
summary(titan.nodummy)
## 
## Call:
## glm(formula = Survived ~ Sex + Pclass + Age, family = binomial(link = "logit"), 
##     data = titanic)
## 
## Deviance Residuals: 
##     Min       1Q   Median       3Q      Max  
## -2.6543  -0.6575  -0.4218   0.6387   2.4265  
## 
## Coefficients:
##              Estimate Std. Error z value Pr(>|z|)    
## (Intercept)  4.725127   0.449779  10.505  < 2e-16 ***
## Sexmale     -2.604696   0.186758 -13.947  < 2e-16 ***
## Pclass      -1.165181   0.118964  -9.794  < 2e-16 ***
## Age         -0.033661   0.007364  -4.571 4.86e-06 ***
## ---
## Signif. codes:  0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
## 
## (Dispersion parameter for binomial family taken to be 1)
## 
##     Null deviance: 1182.82  on 888  degrees of freedom
## Residual deviance:  804.72  on 885  degrees of freedom
## AIC: 812.72
## 
## Number of Fisher Scoring iterations: 5

Berdasarkan summary di atas, dapat diperoleh persamaan regresi logistik sebagai berikut:

\(logit[\pi(x)] = 4.72 − 2.6x1 − 1.16x2 − 0.03x3\)

dengan \(x1\) merupakan jenis kelamin, \(x\)_ (tingkatan kelas penumpang), dan \(x3\) (usia).

Uji Simultan

\(H0: \beta1 = \beta2 = \beta3 = 0\)

\(H1: minimal terdapat satu \beta i ≠ 0\)

nagelkerke(titan.nodummy) 
## $Models
##                                                                                 
## Model: "glm, Survived ~ Sex + Pclass + Age, binomial(link = \"logit\"), titanic"
## Null:  "glm, Survived ~ 1, binomial(link = \"logit\"), titanic"                 
## 
## $Pseudo.R.squared.for.model.vs.null
##                              Pseudo.R.squared
## McFadden                             0.319656
## Cox and Snell (ML)                   0.346428
## Nagelkerke (Cragg and Uhler)         0.470911
## 
## $Likelihood.ratio.test
##  Df.diff LogLik.diff  Chisq    p.value
##       -3     -189.05 378.09 1.2295e-81
## 
## $Number.of.observations
##           
## Model: 889
## Null:  889
## 
## $Messages
## [1] "Note: For models fit with REML, these statistics are based on refitting with ML"
## 
## $Warnings
## [1] "None"

Berdasarkan hasil uji simultan (LRT) di atas, dapat dilihat bahwa nilai p-value < 0.05, sehingga, dapat disimpulkan bahwa terdapat cukup bukti untuk menyatakan bahwa setidaknya terdapat satu peubah penjelas yang memberikan pengaruh signifikan terhadap keselamatan para penumpang Kapal Titanic pada taraf nyata 5%.

Uji Parsial

\(H0: \beta j = 0\)

\(H1: \beta j ≠ 0, j = 1,2,3\)

Anova(titan.nodummy, type="II", test="Wald")
## Analysis of Deviance Table (Type II tests)
## 
## Response: Survived
##        Df   Chisq Pr(>Chisq)    
## Sex     1 194.516  < 2.2e-16 ***
## Pclass  1  95.930  < 2.2e-16 ***
## Age     1  20.893  4.856e-06 ***
## ---
## Signif. codes:  0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1

Berdasarkan hasil uji parsial Wald di atas, dapat dilihat bahwa setiap peubah penjelas memiliki nilai p-value < 0.05, sehingga, dapat disimpulkan bahwa peubah \(x1\), \(x2\), dan \(x3\) masing- masing berpengaruh signifikan terhadap keselamatan para penumpang Kapal Titanic pada taraf nyata 5%.

Dugaan Peluang Peubah Respon

phi.x.2 <- function(x1, x2, x3){
  intercept = 4.72 ; b1 = -2.6 ; b2 = -1.16; b3 = -0.03
  pers <- intercept + b1*x1 + b2*x2 + b3*x3
  phi.x <- exp(pers)/(1+exp(pers))
  return(list(nilai.log.odds=pers, dugaan.peluang=phi.x))
}

Standarisasi nilai peubah Age yang digunakan sama dengan pemodelan regresi logistik dengan peubah dummy, yaitu 30 tahun. Oleh karena itu, dugaan peluang selamat setiap kombinasi peubah respon dummy dapat dilihat pada tabel berikut:

m1 <- phi.x.2(1,1,30)
f1 <- phi.x.2(0,1,30)
m2 <- phi.x.2(1,2,30)
f2 <- phi.x.2(0,2,30)
m3 <- phi.x.2(1,3,30)
f3 <- phi.x.2(0,3,30)

gol2 <- c("Male Class 1", "Female Class 1", "Male Class 2", "Female Class 2",
         "Male Class 3", "Female Class 3")
usia2 <- c(rep("30 tahun", 6))
logit2 <- c(m1$nilai.log.odds, f1$nilai.log.odds, m2$nilai.log.odds, 
            f2$nilai.log.odds, m3$nilai.log.odds, f3$nilai.log.odds)
prob2 <- c(m1$dugaan.peluang, f1$dugaan.peluang, m2$dugaan.peluang, 
          f2$dugaan.peluang, m3$dugaan.peluang, f3$dugaan.peluang)
dugaan2 <- data.frame(cbind(gol2, usia2, round(logit2,2), round(prob2,2)))
colnames(dugaan2) <- c("Golongan", "Usia", "logit", "Dugaan Peluang")
dugaan2$`Dugaan Selamat` <- ifelse(dugaan2$`Dugaan Peluang` >= 0.5, "Selamat", 
                                   "Tidak Selamat")
kableExtra::kable(dugaan2, align = rep("c",4), 
                  caption = "Pendugaan Peluang Penumpang Selamat dalam Tragedi Titanic")
Pendugaan Peluang Penumpang Selamat dalam Tragedi Titanic
Golongan Usia logit Dugaan Peluang Dugaan Selamat
Male Class 1 30 tahun 0.06 0.51 Selamat
Female Class 1 30 tahun 2.66 0.93 Selamat
Male Class 2 30 tahun -1.1 0.25 Tidak Selamat
Female Class 2 30 tahun 1.5 0.82 Selamat
Male Class 3 30 tahun -2.26 0.09 Tidak Selamat
Female Class 3 30 tahun 0.34 0.58 Selamat

Berdasarkan tabel di atas, dengan nilai cut off respon pada angka 0.5, dapat diketahui bahwa terdapat dua golongan penumpang yang diduga tidak selamat dalam tragedi Titanic, yaitu golongan laki-laki dengan kelas tumpangan 2 dan 3. Selain itu, secara umum dapat diamati bahwa dugaan peluang penumpang selamat berjenis kelamin perempuan lebih tinggi dibandingkan penumpang laki-laki.

Odds Ratio Antarlevel Peubah

male2 <- phi.x.2(1,0,0)
female2 <- phi.x.2(0,0,0)
sel_sex2 <- male2$nilai.log.odds-female2$nilai.log.odds
or_sex2 <- exp(sel_sex2)

c1.2 <- phi.x.2(0,1,0)
c3.2 <- phi.x.2(0,3,0)
sel_c1c3.2 <- c1.2$nilai.log.odds-c3.2$nilai.log.odds
or_c1c3.2 <- exp(sel_c1c3.2)

c2.2 <- phi.x.2(0,2,0)
sel_c1c2.2 <- c1.2$nilai.log.odds-c2.2$nilai.log.odds
or_c1c2.2 <- exp(sel_c1c2.2)

sel_c2c3.2 <- c2.2$nilai.log.odds-c3.2$nilai.log.odds
or_c2c3.2 <- exp(sel_c2c3.2)

rasio2 <- c("Male to Female", "Class 1 to Class 3", "Class 1 to Class 2", 
            "Class 2 to Class 3")
int.model2 <- c(male2$nilai.log.odds, c1.2$nilai.log.odds, c1.2$nilai.log.odds, 
                c2.2$nilai.log.odds)
int.comp2 <- c(female2$nilai.log.odds, c3.2$nilai.log.odds, c2.2$nilai.log.odds, 
               c3.2$nilai.log.odds)
sel_int2 <- c(sel_sex2, sel_c1c3.2, sel_c1c2.2, sel_c2c3.2)
or2 <- c(or_sex2, or_c1c3.2, or_c1c2.2, or_c2c3.2)
odds_rasio2 <- cbind(rasio2, int.model2, int.comp2, sel_int2, round(or2,2))
colnames(odds_rasio2) <- c("Perbandingan", "Intersep Model", 
                           "Intersep Pembanding", "Selisih Intersep", "Odds Ratio")
kableExtra::kable(odds_rasio2, align = rep("c",5), 
                  caption = "Perhitungan Odds Ratio Antarlevel Peubah")
Perhitungan Odds Ratio Antarlevel Peubah
Perbandingan Intersep Model Intersep Pembanding Selisih Intersep Odds Ratio
Male to Female 2.12 4.72 -2.6 0.07
Class 1 to Class 3 3.56 1.24 2.32 10.18
Class 1 to Class 2 3.56 2.4 1.16 3.19
Class 2 to Class 3 2.4 1.24 1.16 3.19

Interpretasi:

  1. Berdasarkan usia dan jenis kelas tumpangan tertentu, dugaan odds seorang penumpang laki-laki untuk selamat adalah sebesar 0.07 kali dugaan odds selamat penumpang perempuan dalam tragedi Titanic.
  2. Berdasarkan usia dan jenis kelamin tertentu, dugaan odds penumpang pada kelas 1 untuk selamat adalah sebesar 10.18 kali dugaan odds selamat penumpang pada kelas 3 dalam tragedi Titanic.
  3. Berdasarkan usia dan jenis kelamin tertentu, dugaan odds penumpang pada kelas 1 untuk selamat adalah sebesar 3.19 kali dugaan odds selamat penumpang pada kelas 2 dalam tragedi Titanic.
  4. Berdasarkan usia dan jenis kelamin tertentu, dugaan odds penumpang pada kelas 2 untuk selamat adalah sebesar 3.19 kali dugaan odds selamat penumpang pada kelas 3 dalam tragedi Titanic.

Simpulan

Berdasarkan hasil analisis regresi logistik dengan dan tanpa peubah dummy, dapat disimpulkan beberapa hal sebagai berikut:

  1. Model dan seluruh peubah yang digunakan berpengaruh signifikan terhadap peubah respon baik pada regresi logistik dengan peubah dummy maupun tanpa peubah dummy.
  2. Kelas tumpangan 1, 2, dan 3 secara berurutan memiliki dugaan peluang selamat paling tinggi dalam tragedi Titanic.
  3. Model regresi logistik tanpa peubah dummy menunjukkan bahwa terdapat lebih banyak penumpang yang selamat dibandingkan penumpang selamat pada model regresi logistik dengan peubah dummy.
  4. Secara umum, penumpang perempuan memiliki dugaan peluang selamat lebih tinggi dibandingkan dengan penumpang laki-laki.

Daftar Pustaka

Agresti A. 2003. Categorical Data Analysis (2th ed.). John Wiley & Sons.

Suhendra MA, Ispriyanti DD, Sudarno. 2020. Ketepatan klasifikasi pemberian kartu keluarga sejahtera di Kota Semarang menggunakan metode regresi logistik biner dan metode chaid. Jurnal Gaussian. 9(1): 64-74. doi: https://doi.org/10.14710/j.gauss.v9i1.27524