##nomor 1##
##Membuat Tabel Kontingensi##
data <- read.csv("D:/2025/IZIN BELAJAR/SEMESTER 2/ADK/Heart Disease.csv")
dim(data) # jumlah baris dan kolom
## [1] 299 14
nrow(data) # jumlah baris
## [1] 299
ncol(data) # jumlah kolom
## [1] 14
tabel_kontingensi <- table(data$Gender, data$HeartDisease)
tabel_kontingensi
##
## no yes
## F 72 25
## M 89 113
prop.table(tabel_kontingensi)
##
## no yes
## F 0.24080268 0.08361204
## M 0.29765886 0.37792642
##NOMOR 2##
##Ujilah hubungan antara jenis kelamin dan status penyakit jantung pada taraf nyata 5%##
# Uji Chi-Square
uji <- chisq.test(tabel_kontingensi, correct = FALSE)
uji
##
## Pearson's Chi-squared test
##
## data: tabel_kontingensi
## X-squared = 23.997, df = 1, p-value = 9.646e-07
##INTERPRETASI##
##Hipotesis##
##H₀ (hipotesis nol) : tidak ada hubungan antara jenis kelamin dan penyakit jantung vs H₁ (hipotesis alternatif) : ada hubungan antara jenis kelamin dan penyakit jantung##
##Keputusan Tolak Ho karena P-Value < α##
#Kesimpulan#
##Dengan tingkat kepercayaan 95%, sudah cukup bukti untuk mengatakan bahwa Ada hubungan signifikan antara jenis kelamin dan penyakit jantung##
#Hitunglah odds ratio (OR) dari tabel kontingensi jenis kelamin dan status penyakit jantung. Interpretasikan nilai OR yang diperoleh##
library(epitools)
##NOMOR 3##
# Hitung odds ratio
hasil_or <- oddsratio(tabel_kontingensi)
hasil_or
## $data
##
## no yes Total
## F 72 25 97
## M 89 113 202
## Total 161 138 299
##
## $measure
## odds ratio with 95% C.I.
## estimate lower upper
## F 1.000000 NA NA
## M 3.628826 2.149782 6.285872
##
## $p.value
## two-sided
## midp.exact fisher.exact chi.square
## F NA NA NA
## M 7.731329e-07 1.060775e-06 9.646353e-07
##
## $correction
## [1] FALSE
##
## attr(,"method")
## [1] "median-unbiased estimate & mid-p exact CI"
##Interpretasi: Nilai OR = 3,63 berarti bahwa laki-laki memiliki peluang 3,63 kali lebih besar untuk menderita penyakit jantung dibandingkan perempuan##
#NOMOR 4##
data <- read.csv("D:/2025/IZIN BELAJAR/SEMESTER 2/ADK/Heart Disease1.csv")
dim(data) # jumlah baris dan kolom
## [1] 299 14
nrow(data) # jumlah baris
## [1] 299
ncol(data) # jumlah kolom
## [1] 14
model <- glm(HeartDisease ~ Gender + HeartRate + Vessel,
data = data,
family = binomial)
summary(model)
##
## Call:
## glm(formula = HeartDisease ~ Gender + HeartRate + Vessel, family = binomial,
## data = data)
##
## Coefficients:
## Estimate Std. Error z value Pr(>|z|)
## (Intercept) 4.079707 1.116123 3.655 0.000257 ***
## GenderM 1.520229 0.333810 4.554 5.26e-06 ***
## HeartRate -0.040174 0.007406 -5.425 5.81e-08 ***
## Vessel 1.172716 0.192693 6.086 1.16e-09 ***
## ---
## Signif. codes: 0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
##
## (Dispersion parameter for binomial family taken to be 1)
##
## Null deviance: 412.73 on 298 degrees of freedom
## Residual deviance: 283.79 on 295 degrees of freedom
## AIC: 291.79
##
## Number of Fisher Scoring iterations: 5
# Uji signifikansi parameter pada taraf nyata 5%
# Variabel dianggap signifikan jika Pr(>|z|) < 0.05
# Bentuk model regresi logistik biner
coef(model) # menampilkan koefisien
## (Intercept) GenderM HeartRate Vessel
## 4.07970676 1.52022911 -0.04017422 1.17271633
exp(coef(model)) # odds ratio (OR)
## (Intercept) GenderM HeartRate Vessel
## 59.1281285 4.5732729 0.9606221 3.2307565
#Jawaban
#a. Ujilah parameter regresi logistik biner pada taraf nyata 5%.
#Dari Hasil peroleh semua variabel X memiliki nilai P-Value < 0,05 artinya semua variabel X tersebut signifikan mempengaruhi variabel Y. Atau dengan kata lain Gender, HeartRate, dan Vessel berpengaruh signifikan terhadap kemungkinan seseorang menderita penyakit jantung
#b. Tuliskan model regresi logistik biner yang terbentuk.
##log p/(1−p)= 4.0797+1.5202(GenderM)−0.0402(HeartRate)+1.1727(Vessel)
#dengan p = probabilitas seseorang menderita penyakit jantung.
#c. Interpretasikan koefisien model yang diperoleh.
#(Intercept) = 4.0797
#Ketika semua variabel lain bernilai nol (Gender = Female, HeartRate = 0, Vessel = 0), maka log-odds (peluang logaritmik) seseorang menderita penyakit jantung adalah 4.0797.Nilai ini sendiri tidak terlalu bermakna karena kondisi HeartRate = 0 tidak realistis, tapi tetap digunakan sebagai konstanta model.
#GenderM = 1.5202 → OR = 4.57. Artinya, laki-laki memiliki peluang 4.57 kali lebih besar untuk menderita penyakit jantung dibandingkan perempuan, dengan asumsi HeartRate dan Vessel sama.
#HeartRate = -0.0402 → OR = 0.96 Artinya, setiap kenaikan 1 detak jantung per menit akan menurunkan peluang menderita penyakit jantung sebesar (1 - 0.96) × 100% = 4%, jika variabel lain tetap. Interpretasi ini mungkin menunjukkan bahwa pasien dengan detak jantung tinggi justru lebih sehat pada data ini (bisa jadi karena pasien sakit jantung justru punya detak rendah akibat gangguan jantung tertentu).
#Vessel = 1.1727 → OR = 3.23 Artinya, setiap tambahan satu pembuluh darah yang tersumbat akan meningkatkan peluang menderita penyakit jantung 3.23 kali lipat, dengan asumsi variabel lain tetap.