##nomor 1##

##Membuat Tabel Kontingensi##
data <- read.csv("D:/2025/IZIN BELAJAR/SEMESTER 2/ADK/Heart Disease.csv")

dim(data)        # jumlah baris dan kolom
## [1] 299  14
nrow(data)       # jumlah baris
## [1] 299
ncol(data)       # jumlah kolom
## [1] 14
tabel_kontingensi <- table(data$Gender, data$HeartDisease)

tabel_kontingensi
##    
##      no yes
##   F  72  25
##   M  89 113
prop.table(tabel_kontingensi)
##    
##             no        yes
##   F 0.24080268 0.08361204
##   M 0.29765886 0.37792642
##NOMOR 2##

##Ujilah hubungan antara jenis kelamin dan status penyakit jantung pada taraf nyata 5%##

# Uji Chi-Square
uji <- chisq.test(tabel_kontingensi, correct = FALSE)

uji
## 
##  Pearson's Chi-squared test
## 
## data:  tabel_kontingensi
## X-squared = 23.997, df = 1, p-value = 9.646e-07
##INTERPRETASI##
##Hipotesis##
##H₀ (hipotesis nol) : tidak ada hubungan antara jenis kelamin dan penyakit jantung vs H₁ (hipotesis alternatif) : ada hubungan antara jenis kelamin dan penyakit jantung##

##Keputusan Tolak Ho karena P-Value < α##

#Kesimpulan#
##Dengan tingkat kepercayaan 95%, sudah cukup bukti untuk mengatakan bahwa Ada hubungan signifikan antara jenis kelamin dan penyakit jantung##


#Hitunglah odds ratio (OR) dari tabel kontingensi jenis kelamin dan status penyakit jantung. Interpretasikan nilai OR yang diperoleh##


library(epitools)

##NOMOR 3##

# Hitung odds ratio
hasil_or <- oddsratio(tabel_kontingensi)
hasil_or
## $data
##        
##          no yes Total
##   F      72  25    97
##   M      89 113   202
##   Total 161 138   299
## 
## $measure
##    odds ratio with 95% C.I.
##     estimate    lower    upper
##   F 1.000000       NA       NA
##   M 3.628826 2.149782 6.285872
## 
## $p.value
##    two-sided
##       midp.exact fisher.exact   chi.square
##   F           NA           NA           NA
##   M 7.731329e-07 1.060775e-06 9.646353e-07
## 
## $correction
## [1] FALSE
## 
## attr(,"method")
## [1] "median-unbiased estimate & mid-p exact CI"
##Interpretasi: Nilai OR = 3,63 berarti bahwa laki-laki memiliki peluang 3,63 kali lebih besar untuk menderita penyakit jantung dibandingkan perempuan##
#NOMOR 4##
data <- read.csv("D:/2025/IZIN BELAJAR/SEMESTER 2/ADK/Heart Disease1.csv")

dim(data)        # jumlah baris dan kolom
## [1] 299  14
nrow(data)       # jumlah baris
## [1] 299
ncol(data)       # jumlah kolom
## [1] 14
model <- glm(HeartDisease ~ Gender + HeartRate + Vessel,
             data = data,
             family = binomial)
summary(model)
## 
## Call:
## glm(formula = HeartDisease ~ Gender + HeartRate + Vessel, family = binomial, 
##     data = data)
## 
## Coefficients:
##              Estimate Std. Error z value Pr(>|z|)    
## (Intercept)  4.079707   1.116123   3.655 0.000257 ***
## GenderM      1.520229   0.333810   4.554 5.26e-06 ***
## HeartRate   -0.040174   0.007406  -5.425 5.81e-08 ***
## Vessel       1.172716   0.192693   6.086 1.16e-09 ***
## ---
## Signif. codes:  0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
## 
## (Dispersion parameter for binomial family taken to be 1)
## 
##     Null deviance: 412.73  on 298  degrees of freedom
## Residual deviance: 283.79  on 295  degrees of freedom
## AIC: 291.79
## 
## Number of Fisher Scoring iterations: 5
# Uji signifikansi parameter pada taraf nyata 5%
# Variabel dianggap signifikan jika Pr(>|z|) < 0.05

#  Bentuk model regresi logistik biner
coef(model)  # menampilkan koefisien
## (Intercept)     GenderM   HeartRate      Vessel 
##  4.07970676  1.52022911 -0.04017422  1.17271633
exp(coef(model))  # odds ratio (OR)
## (Intercept)     GenderM   HeartRate      Vessel 
##  59.1281285   4.5732729   0.9606221   3.2307565
#Jawaban
#a. Ujilah parameter regresi logistik biner pada taraf nyata 5%. 
#Dari Hasil peroleh semua variabel X memiliki nilai P-Value < 0,05 artinya semua variabel X tersebut signifikan mempengaruhi variabel Y. Atau dengan kata lain Gender, HeartRate, dan Vessel berpengaruh signifikan terhadap kemungkinan seseorang menderita penyakit jantung

#b. Tuliskan model regresi logistik biner yang terbentuk. 
##log p/(1−p)= 4.0797+1.5202(GenderM)−0.0402(HeartRate)+1.1727(Vessel)
#dengan p = probabilitas seseorang menderita penyakit jantung.

#c. Interpretasikan koefisien model yang diperoleh.
#(Intercept) = 4.0797

#Ketika semua variabel lain bernilai nol (Gender = Female, HeartRate = 0, Vessel = 0), maka log-odds (peluang logaritmik) seseorang menderita penyakit jantung adalah 4.0797.Nilai ini sendiri tidak terlalu bermakna karena kondisi HeartRate = 0 tidak realistis, tapi tetap digunakan sebagai konstanta model.

#GenderM = 1.5202 → OR = 4.57. Artinya, laki-laki memiliki peluang 4.57 kali lebih besar untuk menderita penyakit jantung dibandingkan perempuan, dengan asumsi HeartRate dan Vessel sama.

#HeartRate = -0.0402 → OR = 0.96 Artinya, setiap kenaikan 1 detak jantung per menit akan menurunkan peluang menderita penyakit jantung sebesar (1 - 0.96) × 100% = 4%, jika variabel lain tetap. Interpretasi ini mungkin menunjukkan bahwa pasien dengan detak jantung tinggi justru lebih sehat pada data ini (bisa jadi karena pasien sakit jantung justru punya detak rendah akibat gangguan jantung tertentu).

#Vessel = 1.1727 → OR = 3.23 Artinya, setiap tambahan satu pembuluh darah yang tersumbat akan meningkatkan peluang menderita penyakit jantung 3.23 kali lipat, dengan asumsi variabel lain tetap.