Library:
> # install.packages("knitr")
> # install.packages("rmarkdown")
> # install.packages("prettydoc")
> # install.packages("equatiomatic")1 PENDAHULUAN
1.1 Latar Belakang
Penyakit kardiovaskular merupakan penyakit yang terjadi akibat adanya gangguan pada jantung dan pembuluh darah(Juslim dan Herawati, 2018). Salah satu penyakit yang disebabkan oleh penyakit kardiovaskular adalah gagal jantung. Oleh karena itu, digunakan tiga faktor yang dapat digunakan untuk memprediksi apakah seseorang menderita penyakit jantung atau tidak. Tiga faktor tersebut di antaranya adalah umur, tekanan darah selama istirahat, dan kolesterol. Selain itu, untuk merincikan hasil penelitian, dibedakan data untuk laki-laki dan perempuan untuk mengidentifikasi apakah ada perbedaan dari ketiga faktor tersebut pada laki-laki dan perempuan. Hal ini dapat enjadi dasar untuk penelitian lebih lanjut jika ternyata terdapat perbedaan pada tiga faktor tersebut di laku-laki dan perempuan, penelitian lebih lanjut dapat digunakan untuk mengidentifikasi lebih tinggi mana, risiko untuk terkena penyakit jantung antara laki-laki dan perempuan. Oleh karena itu, penelitian ini dilakukan sebagai dasar pengetahuan umum untuk mengetahui perbedaan risiko terkana penyakit jantung pada laki-laki dan perempuan menggunakan analisis T2-Hotelling.
1.2 T2-Hotelling
1.2.1 Pengertian
Uji T2-Hotelling merupakan perluasan dari uji t-student untuk data multivariat(Musa dkk, 2022). Tujuan utamanya tetap sama seperti uji t-student yaitu membandingkan rata-rata dua sampel. Dimana perbedaannya pada uji t-student masing-masing populasi atau kelompok yang diuji hanya memiliki satu variabel tertentu, sedangkan pada uji T2-Hotelling masing-masing kelompok memiliki ≥ 2 variabel. Dapat disimpulkan bahwa T^2-Hotelling adalah perluasan uji t-student pada untuk data multivariat di mana pada masing-masing populasi atau kelompok memiliki ≥ 2 variabel.
1.2.2 ASUMSI
Asumsi yang harus dipenuhi untuk melaksanakan uji ini adalah asumsi normalitas dan homogenitas.
1.2.2.1 Asumsi Normalitas
Uji yang dapat digunakan untuk menguji normalitas di antaranya adalah Shapiro-Wilk, Kolmogorov-Smirnov, QQ Plot, dan lain sebagainya. Pada Shapiro-Wilk dan Kolmogorov-Smirnov, asumsi normalitas terpenuhi jika nilai sig/p-value/nilai-p bernilai lebih dari taraf nyata. Misal digunakan taraf nyata 5%, maka nilai-p harus >5% atau >0,05. Hal ini dikarenakan hipotesis yang digunakan pada H0 adalah data berdistribusi normal, sedangkan H1 berisi bahwa data tidak berdistribusi normal. Sehingga untuk memenuhi asumsi normalitas, diperlukan untuk menerima H0.Asumsi ini harus terpenuhi agar dapat menggunakan rumus umum statistik uji T2-Hotelling dengan tepat.
1.2.2.2 Asumsi Homogenitas
Uji yang dapat digunakan untuk menguji homogenitas matriks kovarian diantaranya adalah BoxM dan Bartlett. Asumsi ini terpenuhi jika nilai-p bernilai lebih dari taraf nyata. Misal digunakan taraf nyata 5%, maka nilai-p harus >5% atau >0,05. Hal ini dikarenakan hipotesis yang digunakan pada H0 adalah matriks kovarian kedua data bernilai sama, sedangkan H1 berisi sebaliknya.
1.2.3 SATU POPULASI
Pada satu populasi, maka ditujukan untuk menguji apakah rata-rata populasi dari beberapa variabel di populasi atau kelompok tersebut sama dengan beberapa nilai tertentu. Dapat dituliskan bahwa H0 : \(\mu\) 1 = \(\mu\) 0 dan H1 : \(\mu\) 1 \(\ne\) \(\mu\) 0, di mana \(\mu\) i adalah vektor rata-rata populasi pada kelompok i dan \(\mu\) 0 adalah vektor angka. Jika asumsi terpenuhi maka (Jobson, 1992): \[ T^2 = n(\bar{X}-\mu0)'S^{-1}(\bar{X}-\mu0) \] T2 dapat didekati dengan sebaran F, sehingga : \[ F = \frac{n-p}{p(n-1)}T^2 \] Jika H0 ditolak maka \[ F = \frac{n-p}{p(n-1)}T^2 \sim F_{\substack{p,(n-p)}} \]
1.2.4 DUA POPULASI
Pada dua populasi, maka ditujukan untuk menguji apakah rata-rata populasi dari beberapa variabel di populasi atau kelompok 1 sama dengan kelompok 2. Dapat dituliskan bahwa H0 : \(\mu\) 1 = \(\mu\) 2 dan H1 : \(\mu\) 1 \(\ne\) \(\mu\) 2, di mana \(\mu\) i adalah vektor rata-rata populasi pada kelompok i. Jika asumsi terpenuhi maka (Timm,2002): \[ T^2 = \frac{n{\substack{1}}n{\substack{2}}}{n{\substack{1}}+n{\substack{2}}}(\bar{X}\substack{1}-\bar{X}\substack{2})'S\substack{p}^{-1}(\bar{X}\substack{1}-\bar{X}\substack{2}) \\dimana\\ S\substack{p}\ = \frac{(n{\substack{1}}-1)S{\substack{1}}+(n{\substack{2}}-1)S{\substack{2}}}{n{\substack{1}}+n{\substack{2}}-2} \] T2 dapat didekati dengan sebaran F, sehingga : \[ F = \frac{n\substack{1}+n\substack{2}-p-1}{p(n\substack{1}+n\substack{2}-2)}T^2 \] Jika H0 ditolak maka \[ F = \frac{n\substack{1}+n\substack{2}-p-1}{p(n\substack{1}+n\substack{2}-2)}T^2 \sim F_{\substack{p,(n\substack{1}+n\substack{2}-p-1)}} \]
1.2.5 ≥ 3 POPULASI
Jika data yang diuji memiliki lebih dari 2 kelompok, uji T2-Hotelling tetap dapat digunakan dengan cara menguji secara berpasangan untuk setiap populasi. Misal, terdapat data dengan tiga kelompok yaitu muda, remaja, dan tua. Maka masing-masing pasangan dapat diuji dengan T2-Hotelling, di mana pasangan-pasangan tersebut di antara lain {(muda, remaja),(muda, tua), (remaja, tua)}. Masing-masing pasangan tersebut diuji apakah nilai rata-rata populasinya sama atau tidak menggunakan rumus hitung pada dua populasi atau kelompok.
1.3 DATA
Tedapat dua kelompok atau populasi yang digunakan pada data ini, yaitu pasien laki-laki dan perempuan. Masing-masing populasi diambil data mengenai :
1. Umur : umur pasien (tahun).
2. Resting BP : tekanan darah saat beristirahat (mmHg).
3. Kolesterol : kolesterol serum (mm/dl).
> library(readxl)
> data = read_excel("~/FILE EVI/UNIV/SEMESTER 5/PRAK ANMUL/heart.xlsx")
> data
# A tibble: 100 × 4
Sex Age RestingBP Cholesterol
<dbl> <dbl> <dbl> <dbl>
1 1 40 140 289
2 1 31 136 220
3 1 52 145 270
4 1 43 125 210
5 1 53 140 225
6 1 29 135 250
7 1 51 142 240
8 1 45 129 275
9 1 54 133 230
10 1 30 145 188
# ℹ 90 more rows2 HASIL DAN INTERPRETASI
2.1 Library
2.2 Input Data
> data = read_excel("~/FILE EVI/UNIV/SEMESTER 5/PRAK ANMUL/heart.xlsx")
> str(data)
tibble [100 × 4] (S3: tbl_df/tbl/data.frame)
$ Sex : num [1:100] 1 1 1 1 1 1 1 1 1 1 ...
$ Age : num [1:100] 40 31 52 43 53 29 51 45 54 30 ...
$ RestingBP : num [1:100] 140 136 145 125 140 135 142 129 133 145 ...
$ Cholesterol: num [1:100] 289 220 270 210 225 250 240 275 230 188 ...
> x = data %>% filter(Sex == 1)
> y = data %>% filter(Sex == 2)
> x = x[,-1]
> y = y[,-1]
> data = as.matrix(rbind(x,y))
> k = c(rep(1,52), rep(2,48))2.3 Uji Asumsi Normalitas
Hipotesis
H0 : Data berdistribusi normal
H1 : Data tidak bersitribusi normal
Taraf Uji
\[ \alpha=0.05 \]
Statistik Uji dan Nilai-p
> mshapiro.test(t(x))
Shapiro-Wilk normality test
data: Z
W = 0.97635, p-value = 0.3844
> mshapiro.test(t(y))
Shapiro-Wilk normality test
data: Z
W = 0.97963, p-value = 0.5633Keputusan
Data laki-laki (x) : p-value > alpha, maka terima H0
Data Perempuan (y) : p-value > alpha, maka terima H0
Kesimpulan
Pada taraf nyata 5% dapat disimpulkan bahwa data pasien laki-laki dan perempuan berdistribusi normal (asumsi normalitas terpenuhi).
2.4 Uji Asumsi Homogenitas
Hipotesis
H0 : Data pasien laki-laki dan perempuan memiliki matriks kovarians yang sama
H1 : Data pasien laki-laki dan perempuan tidak memiliki matriks kovarian yang sama
Taraf Uji
\[ \alpha=0.05 \]
Statistik Uji dan Nilai-p
> hom <- BoxM(data = data, k)
> summary(hom)
Box's M Test
Chi-Squared Value = 5.632181 , df = 6 and p-value: 0.466 Keputusan
Data laki-laki (x) : p-value > alpha, maka terima H0
Data Perempuan (x) : p-value > alpha, maka terima H0
Kesimpulan
Pada taraf nyata 5% dapat disimpulkan data pasien laki-laki dan perempuan memiliki matriks kovarian yang sama (asumsi homogenitas terpenuhi).
2.5 Uji T2-Hotelling
Hipotesis
H0 : Data pasien laki-laki dan perempuan memiliki vektor rata-rata yang sama
H1 : Data pasien laki-laki dan perempuan tidak memiliki vektor rata-rata yang sama
Taraf Uji
\[ \alpha=0.05 \]
Statistik Uji dan Nilai-p
> HotellingsT2Test(data~k)
Hotelling's two sample T2-test
data: data by k
T.2 = 2.8608, df1 = 3, df2 = 96, p-value = 0.04088
alternative hypothesis: true location difference is not equal to c(0,0,0)Keputusan
p-value < alpha, maka tolak H0
Kesimpulan
Pada taraf nyata 5% dapat disimpulkan data pasien laki-laki dan perempuan memiliki vektor rata-rata yang berbeda.
3 KESIMPULAN
Setelah melakukan analisis, dapat disimpulkan bahwa rata-rata dari data umur, tekanan darah saat bersitirahat, dan kolesterol pada laki-laki dan perempuan berbeda. Hal ini dapat mengartikan bahwa terdapat perbedaan pada risiko terkena penyakit jantung pada laki-laki dan perempuan. Namun diperlukan uji yang lebih lanjut, untuk memberikan kesimpulan yang lebih mendetail.
4 DAFTAR PUSTAKA
Jobson, J.D. 1992. Applied Mulivariate Data Analysis. New York: Springer Science+Business Media.
Juslim, R. Rukma, dan F. Herawati. 2018. Penyakit Kardiovaskular.
Musa, M. dkk. 2022. Analisis Multivariat Terapan untuk Penelitian Ekologi Kunatitatif. Malang: Universitas Brawijaya Press.
Timm, N.H. 2002. Applied Multivariate Analysis. New York: Springer-Verlang, Inc.