Library:
> # install.packages("knitr")
> # install.packages("rmarkdown")
> # install.packages("prettydoc")
> # install.packages("equatiomatic")1 PENDAHULUAN
1.1 Latar Belakang
Tekanan darah dalam keadaan istirahat, kolesterol serum, dan detak jantung maksimum adalah parameter yang krusial dalam menilai risiko penyakit jantung dan permasalahan kesehatan kardiovaskular lainnya. Jenis kelamin telah lama dianggap sebagai salah satu faktor yang dapat berpengaruh terhadap variabel-variabel ini. Penelitian sebelumnya telah mengungkapkan bahwa terdapat potensi adanya perbedaan dalam karakteristik fisiologis antara pria dan wanita yang mungkin memengaruhi parameter-parameter ini.
Sebelumnya, studi ilmiah telah mengidentifikasi perbedaan biologis yang menjadi dasar dari perbedaan ini. Sebagai contoh, hormon seks seperti estrogen dan testosteron memiliki peran penting dalam mengatur tekanan darah dan profil lipid dalam darah. Selain itu, perbedaan dalam struktur dan fungsi jantung antara pria dan wanita juga dapat memiliki dampak pada tingkat detak jantung maksimum yang dapat dicapai.
Meski sudah ada beberapa temuan seputar perbedaan ini, masih banyak pertanyaan yang perlu dipecahkan. Oleh karena itu, dalam penelitian ini, kami akan menggunakan analisis statistik \(T^2-Hotelling\) untuk mengevaluasi apakah perbedaan antara pria dan wanita dalam variabel-variabel ini memiliki signifikansi statistik. Diharapkan bahwa hasil penelitian ini akan memberikan wawasan yang lebih mendalam tentang perbedaan berdasarkan jenis kelamin dalam parameter kesehatan kardiovaskular ini. Hasil ini bisa sangat bermanfaat dalam pengembangan strategi intervensi kesehatan yang lebih tepat sasaran dan spesifik.
1.2 Tinjauan Pustaka
1.2.1 Uji Asumsi
1.2.1.1 Asumsi Normalitas
Multivariasi normal (MVN) adalah salah satu asumsi penting dalam uji parameter multivariat. Asumsi mengenai normalitas menjelaskan bahwa apabila sampel tersebut mengikuti distribusi normal, maka sampel tersebut akan mencerminkan dengan baik kondisi sebenarnya di populasi. Di sisi lain, jika data tersebut tidak mematuhi distribusi normal, maka data tersebut tidak dapat diolah atau dianalisis dengan menggunakan uji parametrik multivariat. Jika asumsi ini dilanggar dapat mengakibatkan hasil analisis statistik menjadi tidak valid atau bias, terutama dengan sampel yang berukuran kecil. Dalam menguji normalitas dalam konteks data multivariat, ada beberapa uji yang banyak digunakan, seperti Uji Mardia MVN, Henze Zikler MVN, dan Shapiro Wilk MVN. Pengujian distribusi normal multivariat menggunakan hipotesis sebagai berikut. Hipotesis: \(H_0\) : Data berdistribusi normal multivariat vs \(H_1\) : Data tidak berdistribusi normal multivariat
Asumsi data berdistribusi normal multivariat atau uji normalitas multivariat dapat dilakukan dengan menggunakan Scatter-Plot dari nilai Chi-Square dan jarak mahalanobis dengan persamaan berikut (Rencher & Schimek, 1997). Jika Scatter-Plot dari nilai Chi-Square dan jarak mahalanobis titik-titik menyebar hampir membentuk garis lurus, maka dapat dinyatakan bahwa data berdistribusi normal multivariat.
1.2.1.2 Asumsi Homogenitas
Pemeriksaan kesamaan matriks varians kovarians antara dua populasi atau lebih dilakukan dengan Box’s M test yang dirumuskan sebagai berikut:
Hipotesis untuk uji ini adalah: \(H_0\) : \(∑_1\) = \(∑_2\) = … = \(∑_k\) = ∑ (matriks kovarians bersifat multivariat homoskedastisitas) vs \(H_1\) : minimal ada satu \(∑_i\) ≠ \(∑_j\) (matriks kovarians tidak bersifat multivariat homoskedastisitas)
Statistik Uji:
\[C = (1-u)M\]
dimana
\[u= [∑_l\frac {1}{(n_l-1)}- \frac {1}{(n_l-1)}][ \frac {2p^2-2p-1}{6(p+1)(q-1)}]\] \[M= [∑_l(n_l-1)]ll|S_p| - ∑_l[(n_l-1)ln|S_l|] \] Daerah kritis tolak \(H_0\) jika C > \(X^2_{\gamma(\alpha)}\) dengan \[\gamma =\frac{1}{2}p(p+1)(q-1) \]
1.2.2 Uji \(T^2-Hotelling\)
Uji \(T^2-Hotelling\) adalah salah satu uji statistik multivariat yang digunakan untuk melihat apakah terdapat perbedaan antara 2 kelompok percobaan yang terdiri dari 2 atau lebih variabel. Pada pengujian vektor rata rata dilakukan secara serentak pada semua variabel. Dengan kata lain, Uji \(T^2-Hotelling\) adalah Uji-T namun pada kasus multivariabel. Tujuan dari uji \(T^2-Hotelling\) adalah untuk mengukur apakah terdapat perbedaan yang signifikan antara kelompok-kelompok ini dalam dimensi multivariat. Uji ini menghasilkan statistik \(T^2\) yang digunakan untuk menguji hipotesis nol bahwa rata-rata kelompok-kelompok tersebut adalah sama dalam beberapa variabel yang dianalisis.
Distribusi ini didefinisikan sebagai \[T^2 = n(\bar{x}-\mu_0)'S^{-1}(\bar{x}-\mu_0)\]
dengan \(\bar{x}\) merupakan vektor rata-rata sampel yang berukuran p x 1, S merupakan matriks varians-kovarians sampel yang berukuran p x p, dan \(\mu_0\) merupakan vektor rata-rata populasi yang berukuran p x 1.
Hipotesis untuk uji ini adalah : \(H_0\) : \(\mu_0\) = 0 vs \(H_1\) : \(\mu_0 \neq 0\)
1.2.2.1 Uji Hipotesis Rata-Rata Multivariat untuk Satu Populasi
\(H_0\) di tolak apabila \(T^2\) > \(\frac{(n-1)p}{(n-p)}F_{\alpha,(p,n-p)}\)
1.2.2.2 Uji Hipotesis Rata-Rata Multivariat untuk Dua Populasi
Statistik \(T^2\) berubah menjadi \[T^2 = [\bar{x_1}-\bar{x_2}-(\mu_1-\mu_2)]'[(\frac {1}{(n_1)}+\frac {1}{(n_2)})S_{pooled}]^{-1}[\bar{x_1}-\bar{x_2}-(\mu_1-\mu_2)]\] dengan \[S_{pooled} = \frac {n_1-1}{(n_1+n_2-2)}S_1 + \frac {n_2-1}{(n_1+n_2-2)}S_2\] \(H_0\) di tolak apabila \(T^2\) > \(\frac{(n_1+n_2-2)p}{(n_1+n_2-p-1)}F_{p,n_!+n_2-p-1}\)
1.3 Data
Data yang digunakan pada uji ini merupakan data sekunder yang diperoleh dari Datasets Kaggle meliputi jenis kelamin (sex), tekanan darah dalam keadaan istirahat (trestbps), kolesterol serum (chol), dan detak jantung maksimum (thalach) sebanyak 30 amatan. Adapun data dapat dilihat sebagai berikut:
| sex | trestbps | chol | thalach |
|---|---|---|---|
| 0 | 125 | 212 | 168 |
| 1 | 140 | 203 | 155 |
| 1 | 145 | 174 | 125 |
| 1 | 148 | 203 | 161 |
| 0 | 138 | 294 | 106 |
| 0 | 100 | 248 | 122 |
| 1 | 114 | 318 | 140 |
| 1 | 160 | 289 | 145 |
| 1 | 120 | 249 | 144 |
| 1 | 122 | 286 | 116 |
| 0 | 112 | 149 | 125 |
| 0 | 132 | 341 | 136 |
| 0 | 118 | 210 | 192 |
| 1 | 140 | 298 | 122 |
| 1 | 128 | 204 | 156 |
| 0 | 118 | 210 | 192 |
| 0 | 140 | 308 | 142 |
| 1 | 124 | 266 | 109 |
| 0 | 120 | 244 | 162 |
| 1 | 140 | 211 | 165 |
| 1 | 140 | 185 | 155 |
| 0 | 106 | 223 | 142 |
| 1 | 104 | 208 | 148 |
| 0 | 135 | 252 | 172 |
| 0 | 120 | 209 | 173 |
| 0 | 145 | 307 | 146 |
| 1 | 130 | 233 | 179 |
| 0 | 136 | 319 | 152 |
| 1 | 130 | 256 | 142 |
| 0 | 132 | 342 | 166 |
2 SOURCE CODE
2.1 Library yang Dibutuhkan
> # Library
> library(mvnormtest)
> library(MVTests)
> library(DescTools)2.2 Import Data
> #Import data
> heart_disease <- read.csv("D:/KULIAH SHOFI/Semester 5/Analisis Multivariat I/Praktikum/heart.csv")
> View(heart_disease)
>
> #Split data
> split <- split(heart_disease[,-1], heart_disease$`sex`)
> Wanita<-split[['0']]
> Wanita
trestbps chol thalach
1 125 212 168
5 138 294 106
6 100 248 122
11 112 149 125
12 132 341 136
13 118 210 192
16 118 210 192
17 140 308 142
19 120 244 162
22 106 223 142
24 135 252 172
25 120 209 173
26 145 307 146
28 136 319 152
30 132 342 166
>
> Laki_Laki<-split[['1']]
> Laki_Laki
trestbps chol thalach
2 140 203 155
3 145 174 125
4 148 203 161
7 114 318 140
8 160 289 145
9 120 249 144
10 122 286 116
14 140 298 122
15 128 204 156
18 124 266 109
20 140 211 165
21 140 185 155
23 104 208 148
27 130 233 179
29 130 256 1422.3 Statistika Deskriptif
> summary(Wanita)
trestbps chol thalach
Min. :100.0 Min. :149.0 Min. :106.0
1st Qu.:118.0 1st Qu.:211.0 1st Qu.:139.0
Median :125.0 Median :248.0 Median :152.0
Mean :125.1 Mean :257.9 Mean :153.1
3rd Qu.:135.5 3rd Qu.:307.5 3rd Qu.:170.0
Max. :145.0 Max. :342.0 Max. :192.0
> summary(Laki_Laki)
trestbps chol thalach
Min. :104.0 Min. :174.0 Min. :109.0
1st Qu.:123.0 1st Qu.:203.5 1st Qu.:132.5
Median :130.0 Median :233.0 Median :145.0
Mean :132.3 Mean :238.9 Mean :144.1
3rd Qu.:140.0 3rd Qu.:276.0 3rd Qu.:155.5
Max. :160.0 Max. :318.0 Max. :179.0 2.4 Uji Asumsi
2.4.1 Asumsi Normalitas
> library(mvnormtest)
> mshapiro.test(t(Wanita))
Shapiro-Wilk normality test
data: Z
W = 0.88254, p-value = 0.05177
> mshapiro.test(t(Laki_Laki))
Shapiro-Wilk normality test
data: Z
W = 0.90216, p-value = 0.10272.4.2 Asumsi Homogenitas
> library(MVTests)
> hom<-BoxM(data = heart_disease[,2:4],heart_disease$`sex`)
> summary(hom)
Box's M Test
Chi-Squared Value = 8.970589 , df = 6 and p-value: 0.175 2.5 Uji \(T^2-Hotelling\)
> library(DescTools)
> with(heart_disease,
+ HotellingsT2Test(cbind(`trestbps`,`chol`,`thalach`)~`sex`))
Hotelling's two sample T2-test
data: cbind(trestbps, chol, thalach) by sex
T.2 = 2.3179, df1 = 3, df2 = 26, p-value = 0.09891
alternative hypothesis: true location difference is not equal to c(0,0,0)3 HASIL DAN PEMBAHASAN
3.1 Statistika Deskriptif
> summary(Wanita)
trestbps chol thalach
Min. :100.0 Min. :149.0 Min. :106.0
1st Qu.:118.0 1st Qu.:211.0 1st Qu.:139.0
Median :125.0 Median :248.0 Median :152.0
Mean :125.1 Mean :257.9 Mean :153.1
3rd Qu.:135.5 3rd Qu.:307.5 3rd Qu.:170.0
Max. :145.0 Max. :342.0 Max. :192.0
> summary(Laki_Laki)
trestbps chol thalach
Min. :104.0 Min. :174.0 Min. :109.0
1st Qu.:123.0 1st Qu.:203.5 1st Qu.:132.5
Median :130.0 Median :233.0 Median :145.0
Mean :132.3 Mean :238.9 Mean :144.1
3rd Qu.:140.0 3rd Qu.:276.0 3rd Qu.:155.5
Max. :160.0 Max. :318.0 Max. :179.0 Interpretasi
- Bardasarkan hasil analisis deskriptif didapatkan bahwa rata-rata tekanan darah dalam keadaan istirahat (trestbps), kolesterol serum (chol), dan detak jantung maksimum (thalach) pada wanita berturut-turut sebesar 125.1, 257.9 dan 153.1 sedangkan rata-rata tekanan darah dalam keadaan istirahat (trestbps), kolesterol serum (chol), dan detak jantung maksimum (thalach) pada laki-laki berturut-turut sebesar 132.3, 238.9, dan 144.1. Hal ini berarti rata-rata tekanan darah dalam keadaan istirahat (trestbps) pada wanita lebih kecil daripada rata-rata tekanan darah dalam keadaan istirahat (trestbps) pada laki-laki, sedangkan rata-rata kolesterol serum (chol), dan detak jantung maksimum (thalach) pada wanita lebih besar daripada rata-rata kolesterol serum (chol), dan detak jantung maksimum (thalach) pada laki-laki.
3.2 Hasil Uji
3.2.1 Uji Asumsi
3.2.1.1 Asumsi Normalitas
Hipotesis
\(H_0\) : Data berdistribusi normal multivariat vs \(H_1\) : Data tidak berdistribusi normal multivariat
Taraf Nyata : 0.05
Hasil Uji:
> library(mvnormtest)
> mshapiro.test(t(Wanita))
Shapiro-Wilk normality test
data: Z
W = 0.88254, p-value = 0.05177
> mshapiro.test(t(Laki_Laki))
Shapiro-Wilk normality test
data: Z
W = 0.90216, p-value = 0.1027Keputusan: P- value kedua kelompok (wanita dan laki-laki) > \(\alpha\) (0.05), Maka terima \(H_0\)
Interpretasi:
Dengan taraf nyata 5%, dapat disimpullkan bahwa data tekanan darah dalam keadaan istirahat (trestbps), kolesterol serum (chol), dan detak jantung maksimum (thalach) pada wanita menyebar normal normal multivariat.
Dengan taraf nyata 5%, dapat disimpullkan bahwa data tekanan darah dalam keadaan istirahat (trestbps), kolesterol serum (chol), dan detak jantung maksimum (thalach) pada laki-laki menyebar normal normal multivariat.
3.2.1.2 Asumsi Homogenitas
Hipotesis:
\(H_0\) : Matriks varian-kovarian dari kedua kelompok sama vs
\(H_1\) : Matriks varian-kovarian dari kedua kelompok tidak sama atau berbeda
Taraf Nyata : 0.05
Hasil Uji:
> library(MVTests)
> hom<-BoxM(data = heart_disease[,2:4],heart_disease$`sex`)
> summary(hom)
Box's M Test
Chi-Squared Value = 8.970589 , df = 6 and p-value: 0.175 Keputusan: P- value > \(\alpha\) (0.05), Maka terima \(H_0\)
Interpretasi:
- Dengan taraf nyata 5%, dapat disimpullkan bahwa asumsi kehomogenan matriks ragam-peragam terpenuhi pada data.
3.2.2 Uji \(T^2 Hotelling\)
Hipotesis:
\(H_0\) : \(\mu_1\) = \(\mu_2\) vs \(H_1\) : \(\mu_1\neq \mu_2\)
Taraf Nyata: 0.05
Hasil Uji:
> library(DescTools)
> with(heart_disease,
+ HotellingsT2Test(cbind(`trestbps`,`chol`,`thalach`)~`sex`))
Hotelling's two sample T2-test
data: cbind(trestbps, chol, thalach) by sex
T.2 = 2.3179, df1 = 3, df2 = 26, p-value = 0.09891
alternative hypothesis: true location difference is not equal to c(0,0,0)Keputusan: P- value > \(\alpha\) (0.05), Maka terima \(H_0\)
Interpretasi: Dengan taraf nyata 5% dapat disimpulkan bahwa pada vektor rata-rata jenis kelamin wanita dan laki-laki memiliki rata-rata tekanan darah dalam keadaan istirahat (trestbps), kolesterol serum (chol), dan detak jantung maksimum (thalach) yang sama.
4 KESIMPULAN
Berdasarkan pengujian yang telah dilakukan dapat disimpulkan bahwa tidak ada perbedaan yang signifikan antara tekanan darah dalam keadaan istirahat (trestbps), kolesterol serum (chol), dan detak jantung maksimum (thalach) pada jenis kelamin wanita dan laki-laki. Dengan kata lain, rata rata tekanan darah dalam keadaan istirahat (trestbps), kolesterol serum (chol), dan detak jantung maksimum (thalach) pada jenis kelamin wanita dan laki-laki dianggap sama.
5 DAFTAR PUSTAKA
Anis, W., Kuntoro, S. M., & Melaniani, S. (2021).Perbedaan Kekuatan Uji dan Kesalahan Tipe II (β) pada Uji Mardia MVN, Uji Henze Zikler MVN dan Uji Royston MVN dalam Analisis Normalitas Data Multivariat
Nensi, N., Pradana, M. S., & Chandra, N. E. (2022). Analisis Regresi Multivariat Berdasarkan Latar Belakang Pribadi Santri Terhadap Motivasi Ber-prestasi, Motivasi Belajar dan Prestasi Belajar. Jurnal Matematika Vol, 12(1), 56-67.
Richard A., Johnson, Dean W Wichern. 2007.Applied Multivariate Statistical Analysis. United States of America: Pearson Education, Inc.
RUSLI, R. (2018). Komparasi Prestasi Belajar (IPK) Dan Kredit Lulus Mahasiswa Universitas Negeri Makassar Berdasarkan Jalur Seleksi Masuk, Jenis Kelamin, Akreditasi Sekolah, Dan Sumber Biaya (Doctoral dissertation, Pascasarjana).