Library:

> # install.packages("knitr")
> # install.packages("rmarkdown")
> # install.packages("prettydoc")
> # install.packages("equatiomatic")

1 PENDAHULUAN

1.1 Latar Belakang

Tekanan darah dalam keadaan istirahat, kolesterol serum, dan detak jantung maksimum adalah parameter yang krusial dalam menilai risiko penyakit jantung dan permasalahan kesehatan kardiovaskular lainnya. Jenis kelamin telah lama dianggap sebagai salah satu faktor yang dapat berpengaruh terhadap variabel-variabel ini. Penelitian sebelumnya telah mengungkapkan bahwa terdapat potensi adanya perbedaan dalam karakteristik fisiologis antara pria dan wanita yang mungkin memengaruhi parameter-parameter ini.

Sebelumnya, studi ilmiah telah mengidentifikasi perbedaan biologis yang menjadi dasar dari perbedaan ini. Sebagai contoh, hormon seks seperti estrogen dan testosteron memiliki peran penting dalam mengatur tekanan darah dan profil lipid dalam darah. Selain itu, perbedaan dalam struktur dan fungsi jantung antara pria dan wanita juga dapat memiliki dampak pada tingkat detak jantung maksimum yang dapat dicapai.

Meski sudah ada beberapa temuan seputar perbedaan ini, masih banyak pertanyaan yang perlu dipecahkan. Oleh karena itu, dalam penelitian ini, kami akan menggunakan analisis statistik \(T^2-Hotelling\) untuk mengevaluasi apakah perbedaan antara pria dan wanita dalam variabel-variabel ini memiliki signifikansi statistik. Diharapkan bahwa hasil penelitian ini akan memberikan wawasan yang lebih mendalam tentang perbedaan berdasarkan jenis kelamin dalam parameter kesehatan kardiovaskular ini. Hasil ini bisa sangat bermanfaat dalam pengembangan strategi intervensi kesehatan yang lebih tepat sasaran dan spesifik.

1.2 Tinjauan Pustaka

1.2.1 Uji Asumsi

1.2.1.1 Asumsi Normalitas

Multivariasi normal (MVN) adalah salah satu asumsi penting dalam uji parameter multivariat. Asumsi mengenai normalitas menjelaskan bahwa apabila sampel tersebut mengikuti distribusi normal, maka sampel tersebut akan mencerminkan dengan baik kondisi sebenarnya di populasi. Di sisi lain, jika data tersebut tidak mematuhi distribusi normal, maka data tersebut tidak dapat diolah atau dianalisis dengan menggunakan uji parametrik multivariat. Jika asumsi ini dilanggar dapat mengakibatkan hasil analisis statistik menjadi tidak valid atau bias, terutama dengan sampel yang berukuran kecil. Dalam menguji normalitas dalam konteks data multivariat, ada beberapa uji yang banyak digunakan, seperti Uji Mardia MVN, Henze Zikler MVN, dan Shapiro Wilk MVN. Pengujian distribusi normal multivariat menggunakan hipotesis sebagai berikut. Hipotesis: \(H_0\) : Data berdistribusi normal multivariat vs \(H_1\) : Data tidak berdistribusi normal multivariat

Asumsi data berdistribusi normal multivariat atau uji normalitas multivariat dapat dilakukan dengan menggunakan Scatter-Plot dari nilai Chi-Square dan jarak mahalanobis dengan persamaan berikut (Rencher & Schimek, 1997). Jika Scatter-Plot dari nilai Chi-Square dan jarak mahalanobis titik-titik menyebar hampir membentuk garis lurus, maka dapat dinyatakan bahwa data berdistribusi normal multivariat.

1.2.1.2 Asumsi Homogenitas

Pemeriksaan kesamaan matriks varians kovarians antara dua populasi atau lebih dilakukan dengan Box’s M test yang dirumuskan sebagai berikut:

Hipotesis untuk uji ini adalah: \(H_0\) : \(∑_1\) = \(∑_2\) = … = \(∑_k\) = ∑ (matriks kovarians bersifat multivariat homoskedastisitas) vs \(H_1\) : minimal ada satu \(∑_i\)\(∑_j\) (matriks kovarians tidak bersifat multivariat homoskedastisitas)

Statistik Uji:

\[C = (1-u)M\]

dimana

\[u= [∑_l\frac {1}{(n_l-1)}- \frac {1}{(n_l-1)}][ \frac {2p^2-2p-1}{6(p+1)(q-1)}]\] \[M= [∑_l(n_l-1)]ll|S_p| - ∑_l[(n_l-1)ln|S_l|] \] Daerah kritis tolak \(H_0\) jika C > \(X^2_{\gamma(\alpha)}\) dengan \[\gamma =\frac{1}{2}p(p+1)(q-1) \]

1.2.2 Uji \(T^2-Hotelling\)

Uji \(T^2-Hotelling\) adalah salah satu uji statistik multivariat yang digunakan untuk melihat apakah terdapat perbedaan antara 2 kelompok percobaan yang terdiri dari 2 atau lebih variabel. Pada pengujian vektor rata rata dilakukan secara serentak pada semua variabel. Dengan kata lain, Uji \(T^2-Hotelling\) adalah Uji-T namun pada kasus multivariabel. Tujuan dari uji \(T^2-Hotelling\) adalah untuk mengukur apakah terdapat perbedaan yang signifikan antara kelompok-kelompok ini dalam dimensi multivariat. Uji ini menghasilkan statistik \(T^2\) yang digunakan untuk menguji hipotesis nol bahwa rata-rata kelompok-kelompok tersebut adalah sama dalam beberapa variabel yang dianalisis.

Distribusi ini didefinisikan sebagai \[T^2 = n(\bar{x}-\mu_0)'S^{-1}(\bar{x}-\mu_0)\]

dengan \(\bar{x}\) merupakan vektor rata-rata sampel yang berukuran p x 1, S merupakan matriks varians-kovarians sampel yang berukuran p x p, dan \(\mu_0\) merupakan vektor rata-rata populasi yang berukuran p x 1.

Hipotesis untuk uji ini adalah : \(H_0\) : \(\mu_0\) = 0 vs \(H_1\) : \(\mu_0 \neq 0\)

1.2.2.1 Uji Hipotesis Rata-Rata Multivariat untuk Satu Populasi

\(H_0\) di tolak apabila \(T^2\) > \(\frac{(n-1)p}{(n-p)}F_{\alpha,(p,n-p)}\)

1.2.2.2 Uji Hipotesis Rata-Rata Multivariat untuk Dua Populasi

Statistik \(T^2\) berubah menjadi \[T^2 = [\bar{x_1}-\bar{x_2}-(\mu_1-\mu_2)]'[(\frac {1}{(n_1)}+\frac {1}{(n_2)})S_{pooled}]^{-1}[\bar{x_1}-\bar{x_2}-(\mu_1-\mu_2)]\] dengan \[S_{pooled} = \frac {n_1-1}{(n_1+n_2-2)}S_1 + \frac {n_2-1}{(n_1+n_2-2)}S_2\] \(H_0\) di tolak apabila \(T^2\) > \(\frac{(n_1+n_2-2)p}{(n_1+n_2-p-1)}F_{p,n_!+n_2-p-1}\)

1.3 Data

Data yang digunakan pada uji ini merupakan data sekunder yang diperoleh dari Datasets Kaggle meliputi jenis kelamin (sex), tekanan darah dalam keadaan istirahat (trestbps), kolesterol serum (chol), dan detak jantung maksimum (thalach) sebanyak 30 amatan. Adapun data dapat dilihat sebagai berikut:

sex trestbps chol thalach
0 125 212 168
1 140 203 155
1 145 174 125
1 148 203 161
0 138 294 106
0 100 248 122
1 114 318 140
1 160 289 145
1 120 249 144
1 122 286 116
0 112 149 125
0 132 341 136
0 118 210 192
1 140 298 122
1 128 204 156
0 118 210 192
0 140 308 142
1 124 266 109
0 120 244 162
1 140 211 165
1 140 185 155
0 106 223 142
1 104 208 148
0 135 252 172
0 120 209 173
0 145 307 146
1 130 233 179
0 136 319 152
1 130 256 142
0 132 342 166

2 SOURCE CODE

2.1 Library yang Dibutuhkan

>     # Library
>     library(mvnormtest)
>     library(MVTests)
>     library(DescTools)

2.2 Import Data

>     #Import data
>     heart_disease <- read.csv("D:/KULIAH SHOFI/Semester 5/Analisis Multivariat I/Praktikum/heart.csv")
>     View(heart_disease)
> 
>     #Split data
>     split <- split(heart_disease[,-1], heart_disease$`sex`)
>     Wanita<-split[['0']]
>     Wanita
   trestbps chol thalach
1       125  212     168
5       138  294     106
6       100  248     122
11      112  149     125
12      132  341     136
13      118  210     192
16      118  210     192
17      140  308     142
19      120  244     162
22      106  223     142
24      135  252     172
25      120  209     173
26      145  307     146
28      136  319     152
30      132  342     166
> 
>     Laki_Laki<-split[['1']]
>     Laki_Laki
   trestbps chol thalach
2       140  203     155
3       145  174     125
4       148  203     161
7       114  318     140
8       160  289     145
9       120  249     144
10      122  286     116
14      140  298     122
15      128  204     156
18      124  266     109
20      140  211     165
21      140  185     155
23      104  208     148
27      130  233     179
29      130  256     142

2.3 Statistika Deskriptif

>     summary(Wanita)
    trestbps          chol          thalach     
 Min.   :100.0   Min.   :149.0   Min.   :106.0  
 1st Qu.:118.0   1st Qu.:211.0   1st Qu.:139.0  
 Median :125.0   Median :248.0   Median :152.0  
 Mean   :125.1   Mean   :257.9   Mean   :153.1  
 3rd Qu.:135.5   3rd Qu.:307.5   3rd Qu.:170.0  
 Max.   :145.0   Max.   :342.0   Max.   :192.0  
>     summary(Laki_Laki)
    trestbps          chol          thalach     
 Min.   :104.0   Min.   :174.0   Min.   :109.0  
 1st Qu.:123.0   1st Qu.:203.5   1st Qu.:132.5  
 Median :130.0   Median :233.0   Median :145.0  
 Mean   :132.3   Mean   :238.9   Mean   :144.1  
 3rd Qu.:140.0   3rd Qu.:276.0   3rd Qu.:155.5  
 Max.   :160.0   Max.   :318.0   Max.   :179.0  

2.4 Uji Asumsi

2.4.1 Asumsi Normalitas

> library(mvnormtest)
> mshapiro.test(t(Wanita))

    Shapiro-Wilk normality test

data:  Z
W = 0.88254, p-value = 0.05177
> mshapiro.test(t(Laki_Laki))

    Shapiro-Wilk normality test

data:  Z
W = 0.90216, p-value = 0.1027

2.4.2 Asumsi Homogenitas

>     library(MVTests)
>     hom<-BoxM(data = heart_disease[,2:4],heart_disease$`sex`)
>     summary(hom)
       Box's M Test 

Chi-Squared Value = 8.970589 , df = 6  and p-value: 0.175 

2.5 Uji \(T^2-Hotelling\)

>     library(DescTools)
>     with(heart_disease,
+          HotellingsT2Test(cbind(`trestbps`,`chol`,`thalach`)~`sex`))

    Hotelling's two sample T2-test

data:  cbind(trestbps, chol, thalach) by sex
T.2 = 2.3179, df1 = 3, df2 = 26, p-value = 0.09891
alternative hypothesis: true location difference is not equal to c(0,0,0)

3 HASIL DAN PEMBAHASAN

3.1 Statistika Deskriptif

>     summary(Wanita)
    trestbps          chol          thalach     
 Min.   :100.0   Min.   :149.0   Min.   :106.0  
 1st Qu.:118.0   1st Qu.:211.0   1st Qu.:139.0  
 Median :125.0   Median :248.0   Median :152.0  
 Mean   :125.1   Mean   :257.9   Mean   :153.1  
 3rd Qu.:135.5   3rd Qu.:307.5   3rd Qu.:170.0  
 Max.   :145.0   Max.   :342.0   Max.   :192.0  
>     summary(Laki_Laki)
    trestbps          chol          thalach     
 Min.   :104.0   Min.   :174.0   Min.   :109.0  
 1st Qu.:123.0   1st Qu.:203.5   1st Qu.:132.5  
 Median :130.0   Median :233.0   Median :145.0  
 Mean   :132.3   Mean   :238.9   Mean   :144.1  
 3rd Qu.:140.0   3rd Qu.:276.0   3rd Qu.:155.5  
 Max.   :160.0   Max.   :318.0   Max.   :179.0  

Interpretasi

  • Bardasarkan hasil analisis deskriptif didapatkan bahwa rata-rata tekanan darah dalam keadaan istirahat (trestbps), kolesterol serum (chol), dan detak jantung maksimum (thalach) pada wanita berturut-turut sebesar 125.1, 257.9 dan 153.1 sedangkan rata-rata tekanan darah dalam keadaan istirahat (trestbps), kolesterol serum (chol), dan detak jantung maksimum (thalach) pada laki-laki berturut-turut sebesar 132.3, 238.9, dan 144.1. Hal ini berarti rata-rata tekanan darah dalam keadaan istirahat (trestbps) pada wanita lebih kecil daripada rata-rata tekanan darah dalam keadaan istirahat (trestbps) pada laki-laki, sedangkan rata-rata kolesterol serum (chol), dan detak jantung maksimum (thalach) pada wanita lebih besar daripada rata-rata kolesterol serum (chol), dan detak jantung maksimum (thalach) pada laki-laki.

3.2 Hasil Uji

3.2.1 Uji Asumsi

3.2.1.1 Asumsi Normalitas

Hipotesis

\(H_0\) : Data berdistribusi normal multivariat vs \(H_1\) : Data tidak berdistribusi normal multivariat

Taraf Nyata : 0.05

Hasil Uji:

> library(mvnormtest)
> mshapiro.test(t(Wanita))

    Shapiro-Wilk normality test

data:  Z
W = 0.88254, p-value = 0.05177
> mshapiro.test(t(Laki_Laki))

    Shapiro-Wilk normality test

data:  Z
W = 0.90216, p-value = 0.1027

Keputusan: P- value kedua kelompok (wanita dan laki-laki) > \(\alpha\) (0.05), Maka terima \(H_0\)

Interpretasi:

  • Dengan taraf nyata 5%, dapat disimpullkan bahwa data tekanan darah dalam keadaan istirahat (trestbps), kolesterol serum (chol), dan detak jantung maksimum (thalach) pada wanita menyebar normal normal multivariat.

  • Dengan taraf nyata 5%, dapat disimpullkan bahwa data tekanan darah dalam keadaan istirahat (trestbps), kolesterol serum (chol), dan detak jantung maksimum (thalach) pada laki-laki menyebar normal normal multivariat.

3.2.1.2 Asumsi Homogenitas

Hipotesis:

\(H_0\) : Matriks varian-kovarian dari kedua kelompok sama vs

\(H_1\) : Matriks varian-kovarian dari kedua kelompok tidak sama atau berbeda

Taraf Nyata : 0.05

Hasil Uji:

>     library(MVTests)
>     hom<-BoxM(data = heart_disease[,2:4],heart_disease$`sex`)
>     summary(hom)
       Box's M Test 

Chi-Squared Value = 8.970589 , df = 6  and p-value: 0.175 

Keputusan: P- value > \(\alpha\) (0.05), Maka terima \(H_0\)

Interpretasi:

  • Dengan taraf nyata 5%, dapat disimpullkan bahwa asumsi kehomogenan matriks ragam-peragam terpenuhi pada data.

3.2.2 Uji \(T^2 Hotelling\)

Hipotesis:

\(H_0\) : \(\mu_1\) = \(\mu_2\) vs \(H_1\) : \(\mu_1\neq \mu_2\)

Taraf Nyata: 0.05

Hasil Uji:

>     library(DescTools)
>     with(heart_disease,
+          HotellingsT2Test(cbind(`trestbps`,`chol`,`thalach`)~`sex`))

    Hotelling's two sample T2-test

data:  cbind(trestbps, chol, thalach) by sex
T.2 = 2.3179, df1 = 3, df2 = 26, p-value = 0.09891
alternative hypothesis: true location difference is not equal to c(0,0,0)

Keputusan: P- value > \(\alpha\) (0.05), Maka terima \(H_0\)

Interpretasi: Dengan taraf nyata 5% dapat disimpulkan bahwa pada vektor rata-rata jenis kelamin wanita dan laki-laki memiliki rata-rata tekanan darah dalam keadaan istirahat (trestbps), kolesterol serum (chol), dan detak jantung maksimum (thalach) yang sama.

4 KESIMPULAN

Berdasarkan pengujian yang telah dilakukan dapat disimpulkan bahwa tidak ada perbedaan yang signifikan antara tekanan darah dalam keadaan istirahat (trestbps), kolesterol serum (chol), dan detak jantung maksimum (thalach) pada jenis kelamin wanita dan laki-laki. Dengan kata lain, rata rata tekanan darah dalam keadaan istirahat (trestbps), kolesterol serum (chol), dan detak jantung maksimum (thalach) pada jenis kelamin wanita dan laki-laki dianggap sama.

5 DAFTAR PUSTAKA