Penerapan T^2 Hotelling untuk Mengidentifikasi Perbedaan Data Umur, Resting BP, dan Kolesterol pada Pria dan Wanita

Evi Febiyanti Putri

22 Oktober 2023

Library:

> # install.packages("knitr")
> # install.packages("rmarkdown")
> # install.packages("prettydoc")
> # install.packages("equatiomatic")

1 PENDAHULUAN

1.1 Latar Belakang

Penyakit kardiovaskular merupakan penyakit yang terjadi akibat adanya gangguan pada jantung dan pembuluh darah(Juslim dan Herawati, 2018). Salah satu penyakit yang disebabkan oleh penyakit kardiovaskular adalah gagal jantung. Oleh karena itu, digunakan tiga faktor yang dapat digunakan untuk memprediksi apakah seseorang menderita penyakit jantung atau tidak. Tiga faktor tersebut di antaranya adalah umur, tekanan darah selama istirahat, dan kolesterol. Selain itu, untuk merincikan hasil penelitian, dibedakan data untuk laki-laki dan perempuan untuk mengidentifikasi apakah ada perbedaan dari ketiga faktor tersebut pada laki-laki dan perempuan. Hal ini dapat enjadi dasar untuk penelitian lebih lanjut jika ternyata terdapat perbedaan pada tiga faktor tersebut di laku-laki dan perempuan, penelitian lebih lanjut dapat digunakan untuk mengidentifikasi lebih tinggi mana, risiko untuk terkena penyakit jantung antara laki-laki dan perempuan. Oleh karena itu, penelitian ini dilakukan sebagai dasar pengetahuan umum untuk mengetahui perbedaan risiko terkana penyakit jantung pada laki-laki dan perempuan menggunakan analisis T2-Hotelling.

1.2 T2-Hotelling

1.2.1 Pengertian

Uji T2-Hotelling merupakan perluasan dari uji t-student untuk data multivariat(Musa dkk, 2022). Tujuan utamanya tetap sama seperti uji t-student yaitu membandingkan rata-rata dua sampel. Dimana perbedaannya pada uji t-student masing-masing populasi atau kelompok yang diuji hanya memiliki satu variabel tertentu, sedangkan pada uji T2-Hotelling masing-masing kelompok memiliki ≥ 2 variabel. Dapat disimpulkan bahwa T^2-Hotelling adalah perluasan uji t-student pada untuk data multivariat di mana pada masing-masing populasi atau kelompok memiliki ≥ 2 variabel.

1.2.2 ASUMSI

Asumsi yang harus dipenuhi untuk melaksanakan uji ini adalah asumsi normalitas dan homogenitas.

1.2.2.1 Asumsi Normalitas

Uji yang dapat digunakan untuk menguji normalitas di antaranya adalah Shapiro-Wilk, Kolmogorov-Smirnov, QQ Plot, dan lain sebagainya. Pada Shapiro-Wilk dan Kolmogorov-Smirnov, asumsi normalitas terpenuhi jika nilai sig/p-value/nilai-p bernilai lebih dari taraf nyata. Misal digunakan taraf nyata 5%, maka nilai-p harus >5% atau >0,05. Hal ini dikarenakan hipotesis yang digunakan pada H0 adalah data berdistribusi normal, sedangkan H1 berisi bahwa data tidak berdistribusi normal. Sehingga untuk memenuhi asumsi normalitas, diperlukan untuk menerima H0.Asumsi ini harus terpenuhi agar dapat menggunakan rumus umum statistik uji T2-Hotelling dengan tepat.

1.2.2.2 Asumsi Homogenitas

Uji yang dapat digunakan untuk menguji homogenitas matriks kovarian diantaranya adalah BoxM dan Bartlett. Asumsi ini terpenuhi jika nilai-p bernilai lebih dari taraf nyata. Misal digunakan taraf nyata 5%, maka nilai-p harus >5% atau >0,05. Hal ini dikarenakan hipotesis yang digunakan pada H0 adalah matriks kovarian kedua data bernilai sama, sedangkan H1 berisi sebaliknya.

1.2.3 SATU POPULASI

Pada satu populasi, maka ditujukan untuk menguji apakah rata-rata populasi dari beberapa variabel di populasi atau kelompok tersebut sama dengan beberapa nilai tertentu. Dapat dituliskan bahwa H0 : \(\mu\) 1 = \(\mu\) 0 dan H1 : \(\mu\) 1 \(\ne\) \(\mu\) 0, di mana \(\mu\) i adalah vektor rata-rata populasi pada kelompok i dan \(\mu\) 0 adalah vektor angka. Jika asumsi terpenuhi maka (Jobson, 1992): \[ T^2 = n(\bar{X}-\mu0)'S^{-1}(\bar{X}-\mu0) \] T2 dapat didekati dengan sebaran F, sehingga : \[ F = \frac{n-p}{p(n-1)}T^2 \] Jika H0 ditolak maka \[ F = \frac{n-p}{p(n-1)}T^2 \sim F_{\substack{p,(n-p)}} \]

1.2.4 DUA POPULASI

Pada dua populasi, maka ditujukan untuk menguji apakah rata-rata populasi dari beberapa variabel di populasi atau kelompok 1 sama dengan kelompok 2. Dapat dituliskan bahwa H0 : \(\mu\) 1 = \(\mu\) 2 dan H1 : \(\mu\) 1 \(\ne\) \(\mu\) 2, di mana \(\mu\) i adalah vektor rata-rata populasi pada kelompok i. Jika asumsi terpenuhi maka (Timm,2002): \[ T^2 = \frac{n{\substack{1}}n{\substack{2}}}{n{\substack{1}}+n{\substack{2}}}(\bar{X}\substack{1}-\bar{X}\substack{2})'S\substack{p}^{-1}(\bar{X}\substack{1}-\bar{X}\substack{2}) \\dimana\\ S\substack{p}\ = \frac{(n{\substack{1}}-1)S{\substack{1}}+(n{\substack{2}}-1)S{\substack{2}}}{n{\substack{1}}+n{\substack{2}}-2} \] T2 dapat didekati dengan sebaran F, sehingga : \[ F = \frac{n\substack{1}+n\substack{2}-p-1}{p(n\substack{1}+n\substack{2}-2)}T^2 \] Jika H0 ditolak maka \[ F = \frac{n\substack{1}+n\substack{2}-p-1}{p(n\substack{1}+n\substack{2}-2)}T^2 \sim F_{\substack{p,(n\substack{1}+n\substack{2}-p-1)}} \]

1.2.5 ≥ 3 POPULASI

Jika data yang diuji memiliki lebih dari 2 kelompok, uji T2-Hotelling tetap dapat digunakan dengan cara menguji secara berpasangan untuk setiap populasi. Misal, terdapat data dengan tiga kelompok yaitu muda, remaja, dan tua. Maka masing-masing pasangan dapat diuji dengan T2-Hotelling, di mana pasangan-pasangan tersebut di antara lain {(muda, remaja),(muda, tua), (remaja, tua)}. Masing-masing pasangan tersebut diuji apakah nilai rata-rata populasinya sama atau tidak menggunakan rumus hitung pada dua populasi atau kelompok.

1.3 DATA

Tedapat dua kelompok atau populasi yang digunakan pada data ini, yaitu pasien laki-laki dan perempuan. Masing-masing populasi diambil data mengenai :

1. Umur : umur pasien (tahun).

2. Resting BP : tekanan darah saat beristirahat (mmHg).

3. Kolesterol : kolesterol serum (mm/dl).

> library(readxl)
> data = read_excel("~/FILE EVI/UNIV/SEMESTER 5/PRAK ANMUL/heart.xlsx")
> data
# A tibble: 100 × 4
     Sex   Age RestingBP Cholesterol
   <dbl> <dbl>     <dbl>       <dbl>
 1     1    40       140         289
 2     1    31       136         220
 3     1    52       145         270
 4     1    43       125         210
 5     1    53       140         225
 6     1    29       135         250
 7     1    51       142         240
 8     1    45       129         275
 9     1    54       133         230
10     1    30       145         188
# ℹ 90 more rows

2 HASIL DAN INTERPRETASI

2.1 Library

> library(readxl) #membaca input data
> library(dplyr) #filter data untuk masing-masing kelompok atau populasi
> library(mvnormtest) #melakukan uji normalitas
> library(MVTests) #melakukan uji homogenitas
> library(DescTools) #melakukan uji T^2 Hotelling

2.2 Input Data

> data = read_excel("~/FILE EVI/UNIV/SEMESTER 5/PRAK ANMUL/heart.xlsx")
> str(data)
tibble [100 × 4] (S3: tbl_df/tbl/data.frame)
 $ Sex        : num [1:100] 1 1 1 1 1 1 1 1 1 1 ...
 $ Age        : num [1:100] 40 31 52 43 53 29 51 45 54 30 ...
 $ RestingBP  : num [1:100] 140 136 145 125 140 135 142 129 133 145 ...
 $ Cholesterol: num [1:100] 289 220 270 210 225 250 240 275 230 188 ...
> x = data %>% filter(Sex == 1)
> y = data %>% filter(Sex == 2)
> x = x[,-1]
> y = y[,-1]
> data = as.matrix(rbind(x,y))
> k = c(rep(1,52), rep(2,48))

2.3 Uji Asumsi Normalitas

Hipotesis

H0 : Data berdistribusi normal

H1 : Data tidak bersitribusi normal

Taraf Uji

\[ \alpha=0.05 \]

Statistik Uji dan Nilai-p

> mshapiro.test(t(x))

    Shapiro-Wilk normality test

data:  Z
W = 0.97635, p-value = 0.3844
> mshapiro.test(t(y))

    Shapiro-Wilk normality test

data:  Z
W = 0.97963, p-value = 0.5633

Keputusan

Data laki-laki (x) : p-value > alpha, maka terima H0

Data Perempuan (y) : p-value > alpha, maka terima H0

Kesimpulan

Pada taraf nyata 5% dapat disimpulkan bahwa data pasien laki-laki dan perempuan berdistribusi normal (asumsi normalitas terpenuhi).

2.4 Uji Asumsi Homogenitas

Hipotesis

H0 : Data pasien laki-laki dan perempuan memiliki matriks kovarians yang sama

H1 : Data pasien laki-laki dan perempuan tidak memiliki matriks kovarian yang sama

Taraf Uji

\[ \alpha=0.05 \]

Statistik Uji dan Nilai-p

> hom <- BoxM(data = data, k)
> summary(hom)
       Box's M Test 

Chi-Squared Value = 5.632181 , df = 6  and p-value: 0.466 

Keputusan

Data laki-laki (x) : p-value > alpha, maka terima H0

Data Perempuan (x) : p-value > alpha, maka terima H0

Kesimpulan

Pada taraf nyata 5% dapat disimpulkan data pasien laki-laki dan perempuan memiliki matriks kovarian yang sama (asumsi homogenitas terpenuhi).

2.5 Uji T2-Hotelling

Hipotesis

H0 : Data pasien laki-laki dan perempuan memiliki vektor rata-rata yang sama

H1 : Data pasien laki-laki dan perempuan tidak memiliki vektor rata-rata yang sama

Taraf Uji

\[ \alpha=0.05 \]

Statistik Uji dan Nilai-p

> HotellingsT2Test(data~k)

    Hotelling's two sample T2-test

data:  data by k
T.2 = 2.8608, df1 = 3, df2 = 96, p-value = 0.04088
alternative hypothesis: true location difference is not equal to c(0,0,0)

Keputusan

p-value < alpha, maka tolak H0

Kesimpulan

Pada taraf nyata 5% dapat disimpulkan data pasien laki-laki dan perempuan memiliki vektor rata-rata yang berbeda.

3 KESIMPULAN

Setelah melakukan analisis, dapat disimpulkan bahwa rata-rata dari data umur, tekanan darah saat bersitirahat, dan kolesterol pada laki-laki dan perempuan berbeda. Hal ini dapat mengartikan bahwa terdapat perbedaan pada risiko terkena penyakit jantung pada laki-laki dan perempuan. Namun diperlukan uji yang lebih lanjut, untuk memberikan kesimpulan yang lebih mendetail.

4 DAFTAR PUSTAKA

Jobson, J.D. 1992. Applied Mulivariate Data Analysis. New York: Springer Science+Business Media.

Juslim, R. Rukma, dan F. Herawati. 2018. Penyakit Kardiovaskular.

Musa, M. dkk. 2022. Analisis Multivariat Terapan untuk Penelitian Ekologi Kunatitatif. Malang: Universitas Brawijaya Press.

Timm, N.H. 2002. Applied Multivariate Analysis. New York: Springer-Verlang, Inc.