1 PENDAHULUAN
1.1 Latar Belakang
Penyakit jantung merupakan salah satu masalah kesehatan utama di seluruh dunia. Menurut WHO (World Health Organization) pada tahun 2020, penyakit kardiovaskuler menyumbang sekitar 25% dari hasil angka kematian dan mengalami peningkatan, salah satu diantaranya berada di Asia Tenggara. Penyakit jantung terjadi akibat penyumbatan pada arteri koroner oleh tumpukan plak, polutan atau zat-zat kimia lingkungan yang biasanya masuk ke tubuh melalui makanan, minuman atau berbentuk gas yang terkumpul pada dinding arteri koronaria (Tambunan dan Baringbing, 2023). Banyak faktor yang dapat memicu terjadinya penyakit jantung, antara lain kadar kolesterol dalam tubuh, obesitas, diabetes, merokok, diet tidak sehat, kurangnya aktivitas fisik, tekanan darah tinggi, dan lain-lain.
Selain itu, usia juga menjadi salah satu faktor yang berpengaruh pada resiko terkena penyakit kardiovaskuler. Semakin bertambah usia, maka risiko terkena penyakit jantung semakin tinggi. Dengan kata lain, individu dengan usia lanjut lebih rentan terkena penyakit jantung. Hal ini dikarenakan, pertambahan usia menyebabkan perubahan di dalam jantung dan pembuluh darah.
Penelitian ini berfokus pada ada/tidaknya pengaruh kelompok usia terhadap faktor pemicu penyakit jantung, seperti kolesterol, obesitas yang diukur dengan BMI, dan diabetes yang diukur dari kadar glukosa dalam darah. Apabila kelompok usia berpengaruh terhadap ketiga faktor tersebut maka terdapat kemungkinan bahwa kelompok usia juga menjadi pemicu terjadinya penyakit jantung. Oleh karena itu, diperlukan sebuah analisis statistik yang kuat untuk menjawab permasalahan tersebut. Analisis yang tepat untuk digunakan adalah analisis MANOVA. Analisis tersebut digunakan untuk menguji perbedaan dalam beberapa variabel dependen antara beberapa kelompok.Dalam konteks ini, MANOVA digunakan untuk sejauh mana perbedaan pengaruh kelompok usia terhadap faktor-faktor pemicu penyakit jantung. Variabel dependen akan mencakup faktor-faktor pemicu penyakit jantung seperti total kolesterol dalam tubuh, BMI, dan kadar glukosa dalam darah. Sementara kelompok usia akan menjadi variabel independen yang terbagi menjadi 3 kelompok usia.
1.2 Rumusan Masalah
Berdasarkan uraian latar belakang di atas, maka rumusan masalah untuk penelitian ini adalah sebagai berikut.
- Apakah terdapat pengaruh yang signifikan pada kelompok usia terhadap total kolesterol dalam tubuh, BMI, dan kadar glukosa dalam darah secara multivariat?
- Apakah data pengaruh kelompok usia terhadap total kolesterol dalam tubuh, BMI, dan kadar glukosa dalam darah memenuhi semua asumsi analisis?
- Bagaimana perbedaan hasil antara analisis multivariat dengan analisis univariat?
1.3 Tujuan
Tujuan dari penelitian ini adalah sebagai berikut.
- Untuk mengetahui pengaruh kelompok usia terhadap faktor-faktor pemicu penyakit jantung, seperti tingginya kolesterol dalam tubuh, obesitas, dan tingginya kadar glukosa dalam darah secara multivariat.
- Untuk mengetahui apakah data yang digunakan sudah memenuhi seluruh asumsi analisis yang disyaratkan.
- Untuk mengetahui perbandingan hasil analisis Multivariat dan Univariat pada data yang sama.
2 Analisis Penelitian
2.1 Metode Analisis
Penelitian ini menggunakan analisis MANOVA (Multivariate Analysis of Variance) yang dimana analisis tersebut merupakan metode statistik yang digunakan untuk untuk menguji perbedaan rata-rata pengaruh antara dua atau lebih kelompok pada variabel independen terhadap dua atau lebih variabel dependen. Hal ini sejalan dengan tujuan penelitian, sehingga analisis yang cocok untuk digunakan ialah analisis MANOVA. Dalam penelitian ini, MANOVA dapat digunakan untuk mengevaluasi apakah ada perbedaan signifikan pada tiga kelompok usia yang berbeda terhadap faktor pemicu penyakit jantung (variabel dependen).
Analisis MANOVA merupakan perluasan dari analisis ANOVA pada data univariat. Pada analisis ANOVA, hubungan antar variabel dependen secara simultan tidak dapat terjelaskan dengan baik. Maka dari itu, digunakanlah analisis MANOVA untuk dapat mengetahui informasi mengenai hubungan antara variabel dependen secara simultan.
2.2 Data
Data yang digunakan adalah data sekunder yang bersumber dari https://www.kaggle.com/datasets/dileep070/heart-disease-prediction-using-logistic-regression. Dalam penelitian ini, data yang digunakan yaitu sebanyak 49 pengamatan. Data terdiri dari 4 variabel, yaitu 1 variabel independen dan 3 variabel dependen. Adapun uraian variabel yang digunakan adalah sebagai berikut.
Variabel Independen
Variabel independen yang digunakan adalah kelompok usia yang dibagi menjadi tiga kelompok, yaitu:
- Usia 30-42 tahun
- Usia 43-54 tahun
- Usia 55-66 tahun
Variabel Dependen
Terdapat tiga variabel Dependen yang digunakan, antara lain:
- Total kolesterol dalam tubuh (mg/dL)
- Body Mass Index (BMI) yang mana sebagai indikator untuk melihat apakah orang tersebut obesitas atau tidak (kg/m^2)
- Kadar glukosa dalam darah (mg/dL)
Berikut adalah data yang digunakan dalam penelitian.
> library(readxl)
> data_usia <- read_excel("C:/Users/dinar/Downloads/data_jantung usia.xlsx")
> library(knitr)
> kable(data_usia)| Usia | Total_Kolestrol | BMI | Kadar Glukosa |
|---|---|---|---|
| usia 30-42 | 165 | 26.74 | 77 |
| usia 30-42 | 200 | 23.80 | 74 |
| usia 30-42 | 180 | 27.78 | 80 |
| usia 30-42 | 194 | 24.33 | 62 |
| usia 30-42 | 173 | 28.39 | 61 |
| usia 30-42 | 270 | 33.11 | 75 |
| usia 30-42 | 195 | 23.24 | 78 |
| usia 30-42 | 231 | 22.78 | 93 |
| usia 30-42 | 170 | 19.64 | 77 |
| usia 30-42 | 195 | 26.88 | 65 |
| usia 30-42 | 237 | 23.28 | 74 |
| usia 30-42 | 190 | 21.59 | 85 |
| usia 30-42 | 233 | 28.93 | 90 |
| usia 43-54 | 228 | 30.30 | 99 |
| usia 43-54 | 225 | 23.61 | 88 |
| usia 43-54 | 247 | 27.64 | 61 |
| usia 43-54 | 226 | 27.57 | 75 |
| usia 43-54 | 301 | 28.04 | 72 |
| usia 43-54 | 265 | 25.26 | 88 |
| usia 43-54 | 313 | 21.68 | 78 |
| usia 43-54 | 250 | 28.73 | 76 |
| usia 43-54 | 285 | 23.10 | 85 |
| usia 43-54 | 175 | 25.09 | 85 |
| usia 43-54 | 150 | 28.69 | 88 |
| usia 43-54 | 261 | 23.59 | 74 |
| usia 43-54 | 294 | 24.18 | 66 |
| usia 43-54 | 237 | 19.66 | 75 |
| usia 43-54 | 245 | 25.34 | 70 |
| usia 43-54 | 203 | 29.29 | 97 |
| usia 43-54 | 250 | 28.73 | 76 |
| usia 43-54 | 254 | 22.91 | 76 |
| usia 43-54 | 216 | 23.47 | 95 |
| usia 43-54 | 260 | 26.36 | 79 |
| usia 43-54 | 266 | 31.16 | 90 |
| usia 43-54 | 215 | 25.11 | 75 |
| usia 43-54 | 245 | 32.04 | 81 |
| usia 43-54 | 200 | 26.66 | 81 |
| usia 43-54 | 214 | 24.71 | 87 |
| usia 43-54 | 242 | 22.16 | 87 |
| usia 55-66 | 257 | 28.09 | 75 |
| usia 55-66 | 209 | 20.77 | 88 |
| usia 55-66 | 247 | 30.36 | 74 |
| usia 55-66 | 246 | 23.44 | 78 |
| usia 55-66 | 219 | 28.57 | 76 |
| usia 55-66 | 254 | 25.50 | 87 |
| usia 55-66 | 205 | 33.11 | 85 |
| usia 55-66 | 179 | 22.15 | 75 |
| usia 55-66 | 267 | 27.10 | 79 |
| usia 55-66 | 252 | 30.47 | 87 |
3 TINJAUAN PUSTAKA
3.1 Statistika Deskriptif
Statistika deskriptif adalah metode-metode yang berkaitan dengan pengumpulan dan penyajian suatu gugus data sehingga memberikan informasi yang berguna (Setiawan et al, 2017). Tujuan statistika deskriptif adalah untuk untuk memberi gambaran pola atau karakteristik data yang diamati tanpa melakukan inferensi statistika terhadap populasi yang lebih besar. Untuk memberikan gambaran tentang pusat distribusi data, statistika deskriptif melibatkan pengukuran tendensi sentral, seperti rata-rata (mean), median, dan modus. Selain itu, untuk mengetahui penyebaran nilai data, statistika deskriptif melibatkan pengukuran sebaran seperti rentang, deviasi standar, dan kuartil.
Adapun grafik dan diagram juga digunakan dalam statistika deskriptif untuk menyajikan data secara visual, membantu dalam memahami pola, outlier, dan distribusi data. Contoh grafik dan diagram tersebut, yaitu histogram, box plot, scatter plot, diagram lingkaran, dan lain sebagainya. Visualisasi data yang digunakan dalam penelitian ini adalah dengan box plot.
3.2 Analisis MANOVA
MANOVA (Multivariate Analysis of Variance) adalah suatu teknik analisis statistika yang memiliki karakteristik yaitu variabel dependen yang digunakan lebih dari satu. Analisis MANOVA digunakan untuk menguji perbedaan rata-rata pengaruh antara dua atau lebih kelompok pada variabel independen terhadap dua atau lebih variabel dependen. MANOVA merupakan perluasan dari ANOVA yang mana perbedaannya hanya terletak pada jumlah variabel dependennya (Sunaryo, 2014). MANOVA menggunakan satu atau lebih variabel independen kategorik (biasanya berupa perlakuan) sebagai prediktor dan dua atau lebih variabel dependen metrik yang bersifat tak bebas secara simultan.
Hipotesis: \[ H0: \mu_1=\mu_2=...=\mu_g \\ H1: \text{minimal terdapat satu } \mu_j \text{ yang berbeda} \] note: seluruh hipotesis tersebut berupa vektor dari mu_j dimana j = 1,2,..,g
3.3 MANOVA One Way
One-Way MANOVA atau MANOVA satu arah merupakan analisis yang digunakan untuk menilai apakah terdapat perbedaan signifikan antara rata-rata kelompok-kelompok pada dua atau lebih variabel dependen . Analisis One-Way MANOVA hanya melibatkan satu faktor atau variabel independen dan dua atau lebih variabel dependen yang bersifat kontinu.
Model One-Way MANOVA : \[ y_{lj}= \mu+\tau_l+\varepsilon_{lj} \] dimana, j = 1,2,..,nl l = 1,2,..,g nl = banyaknya pengamatan pada perlakuan ke-i g = banyaknya perlakuan atau kelompok
Hipotesis: \[ H0: \tau_1=\tau_2=...=\tau_g=0 \\ H1: minimal\hspace{2mm} terdapat \hspace{2mm} sepasang \hspace{2mm} \tau_l \neq 0 \] note: seluruh hipotesis tersebut berupa vektor dari tau_l dimana l = 1,2,..,g
3.4 Statistik Uji MANOVA
3.4.1 Wilk’s Lambda
Statistik uji digunakan jika terdapat lebih dari dua kelompok variabel independen dan asumsi homogenitas matriks varians-kovarians terpenuhi. \[ \lambda^{*} = \frac{|W|}{|B|+|W| } \] dimana,
W = matriks varians-kovarians galat pada MANOVA
B = matriks varians-kovarians perlakuan pada MANOVA
Statistik uji ini akan menghasilkan keputusan Tolak H0, apabila \[ \lambda^{*} < U_{\alpha,(g-1,\Sigma n_t-g)} \hspace{1mm} atau \hspace{1mm}p-value<\alpha \]
3.4.2 Pillai’s Trace
Statistik uji ini digunakan jika asumsi homogenitas matriks varians-kovarians tidak terpenuhi dan ukuran-ukuran sampel kecil. \[ P = tr[(B+W)^{-1}(B)] \]
Statistik uji ini akan menghasilkan keputusan Tolak H0, apabila \[ p-value<\alpha \]
3.4.3 Hotteling’s Lambda
Statistik uji digunakan jika hanya terdapat dua kelompok variabel independen. \[ T = tr[(W)^{-1}(B)] \] Statistik uji ini akan menghasilkan keputusan Tolak H0, apabila \[ p-value<\alpha \]
3.4.4 Roy’s Test
Statistik uji ini hanya digunakan jika asumsi homogenitas matriks varians-kovarians terpenuhi. \[ R = \lambda_{maks} =maks(\lambda_1,\lambda_2,...,\lambda_p) \\ R=\text{akar karakteristik maksimum dari }(W)^{-1}(B) \] Statistik uji ini akan menghasilkan keputusan Tolak H0, apabila \[ p-value<\alpha \]
3.5 Asumsi dalam MANOVA
3.5.1 Uji Asumsi Normalitas Multivariat
Uji normalitas multivariat bertujuan untuk menguji apakah data yang digunakan dalam analisis tersebut mengikuti distribusi normal atau tidak. Asumsi normalitas menjelaskan bahwa apabila sampel berdistribusi normal maka sampel itu menggambarkan kondisi riil seperti populasi (Anis, 2021). Analisis MANOVA dapat dilakukan apabila data berdistribusi normal. Apabila asumsi normalitas diabaikan maka hasil dari analisis statistik akan menjadi tidak valid atau bias, terutama pada besar sampel yang kecil. Pengujian normalitas multivariat dapat dilakukan dengan uji Mardia MVN, uji Henze-Zirkler, uji Royston, uji Anderson-Darling, uji Shapiro Wilk, serta dapat dilakukan dengan visualisasi data menggunakan Q-Q plot, dan metode lainnya.
Hipotesis: \[ H0: \text{Data berdistribusi Normal} \\ H1: \text{Data tidak berdistribusi Normal} \] Kriteria uji: Tolak H0, apabila p-value < α
3.5.2 Uji Asumsi Homogenitas Ragam
Fungsi dari uji homogenitas ragam adalah untuk mengetahui apakah varians data tersebut homogen atau heterogen, tergantung pada faktor-faktor tertentu. Asumsi terpenuhi apabila ragam dari data adalah homogen. Pengujian asumsi dilakukan dengan Uji Levene.
Hipotesis: \[ H0: \text{Ragam data homogen} \\ H1: \text{Ragam data tidak homogen} \] Kriteria uji: Tolak H0, apabila p-value < α
3.5.3 Uji Asumsi Homogenitas Matriks Kovarians
Uji asumsi homogenitas matriks varians kovarians (homogeneity of covariance matrices) adalah salah satu asumsi yang harus dipenuhi ketika Anda melakukan analisis MANOVA. Asumsi ini mengacu pada kesamaan matriks varians kovarians antara kelompok atau perlakuan yang berbeda dalam analisis MANOVA. Artinya, jika matriks varians kovarians antara kelompok tidak homogen atau sama, maka hasil analisis MANOVA dapat menjadi tidak valid. Pengujian homogenitas ini dapat menggunakan statistik uji Box’s M.
Hipotesis: \[ H0: \Sigma_1= \Sigma_2=...=\Sigma_k\text{ (matriks varians-kovarians homogen)} \\ H1: \Sigma_i\neq \Sigma_j \text{ untuk } i\neq \text{ j} \text{ (matriks varians-kovarians tidak homogen)} \] Kriteria uji: Tolak H0, apabila p-value < α
4 SOURCE CODE
4.1 Library
Dalam melakukan analisis MANOVA dengan software R Studio,
dibutuhkan pengaktifan beberapa package dengan fungsi
library(), antara lain:
Digunakan untuk mengaktifkan paket readxl yang mana berfungsi untuk membaca data dari file Excel dengan format file (.xls dan .xlsx).
Digunakan untuk mengaktifkan paket knitr yang mana
berfungsi untuk membantu dalam membuat format laporan pada R Markdown
seperti pembuatan tabel dengan fungsi kable().
Digunakan untuk mengaktifkan paket MNV yang mana berfungsi untuk melakukan uji asumsi tentang normalitas multivariat dalam analisis data multivariat.
Digunakan untuk mengaktifkan paket MNTests yang mana berfungsi untuk melakukan uji homogenitas matriks varians kovarians dan uji hipotesis multivariat lainnya dalam analisis data multivariat.
Digunakan untuk mengaktifkan paket mvnormtest yang mana berfungsi untuk melakukan uji asumsi tentang normalitas multivariat dengan uji shapiro wilk dalam analisis data multivariat.
Digunakan untuk mengaktifkan paket car yang mana berfungsi untuk melakukan uji homogenitas ragam.
library(ggplot)digunakan untuk membuat grafik dan visualisasi data seperti scatter plots, box plots, bar plots, dan lain sebagainya.library(gridExtra)digunakan untuk menggabungkan beberapa grafik dalam satu tampilan atau layout.
4.2 Input Data
4.2.1 Membuat Data Frame
4.3 Statistika Deskriptif
> summary(data_jantung)
perlakuan y1 y2 y3
Length:49 Min. :150.0 Min. :19.64 Min. :61.00
Class :character 1st Qu.:200.0 1st Qu.:23.44 1st Qu.:75.00
Mode :character Median :233.0 Median :25.50 Median :78.00
Mean :229.3 Mean :26.02 Mean :79.57
3rd Qu.:254.0 3rd Qu.:28.57 3rd Qu.:87.00
Max. :313.0 Max. :33.11 Max. :99.00 4.3.1 Boxplot
> library(ggplot2)
> library(gridExtra)
> box_y1 <- ggplot(data_usia, aes(x = Usia, y = Total_Kolestrol, fill = Usia)) +
+ geom_boxplot() +
+ theme(legend.position = "top")
> box_y2 <- ggplot(data_usia, aes(x = Usia, y = BMI, fill = Usia)) +
+ geom_boxplot() +
+ theme(legend.position = "top")
> box_y3 <- ggplot(data_usia, aes(x = Usia, y = `Kadar Glukosa`, fill = Usia)) +
+ geom_boxplot() +
+ theme(legend.position = "top")
>
> grid.arrange(box_y1, box_y2, box_y3, ncol = 2, nrow = 2)4.4 Uji Asumsi pada MANOVA
4.4.1 Uji Asumsi Normalitas Multivariat
Uji Mardia
> library(MVN)
> uji_norm_mul <- mvn(data = data_usia, subset = "Usia", mvnTest = "mardia")
> uji_norm_mul$multivariateNormality
$`usia 30-42`
Test Statistic p value Result
1 Mardia Skewness 4.69199741544195 0.910780928020776 YES
2 Mardia Kurtosis -1.00425443806922 0.315255988654633 YES
3 MVN <NA> <NA> YES
$`usia 43-54`
Test Statistic p value Result
1 Mardia Skewness 2.93423863854136 0.982929521554316 YES
2 Mardia Kurtosis -1.27831938679275 0.201136834856878 YES
3 MVN <NA> <NA> YES
$`usia 55-66`
Test Statistic p value Result
1 Mardia Skewness 7.82177538500514 0.646240699178912 YES
2 Mardia Kurtosis -0.924497847936567 0.355227171435573 YES
3 MVN <NA> <NA> YESUji Shapiro Wilk
4.4.2 Uji Asumsi Homogenitas Ragam
> library(car)
> leveneTest(Total_Kolestrol~as.factor(Usia), data_usia)
Levene's Test for Homogeneity of Variance (center = median)
Df F value Pr(>F)
group 2 0.3043 0.7391
46
> leveneTest(BMI~as.factor(Usia), data_usia)
Levene's Test for Homogeneity of Variance (center = median)
Df F value Pr(>F)
group 2 0.3637 0.6971
46
> leveneTest(data_usia$`Kadar Glukosa`~as.factor(Usia), data_usia)
Levene's Test for Homogeneity of Variance (center = median)
Df F value Pr(>F)
group 2 1.033 0.364
46 4.5 Analisis Manova
> y <- cbind(y1,y2,y3)
> manova_jantung <- manova(cbind(y1,y2,y3)~perlakuan,data=data_jantung)
>
> #Statistik Uji MANOVA
> summary(manova_jantung, test="Wilks")
Df Wilks approx F num Df den Df Pr(>F)
perlakuan 2 0.72634 2.5426 6 88 0.02565 *
Residuals 46
---
Signif. codes: 0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
> summary(manova_jantung, test="Pillai")
Df Pillai approx F num Df den Df Pr(>F)
perlakuan 2 0.27808 2.4224 6 90 0.03235 *
Residuals 46
---
Signif. codes: 0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
> summary(manova_jantung, test="Hotelling-Lawley")
Df Hotelling-Lawley approx F num Df den Df Pr(>F)
perlakuan 2 0.37069 2.6566 6 86 0.0206 *
Residuals 46
---
Signif. codes: 0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
> summary(manova_jantung, test="Roy")
Df Roy approx F num Df den Df Pr(>F)
perlakuan 2 0.35349 5.3024 3 45 0.00324 **
Residuals 46
---
Signif. codes: 0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 14.6 Analisis ANOVA
> anova_jantung <- summary.aov(manova_jantung)
> anova_jantung
Response y1 :
Df Sum Sq Mean Sq F value Pr(>F)
perlakuan 2 13069 6534.7 5.6299 0.0065 **
Residuals 46 53393 1160.7
---
Signif. codes: 0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
Response y2 :
Df Sum Sq Mean Sq F value Pr(>F)
perlakuan 2 13.48 6.7422 0.5733 0.5676
Residuals 46 540.95 11.7598
Response y3 :
Df Sum Sq Mean Sq F value Pr(>F)
perlakuan 2 199.4 99.723 1.2705 0.2904
Residuals 46 3610.6 78.490 5 HASIL DAN PEMBAHASAN
5.1 Statistika Deskriptif
> summary(data_jantung)
perlakuan y1 y2 y3
Length:49 Min. :150.0 Min. :19.64 Min. :61.00
Class :character 1st Qu.:200.0 1st Qu.:23.44 1st Qu.:75.00
Mode :character Median :233.0 Median :25.50 Median :78.00
Mean :229.3 Mean :26.02 Mean :79.57
3rd Qu.:254.0 3rd Qu.:28.57 3rd Qu.:87.00
Max. :313.0 Max. :33.11 Max. :99.00 Dari hasil statistika deskriptif di atas, diketahui bahwa
- Total kolesterol dalam tubuh seseorang paling rendah adalah sebesar 150 mg/dL dan paling tinggi adalah sebesar 313 mg/dL. Rata-rata total kolesterol adalah sebesar 229.3 mg/dL. Hasil tersebut menunjukkan bahwa variasi data cukup signifikan yang mana sebagian besar data berada diatas nilai kuartil pertama.
- BMI paling rendah adalah sebesar 19.64 kg/m^2 dan paling tinggi adalah sebesar 33.11 kg/m^2. Rata-rata BMI adalah sebesar 26.02 kg/m^2. Hasil tersebut menunjukkan bahwa variasi data cukup signifikan yang mana sebagian besar data berada diatas nilai kuartil pertama.
- Kadar glukosa dalam darah paling rendah adalah sebesar 61 mg/dL dan paling tinggi adalah sebesar 99 mg/dL. Rata-rata kadar glukosa dalam darah adalah sebesar 79.57 mg/dL. Hasil tersebut menunjukkan bahwa variasi data cukup signifikan yang mana sebagian besar data berada diatas nilai kuartil pertama.
Berdasarkan hasil ketiga boxplot untuk setiap variabel dependen (y),
dapat dilihat bahwa masih terdapat outlier atau pencilan pada data.
Terdapat outlier pada data variabel usia 43-54 tahun terhadap variabel
total kolesterol dan variabel usia 30-42 tahun terhadap kadar glukosa.
Di sisi lain, dapat dilihat bahwa tidak terdapat outlier pada variabel
usia terhadap variabel BMI. Outlier atau pencilan ini dapat mengganggu
analisis data, maka perlu pemeriksaan data untuk mengetahui pengaruh
data outlier tersebut terhadap hasil analisis. Pada ketiga boxplot
tersebut dapat dilihat bahwa outliernya tidak terlalu jauh, sehingga
memungkinkan untuk dilakukan analisis lebih lanjut.
5.2 Uji Asumsi Normalitas Multivariat
Hipotesis: \[ H0: \text{Data berdistribusi Normal} \\ H1: \text{Data tidak berdistribusi Normal} \] Uji Mardia
> uji_norm_mul$multivariateNormality
$`usia 30-42`
Test Statistic p value Result
1 Mardia Skewness 4.69199741544195 0.910780928020776 YES
2 Mardia Kurtosis -1.00425443806922 0.315255988654633 YES
3 MVN <NA> <NA> YES
$`usia 43-54`
Test Statistic p value Result
1 Mardia Skewness 2.93423863854136 0.982929521554316 YES
2 Mardia Kurtosis -1.27831938679275 0.201136834856878 YES
3 MVN <NA> <NA> YES
$`usia 55-66`
Test Statistic p value Result
1 Mardia Skewness 7.82177538500514 0.646240699178912 YES
2 Mardia Kurtosis -0.924497847936567 0.355227171435573 YES
3 MVN <NA> <NA> YESKeputusan:
- Kelompok Usia 30-42 tahun, diperoleh nilai p-value > α (0,05), maka Terima H0
- Kelompok Usia 43-54 tahun, diperoleh nilai p-value > α (0,05), maka Terima H0
- Kelompok Usia 55-66 tahun, diperoleh nilai p-value > α (0,05), maka Terima H0
Kesimpulan: Dengan taraf nyata 5% sudah terdapat cukup bukti untuk menyatakan bahwa data kelompok usia 30-42, 43-54, dan 55-66 berdistribusi normal, dengan kata lain bahwa data faktor pemicu penyakit jantung terbukti berdistribusi normal. Oleh karena itu, asumsi normalitas multivariat terpenuhi.
5.2.1 Uji Shapiro Wilk Multivariat
> mshapiro.test(t(data_usia[,2:4]))
Shapiro-Wilk normality test
data: Z
W = 0.9718, p-value = 0.2851Berdasarkan uji shapiro wilk multivariat, didapatkan nilai W = 0.9718 dan p-value sebesar 0.2851
Keputusan:
karena p-value > α (0,05), maka Terima H0
Kesimpulan: Dengan taraf nyata 5% sudah terdapat cukup bukti untuk menyatakan bahwa data faktor pemicu penyakit jantung berdistribusi normal multivariat, sehingga asumsi normalitas multivariat terpenuhi.
5.3 Uji Asumsi Homogenitas Ragam
Hipotesis: \[ H0: \text{Ragam data homogen} \\ H1: \text{Ragam data tidak homogen} \]
> leveneTest(Total_Kolestrol~as.factor(Usia), data_usia)
Levene's Test for Homogeneity of Variance (center = median)
Df F value Pr(>F)
group 2 0.3043 0.7391
46 > leveneTest(BMI~as.factor(Usia), data_usia)
Levene's Test for Homogeneity of Variance (center = median)
Df F value Pr(>F)
group 2 0.3637 0.6971
46 > leveneTest(data_usia$`Kadar Glukosa`~as.factor(Usia), data_usia)
Levene's Test for Homogeneity of Variance (center = median)
Df F value Pr(>F)
group 2 1.033 0.364
46 | Variabel | p-value | Keputusan |
|---|---|---|
| Total_Kolestrol | 0.7391 | Terima H0 |
| BMI | 0.6971 | Terima H0 |
| Kadar Glukosa | 0.364 | Terima H0 |
seluruh variabel dependen menghasilkan keputusan yang sama, yaitu Terima H0
Kesimpulan: Dengan taraf nyata 5% sudah terdapat cukup bukti untuk menyatakan bahwa data dari setiap variabel dependen memiliki ragam yang homogen. Dengan kata lain, asumsi homogenitas ragam terpenuhi.
5.4 Uji Asumsi Homogenitas Matriks Varian Kovarian
Hipotesis: \[ H0: \Sigma_1= \Sigma_2=...=\Sigma_k\text{ (matriks varians-kovarians homogen)} \\ H1: \Sigma_i\neq \Sigma_j \text{ untuk } i\neq \text{ j} \text{ (matriks varians-kovarians tidak homogen)} \]
Berdasarkan uji Box-M, didapatkan nilai Chi-square = 13.09833 dan p-value sebesar 0.362
Keputusan:
karena p-value > α (0.05), maka Terima H0
Kesimpulan: Dengan taraf nyata 5% sudah terdapat cukup bukti untuk menyatakan bahwa matriks varians kovarians bersifat homogen atau sama. Sehingga, asumsi homogenitas matriks varians-kovarians terpenuhi.
5.5 Analisis MANOVA
Hipotesis: \[ H0: \mu_1=\mu_2=\mu_3 \\ H1: \text{minimal terdapat satu } \mu_j \text{ yang berbeda} \] note: seluruh hipotesis tersebut berupa vektor dari mu_j dimana j = 1,2,3
5.5.1 Uji Wilk’s Lambda
> summary(manova_jantung, test="Wilks")
Df Wilks approx F num Df den Df Pr(>F)
perlakuan 2 0.72634 2.5426 6 88 0.02565 *
Residuals 46
---
Signif. codes: 0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1Berdasarkan uji Wilk’s Lambda, didapat hasil berikut.
| Lambda* | p-value |
|---|---|
| 0.72634 | 0.02565 |
Keputusan:
karena p-value < α (0.05), maka Tolak H0
Kesimpulan: Dengan taraf nyata 5% dapat disimpulkan bahwa perbedaan kelompok usia berpengaruh signifikan secara multivariat terhadap total kolesterol, BMI, dan kadar glukosa.
5.5.2 Uji Pillai’s Trace
> summary(manova_jantung, test="Pillai")
Df Pillai approx F num Df den Df Pr(>F)
perlakuan 2 0.27808 2.4224 6 90 0.03235 *
Residuals 46
---
Signif. codes: 0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1Berdasarkan uji Pillai’s Trace, didapat hasil berikut.
| P | p-value |
|---|---|
| 0.27808 | 0.03235 |
Keputusan:
karena p-value < α (0.05), maka Tolak H0
Kesimpulan: Dengan taraf nyata 5% dapat disimpulkan bahwa perbedaan kelompok usia berpengaruh signifikan secara multivariat terhadap total kolesterol, BMI, dan kadar glukosa.
5.5.3 Uji Hotelling-Lawkey
> summary(manova_jantung, test="Hotelling-Lawley")
Df Hotelling-Lawley approx F num Df den Df Pr(>F)
perlakuan 2 0.37069 2.6566 6 86 0.0206 *
Residuals 46
---
Signif. codes: 0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1Berdasarkan uji Hotelling-Lawkey, didapat hasil berikut.
| T | p-value |
|---|---|
| 0.37069 | 0.0206 |
Keputusan:
karena p-value < α (0.05), maka Tolak H0
Kesimpulan: Dengan taraf nyata 5% dapat disimpulkan bahwa perbedaan kelompok usia berpengaruh signifikan secara multivariat terhadap total kolesterol, BMI, dan kadar glukosa.
5.5.4 Uji Roy’s Test
> summary(manova_jantung, test="Roy")
Df Roy approx F num Df den Df Pr(>F)
perlakuan 2 0.35349 5.3024 3 45 0.00324 **
Residuals 46
---
Signif. codes: 0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1Berdasarkan uji Roy’s Test, didapat hasil berikut.
| R | p-value |
|---|---|
| 0.35349 | 0.00324 |
Keputusan:
karena p-value < α (0.05), maka Tolak H0
Kesimpulan: Dengan taraf nyata 5% dapat disimpulkan bahwa perbedaan kelompok usia berpengaruh signifikan secara multivariat terhadap total kolesterol, BMI, dan kadar glukosa.
5.6 Analisis ANOVA
Hipotesis: \[ H0: \mu_1=\mu_2=\mu_3 \\ H1: \text{minimal terdapat satu } \mu_j \text{ yang berbeda} \]
> anova_jantung <- summary.aov(manova_jantung)
> anova_jantung
Response y1 :
Df Sum Sq Mean Sq F value Pr(>F)
perlakuan 2 13069 6534.7 5.6299 0.0065 **
Residuals 46 53393 1160.7
---
Signif. codes: 0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
Response y2 :
Df Sum Sq Mean Sq F value Pr(>F)
perlakuan 2 13.48 6.7422 0.5733 0.5676
Residuals 46 540.95 11.7598
Response y3 :
Df Sum Sq Mean Sq F value Pr(>F)
perlakuan 2 199.4 99.723 1.2705 0.2904
Residuals 46 3610.6 78.490 Hasil Analisis ANOVA adalah sebagai berikut.
| Variabel Dependen | p-value |
|---|---|
| Total_Kolestrol | 0.0065 |
| BMI | 0.5676 |
| Kadar Glukosa | 0.2904 |
Keputusan:
- Respon Total_Kolestrol, diperoleh nilai p-value < α (0,05), maka Tolak H0
- Respon BMI, diperoleh nilai p-value > α (0,05), maka Terima H0
- Respon Kadar Glukosa, diperoleh nilai p-value > α (0,05), maka Terima H0
Kesimpulan:
- Dengan taraf nyata 5% dapat disimpulkan bahwa terdapat perbedaan pengaruh yang signifikan kelompok usia terhadap variabel total_kolesterol dalam tubuh.
- Dengan taraf nyata 5% dapat disimpulkan bahwa tidak terdapat perbedaan pengaruh yang signifikan kelompok usia terhadap variabel BMI.
- Dengan taraf nyata 5% dapat disimpulkan bahwa tidak terdapat perbedaan pengaruh yang signifikan kelompok usia terhadap variabel kadar glukosa dalam darah.
6 PENUTUP
6.1 KESIMPULAN
Berdasarkan hasil analisis, dapat disimpulkan bahwa :
- Dari hasil keempat statistik uji MANOVA yang dilakukan (Wilk’s Lambda, Pillai’s Trace, Hotelling-Lawkey, dan Roy’s Test), dapat disimpulkan bahwa terdapat pengaruh yang signifikan secara simultan antara ketiga kelompok usia terhadap total kolesterol, BMI, dan kadar glukosa.
- Hasil analisis ANOVA menunjukkan bahwa ketiga kelompok usia tidak semuanya berpengaruh signifikan secara univariat terhadap total kolesterol, BMI, dan kadar glukosa. Perbedaan kelompok usia hanya berpengaruh signifikan terhadap total kolesterol dan tidak berpengaruh signifikan terhadap BMI dan kadar glukosa.
- Dilihat dari boxplot pada bagian statistika deskriptif, didapat bahwa masih terdapat outlier pada data. Akan tetapi outlier tersebut tidak berpengaruh signifikan, sehingga pengujian analisis dapat dilanjutkan.
- Data pengaruh kelompok usia terhadap faktor pemicu penyakit jantung yang digunakan sudah memenuhi seluruh asumsi pada analisis MANOVA. Asumsi yang dimaksud ialah bahwa data terbukti menyebar secara normal multivariat, ragam data homogen, dan matriks varians-kovarians data juga bersifat homogen. Maka dari itu, kemungkinan besar hasil analisis yang diperoleh valid dan tidak bias.
6.2 SARAN
Analisis MANOVA yang telah dilakukan sudah cukup baik dalam menjelaskan pengaruh dari ketiga kelompok usia terhadap total kolesterol, BMI, dan kadar glukosa yang mana ketiga faktor tersebut merupakan faktor pemicu penyakit jantung. Ketiga kelompok tersebut menunjukkan pengaruh yang signifikan terhadap seluruh variabel dependen secara simultan. Walaupun sudah cukup baik dalam analisisnya, tetapi disarankan dilakukan uji lanjutan seperti analisis profile, atau analisis lainnya. Hal ini bertujuan untuk menggabungkan data dari beberapa variabel dalam rangka memahami hubungan antara variabel-variabel tersebut. Dalam konteks pengaruh kelompok usia terhadap faktor pemicu penyakit jantung, analisis profil dapat membantu mengidentifikasi bagaimana faktor-faktor seperti total kolesterol, BMI, dan kadar gula darah berubah atau berinteraksi dengan usia. Hal ini dapat memberikan wawasan yang lebih mendalam tentang bagaimana faktor-faktor tersebut mempengaruhi risiko penyakit jantung pada kelompok usia yang berbeda.
Selain itu, dengan adanya penelitian ini maka masyarakat mendapatkan wawasan atau informasi terbaru terkait penyakit jantung. Dari hasil analisis, didapat bahwa perbedaan kelompok usia berpengaruh signifikan terhadap faktor pemicu penyakit jantung. Usia memang merupakan faktor yang yak dapat diubah, akan tetapi seseorang dapat mencegah dan menghindari terjadinya penyakit pada diri mereka sendiri. Oleh karena itu, disarankan bagi masyarakat untuk selalu menjaga kesehatannya seiring bertambahnya usia dengan cara mengontrol gula darah, kadar kolesterol, dan berat badan agar tidak obesitas. Dengan melakukan pencegahan maka risiko seseorang terkena penyakit jantung akan berkurang walaupun usia terus bertambah.
7 DAFTAR PUSTAKA
Anis, Wahyul. (2021). Perbedaan Kekuatan Uji dan Kesalahan Tipe II (Β) pada Uji Mardia MVN, Uji Henze Zikler MVN dan Uji Royston MVN dalam Analisis Normalitas Data Multivariat. https://news.unair.ac.id/2021/11/23/perbedaan-kekuatan-uji-dan-kesalahan-tipe-ii-%CE%B2-pada-uji-mardia-mvn-uji-henze-zikler-mvn-dan-uji-royston-mvn-dalam-analisis-normalitas-data-multivariat/?lang=id
Iqbal, Muhammad, Salsabila, Inas., Syahbani, D.A., Douw, Januaria., Marzuki, Rusyana, Asep.(2020). Analisis MANOVA Satu Arah untuk Melihat Perbedaan Status Gizi Balita Berdasarkan Wilayah Pembangunan Utama di Indonesia Tahun 2017. Journal of Data Analysis,3(1), 52-53.
Setiawan, Dedi., Juwita, Ratna., Lindasari, Devi., Tahayu, S.P.(2017). Analisis MANOVA Satu Arah pada Data Komponen Kesehatan Bayi di Pulau Jawa pada Tahun 2013.
Harun, A.A. (2019). Analisis MANOVA (Multivariate Analysis Of Variance) pada Data Faktor-Faktor yang Mempengaruhi Jumlah Benzoic Acid (BA) Dan Phthalide (PL) yang Dihasilkan Akibat Proses Destilasi Phtalic Anhydride (PA).
Handoko, Jalu. (2014). ANALISIS PENGELOMPOKKAN NEGARA-NEGARA IMPORTIR PRODUK INDONESIA BERDASARKAN FAKTOR BARANG INDUSTRI. (Tugas Akhir, Institut Teknologi Sepuluh Nopember).
Tambunan, L.N., Baringbing, E.P. (2023). Hubungan Usia dengan Kejadian Penyakit Jantung Koroner Pada Pasien Rawat Jalan di RSUD dr.Doris Sylvanus Provinsi Kalimantan Tengah. Jurnal Surya Medika (JSM), 9(1), 119-120. https://journal.umpr.ac.id/index.php/jsm/article/view/5158/3215