Penerapan MANOVA untuk Mengetahui Pengaruh Kelompok Usia terhadap Faktor Pemicu Penyakit Jantung

Dina Apriska

08-11-2023

1 PENDAHULUAN

1.1 Latar Belakang

Penyakit jantung merupakan salah satu masalah kesehatan utama di seluruh dunia. Menurut WHO (World Health Organization) pada tahun 2020, penyakit kardiovaskuler menyumbang sekitar 25% dari hasil angka kematian dan mengalami peningkatan, salah satu diantaranya berada di Asia Tenggara. Penyakit jantung terjadi akibat penyumbatan pada arteri koroner oleh tumpukan plak, polutan atau zat-zat kimia lingkungan yang biasanya masuk ke tubuh melalui makanan, minuman atau berbentuk gas yang terkumpul pada dinding arteri koronaria (Tambunan dan Baringbing, 2023). Banyak faktor yang dapat memicu terjadinya penyakit jantung, antara lain kadar kolesterol dalam tubuh, obesitas, diabetes, merokok, diet tidak sehat, kurangnya aktivitas fisik, tekanan darah tinggi, dan lain-lain.

Selain itu, usia juga menjadi salah satu faktor yang berpengaruh pada resiko terkena penyakit kardiovaskuler. Semakin bertambah usia, maka risiko terkena penyakit jantung semakin tinggi. Dengan kata lain, individu dengan usia lanjut lebih rentan terkena penyakit jantung. Hal ini dikarenakan, pertambahan usia menyebabkan perubahan di dalam jantung dan pembuluh darah.

Penelitian ini berfokus pada ada/tidaknya pengaruh kelompok usia terhadap faktor pemicu penyakit jantung, seperti kolesterol, obesitas yang diukur dengan BMI, dan diabetes yang diukur dari kadar glukosa dalam darah. Apabila kelompok usia berpengaruh terhadap ketiga faktor tersebut maka terdapat kemungkinan bahwa kelompok usia juga menjadi pemicu terjadinya penyakit jantung. Oleh karena itu, diperlukan sebuah analisis statistik yang kuat untuk menjawab permasalahan tersebut. Analisis yang tepat untuk digunakan adalah analisis MANOVA. Analisis tersebut digunakan untuk menguji perbedaan dalam beberapa variabel dependen antara beberapa kelompok.Dalam konteks ini, MANOVA digunakan untuk sejauh mana perbedaan pengaruh kelompok usia terhadap faktor-faktor pemicu penyakit jantung. Variabel dependen akan mencakup faktor-faktor pemicu penyakit jantung seperti total kolesterol dalam tubuh, BMI, dan kadar glukosa dalam darah. Sementara kelompok usia akan menjadi variabel independen yang terbagi menjadi 3 kelompok usia.

1.2 Rumusan Masalah

Berdasarkan uraian latar belakang di atas, maka rumusan masalah untuk penelitian ini adalah sebagai berikut.

  1. Apakah terdapat pengaruh yang signifikan pada kelompok usia terhadap total kolesterol dalam tubuh, BMI, dan kadar glukosa dalam darah secara multivariat?
  2. Apakah data pengaruh kelompok usia terhadap total kolesterol dalam tubuh, BMI, dan kadar glukosa dalam darah memenuhi semua asumsi analisis?
  3. Bagaimana perbedaan hasil antara analisis multivariat dengan analisis univariat?

1.3 Tujuan

Tujuan dari penelitian ini adalah sebagai berikut.

  • Untuk mengetahui pengaruh kelompok usia terhadap faktor-faktor pemicu penyakit jantung, seperti tingginya kolesterol dalam tubuh, obesitas, dan tingginya kadar glukosa dalam darah secara multivariat.
  • Untuk mengetahui apakah data yang digunakan sudah memenuhi seluruh asumsi analisis yang disyaratkan.
  • Untuk mengetahui perbandingan hasil analisis Multivariat dan Univariat pada data yang sama.

2 Analisis Penelitian

2.1 Metode Analisis

Penelitian ini menggunakan analisis MANOVA (Multivariate Analysis of Variance) yang dimana analisis tersebut merupakan metode statistik yang digunakan untuk untuk menguji perbedaan rata-rata pengaruh antara dua atau lebih kelompok pada variabel independen terhadap dua atau lebih variabel dependen. Hal ini sejalan dengan tujuan penelitian, sehingga analisis yang cocok untuk digunakan ialah analisis MANOVA. Dalam penelitian ini, MANOVA dapat digunakan untuk mengevaluasi apakah ada perbedaan signifikan pada tiga kelompok usia yang berbeda terhadap faktor pemicu penyakit jantung (variabel dependen).

Analisis MANOVA merupakan perluasan dari analisis ANOVA pada data univariat. Pada analisis ANOVA, hubungan antar variabel dependen secara simultan tidak dapat terjelaskan dengan baik. Maka dari itu, digunakanlah analisis MANOVA untuk dapat mengetahui informasi mengenai hubungan antara variabel dependen secara simultan.

2.2 Data

Data yang digunakan adalah data sekunder yang bersumber dari https://www.kaggle.com/datasets/dileep070/heart-disease-prediction-using-logistic-regression. Dalam penelitian ini, data yang digunakan yaitu sebanyak 49 pengamatan. Data terdiri dari 4 variabel, yaitu 1 variabel independen dan 3 variabel dependen. Adapun uraian variabel yang digunakan adalah sebagai berikut.

Variabel Independen

Variabel independen yang digunakan adalah kelompok usia yang dibagi menjadi tiga kelompok, yaitu:

  • Usia 30-42 tahun
  • Usia 43-54 tahun
  • Usia 55-66 tahun

Variabel Dependen

Terdapat tiga variabel Dependen yang digunakan, antara lain:

  • Total kolesterol dalam tubuh (mg/dL)
  • Body Mass Index (BMI) yang mana sebagai indikator untuk melihat apakah orang tersebut obesitas atau tidak (kg/m^2)
  • Kadar glukosa dalam darah (mg/dL)

Berikut adalah data yang digunakan dalam penelitian.

> library(readxl)
> data_usia <- read_excel("C:/Users/dinar/Downloads/data_jantung usia.xlsx")
> library(knitr)
> kable(data_usia)
Usia Total_Kolestrol BMI Kadar Glukosa
usia 30-42 165 26.74 77
usia 30-42 200 23.80 74
usia 30-42 180 27.78 80
usia 30-42 194 24.33 62
usia 30-42 173 28.39 61
usia 30-42 270 33.11 75
usia 30-42 195 23.24 78
usia 30-42 231 22.78 93
usia 30-42 170 19.64 77
usia 30-42 195 26.88 65
usia 30-42 237 23.28 74
usia 30-42 190 21.59 85
usia 30-42 233 28.93 90
usia 43-54 228 30.30 99
usia 43-54 225 23.61 88
usia 43-54 247 27.64 61
usia 43-54 226 27.57 75
usia 43-54 301 28.04 72
usia 43-54 265 25.26 88
usia 43-54 313 21.68 78
usia 43-54 250 28.73 76
usia 43-54 285 23.10 85
usia 43-54 175 25.09 85
usia 43-54 150 28.69 88
usia 43-54 261 23.59 74
usia 43-54 294 24.18 66
usia 43-54 237 19.66 75
usia 43-54 245 25.34 70
usia 43-54 203 29.29 97
usia 43-54 250 28.73 76
usia 43-54 254 22.91 76
usia 43-54 216 23.47 95
usia 43-54 260 26.36 79
usia 43-54 266 31.16 90
usia 43-54 215 25.11 75
usia 43-54 245 32.04 81
usia 43-54 200 26.66 81
usia 43-54 214 24.71 87
usia 43-54 242 22.16 87
usia 55-66 257 28.09 75
usia 55-66 209 20.77 88
usia 55-66 247 30.36 74
usia 55-66 246 23.44 78
usia 55-66 219 28.57 76
usia 55-66 254 25.50 87
usia 55-66 205 33.11 85
usia 55-66 179 22.15 75
usia 55-66 267 27.10 79
usia 55-66 252 30.47 87

3 TINJAUAN PUSTAKA

3.1 Statistika Deskriptif

Statistika deskriptif adalah metode-metode yang berkaitan dengan pengumpulan dan penyajian suatu gugus data sehingga memberikan informasi yang berguna (Setiawan et al, 2017). Tujuan statistika deskriptif adalah untuk untuk memberi gambaran pola atau karakteristik data yang diamati tanpa melakukan inferensi statistika terhadap populasi yang lebih besar. Untuk memberikan gambaran tentang pusat distribusi data, statistika deskriptif melibatkan pengukuran tendensi sentral, seperti rata-rata (mean), median, dan modus. Selain itu, untuk mengetahui penyebaran nilai data, statistika deskriptif melibatkan pengukuran sebaran seperti rentang, deviasi standar, dan kuartil.

Adapun grafik dan diagram juga digunakan dalam statistika deskriptif untuk menyajikan data secara visual, membantu dalam memahami pola, outlier, dan distribusi data. Contoh grafik dan diagram tersebut, yaitu histogram, box plot, scatter plot, diagram lingkaran, dan lain sebagainya. Visualisasi data yang digunakan dalam penelitian ini adalah dengan box plot.

3.2 Analisis MANOVA

MANOVA (Multivariate Analysis of Variance) adalah suatu teknik analisis statistika yang memiliki karakteristik yaitu variabel dependen yang digunakan lebih dari satu. Analisis MANOVA digunakan untuk menguji perbedaan rata-rata pengaruh antara dua atau lebih kelompok pada variabel independen terhadap dua atau lebih variabel dependen. MANOVA merupakan perluasan dari ANOVA yang mana perbedaannya hanya terletak pada jumlah variabel dependennya (Sunaryo, 2014). MANOVA menggunakan satu atau lebih variabel independen kategorik (biasanya berupa perlakuan) sebagai prediktor dan dua atau lebih variabel dependen metrik yang bersifat tak bebas secara simultan.

Hipotesis: \[ H0: \mu_1=\mu_2=...=\mu_g \\ H1: \text{minimal terdapat satu } \mu_j \text{ yang berbeda} \] note: seluruh hipotesis tersebut berupa vektor dari mu_j dimana j = 1,2,..,g

3.3 MANOVA One Way

One-Way MANOVA atau MANOVA satu arah merupakan analisis yang digunakan untuk menilai apakah terdapat perbedaan signifikan antara rata-rata kelompok-kelompok pada dua atau lebih variabel dependen . Analisis One-Way MANOVA hanya melibatkan satu faktor atau variabel independen dan dua atau lebih variabel dependen yang bersifat kontinu.

Model One-Way MANOVA : \[ y_{lj}= \mu+\tau_l+\varepsilon_{lj} \] dimana, j = 1,2,..,nl l = 1,2,..,g nl = banyaknya pengamatan pada perlakuan ke-i g = banyaknya perlakuan atau kelompok

Hipotesis: \[ H0: \tau_1=\tau_2=...=\tau_g=0 \\ H1: minimal\hspace{2mm} terdapat \hspace{2mm} sepasang \hspace{2mm} \tau_l \neq 0 \] note: seluruh hipotesis tersebut berupa vektor dari tau_l dimana l = 1,2,..,g

3.4 Statistik Uji MANOVA

3.4.1 Wilk’s Lambda

Statistik uji digunakan jika terdapat lebih dari dua kelompok variabel independen dan asumsi homogenitas matriks varians-kovarians terpenuhi. \[ \lambda^{*} = \frac{|W|}{|B|+|W| } \] dimana,

W = matriks varians-kovarians galat pada MANOVA

B = matriks varians-kovarians perlakuan pada MANOVA

Statistik uji ini akan menghasilkan keputusan Tolak H0, apabila \[ \lambda^{*} < U_{\alpha,(g-1,\Sigma n_t-g)} \hspace{1mm} atau \hspace{1mm}p-value<\alpha \]

3.4.2 Pillai’s Trace

Statistik uji ini digunakan jika asumsi homogenitas matriks varians-kovarians tidak terpenuhi dan ukuran-ukuran sampel kecil. \[ P = tr[(B+W)^{-1}(B)] \]

Statistik uji ini akan menghasilkan keputusan Tolak H0, apabila \[ p-value<\alpha \]

3.4.3 Hotteling’s Lambda

Statistik uji digunakan jika hanya terdapat dua kelompok variabel independen. \[ T = tr[(W)^{-1}(B)] \] Statistik uji ini akan menghasilkan keputusan Tolak H0, apabila \[ p-value<\alpha \]

3.4.4 Roy’s Test

Statistik uji ini hanya digunakan jika asumsi homogenitas matriks varians-kovarians terpenuhi. \[ R = \lambda_{maks} =maks(\lambda_1,\lambda_2,...,\lambda_p) \\ R=\text{akar karakteristik maksimum dari }(W)^{-1}(B) \] Statistik uji ini akan menghasilkan keputusan Tolak H0, apabila \[ p-value<\alpha \]

3.5 Asumsi dalam MANOVA

3.5.1 Uji Asumsi Normalitas Multivariat

Uji normalitas multivariat bertujuan untuk menguji apakah data yang digunakan dalam analisis tersebut mengikuti distribusi normal atau tidak. Asumsi normalitas menjelaskan bahwa apabila sampel berdistribusi normal maka sampel itu menggambarkan kondisi riil seperti populasi (Anis, 2021). Analisis MANOVA dapat dilakukan apabila data berdistribusi normal. Apabila asumsi normalitas diabaikan maka hasil dari analisis statistik akan menjadi tidak valid atau bias, terutama pada besar sampel yang kecil. Pengujian normalitas multivariat dapat dilakukan dengan uji Mardia MVN, uji Henze-Zirkler, uji Royston, uji Anderson-Darling, uji Shapiro Wilk, serta dapat dilakukan dengan visualisasi data menggunakan Q-Q plot, dan metode lainnya.

Hipotesis: \[ H0: \text{Data berdistribusi Normal} \\ H1: \text{Data tidak berdistribusi Normal} \] Kriteria uji: Tolak H0, apabila p-value < α

3.5.2 Uji Asumsi Homogenitas Ragam

Fungsi dari uji homogenitas ragam adalah untuk mengetahui apakah varians data tersebut homogen atau heterogen, tergantung pada faktor-faktor tertentu. Asumsi terpenuhi apabila ragam dari data adalah homogen. Pengujian asumsi dilakukan dengan Uji Levene.

Hipotesis: \[ H0: \text{Ragam data homogen} \\ H1: \text{Ragam data tidak homogen} \] Kriteria uji: Tolak H0, apabila p-value < α

3.5.3 Uji Asumsi Homogenitas Matriks Kovarians

Uji asumsi homogenitas matriks varians kovarians (homogeneity of covariance matrices) adalah salah satu asumsi yang harus dipenuhi ketika Anda melakukan analisis MANOVA. Asumsi ini mengacu pada kesamaan matriks varians kovarians antara kelompok atau perlakuan yang berbeda dalam analisis MANOVA. Artinya, jika matriks varians kovarians antara kelompok tidak homogen atau sama, maka hasil analisis MANOVA dapat menjadi tidak valid. Pengujian homogenitas ini dapat menggunakan statistik uji Box’s M.

Hipotesis: \[ H0: \Sigma_1= \Sigma_2=...=\Sigma_k\text{ (matriks varians-kovarians homogen)} \\ H1: \Sigma_i\neq \Sigma_j \text{ untuk } i\neq \text{ j} \text{ (matriks varians-kovarians tidak homogen)} \] Kriteria uji: Tolak H0, apabila p-value < α

4 SOURCE CODE

4.1 Library

Dalam melakukan analisis MANOVA dengan software R Studio, dibutuhkan pengaktifan beberapa package dengan fungsi library(), antara lain:

> library(readxl)

Digunakan untuk mengaktifkan paket readxl yang mana berfungsi untuk membaca data dari file Excel dengan format file (.xls dan .xlsx).

> library(knitr)

Digunakan untuk mengaktifkan paket knitr yang mana berfungsi untuk membantu dalam membuat format laporan pada R Markdown seperti pembuatan tabel dengan fungsi kable().

> library(MVN)

Digunakan untuk mengaktifkan paket MNV yang mana berfungsi untuk melakukan uji asumsi tentang normalitas multivariat dalam analisis data multivariat.

> library(MVTests)

Digunakan untuk mengaktifkan paket MNTests yang mana berfungsi untuk melakukan uji homogenitas matriks varians kovarians dan uji hipotesis multivariat lainnya dalam analisis data multivariat.

> library(mvnormtest)

Digunakan untuk mengaktifkan paket mvnormtest yang mana berfungsi untuk melakukan uji asumsi tentang normalitas multivariat dengan uji shapiro wilk dalam analisis data multivariat.

> library(car)

Digunakan untuk mengaktifkan paket car yang mana berfungsi untuk melakukan uji homogenitas ragam.

> library(ggplot2)
> library(gridExtra)
  • library(ggplot) digunakan untuk membuat grafik dan visualisasi data seperti scatter plots, box plots, bar plots, dan lain sebagainya.
  • library(gridExtra) digunakan untuk menggabungkan beberapa grafik dalam satu tampilan atau layout.

4.2 Input Data

> library(readxl)
> data_usia <- read_excel("C:/Users/dinar/Downloads/data_jantung usia.xlsx")

4.2.1 Membuat Data Frame

> y1 <- as.matrix(data_usia$`Total_Kolestrol`, nrow=49, ncol=1)
> y2 <- as.matrix(data_usia$`BMI`, nrow=49, ncol=1)
> y3 <- as.matrix(data_usia$`Kadar Glukosa`, nrow=49, ncol=1)
> perlakuan <- as.matrix(data_usia$Usia, nrow=49, ncol=1)
> data_jantung <- data.frame(perlakuan,y1,y2,y3)

4.3 Statistika Deskriptif

> summary(data_jantung)
  perlakuan               y1              y2              y3       
 Length:49          Min.   :150.0   Min.   :19.64   Min.   :61.00  
 Class :character   1st Qu.:200.0   1st Qu.:23.44   1st Qu.:75.00  
 Mode  :character   Median :233.0   Median :25.50   Median :78.00  
                    Mean   :229.3   Mean   :26.02   Mean   :79.57  
                    3rd Qu.:254.0   3rd Qu.:28.57   3rd Qu.:87.00  
                    Max.   :313.0   Max.   :33.11   Max.   :99.00  

4.3.1 Boxplot

> library(ggplot2)
> library(gridExtra)
> box_y1 <- ggplot(data_usia, aes(x = Usia, y = Total_Kolestrol, fill = Usia)) +
+   geom_boxplot() +
+   theme(legend.position = "top")
> box_y2 <- ggplot(data_usia, aes(x = Usia, y = BMI, fill = Usia)) +
+   geom_boxplot() +
+   theme(legend.position = "top")
> box_y3 <- ggplot(data_usia, aes(x = Usia, y = `Kadar Glukosa`, fill = Usia)) +
+   geom_boxplot() +
+   theme(legend.position = "top")
> 
> grid.arrange(box_y1, box_y2, box_y3, ncol = 2, nrow = 2)

4.4 Uji Asumsi pada MANOVA

4.4.1 Uji Asumsi Normalitas Multivariat

Uji Mardia

> library(MVN)
> uji_norm_mul <- mvn(data = data_usia, subset = "Usia", mvnTest = "mardia")
> uji_norm_mul$multivariateNormality
$`usia 30-42`
             Test         Statistic           p value Result
1 Mardia Skewness  4.69199741544195 0.910780928020776    YES
2 Mardia Kurtosis -1.00425443806922 0.315255988654633    YES
3             MVN              <NA>              <NA>    YES

$`usia 43-54`
             Test         Statistic           p value Result
1 Mardia Skewness  2.93423863854136 0.982929521554316    YES
2 Mardia Kurtosis -1.27831938679275 0.201136834856878    YES
3             MVN              <NA>              <NA>    YES

$`usia 55-66`
             Test          Statistic           p value Result
1 Mardia Skewness   7.82177538500514 0.646240699178912    YES
2 Mardia Kurtosis -0.924497847936567 0.355227171435573    YES
3             MVN               <NA>              <NA>    YES

Uji Shapiro Wilk

> library(mvnormtest)
> mshapiro.test(t(data_usia[,2:4]))

    Shapiro-Wilk normality test

data:  Z
W = 0.9718, p-value = 0.2851

4.4.2 Uji Asumsi Homogenitas Ragam

> library(car)
> leveneTest(Total_Kolestrol~as.factor(Usia), data_usia)
Levene's Test for Homogeneity of Variance (center = median)
      Df F value Pr(>F)
group  2  0.3043 0.7391
      46               
> leveneTest(BMI~as.factor(Usia), data_usia)
Levene's Test for Homogeneity of Variance (center = median)
      Df F value Pr(>F)
group  2  0.3637 0.6971
      46               
> leveneTest(data_usia$`Kadar Glukosa`~as.factor(Usia), data_usia)
Levene's Test for Homogeneity of Variance (center = median)
      Df F value Pr(>F)
group  2   1.033  0.364
      46               

4.4.3 Uji Asumsi Homogenitas Matriks Varians Kovarians

> library(MVTests)
> uji_homogen_mul<-BoxM(data = data_usia[,-1], data_usia$`Usia`)
> summary(uji_homogen_mul)
       Box's M Test 

Chi-Squared Value = 13.09833 , df = 12  and p-value: 0.362 

4.5 Analisis Manova

> y <- cbind(y1,y2,y3)
> manova_jantung <- manova(cbind(y1,y2,y3)~perlakuan,data=data_jantung)
> 
> #Statistik Uji MANOVA
> summary(manova_jantung, test="Wilks")
          Df   Wilks approx F num Df den Df  Pr(>F)  
perlakuan  2 0.72634   2.5426      6     88 0.02565 *
Residuals 46                                         
---
Signif. codes:  0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
> summary(manova_jantung, test="Pillai")
          Df  Pillai approx F num Df den Df  Pr(>F)  
perlakuan  2 0.27808   2.4224      6     90 0.03235 *
Residuals 46                                         
---
Signif. codes:  0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
> summary(manova_jantung, test="Hotelling-Lawley")
          Df Hotelling-Lawley approx F num Df den Df Pr(>F)  
perlakuan  2          0.37069   2.6566      6     86 0.0206 *
Residuals 46                                                 
---
Signif. codes:  0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
> summary(manova_jantung, test="Roy")
          Df     Roy approx F num Df den Df  Pr(>F)   
perlakuan  2 0.35349   5.3024      3     45 0.00324 **
Residuals 46                                          
---
Signif. codes:  0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1

4.6 Analisis ANOVA

> anova_jantung <- summary.aov(manova_jantung)
> anova_jantung
 Response y1 :
            Df Sum Sq Mean Sq F value Pr(>F)   
perlakuan    2  13069  6534.7  5.6299 0.0065 **
Residuals   46  53393  1160.7                  
---
Signif. codes:  0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1

 Response y2 :
            Df Sum Sq Mean Sq F value Pr(>F)
perlakuan    2  13.48  6.7422  0.5733 0.5676
Residuals   46 540.95 11.7598               

 Response y3 :
            Df Sum Sq Mean Sq F value Pr(>F)
perlakuan    2  199.4  99.723  1.2705 0.2904
Residuals   46 3610.6  78.490               

5 HASIL DAN PEMBAHASAN

5.1 Statistika Deskriptif

> summary(data_jantung)
  perlakuan               y1              y2              y3       
 Length:49          Min.   :150.0   Min.   :19.64   Min.   :61.00  
 Class :character   1st Qu.:200.0   1st Qu.:23.44   1st Qu.:75.00  
 Mode  :character   Median :233.0   Median :25.50   Median :78.00  
                    Mean   :229.3   Mean   :26.02   Mean   :79.57  
                    3rd Qu.:254.0   3rd Qu.:28.57   3rd Qu.:87.00  
                    Max.   :313.0   Max.   :33.11   Max.   :99.00  

Dari hasil statistika deskriptif di atas, diketahui bahwa

  • Total kolesterol dalam tubuh seseorang paling rendah adalah sebesar 150 mg/dL dan paling tinggi adalah sebesar 313 mg/dL. Rata-rata total kolesterol adalah sebesar 229.3 mg/dL. Hasil tersebut menunjukkan bahwa variasi data cukup signifikan yang mana sebagian besar data berada diatas nilai kuartil pertama.
  • BMI paling rendah adalah sebesar 19.64 kg/m^2 dan paling tinggi adalah sebesar 33.11 kg/m^2. Rata-rata BMI adalah sebesar 26.02 kg/m^2. Hasil tersebut menunjukkan bahwa variasi data cukup signifikan yang mana sebagian besar data berada diatas nilai kuartil pertama.
  • Kadar glukosa dalam darah paling rendah adalah sebesar 61 mg/dL dan paling tinggi adalah sebesar 99 mg/dL. Rata-rata kadar glukosa dalam darah adalah sebesar 79.57 mg/dL. Hasil tersebut menunjukkan bahwa variasi data cukup signifikan yang mana sebagian besar data berada diatas nilai kuartil pertama.
> grid.arrange(box_y1, box_y2, box_y3, ncol = 2, nrow = 2)

Berdasarkan hasil ketiga boxplot untuk setiap variabel dependen (y), dapat dilihat bahwa masih terdapat outlier atau pencilan pada data. Terdapat outlier pada data variabel usia 43-54 tahun terhadap variabel total kolesterol dan variabel usia 30-42 tahun terhadap kadar glukosa. Di sisi lain, dapat dilihat bahwa tidak terdapat outlier pada variabel usia terhadap variabel BMI. Outlier atau pencilan ini dapat mengganggu analisis data, maka perlu pemeriksaan data untuk mengetahui pengaruh data outlier tersebut terhadap hasil analisis. Pada ketiga boxplot tersebut dapat dilihat bahwa outliernya tidak terlalu jauh, sehingga memungkinkan untuk dilakukan analisis lebih lanjut.

5.2 Uji Asumsi Normalitas Multivariat

Hipotesis: \[ H0: \text{Data berdistribusi Normal} \\ H1: \text{Data tidak berdistribusi Normal} \] Uji Mardia

> uji_norm_mul$multivariateNormality
$`usia 30-42`
             Test         Statistic           p value Result
1 Mardia Skewness  4.69199741544195 0.910780928020776    YES
2 Mardia Kurtosis -1.00425443806922 0.315255988654633    YES
3             MVN              <NA>              <NA>    YES

$`usia 43-54`
             Test         Statistic           p value Result
1 Mardia Skewness  2.93423863854136 0.982929521554316    YES
2 Mardia Kurtosis -1.27831938679275 0.201136834856878    YES
3             MVN              <NA>              <NA>    YES

$`usia 55-66`
             Test          Statistic           p value Result
1 Mardia Skewness   7.82177538500514 0.646240699178912    YES
2 Mardia Kurtosis -0.924497847936567 0.355227171435573    YES
3             MVN               <NA>              <NA>    YES

Keputusan:

  • Kelompok Usia 30-42 tahun, diperoleh nilai p-value > α (0,05), maka Terima H0
  • Kelompok Usia 43-54 tahun, diperoleh nilai p-value > α (0,05), maka Terima H0
  • Kelompok Usia 55-66 tahun, diperoleh nilai p-value > α (0,05), maka Terima H0

Kesimpulan: Dengan taraf nyata 5% sudah terdapat cukup bukti untuk menyatakan bahwa data kelompok usia 30-42, 43-54, dan 55-66 berdistribusi normal, dengan kata lain bahwa data faktor pemicu penyakit jantung terbukti berdistribusi normal. Oleh karena itu, asumsi normalitas multivariat terpenuhi.

5.2.1 Uji Shapiro Wilk Multivariat

> mshapiro.test(t(data_usia[,2:4]))

    Shapiro-Wilk normality test

data:  Z
W = 0.9718, p-value = 0.2851

Berdasarkan uji shapiro wilk multivariat, didapatkan nilai W = 0.9718 dan p-value sebesar 0.2851

Keputusan:

karena p-value > α (0,05), maka Terima H0

Kesimpulan: Dengan taraf nyata 5% sudah terdapat cukup bukti untuk menyatakan bahwa data faktor pemicu penyakit jantung berdistribusi normal multivariat, sehingga asumsi normalitas multivariat terpenuhi.

5.3 Uji Asumsi Homogenitas Ragam

Hipotesis: \[ H0: \text{Ragam data homogen} \\ H1: \text{Ragam data tidak homogen} \]

> leveneTest(Total_Kolestrol~as.factor(Usia), data_usia)
Levene's Test for Homogeneity of Variance (center = median)
      Df F value Pr(>F)
group  2  0.3043 0.7391
      46               
> leveneTest(BMI~as.factor(Usia), data_usia)
Levene's Test for Homogeneity of Variance (center = median)
      Df F value Pr(>F)
group  2  0.3637 0.6971
      46               
> leveneTest(data_usia$`Kadar Glukosa`~as.factor(Usia), data_usia)
Levene's Test for Homogeneity of Variance (center = median)
      Df F value Pr(>F)
group  2   1.033  0.364
      46               
Variabel p-value Keputusan
Total_Kolestrol 0.7391 Terima H0
BMI 0.6971 Terima H0
Kadar Glukosa 0.364 Terima H0

seluruh variabel dependen menghasilkan keputusan yang sama, yaitu Terima H0

Kesimpulan: Dengan taraf nyata 5% sudah terdapat cukup bukti untuk menyatakan bahwa data dari setiap variabel dependen memiliki ragam yang homogen. Dengan kata lain, asumsi homogenitas ragam terpenuhi.

5.4 Uji Asumsi Homogenitas Matriks Varian Kovarian

Hipotesis: \[ H0: \Sigma_1= \Sigma_2=...=\Sigma_k\text{ (matriks varians-kovarians homogen)} \\ H1: \Sigma_i\neq \Sigma_j \text{ untuk } i\neq \text{ j} \text{ (matriks varians-kovarians tidak homogen)} \]

> summary(uji_homogen_mul)
       Box's M Test 

Chi-Squared Value = 13.09833 , df = 12  and p-value: 0.362 

Berdasarkan uji Box-M, didapatkan nilai Chi-square = 13.09833 dan p-value sebesar 0.362

Keputusan:

karena p-value > α (0.05), maka Terima H0

Kesimpulan: Dengan taraf nyata 5% sudah terdapat cukup bukti untuk menyatakan bahwa matriks varians kovarians bersifat homogen atau sama. Sehingga, asumsi homogenitas matriks varians-kovarians terpenuhi.

5.5 Analisis MANOVA

Hipotesis: \[ H0: \mu_1=\mu_2=\mu_3 \\ H1: \text{minimal terdapat satu } \mu_j \text{ yang berbeda} \] note: seluruh hipotesis tersebut berupa vektor dari mu_j dimana j = 1,2,3

5.5.1 Uji Wilk’s Lambda

> summary(manova_jantung, test="Wilks")
          Df   Wilks approx F num Df den Df  Pr(>F)  
perlakuan  2 0.72634   2.5426      6     88 0.02565 *
Residuals 46                                         
---
Signif. codes:  0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1

Berdasarkan uji Wilk’s Lambda, didapat hasil berikut.

Lambda* p-value
0.72634 0.02565

Keputusan:

karena p-value < α (0.05), maka Tolak H0

Kesimpulan: Dengan taraf nyata 5% dapat disimpulkan bahwa perbedaan kelompok usia berpengaruh signifikan secara multivariat terhadap total kolesterol, BMI, dan kadar glukosa.

5.5.2 Uji Pillai’s Trace

> summary(manova_jantung, test="Pillai")
          Df  Pillai approx F num Df den Df  Pr(>F)  
perlakuan  2 0.27808   2.4224      6     90 0.03235 *
Residuals 46                                         
---
Signif. codes:  0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1

Berdasarkan uji Pillai’s Trace, didapat hasil berikut.

P p-value
0.27808 0.03235

Keputusan:

karena p-value < α (0.05), maka Tolak H0

Kesimpulan: Dengan taraf nyata 5% dapat disimpulkan bahwa perbedaan kelompok usia berpengaruh signifikan secara multivariat terhadap total kolesterol, BMI, dan kadar glukosa.

5.5.3 Uji Hotelling-Lawkey

> summary(manova_jantung, test="Hotelling-Lawley")
          Df Hotelling-Lawley approx F num Df den Df Pr(>F)  
perlakuan  2          0.37069   2.6566      6     86 0.0206 *
Residuals 46                                                 
---
Signif. codes:  0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1

Berdasarkan uji Hotelling-Lawkey, didapat hasil berikut.

T p-value
0.37069 0.0206

Keputusan:

karena p-value < α (0.05), maka Tolak H0

Kesimpulan: Dengan taraf nyata 5% dapat disimpulkan bahwa perbedaan kelompok usia berpengaruh signifikan secara multivariat terhadap total kolesterol, BMI, dan kadar glukosa.

5.5.4 Uji Roy’s Test

> summary(manova_jantung, test="Roy")
          Df     Roy approx F num Df den Df  Pr(>F)   
perlakuan  2 0.35349   5.3024      3     45 0.00324 **
Residuals 46                                          
---
Signif. codes:  0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1

Berdasarkan uji Roy’s Test, didapat hasil berikut.

R p-value
0.35349 0.00324

Keputusan:

karena p-value < α (0.05), maka Tolak H0

Kesimpulan: Dengan taraf nyata 5% dapat disimpulkan bahwa perbedaan kelompok usia berpengaruh signifikan secara multivariat terhadap total kolesterol, BMI, dan kadar glukosa.

5.6 Analisis ANOVA

Hipotesis: \[ H0: \mu_1=\mu_2=\mu_3 \\ H1: \text{minimal terdapat satu } \mu_j \text{ yang berbeda} \]

> anova_jantung <- summary.aov(manova_jantung)
> anova_jantung
 Response y1 :
            Df Sum Sq Mean Sq F value Pr(>F)   
perlakuan    2  13069  6534.7  5.6299 0.0065 **
Residuals   46  53393  1160.7                  
---
Signif. codes:  0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1

 Response y2 :
            Df Sum Sq Mean Sq F value Pr(>F)
perlakuan    2  13.48  6.7422  0.5733 0.5676
Residuals   46 540.95 11.7598               

 Response y3 :
            Df Sum Sq Mean Sq F value Pr(>F)
perlakuan    2  199.4  99.723  1.2705 0.2904
Residuals   46 3610.6  78.490               

Hasil Analisis ANOVA adalah sebagai berikut.

Variabel Dependen p-value
Total_Kolestrol 0.0065
BMI 0.5676
Kadar Glukosa 0.2904

Keputusan:

  • Respon Total_Kolestrol, diperoleh nilai p-value < α (0,05), maka Tolak H0
  • Respon BMI, diperoleh nilai p-value > α (0,05), maka Terima H0
  • Respon Kadar Glukosa, diperoleh nilai p-value > α (0,05), maka Terima H0

Kesimpulan:

  • Dengan taraf nyata 5% dapat disimpulkan bahwa terdapat perbedaan pengaruh yang signifikan kelompok usia terhadap variabel total_kolesterol dalam tubuh.
  • Dengan taraf nyata 5% dapat disimpulkan bahwa tidak terdapat perbedaan pengaruh yang signifikan kelompok usia terhadap variabel BMI.
  • Dengan taraf nyata 5% dapat disimpulkan bahwa tidak terdapat perbedaan pengaruh yang signifikan kelompok usia terhadap variabel kadar glukosa dalam darah.

6 PENUTUP

6.1 KESIMPULAN

Berdasarkan hasil analisis, dapat disimpulkan bahwa :

  1. Dari hasil keempat statistik uji MANOVA yang dilakukan (Wilk’s Lambda, Pillai’s Trace, Hotelling-Lawkey, dan Roy’s Test), dapat disimpulkan bahwa terdapat pengaruh yang signifikan secara simultan antara ketiga kelompok usia terhadap total kolesterol, BMI, dan kadar glukosa.
  2. Hasil analisis ANOVA menunjukkan bahwa ketiga kelompok usia tidak semuanya berpengaruh signifikan secara univariat terhadap total kolesterol, BMI, dan kadar glukosa. Perbedaan kelompok usia hanya berpengaruh signifikan terhadap total kolesterol dan tidak berpengaruh signifikan terhadap BMI dan kadar glukosa.
  3. Dilihat dari boxplot pada bagian statistika deskriptif, didapat bahwa masih terdapat outlier pada data. Akan tetapi outlier tersebut tidak berpengaruh signifikan, sehingga pengujian analisis dapat dilanjutkan.
  4. Data pengaruh kelompok usia terhadap faktor pemicu penyakit jantung yang digunakan sudah memenuhi seluruh asumsi pada analisis MANOVA. Asumsi yang dimaksud ialah bahwa data terbukti menyebar secara normal multivariat, ragam data homogen, dan matriks varians-kovarians data juga bersifat homogen. Maka dari itu, kemungkinan besar hasil analisis yang diperoleh valid dan tidak bias.

6.2 SARAN

Analisis MANOVA yang telah dilakukan sudah cukup baik dalam menjelaskan pengaruh dari ketiga kelompok usia terhadap total kolesterol, BMI, dan kadar glukosa yang mana ketiga faktor tersebut merupakan faktor pemicu penyakit jantung. Ketiga kelompok tersebut menunjukkan pengaruh yang signifikan terhadap seluruh variabel dependen secara simultan. Walaupun sudah cukup baik dalam analisisnya, tetapi disarankan dilakukan uji lanjutan seperti analisis profile, atau analisis lainnya. Hal ini bertujuan untuk menggabungkan data dari beberapa variabel dalam rangka memahami hubungan antara variabel-variabel tersebut. Dalam konteks pengaruh kelompok usia terhadap faktor pemicu penyakit jantung, analisis profil dapat membantu mengidentifikasi bagaimana faktor-faktor seperti total kolesterol, BMI, dan kadar gula darah berubah atau berinteraksi dengan usia. Hal ini dapat memberikan wawasan yang lebih mendalam tentang bagaimana faktor-faktor tersebut mempengaruhi risiko penyakit jantung pada kelompok usia yang berbeda.

Selain itu, dengan adanya penelitian ini maka masyarakat mendapatkan wawasan atau informasi terbaru terkait penyakit jantung. Dari hasil analisis, didapat bahwa perbedaan kelompok usia berpengaruh signifikan terhadap faktor pemicu penyakit jantung. Usia memang merupakan faktor yang yak dapat diubah, akan tetapi seseorang dapat mencegah dan menghindari terjadinya penyakit pada diri mereka sendiri. Oleh karena itu, disarankan bagi masyarakat untuk selalu menjaga kesehatannya seiring bertambahnya usia dengan cara mengontrol gula darah, kadar kolesterol, dan berat badan agar tidak obesitas. Dengan melakukan pencegahan maka risiko seseorang terkena penyakit jantung akan berkurang walaupun usia terus bertambah.

7 DAFTAR PUSTAKA

  • Anis, Wahyul. (2021). Perbedaan Kekuatan Uji dan Kesalahan Tipe II (Β) pada Uji Mardia MVN, Uji Henze Zikler MVN dan Uji Royston MVN dalam Analisis Normalitas Data Multivariat. https://news.unair.ac.id/2021/11/23/perbedaan-kekuatan-uji-dan-kesalahan-tipe-ii-%CE%B2-pada-uji-mardia-mvn-uji-henze-zikler-mvn-dan-uji-royston-mvn-dalam-analisis-normalitas-data-multivariat/?lang=id

  • Iqbal, Muhammad, Salsabila, Inas., Syahbani, D.A., Douw, Januaria., Marzuki, Rusyana, Asep.(2020). Analisis MANOVA Satu Arah untuk Melihat Perbedaan Status Gizi Balita Berdasarkan Wilayah Pembangunan Utama di Indonesia Tahun 2017. Journal of Data Analysis,3(1), 52-53.

  • Setiawan, Dedi., Juwita, Ratna., Lindasari, Devi., Tahayu, S.P.(2017). Analisis MANOVA Satu Arah pada Data Komponen Kesehatan Bayi di Pulau Jawa pada Tahun 2013.

  • Harun, A.A. (2019). Analisis MANOVA (Multivariate Analysis Of Variance) pada Data Faktor-Faktor yang Mempengaruhi Jumlah Benzoic Acid (BA) Dan Phthalide (PL) yang Dihasilkan Akibat Proses Destilasi Phtalic Anhydride (PA).

  • Handoko, Jalu. (2014). ANALISIS PENGELOMPOKKAN NEGARA-NEGARA IMPORTIR PRODUK INDONESIA BERDASARKAN FAKTOR BARANG INDUSTRI. (Tugas Akhir, Institut Teknologi Sepuluh Nopember).

  • Tambunan, L.N., Baringbing, E.P. (2023). Hubungan Usia dengan Kejadian Penyakit Jantung Koroner Pada Pasien Rawat Jalan di RSUD dr.Doris Sylvanus Provinsi Kalimantan Tengah. Jurnal Surya Medika (JSM), 9(1), 119-120. https://journal.umpr.ac.id/index.php/jsm/article/view/5158/3215