BAB I STUDI KASUS

1.1 Latar Belakang

Masalah kesehatan masyarakat saat ini tidak lagi ditentukan oleh satu indikator tunggal, melainkan oleh kombinasi beberapa faktor yang saling berkaitan. Misalnya, kadar glukosa darah, kolesterol, dan trigliserida merupakan indikator penting yang sama-sama berperan dalam menilai risiko penyakit metabolik seperti diabetes, penyakit jantung, dan sindrom metabolik. Di sisi lain, perilaku gaya hidup seperti konsumsi alkohol juga diketahui berpengaruh terhadap kondisi kesehatan seseorang.
Dalam analisis statistik, seringkali peneliti hanya menggunakan satu variabel respons untuk melihat pengaruh suatu faktor. Namun, pendekatan ini menjadi kurang tepat ketika terdapat lebih dari satu variabel respons yang saling berkorelasi. Jika dilakukan uji satu per satu (misalnya ANOVA terpisah), maka risiko kesalahan pengambilan keputusan (Type I error) akan meningkat.
Untuk mengatasi permasalahan tersebut, diperlukan metode analisis yang dapat menguji pengaruh suatu faktor terhadap beberapa variabel respons secara simultan. Salah satu metode yang sesuai adalah Multivariate Analysis of Variance (MANOVA). MANOVA memungkinkan peneliti untuk menguji perbedaan rata-rata beberapa variabel dependen sekaligus berdasarkan kelompok tertentu.
Dalam penelitian ini, MANOVA digunakan untuk menganalisis perbedaan kondisi kesehatan berdasarkan status konsumsi alkohol (peminum dan bukan peminum). Variabel kesehatan yang digunakan sebagai respons adalah kadar glukosa, kolesterol, dan trigliserida. Dengan pendekatan ini, diharapkan hasil analisis lebih komprehensif dalam menjelaskan pengaruh konsumsi alkohol terhadap kondisi kesehatan secara multivariat.

1.2 Tujuan

Tujuan penelitian ini adalah:

  1. Memahami dan menerapkan langkah-langkah metode MANOVA dalam analisis data.

  2. Mengetahui apakah terdapat perbedaan kadar glukosa darah, kolesterol, dan trigliserida antara individu yang mengonsumsi alkohol dan yang tidak mengonsumsi alkohol.

1.3 Tinjauan Pustaka

1.3.1 Pengertian MANOVA

Multivariate Analysis of Variance (MANOVA) adalah pengembangan dari ANOVA yang digunakan ketika terdapat lebih dari satu variabel dependen. MANOVA bertujuan untuk menguji apakah terdapat perbedaan vektor rata-rata antar kelompok perlakuan (Martin Gail, 2023). Jika pada ANOVA hanya terdapat satu variabel respons, maka pada MANOVA terdapat lebih dari satu variabel respons sehingga dapat digunakan untuk melihat perbedaan kelompok secara lebih menyeluruh.

1.3.2 Asumsi MANOVA

Agar hasil MANOVA valid, maka terdapat beberapa asumsi yang harus dipenuhi, yaitu:

  1. Normalitas Multivariat
    Variabel dependen harus berdistribusi normal secara multivariat Pengujian dapat dilakukan dengan metode Mardia (Abdillah et al., 2025). MANOVA dikatakan cukup robust terhadap penyimpangan normalitas moderat, namun keberadaan multivariate outliers dapat menimbulkan masalah serius (Tufan & Cinar, 2024).

  2. Homogenitas Matriks Kovarians
    Matriks kovarians antar kelompok harus sama (equality of covariance matrices) yang diuji dengan uji Box’s M.

1.3.3 Pengujian MANOVA

Multivariate Analysis of Variance (MANOVA) melibatkan beberapa statistik uji yang digunakan untuk menentukan signifikansi perbedaan vektor rata-rata kelompok. Berbeda dengan ANOVA univariat yang hanya memiliki satu rasio F, MANOVA memiliki beberapa statistik uji (Alesandro et al., 2025). Berikut beberapa statistik uji yang umum digunakan dalam MANOVA.

  • Wilks’ Lambda

  • Pillai’s Trace

  • Hotelling-Lawley Trace

  • Roy’s Largest Root

Jika p-value < 0,05 maka dapat disimpulkan bahwa terdapat perbedaan multivariat signifikan antar kelompok.

1.4 Sumber Data dan Studi Kasus

1.4.1 Sumber Data

Data yang digunakan berasal dari Kaggle yang berjudul “Healthcare Risk Factors Dataset” dengan tautan sebagai berikut. Tautan.
Dataset ini berisi informasi kondisi kesehatan dan gaya hidup individu dengan jumlah data besar.

1.4.2 Studi Kasus

Penelitian ini dilakukan untuk menganalisis perbedaan kadar glukosa darah, kolesterol, dan trigliserida pada individu berdasarkan status konsumsi alkohol menggunakan MANOVA dengan keterangan sebagai berikut.

  • Variabel Penelitian
    Tabel 1.4.2.1 Variabel Penelitian

    Variabel Nama Keterangan
    X (prediktor) Alcohol Status konsumsi alkohol (0 = tidak, 1 = ya)
    Y1 (respons) Glucose Kadar gula darah
    Y2 (respons) Cholesterol Kadar kolesterol
    Y3 (respons) Triglycerides Kadar trigliserida
  • Data
    Data yang digunakan adalah data variabel terpilih (Alcohol, Glucose, Cholesterol, Triglycerides) pada 50 data pertama.

    Alcohol Glucose Cholesterol Triglycerides
    0 137.04 231.88 210.56
    0 71.58 165.57 129.41
    0 95.24 214.94 165.35
    1 95.15 259.53 115.85
    1 164.09 199.62 154.16

BAB II SOURCE CODE

Berikut merupakan source code beserta penjelasan mengenai coding pada RStudio.

data <- read.csv("C:/Users/ransi/Downloads/dirty_v3_path.csv")

read.csv() membaca file data mentah dari file CSV ke dalam R.

manova_data <- data[, c("Alcohol", "Glucose", "Cholesterol", "Triglycerides")]

data[] memilih variabel yang digunakan dalam analisis MANOVA dengan satu variabel prediktor yaitu Alcohol dan tiga variabel respons yaitu tingkat Glucose, Cholesterol, Triglycerides.

manova_data$Alcohol <- as.factor(manova_data$Alcohol)
manova_data$Glucose <- as.numeric(manova_data$Glucose)
manova_data$Cholesterol <- as.numeric(manova_data$Cholesterol)
manova_data$Triglycerides <- as.numeric(manova_data$Triglycerides)
manova_clean <- na.omit(manova_data)

na.omit() menghapus observasi yang memiliki nilai kosong pada variabel utama.

manova_clean <- subset(manova_clean, Alcohol %in% c(0, 1))
manova_clean$Alcohol<-droplevels(manova_clean$Alcohol)
manova_50<- manova_clean[1:50, ]

manova_clean[] mengambil 50 data pertama dari data yang sudah dibersihkan sebagai sampel yang digunakan untuk analisis MANOVA.

library(MVN)
norm.test<-mvn(data = manova_50[, 2:4],mvn_test = "mardia")
norm.test$multivariate_normality
##              Test Statistic p.value     Method          MVN
## 1 Mardia Skewness    28.488   0.002 asymptotic ✗ Not normal
## 2 Mardia Kurtosis     1.192   0.233 asymptotic     ✓ Normal
norm.test$univariate_normality
##               Test      Variable Statistic p.value    Normality
## 1 Anderson-Darling       Glucose     2.248  <0.001 ✗ Not normal
## 2 Anderson-Darling   Cholesterol     0.306   0.554     ✓ Normal
## 3 Anderson-Darling Triglycerides     0.396   0.359     ✓ Normal

mvn() digunakan untuk melakukan uji normalitas multivariat Mardia pada variabel respons.

manova_50$Glucose_log<-log(manova_50$Glucose + 1)

log() digunakan untuk transformasi data ke bentuk log.

manova_tf<-manova_50[,c("Alcohol","Glucose_log","Cholesterol","Triglycerides")]
norm.test<-mvn(data = manova_tf[,2:4],mvn_test = "mardia")
norm.test$multivariate_normality
##              Test Statistic p.value     Method      MVN
## 1 Mardia Skewness    17.460   0.065 asymptotic ✓ Normal
## 2 Mardia Kurtosis     0.073   0.942 asymptotic ✓ Normal

Hasil transformasi dan variabel lainnya dimasukkan ke dalam dataset baru manova_tf. Selanjutnya dilakukan uji normalitas multivariat Mardia kembali pada variabel yang ditransformasi.

library(biotools)
## Loading required package: MASS
## ---
## biotools version 4.3
ujiboxm<-boxM(manova_tf[,2:4],manova_tf$Alcohol)
ujiboxm
## 
##  Box's M-test for Homogeneity of Covariance Matrices
## 
## data:  manova_tf[, 2:4]
## Chi-Sq (approx.) = 2.9831, df = 6, p-value = 0.811

boxM() digunakan untuk uji homogenitas matriks kovarians antar kelompok.

model <- manova(cbind(Glucose_log, Cholesterol, Triglycerides) ~ Alcohol, data = manova_tf)

manova() berfungsi membentuk model MANOVA dengan Alcohol sebagai variabel prediktor dan Glucose, Cholesterol, Triglycerides sebagai variabel respons.

summary(model, test = "Wilks")
##           Df   Wilks approx F num Df den Df Pr(>F)
## Alcohol    1 0.87889    2.113      3     46 0.1115
## Residuals 48

test = "Wilks" melakukan uji signifikansi menggunakan Wilks’ Lambda.

summary(model, test = "Pillai")
##           Df  Pillai approx F num Df den Df Pr(>F)
## Alcohol    1 0.12111    2.113      3     46 0.1115
## Residuals 48

test = "Pillai" melakukan uji signifikansi menggunakan Pillai’s Trace.

summary(model, test = "Hotelling-Lawley")
##           Df Hotelling-Lawley approx F num Df den Df Pr(>F)
## Alcohol    1           0.1378    2.113      3     46 0.1115
## Residuals 48

test = "Hotelling-Lawley" melakukan uji signifikansi menggunakan Hotelling-Lawley Trace.

summary(model, test = "Roy")
##           Df    Roy approx F num Df den Df Pr(>F)
## Alcohol    1 0.1378    2.113      3     46 0.1115
## Residuals 48

test = "Roy" melakukan uji signifikansi menggunakan Roy’s Largest Root.

summary.aov(model)
##  Response Glucose_log :
##             Df Sum Sq  Mean Sq F value Pr(>F)
## Alcohol      1 0.0686 0.068608  0.7453 0.3922
## Residuals   48 4.4183 0.092048               
## 
##  Response Cholesterol :
##             Df Sum Sq Mean Sq F value  Pr(>F)  
## Alcohol      1   6303  6302.9   5.877 0.01916 *
## Residuals   48  51478  1072.5                  
## ---
## Signif. codes:  0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
## 
##  Response Triglycerides :
##             Df Sum Sq Mean Sq F value Pr(>F)
## Alcohol      1    503  502.98  0.2553 0.6157
## Residuals   48  94579 1970.39

summary.aov() menampilkan hasil ANOVA univariat tiap variabel respons.

BAB III HASIL DAN PEMBAHASAN

3.1 Uji Normalitas Multivariat

3.1.1 Uji Normalitas Data Asli

  • Hipotesis
    H0: Data berdistribusi normal multivariat
    H1: Data tidak berdistribusi normal multivariat

  • Output

    ##              Test Statistic p.value     Method          MVN
    ## 1 Mardia Skewness    28.488   0.002 asymptotic ✗ Not normal
    ## 2 Mardia Kurtosis     1.192   0.233 asymptotic     ✓ Normal
    ##               Test      Variable Statistic p.value    Normality
    ## 1 Anderson-Darling       Glucose     2.248  <0.001 ✗ Not normal
    ## 2 Anderson-Darling   Cholesterol     0.306   0.554     ✓ Normal
    ## 3 Anderson-Darling Triglycerides     0.396   0.359     ✓ Normal
  • Keputusan
    Karena terdapat p-value<0,05 maka tolak H0.

  • Interpretasi
    Berdasarkan hasil uji normalitas multivariat menggunakan uji Mardia pada data awal (sebelum transformasi), diperoleh p-value untuk skewness sebesar 0,002 dan p-value untuk kurtosis sebesar 0,233. Karena terdapat p-value lebih kecil dari taraf signifikansi 5% (α = 0,05), maka data tidak berdistribusi normal multivariat. 
    Pada tingkat univariat, uji Anderson–Darling menunjukkan bahwa variabel Glucose tidak berdistribusi normal (p-value < 0,001), sementara variabel Cholesterol dan Triglycerides berdistribusi normal dengan p-value masing-masing sebesar 0,306 dan 0,396 (> 0,05). Dengan demikian, indikasi ketidaknormalan multivariat terutama dipengaruhi oleh distribusi variabel Glucose yang menyimpang dari normal.

3.1.2 Uji Normalitas Data Transformasi

Untuk mengatasi pelanggaran asumsi normalitas multivariat, dilakukan transformasi logaritmik pada variabel Glucose. Setelah transformasi, dilakukan kembali uji normalitas multivariat menggunakan Mardia test.

  • Hipotesis
    H0: Data berdistribusi normal multivariat
    H1: Data tidak berdistribusi normal multivariat

  • Output

    ##              Test Statistic p.value     Method      MVN
    ## 1 Mardia Skewness    17.460   0.065 asymptotic ✓ Normal
    ## 2 Mardia Kurtosis     0.073   0.942 asymptotic ✓ Normal
  • Keputusan 
    Karena p-value>0,05 maka terima H0.

  • Interpretasi
    Setelah transformasi, uji normalitas multivariat diulang dan menghasilkan nilai p-value untuk skewness sebesar 0,065 dan untuk kurtosis sebesar 0,942, yang keduanya lebih besar dari 0,05. Dengan demikian, dapat disimpulkan bahwa setelah transformasi, data telah memenuhi asumsi normalitas multivariat.

3.2 Uji Homogenitas Matriks Kovarians

  • Hipotesis
    H0: Matriks kovarians homogen
    H1: Matriks kovarians tidak homogen

  • Output

    ## 
    ##  Box's M-test for Homogeneity of Covariance Matrices
    ## 
    ## data:  manova_tf[, 2:4]
    ## Chi-Sq (approx.) = 2.9831, df = 6, p-value = 0.811
  • Keputusan 
    Karena p-value>0,05 maka tolak H0.

  • Interpretasi
    Dengan taraf nyata 5% dapat disimpulkan bahwa tidak terdapat perbedaan signifikan antara matriks kovarians antar kelompok sehingga asumsi homogenitas kovarian terpenuhi.

3.3 MANOVA

Hipotesis
H0: µ1=µ2
H1: Paling tidak ada satu µi yang berbeda

3.3.1 Wilks' Lambda

##           Df   Wilks approx F num Df den Df Pr(>F)
## Alcohol    1 0.87889    2.113      3     46 0.1115
## Residuals 48

Hasil uji Wilks' Lambda menunjukkan nilai statistik Wilks sebesar 0,87889 serta p-value 0,1115. Karena p-value lebih besar dari 0,05, maka tidak terdapat perbedaan yang signifikan secara multivariat antara kelompok individu yang mengonsumsi alkohol dan yang tidak mengonsumsi alkohol terhadap kadar glukosa darah, kolesterol, dan trigliserida. 

3.3.2 Pillai’s Trace

##           Df  Pillai approx F num Df den Df Pr(>F)
## Alcohol    1 0.12111    2.113      3     46 0.1115
## Residuals 48

Hasil uji Pillai menunjukkan nilai statistik sebesar 0,12111 serta p-value 0,1115. Karena p-value lebih besar dari 0,05, maka tidak terdapat perbedaan yang signifikan secara multivariat antara kelompok individu yang mengonsumsi alkohol dan yang tidak mengonsumsi alkohol terhadap kadar glukosa darah, kolesterol, dan trigliserida. 

3.3.3 Hotelling-Lawley Trace

##           Df Hotelling-Lawley approx F num Df den Df Pr(>F)
## Alcohol    1           0.1378    2.113      3     46 0.1115
## Residuals 48

Hasil uji Hotelling-Lawley menunjukkan nilai statistik sebesar 0,1378 serta p-value 0,1115. Karena p-value lebih besar dari 0,05, maka tidak terdapat perbedaan yang signifikan secara multivariat antara kelompok individu yang mengonsumsi alkohol dan yang tidak mengonsumsi alkohol terhadap kadar glukosa darah, kolesterol, dan trigliserida.

3.3.4 Roy's Largest Root

##           Df    Roy approx F num Df den Df Pr(>F)
## Alcohol    1 0.1378    2.113      3     46 0.1115
## Residuals 48

Diperoleh nilai statistik Roy sebesar 0,1378 serta p-value 0,1115. Karena nilai p-value lebih besar dari 0,05, maka tidak terdapat perbedaan yang signifikan secara multivariat antara kelompok individu yang mengonsumsi alkohol dan yang tidak mengonsumsi alkohol terhadap kadar glukosa darah, kolesterol, dan trigliserida.

Berdasarkan hasil pengujian MANOVA menggunakan kriteria Wilks' Lambda, Pillai's Trace, Hotelling–Lawley Trace, dan Roy's Largest Root, diperoleh bahwa seluruh nilai uji memberikan hasil tidak signifikan (p-value > 0,05). Hal ini menunjukkan bahwa secara simultan tidak terdapat perbedaan yang bermakna antara kelompok konsumsi alkohol terhadap profil variabel respon, yaitu kadar glukosa (setelah transformasi log), kolesterol, dan trigliserida. Oleh karena itu, tidak perlu dilakukan analisis profil karena analisis profil bertujuan untuk mengeksplorasi lebih lanjut bentuk perbedaan pola rerata antar kelompok, sedangkan hasil MANOVA menunjukkan bahwa perbedaan tersebut tidak signifikan. Dengan demikian, tidak terdapat dasar statistik yang cukup kuat untuk menelusuri lebih jauh baik kesejajaran, keberimpitan, maupun horizontalitas profil.

3.4 ANOVA

Karena uji MANOVA tidak signifikan, analisis univariat sebenarnya bersifat tambahan (eksploratif), namun tetap dapat digunakan untuk melihat variabel mana yang paling berkontribusi.

Hipotesis
H0: µ1=µ2
H1: Paling tidak ada satu µi yang berbeda

##  Response Glucose_log :
##             Df Sum Sq  Mean Sq F value Pr(>F)
## Alcohol      1 0.0686 0.068608  0.7453 0.3922
## Residuals   48 4.4183 0.092048               
## 
##  Response Cholesterol :
##             Df Sum Sq Mean Sq F value  Pr(>F)  
## Alcohol      1   6303  6302.9   5.877 0.01916 *
## Residuals   48  51478  1072.5                  
## ---
## Signif. codes:  0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
## 
##  Response Triglycerides :
##             Df Sum Sq Mean Sq F value Pr(>F)
## Alcohol      1    503  502.98  0.2553 0.6157
## Residuals   48  94579 1970.39
  • Variabel Glucose_log
    Karena p-value lebih besar dari 0,05, maka tidak terdapat perbedaan kadar glukosa (setelah transformasi log) yang signifikan antara kelompok konsumsi alkohol dan non-konsumsi alkohol.

  • Variabel Cholesterol
    Karena p-value lebih kecil dari 0,05, maka terdapat perbedaan kadar kolesterol yang signifikan antara kelompok individu yang mengonsumsi alkohol dan yang tidak.

  • Variabel Triglycerides
    Karena p-value lebih besar dari 0,05, maka tidak terdapat perbedaan kadar trigliserida yang signifikan antara kelompok konsumsi alkohol dan non-konsumsi alkohol.

BAB IV KESIMPULAN

Sebelum dilakukan pengujian MANOVA, asumsi normalitas multivariat dan homogenitas perlu dipenuhi terlebih dahulu. Pada uji normalitas multivariat awal ditemukan pelanggaran asumsi akibat distribusi variabel glukosa yang tidak normal sehingga dilakukan transformasi logaritmik terhadap data glukosa. Selanjutnya setelah diuji kembali, transformasi berhasil memperbaiki normalitas multivariat, sehingga model yang digunakan menjadi lebih valid secara statistik. Sedangkan asumsi homogenitas matriks kovarians sudah terpenuhi sehingga analisis MANOVA dapat dilakukan.

Berdasarkan hasil analisis data menggunakan metode MANOVA, dapat disimpulkan bahwa tidak terdapat perbedaan yang signifikan antara kelompok individu yang mengonsumsi alkohol dan yang tidak mengonsumsi alkohol terhadap kombinasi variabel respon, yaitu kadar glukosa darah (setelah transformasi log), kolesterol, dan trigliserida secara simultan. Hal ini dibuktikan melalui seluruh kriteria uji multivariat yang digunakan, yakni Wilks' Lambda, Pillai's Trace, Hotelling–Lawley Trace, dan Roy's Largest Root, yang masing-masing menghasilkan nilai p-value lebih besar dari taraf signifikansi 5% (α = 0,05). Dengan demikian, tidak perlu dilakukan analisis profil karena secara keseluruhan konsumsi alkohol tidak memberikan pengaruh yang bermakna terhadap profil kesehatan metabolik responden dalam konteks variabel yang dianalisis.

BAB IV DAFTAR PUSTAKA

Abdillah, I. R., Ramadhani, F. N., Rahmasari, N. A., Wara, S. S. M., & Damaliana, A. T. (2025). Analisis Perbandingan Kasus COVID-19 di Indonesia Tahun 2020 dan 2021 Menggunakan Uji Repeated Measure MANOVA. Jurnal Eksbar, 2(1).https://doi.org/10.29408/eksbar.v2i1.29917

Alesandro, I. F., Harith, N., Tabina, A. D., Guminta, D. G., & Nuraini, U. S. (2025). Multivariate Analysis of Variance pada Faktor yang Mempengaruhi Pendanaan dan Valuasi Startup. Prosiding Seminar Nasional Sains Data, 2(1), 130–135.

Martin Gail. (2023). Analysis of one or more dependent variable manova. Medium. Retrieved fromhttps://medium.com/@martingail123gail/analysis-of-one-or-more-dependent-variable-manova-ed7301b41ff

Tufan, A., & Cinar, N. (2024). Comparing the Means of Independent Groups: ANOVA, ANCOVA, MANOVA, and MANCOVA. In StatPearls. StatPearls Publishing. Retrieved fromhttps://www.ncbi.nlm.nih.gov/books/NBK606084/