Implementasi MANOVA dan MANCOVA untuk Analisis Pengaruh Riwayat Keluarga terhadap Kondisi Fisik dan Pola Makan

Abstrak

Obesitas merupakan permasalahan kesehatan yang dipengaruhi oleh beberapa faktor seperti pola makan, aktivitas fisik, kondisi individu atau bahkan riwayat genetik keluarga. Dikarenakan dipengaruhi oleh beberapa faktor maka perlu dilakukan analisis multivariat untuk memhami hubungan antra variabell secra simultan. Pada penelitian ini menerapkan metode Multivariate Analysis of Variance (MANOVA) dan Multivariate Analysis of Covariance (MANCOVA). Tujuan dari penggunaan metode MANCOVA adalah menguji pengaruh tingkat obesitas terhadap beberapa variabel kesehatan secara simultan, sedangkan  MANCOVA digunakan untuk mengontrol pengaruh lain dengan menambahkan variabel kovariat.

Berdasarkan hasil MANOVA menunjukkan bahwa riwayat keluarga berpengaruh signifikan terhadap BMI (p < 0.001), namun tidak signifikan terhadap FCVC (p = 0.064). Analisis MANCOVA mengonfirmasi pengaruh signifikan riwayat keluarga terhadap BMI (p < 0.001) setelah mengendalikan usia, sedangkan FCVC tetap tidak signifikan. Temuan ini menegaskan bahwa faktor genetik berperan utama dalam kondisi fisik individu, sementara kebiasaan makan lebih dipengaruhi oleh faktor individu, serta menunjukkan efektivitas MANCOVA dalam menilai pengaruh murni riwayat keluarga setelah mengontrol variabel perancu.

Kata kunci: MANOVA, MANCOVA, Obesitas, Analisis Multivariat, Faktor Genetik

BAB 1 Pendahuluan

Obesitas kini telah menjadi epidemi kesehatan global yang sangat mengkhawatirkan, khususnya di Amerika Latin seperti Meksiko. Laporan Kementerian Kesehatan Meksiko mencatat hampir tiga dari empat orang dewasa (72,5%) di negara tersebut mengalami kegemukan (CNN Indonesia, 2016). Meskipun pemerintah telah meluncurkan intervensi agresif seperti pengenaan pajak minuman berpemanis dan penekanan peredaran junk food (Kompas, 2020), angka obesitas tetap menjadi krisis yang persisten. Urgensi penanganan masalah ini berakar pada dampak fatalnya; kelebihan berat badan berkontribusi terhadap 44% kasus diabetes, 23% penyakit jantung, dan hingga 41% kasus kanker (CNN Indonesia, 2016). Kegagalan program gaya hidup umum dan tingginya mortalitas ini mengindikasikan bahwa ledakan kasus obesitas tidak hanya dipicu oleh ketersediaan makanan tidak sehat, tetapi ada faktor determinan lain yang mengakar sangat kuat.

Dalam menganalisis pemicu obesitas, perhatian sering kali hanya tertuju pada gaya hidup eksternal. Padahal, literatur medis modern menegaskan bahwa faktor genetik, yang direpresentasikan melalui riwayat obesitas keluarga, memiliki andil besar dalam menentukan kondisi fisik sekaligus memengaruhi preferensi pola makan individu. Penelitian ini memanfaatkan dataset “Estimation of Obesity Levels” dari populasi Meksiko, Peru, dan Kolombia (Palechor & de la Hoz Manotas, 2019) untuk membedah pengaruh bawaan tersebut. Namun, mengukur dampak riwayat genetik secara murni tidaklah sederhana karena adanya faktor perancu (confounding factor) berupa usia. Seiring bertambahnya usia, laju metabolisme tubuh menurun secara biologis yang secara otomatis memengaruhi berat badan dan mengubah kebiasaan makan (Erol & Subasi, 2023).

Untuk mengatasi permasalahan bias di variabel perancu tersebut, pendekatan analitik menggunakan perbandingan antara Multivariate Analysis of Variance (MANOVA) dan Multivariate Analysis of Covariance (MANCOVA). Sejalan dengan panduan analisis multivariat (Hair et al., 2022), perbandingan kedua metode ini terbukti secara saintifik mampu memastikan apakah pengaruh riwayat genetik benar-benar signifikan, atau sekadar ilusi statistik akibat efek bertambahnya usia.

Berdasarkan latar belakang tersebut, rumusan masalah dalam penelitian ini adalah:

  1. Apakah terdapat perbedaan yang signifikan pada kondisi fisik dan pola makan individu jika ditinjau dari riwayat genetik obesitas keluarga?

  2. Apakah riwayat genetik keluarga memberikan pengaruh yang signifikan terhadap kondisi fisik dan pola makan setelah melihat efek dari usia responden?

  3. Bagaimana perbandingan hasil antara metode MANOVA dan MANCOVA dalam mengevaluasi riwayat genetik obesitas keluarga terhadap kondisi fisik dan pola makan?

Tujuan dari penelitian ini adalah:

  1. Menganalisis perbedaan yang signifikan pada kondisi fisik dan pola makan individu ditinjau dari riwayat genetik obesitas keluarga menggunakan metode MANOVA

  2. menganalisis signifikan pengaruh riwayat genetik keluarga terhadap kondisi fisik dan pola makan setelah mengendalikan efek usia responden  menggunakan metode MANCOVA

  3. Membandingkan hasil antara metode MANOVA dan MANCOVA untuk mengevaluasi efektivitas penggunaan kovariat usia dalam meneliti pengaruh genetik terhadap kondisi fisik dan pola makan.

BAB 2 Metodologi Penelitian

A.   Penjelasan Dataset

Dataset yang digunakan dalam penelitian ini adalah Estimasi Tingkat Obesitas berdasarkan Kebiasaan Makan dan Kondisi Fisik  yang diperoleh dari UCI Machine Learning Repository.

Link Dataset: 

https://archive-ics-uci-edu.translate.goog/dataset/544/estimation+of+obesity+levels+based+on+eating+habits+and+physical+condition

Dataset ini berisi data perkiraan tingkat obesitas pada individu dari negara Meksiko, Peru, dan Kolombia berdasarkan kebiasaan makan dan kondisi fisik. Dataset ini awalnya berisi 17 variabel fitur dan diperoleh dari total 2111 responden. Dataset ini juga memiliki 7 label (Insufficient Weight, Normal Weight, Overweight Level I, Overweight Level II, Obesity Type I, Obesity Type II and Obesity Type III).

B.   Variabel Penelitian

Terdapat 4 variabel yang digunakan pada penelitian ini, sebagai berikut:

library(knitr)

tabel_variabel <- data.frame(
  Simbol = c("X", "Y1", "Y2", "CV"),
  Nama_Variabel = c("family_history_with_overweight", "BMI", "FCVC", "Age"),
  Tipe_Data = c("Binary (Yes/No)", "Kontinu", "Integer", "Kontinu"),
  Keterangan = c(
    "Yes: Memiliki Riwayat; No: Tidak Memiliki Riwayat",
    "BMI = Weight / Height^2",
    "Merepresentasikan tingkat konsumsi sayuran dalam makanan individu",
    "Mengontrol pengaruh laju metabolisme tubuh individu"
  )
)
kable(tabel_variabel, 
      col.names = c("Simbol", "Nama Variabel", "Tipe Data", "Keterangan"),
      caption = "Tabel Variabel yang Digunakan Analisis")
Tabel Variabel yang Digunakan Analisis
Simbol Nama Variabel Tipe Data Keterangan
X family_history_with_overweight Binary (Yes/No) Yes: Memiliki Riwayat; No: Tidak Memiliki Riwayat
Y1 BMI Kontinu BMI = Weight / Height^2
Y2 FCVC Integer Merepresentasikan tingkat konsumsi sayuran dalam makanan individu
CV Age Kontinu Mengontrol pengaruh laju metabolisme tubuh individu

Variabel family_history_with_overweight dipilih sebagai variabel independen (X) karena faktor genetik merupakan komponen biologis yang memiliki pengaruh dalam menentukan risiko penyakit, misalnya obesitas pada seseorang. Secara medis, faktor genetik memengaruhi laju metabolisme dasar (seberapa cepat tubuh membakar kalori saat istirahat) dan pengaturan nafsu makan dan lemak. Penggunaan variabel ini sebagai faktor (X) memungkinkan penelitian untuk menguji apakah faktor genetik memberikan perbedaan nyata secara multivariat pada kondisi fisik dan pola makan seseorang (Palechor & de la Hoz Manotas, 2019). Kondisi fisik direpresentasikan oleh BMI (Y1) sebagai standar global WHO yang bersifat kontinu, ssementara pola makan diwakili FCVC (Y2) karena asupan sayuran merupakan indikator kualitas diet yang konsisten dalam manajemen berat badan dibanding variabel lain seperti FAVC atau NCP yang memiliki variansi data yang rendah, karena meskipun NCP numerik, sebaran datanya terpusat di angka 3 (pola makan 3 kali sehari), sedangkan FACV mempunyai tipe data binary (Yes/No) yang mana tidak memenuhi syarat variabel dependen dalam analisis multivariat yang harus bersifat kontinu agar bisa membentuk matriks varians-kovarians.

C.  Multivariate Analysis of Variance (MANOVA)

Multivariate Analysis of Variance atau MANOVA adalah salah satu teknik statistik yang berguna untuk analisis data multivariat dengan melibatkan dua atau lebih variabel dependen (Y) yang diukur pada dua atau lebih kelompok treatment. Kelompok treatment pada analisis ini yaitu Individu yang memiliki dan tidak memiliki riwayat genetik obesitas keluarga. Variabel dependen yang digunakan terdapat dua, yaitu BMI (Body Mass Index) yang mewakili Kondisi Fisik, variabel ini diperoleh dari variabel Weight dibagi Height 2, serta FCVC tentang tingkat konsumsi sayuran pada makanan individu.

MANOVA dilakukan dengan memenuhi tiga asumsi, yaitu uji normalitas multivariat, homogenitas matriks varians-kovarians (Box’s Test), dan independensi sampel.

D. Multivariate Analysis of Covariance (MANCOVA)

Multivariate Analysis of Covariance atau MANCOVA adalah salah satu teknik statistik yang digunakan untuk menguji perbedaan rata-rata beberapa kelompok pada lebih dari satu variabel dependen (Y), secara bersamaan dengan mengontrol pengaruh satu atau lebih variabel kontinu (Kovariat). Pada analisis ini, variabel Age (Usia) digunakan sebagai Kovariat untuk mengontrol pengaruh atau variasi laju metabolisme tubuh yang secara alami berubah seiring bertambahnya usia. Penggunaan MANCOVA bertujuan untuk melihat pengaruh murni dari riwayat genetik terhadap kondisi fisik dan pola makan setelah pengaruh usia disetarakan.

Selain memenuhi asumsi MANOVA, analisis MANCOVA memerlukan dua pengujian asumsi tambahan, yaitu uji Linearitas (hubungan linear antara kovariat dan dependen) serta Homogeneity of Regression Slopes (kesamaan kemiringan regresi antar kelompok).

E.  Karakteristik Obesitas dan Faktor Risiko

Obesitas adalah kondisi medis yang ditandai dengan jumlah lemak dalam tubuh yang berlebihan, sehingga dapat meningkatkan resiko terjangkitnya berbagai penyakit kronis. Obesitas pada umumnya diukur menggunakan indikator Body Mass Index (BMI). BMI adalah rasio antara berat badan  (kilogram) dan pengkuadratan tinggi badan (meter2). Menurut World Health Organization (WHO, 2023), Individu dikatakan obesitas apabila memiliki BMI lebih dari 30 kg/m².

Obesitas dipengaruhi oleh beberapa faktor, selain karena faktor gaya hidup, riwayat genetik keluarga juga dapat memiliki peranan penting dalam risiko terjadinya obesitas dalam seseorang. Menurut Tri  Hartini Yuliawati (2024), dosen Universitas Airlangga, keterlibatan faktor genetik adalah adanya polimorfisme atau variasi pada gen reseptor leptin yang berpengaruh pada sirkuit pengaturan nafsu makan dan pengeluaran energi, sehingga memengaruhi metabolisme tubuh. Oleh karena itu, perlu adanya analisis multivariat seperti MANOVA dan MANCOVA untuk memahami faktor-faktor  yang berpengaruh dalam kondisi obesitas secara simultan.

BAB 3 Preprocessing dan Load Data

library(readr)
ObesityDataSet_raw_and_data_sinthetic <- read_csv("ObesityDataSet_raw_and_data_sinthetic.csv")
## Rows: 2111 Columns: 17
## ── Column specification ────────────────────────────────────────────────────────
## Delimiter: ","
## chr (9): Gender, family_history_with_overweight, FAVC, CAEC, SMOKE, SCC, CAL...
## dbl (8): Age, Height, Weight, FCVC, NCP, CH2O, FAF, TUE
## 
## ℹ Use `spec()` to retrieve the full column specification for this data.
## ℹ Specify the column types or set `show_col_types = FALSE` to quiet this message.
print(ObesityDataSet_raw_and_data_sinthetic)
## # A tibble: 2,111 × 17
##    Gender   Age Height Weight family_history_with_over…¹ FAVC   FCVC   NCP CAEC 
##    <chr>  <dbl>  <dbl>  <dbl> <chr>                      <chr> <dbl> <dbl> <chr>
##  1 Female    21   1.62   64   yes                        no        2     3 Some…
##  2 Female    21   1.52   56   yes                        no        3     3 Some…
##  3 Male      23   1.8    77   yes                        no        2     3 Some…
##  4 Male      27   1.8    87   no                         no        3     3 Some…
##  5 Male      22   1.78   89.8 no                         no        2     1 Some…
##  6 Male      29   1.62   53   no                         yes       2     3 Some…
##  7 Female    23   1.5    55   yes                        yes       3     3 Some…
##  8 Male      22   1.64   53   no                         no        2     3 Some…
##  9 Male      24   1.78   64   yes                        yes       3     3 Some…
## 10 Male      22   1.72   68   yes                        yes       2     3 Some…
## # ℹ 2,101 more rows
## # ℹ abbreviated name: ¹​family_history_with_overweight
## # ℹ 8 more variables: SMOKE <chr>, CH2O <dbl>, SCC <chr>, FAF <dbl>, TUE <dbl>,
## #   CALC <chr>, MTRANS <chr>, NObeyesdad <chr>
dataset = ObesityDataSet_raw_and_data_sinthetic
colSums(is.na(dataset))
##                         Gender                            Age 
##                              0                              0 
##                         Height                         Weight 
##                              0                              0 
## family_history_with_overweight                           FAVC 
##                              0                              0 
##                           FCVC                            NCP 
##                              0                              0 
##                           CAEC                          SMOKE 
##                              0                              0 
##                           CH2O                            SCC 
##                              0                              0 
##                            FAF                            TUE 
##                              0                              0 
##                           CALC                         MTRANS 
##                              0                              0 
##                     NObeyesdad 
##                              0
 dataset$BMI <- dataset$Weight / (dataset$Height^2)
 print(dataset)
## # A tibble: 2,111 × 18
##    Gender   Age Height Weight family_history_with_over…¹ FAVC   FCVC   NCP CAEC 
##    <chr>  <dbl>  <dbl>  <dbl> <chr>                      <chr> <dbl> <dbl> <chr>
##  1 Female    21   1.62   64   yes                        no        2     3 Some…
##  2 Female    21   1.52   56   yes                        no        3     3 Some…
##  3 Male      23   1.8    77   yes                        no        2     3 Some…
##  4 Male      27   1.8    87   no                         no        3     3 Some…
##  5 Male      22   1.78   89.8 no                         no        2     1 Some…
##  6 Male      29   1.62   53   no                         yes       2     3 Some…
##  7 Female    23   1.5    55   yes                        yes       3     3 Some…
##  8 Male      22   1.64   53   no                         no        2     3 Some…
##  9 Male      24   1.78   64   yes                        yes       3     3 Some…
## 10 Male      22   1.72   68   yes                        yes       2     3 Some…
## # ℹ 2,101 more rows
## # ℹ abbreviated name: ¹​family_history_with_overweight
## # ℹ 9 more variables: SMOKE <chr>, CH2O <dbl>, SCC <chr>, FAF <dbl>, TUE <dbl>,
## #   CALC <chr>, MTRANS <chr>, NObeyesdad <chr>, BMI <dbl>
 data_manova <- dataset[, c(
     "family_history_with_overweight",
     "BMI",
     "FCVC",
     "Age"
 )]
 str(data_manova)
## tibble [2,111 × 4] (S3: tbl_df/tbl/data.frame)
##  $ family_history_with_overweight: chr [1:2111] "yes" "yes" "yes" "no" ...
##  $ BMI                           : num [1:2111] 24.4 24.2 23.8 26.9 28.3 ...
##  $ FCVC                          : num [1:2111] 2 3 2 3 2 2 3 2 3 2 ...
##  $ Age                           : num [1:2111] 21 21 23 27 22 29 23 22 24 22 ...

BAB 4 Hasil dan Pembahasan

A. Karakteristik Data

data_manova$BMI <- as.numeric(data_manova$BMI)
data_manova$FCVC <- as.numeric(data_manova$FCVC)
data_manova$Age <- as.numeric(data_manova$Age)
summary(data_manova)
##  family_history_with_overweight      BMI             FCVC            Age       
##  Length:2111                    Min.   :13.00   Min.   :1.000   Min.   :14.00  
##  Class :character               1st Qu.:24.33   1st Qu.:2.000   1st Qu.:19.95  
##  Mode  :character               Median :28.72   Median :2.386   Median :22.78  
##                                 Mean   :29.70   Mean   :2.419   Mean   :24.31  
##                                 3rd Qu.:36.02   3rd Qu.:3.000   3rd Qu.:26.00  
##                                 Max.   :50.81   Max.   :3.000   Max.   :61.00

Berdasarkan karakteristik data di atas, variabel BMI memiliki mean sebesar 29.70 kg/m2, yang menunjukkan bahwa secara umum responden dalam dataset ini mendekati kategori overweight hingga obesitas. Variabel FCVC memiliki nilai mean 2.419 dengan nilai median 2.386, hal ini menunjukkan bahwa frekuensi konsumsi sayuran responden berada pada tingkat sedang (2 hingga 3 kali sehari). Sementara itu, variabel Age menunjukkan rentang usia antara 14 hingga 61 tahun dengan rata-rata usia yaitu 24.31 tahun, hal ini menunjukkan bahwa dataset didominasi oleh kelompok usia dewasa muda (18 hingga 40 tahun). Lalu untuk variabel family_history_with_overweight menunjukkan jika jumlah responden dengan kategori Yes (memiliki riwayat obesitas keluarga) lebih besar dibandingkan jumlah kategori No (tidak memiliki riwayat obesitas keluarga), hal ini menunjukkan bahwa tingginya prevalensi jumlah faktor genetik dalam sampel, nantinya akan dibandingkan tingkat signifikansinya terhadap kondisi fisik dan pola makan melalui uji multivariat.

B. Uji Asumsi

Sebelum melakukan analisis utama MANOVA dan MANCOVA, perlu dilakukan serangkaian pengujian asumsi untuk memastikan bahwa model statistik yang digunakan valid dan dapat diandalkan.

  1. Uji Normalitas Multivariat
MVN::mvn(data_manova[, c("BMI", "FCVC")], mvn_test = "mardia")
## Registered S3 method overwritten by 'lme4':
##   method           from
##   na.action.merMod car
## $multivariate_normality
##              Test Statistic p.value     Method          MVN
## 1 Mardia Skewness   285.611  <0.001 asymptotic ✗ Not normal
## 2 Mardia Kurtosis    -7.398  <0.001 asymptotic ✗ Not normal
## 
## $univariate_normality
##               Test Variable Statistic p.value    Normality
## 1 Anderson-Darling      BMI    11.862  <0.001 ✗ Not normal
## 2 Anderson-Darling     FCVC   130.690  <0.001 ✗ Not normal
## 
## $descriptives
##   Variable    n   Mean Std.Dev Median    Min    Max   25th   75th   Skew
## 1      BMI 2111 29.700   8.011 28.719 12.999 50.812 24.326 36.017  0.154
## 2     FCVC 2111  2.419   0.534  2.386  1.000  3.000  2.000  3.000 -0.433
##   Kurtosis
## 1    2.190
## 2    2.361
## 
## $data
## # A tibble: 2,111 × 2
##      BMI  FCVC
##    <dbl> <dbl>
##  1  24.4     2
##  2  24.2     3
##  3  23.8     2
##  4  26.9     3
##  5  28.3     2
##  6  20.2     2
##  7  24.4     3
##  8  19.7     2
##  9  20.2     3
## 10  23.0     2
## # ℹ 2,101 more rows
## 
## $subset
## NULL
## 
## $outlierMethod
## [1] "none"
## 
## attr(,"class")
## [1] "mvn"

Berdasarkan uji normalitas multivariat, diperoleh nilai p-value untuk Skewness dan Kurtosis sebesar < 0.001 kurang dari tingkat signifikansi 0.05. Hal ini menunjukkan bahwa asumsi normalitas multivariat tidak terpenuhi. Namun, pelanggaran asumsi ini dapat ditoleransi karena ukuran sampel dalam penelitian ini sangat besar (N =  2111). Berdasarkan Teorema Limit Pusat (Central Limit Theorem), analisis multivariat seperti MANOVA tetap kebal atau tangguh (robust) terhadap penyimpangan normalitas pada ukuran sampel yang besar.

  1. Uji Homogenitas Matriks Varians-Kovarians

    library(biotools)
    ## Loading required package: MASS
    ## ---
    ## biotools version 4.3
    boxM(data_manova[, c("BMI", "FCVC")],data_manova$family_history_with_overweight)
    ## 
    ##  Box's M-test for Homogeneity of Covariance Matrices
    ## 
    ## data:  data_manova[, c("BMI", "FCVC")]
    ## Chi-Sq (approx.) = 209.28, df = 3, p-value < 2.2e-16

Uji Homogenitas bertujuan mengetahui apakah matriks varians-kovarians pada variabel dependen (BMI dan FCVC) sama (identik) diantara kelompok Riwayat Keluarga Yes dan NO. Dengan Hipotesis: H0= Matriks varians-kovarians antar kelompok homogen, H1= Matriks varians-kovarians antar kelompok tidak homogen. Berdasarkan pengujian Box’s M, diperoleh nilai Chi-Square sebesar 209.28 dengan p-value < 0.001. Karena p-value < 0.05, maka matriks varians-kovarians antar kelompok tidak homogen.

  1. Uji Independensi Sampel

    Uji asumsi terpenuhi karena dataset yang digunakan berasal dari tiga negara yang berbeda yaitu Meksiko, Peru, dan Kolombia yang mana setiap baris data mewakili satu individu, hal ini juga didukung dengan adanya variabel family_historis_with_overweight yang dibagi menjadi dua kelompok Yes dan No, artinya setiap anggota kelompok merupakan unit observasi yang berdiri sendiri tanpa ada ketergantungan antar subjek.

  2. Uji Homogenity of Regression Slopes

    model_interaction <- manova(
    cbind(BMI, FCVC) ~ family_history_with_overweight * Age,
     data = data_manova)
    summary(model_interaction, test = "Wilks")
    ##                                      Df   Wilks approx F num Df den Df
    ## family_history_with_overweight        1 0.75207   347.13      2   2106
    ## Age                                   1 0.96977    32.82      2   2106
    ## family_history_with_overweight:Age    1 0.99700     3.17      2   2106
    ## Residuals                          2107                               
    ##                                       Pr(>F)    
    ## family_history_with_overweight     < 2.2e-16 ***
    ## Age                                9.171e-15 ***
    ## family_history_with_overweight:Age   0.04229 *  
    ## Residuals                                       
    ## ---
    ## Signif. codes:  0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1

Uji Homogenity of Regression Slopes berguna untuk memastikan bahwa hubungan antara kovariat (Age) dengan variabel dependen (BMI dan FCVC) bersifat konsisten di seluruh kelompok family_history_with_overweight. Dengan Hipotesis: H0= koefisien regresi antar kelompok sama atau homogen (Tidak terjadi interaksi antara X dan CV), H1=koefisien regresi antar kelompok berbeda (Terjadi interaksi antara X dan CV).

Berdasarkan tabel tersebut, hasil uji menunjukkan nilai Wilks’ Lambda sebesar 0.99700 dengan nilai statistik uji F=3.17 dan p-val= 0.042. Karena p-val < 0.05, maka H0 ditolak, artinya terdapat interaksi tipis antara family_history_with_overweight dengan Age.

  1. Uji Linearitas
summary(lm(BMI ~ Age, data = data_manova))
## 
## Call:
## lm(formula = BMI ~ Age, data = data_manova)
## 
## Residuals:
##     Min      1Q  Median      3Q     Max 
## -18.148  -5.810  -1.285   5.404  22.115 
## 
## Coefficients:
##             Estimate Std. Error t value Pr(>|t|)    
## (Intercept) 22.20607    0.66982   33.15   <2e-16 ***
## Age          0.30824    0.02666   11.56   <2e-16 ***
## ---
## Signif. codes:  0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
## 
## Residual standard error: 7.771 on 2109 degrees of freedom
## Multiple R-squared:  0.05962,    Adjusted R-squared:  0.05917 
## F-statistic: 133.7 on 1 and 2109 DF,  p-value: < 2.2e-16

Berdasarkan Hipotesis yang digunakan yaitu Hubungan Age terhadap BMI menunjukkan p-value < 0.001, yang berarti terdapat hubungan linear yang signifikan.

Hubungan Age terhadap FCVC menunjukkan p-value 0.454 (> 0.05), yang berarti tidak ada hubungan linear yang signifikan. Hal ini menginterpretasikan bahwa kovariat Age (Usia) merupakan variabel pengontrol yang sangat baik untuk BMI, namun kurang relevan untuk mengontrol pola makan (FCVC).

 library(ggplot2)
# Age vs BMI
ggplot(data_manova, aes(x = Age, y = BMI)) +
geom_point(alpha = 0.3) +
geom_smooth(method = "lm", se = FALSE, color = "blue") +
ggtitle("Linearity Check: Age vs BMI")
## `geom_smooth()` using formula = 'y ~ x'

# Age vs FCVC
ggplot(data_manova, aes(x = Age, y = FCVC)) +
geom_point(alpha = 0.3) +
geom_smooth(method = "lm", se = FALSE, color = "red") +
ggtitle("Linearity Check: Age vs FCVC")
## `geom_smooth()` using formula = 'y ~ x'

C. Hasil MANOVA

 manova_model <- manova(
     cbind(BMI, FCVC) ~ family_history_with_overweight,     data = data_manova )
summary(manova_model, test = "Wilks")
##                                  Df   Wilks approx F num Df den Df    Pr(>F)
## family_history_with_overweight    1 0.75807   336.38      2   2108 < 2.2e-16
## Residuals                      2109                                         
##                                   
## family_history_with_overweight ***
## Residuals                         
## ---
## Signif. codes:  0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1

Berdasarkan hasil analisis menggunakan metode MANOVA dengan menguji Wilks’ Lambda, diperoleh nilai Wilks sebesar 0,75807 dengan nilai signifikansi p-value < 0.001 Hal ini menunjukan bahwa terdapat perbedaan yang signifikan pada nilai BMI antara individu yang memiliki dan tidak memiliki riwayat keluarga obesitas. Hasil ini mengindikasikan bahwa faktor genetik tidak hanya berdampak pada satu aspek saja, tetapi secara keseluruhan memengaruhi kondisi tubuh dan kebiasaan makan individu. Oleh karena itu, hipotesis pertama yang menyatakan adanya perbedaan signifikan berdasarkan riwayat keluarga dapat diterima.

tabel uji univariat

summary.aov(manova_model)
##  Response BMI :
##                                  Df Sum Sq Mean Sq F value    Pr(>F)    
## family_history_with_overweight    1  31659   31659  643.47 < 2.2e-16 ***
## Residuals                      2109 103764      49                      
## ---
## Signif. codes:  0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
## 
##  Response FCVC :
##                                  Df Sum Sq Mean Sq F value  Pr(>F)  
## family_history_with_overweight    1   0.98 0.98042  3.4431 0.06366 .
## Residuals                      2109 600.53 0.28475                  
## ---
## Signif. codes:  0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1

Untuk mengetahui variabel apa yang paling berpengaruh, maka dilakukan uji univariat ANOVA terhadap masing-masing variabel dependen. Hasil menunjukkan bahwa pada variabel BMI diperoleh nilai F sebesar 643,47 dengan p-value < 0.001, sehingga dapat dikatakan signifikan. Maka dari itu, riwayat keluarga berpengaruh terhadap BMI seseorang atau dengan kata lain, orang yang memiliki riwayat keluarga obesitas cenderung memiliki kondisi fisik (BMI) yang lebih tinggi  dibandingkan dengan yang tidak memiliki riwayat tersebut.

Pada FCVC nilai p-value adalah 0.064 dimana lebih dari 0.05, sehingga FCVC tidak signifikan. Hal ini menunjukan bahwa  riwayat obesitas keluarga tidak berpengaruh signifikan terhadap tingkat konsumsi sayuran individu. 

D. Hasil MANCOVA

mancova_model <- manova(cbind(BMI, FCVC) ~ family_history_with_overweight + Age,
data = data_manova)
summary(mancova_model, test = "Wilks")
##                                  Df   Wilks approx F num Df den Df    Pr(>F)
## family_history_with_overweight    1 0.75240   346.68      2   2107 < 2.2e-16
## Age                               1 0.96982    32.78      2   2107 9.537e-15
## Residuals                      2108                                         
##                                   
## family_history_with_overweight ***
## Age                            ***
## Residuals                         
## ---
## Signif. codes:  0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1

Berdasarkan hasil analisis pada Tabel 9, pengujian multivariat menggunakan metode MANCOVA menunjukkan bahwa variabel independen utama, yaitu riwayat genetik keluarga (family history), memiliki pengaruh yang sangat signifikan terhadap kombinasi linear variabel dependen (BMI dan FCVC). Hal ini ditunjukkan oleh nilai Wilks’ Lambda sebesar 0,75240 dengan nilai statistik F = 346,68 dan p-value < 0,001. Hasil tersebut menegaskan bahwa perbedaan kondisi fisik dan pola makan responden memang berakar kuat pada faktor hereditas, bahkan setelah pengaruh variabel perancu (disetarakan dalam model.

Di sisi lain, variabel usia (Age) yang diposisikan sebagai kovariat juga menunjukkan pengaruh yang signifikan secara statistik dengan nilai Wilks’ Lambda sebesar 0,96982 dan p-value < 0,001. Signifikansi pada variabel usia ini memvalidasi keputusan penelitian untuk menggunakan metode MANCOVA, karena usia terbukti berkontribusi terhadap variansi data kondisi fisik dan pola makan responden. Meskipun demikian, jika dibandingkan melalui nilai Wilks’ Lambda, variabel riwayat keluarga memberikan kontribusi yang jauh lebih besar dalam menjelaskan perbedaan pada model dibandingkan variabel usia. Dengan demikian, dapat disimpulkan bahwa faktor risiko genetik tetap menjadi determinan utama yang mendominasi profil kesehatan responden melampaui faktor pertambahan usia.Berdasarkan hasil analisis pada Tabel 9, pengujian multivariat menggunakan metode MANCOVA menunjukkan bahwa variabel independen utama, yaitu riwayat genetik keluarga (family history), memiliki pengaruh yang sangat signifikan terhadap kombinasi linear variabel dependen (BMI dan FCVC). Hal ini ditunjukkan oleh nilai Wilks’ Lambda sebesar 0,75240 dengan nilai statistik F = 346,68 dan p-value < 0,001. Hasil tersebut menegaskan bahwa perbedaan kondisi fisik dan pola makan responden memang berakar kuat pada faktor hereditas, bahkan setelah pengaruh variabel perancu (disetarakan dalam model.

Di sisi lain, variabel usia (Age) yang diposisikan sebagai kovariat juga menunjukkan pengaruh yang signifikan secara statistik dengan nilai Wilks’ Lambda sebesar 0,96982 dan p-value < 0,001. Signifikansi pada variabel usia ini memvalidasi keputusan penelitian untuk menggunakan metode MANCOVA, karena usia terbukti berkontribusi terhadap variansi data kondisi fisik dan pola makan responden. Meskipun demikian, jika dibandingkan melalui nilai Wilks’ Lambda, variabel riwayat keluarga memberikan kontribusi yang jauh lebih besar dalam menjelaskan perbedaan pada model dibandingkan variabel usia. Dengan demikian, dapat disimpulkan bahwa faktor risiko genetik tetap menjadi determinan utama yang mendominasi profil kesehatan responden melampaui faktor pertambahan usia.Berdasarkan hasil analisis pada Tabel 9, pengujian multivariat menggunakan metode MANCOVA menunjukkan bahwa variabel independen utama, yaitu riwayat genetik keluarga (family history), memiliki pengaruh yang sangat signifikan terhadap kombinasi linear variabel dependen (BMI dan FCVC). Hal ini ditunjukkan oleh nilai Wilks’ Lambda sebesar 0,75240 dengan nilai statistik F = 346,68 dan p-value < 0,001. Hasil tersebut menegaskan bahwa perbedaan kondisi fisik dan pola makan responden memang berakar kuat pada faktor hereditas, bahkan setelah pengaruh variabel perancu (disetarakan dalam model.

Di sisi lain, variabel usia (Age) yang diposisikan sebagai kovariat juga menunjukkan pengaruh yang signifikan secara statistik dengan nilai Wilks’ Lambda sebesar 0,96982 dan p-value < 0,001. Signifikansi pada variabel usia ini memvalidasi keputusan penelitian untuk menggunakan metode MANCOVA, karena usia terbukti berkontribusi terhadap variansi data kondisi fisik dan pola makan responden. Meskipun demikian, jika dibandingkan melalui nilai Wilks’ Lambda, variabel riwayat keluarga memberikan kontribusi yang jauh lebih besar dalam menjelaskan perbedaan pada model dibandingkan variabel usia. Dengan demikian, dapat disimpulkan bahwa faktor risiko genetik tetap menjadi determinan utama yang mendominasi profil kesehatan responden melampaui faktor pertambahan usia.

BAB 4 Kesimpulan dan Saran

Kesimpulan:

Penelitian ini menyimpulkan bahwa riwayat genetik keluarga merupakan determinan utama yang secara signifikan menentukan Body Mass Index (BMI) seseorang (p < 0,001), namun tidak secara langsung memengaruhi perilaku konsumsi sayuran (p = 0,064), bahkan setelah pengaruh usia dikontrol melalui analisis MANCOVA (Wilks’ Lambda = 0,75240). Temuan ini menegaskan bahwa meskipun risiko obesitas memiliki komponen hereditas (materi genetik) yang kuat dan dominan melampaui efek pertambahan usia (Age) (F = 32,78), aspek pola makan tetap menjadi variabel yang independen dari garis keturunan dan dapat dimodifikasi secara mandiri. Dengan demikian, strategi penanganan obesitas bagi individu dengan risiko genetik tinggi harus mengintegrasikan manajemen medis kondisi fisik dengan intervensi gaya hidup, mengingat kebiasaan makan sehat terbukti sebagai faktor yang tidak terbelenggu oleh batasan faktor keturunan.

Saran:

Berdasarkan hasil penelitian yang telah dilakukan, terdapat beberapa saran yang dapat diberikan, yaitu:

  1. Bagi tenaga kesehatan, program pencegah obesitas tidak hanya dengan menyamaratakan edukasi pola makan seperti memperbanyak makan sayur, karena preferensi sayur tidak berkorelasi dengan genetik, fokus utama harus diarahkan dalam pengendalian laju metabolisme pasien yang memiliki kerentanan genetik tinggi sejak dini.

  2. Mengingat adanya beberapa pelanggaran uji asumsi, maka untuk penelitian selanjutnya disarankan untuk menggunakan metode non parametrik atau pendekatan robust MANCOVA seperti Trimmed Means, hal ini bertujuan untuk memastikan hasil uji signifikansi meski uji normalitas tidak terpenuhi.

  3. Mengingat ukuran sampel yang sangat besar dapat menyebabkan hipersensitivitas pada beberapa uji asumsi (seperti Box’s M), penelitian selanjutnya disarankan menerapkan metode data balancing atau analisis non parametrik multivariat guna membandingkan ketangguhan hasil prediksi.

Daftar Pustaka

CNN Indonesia. (2016, 20 Desember). Tiga dari empat orang dewasa Meksiko alami obesitas. CNN Indonesia. https://www.cnnindonesia.com/gaya-hidup/20161220065903-255-180871/tiga-dari-empat-orang-dewasa-meksiko-alami-obesitas

Erol, Y., & Subasi, A. (2023). Estimation of obesity levels through the proposed predictive approach based on physical activity and nutritional habits. Diagnostics, 13(18), 2949. https://www.google.com/search?q=https://doi.org/10.3390/diagnostics13182949

Hair, J. F., Black, W. C., Babin, B. J., & Anderson, R. E. (2022). Multivariate data analysis (8th ed.). Cengage Learning.

Kompas. (2020, 7 Agustus). Meksiko ucapkan selamat tinggal pada jajanan anak cepat saji. Kompas.id. https://www.kompas.id/artikel/meksiko-ucapkan-selamat-tinggal-pada-jajanan-anak-cepat-saji

Palechor, F. M., & de la Hoz Manotas, A. (2019). Dataset for estimation of obesity levels based on eating habits and physical condition in individuals from Colombia, Peru and Mexico. Data in Brief, 25, 104344. https://doi.org/10.1016/j.dib.2019.104344

Titisari, V. N. (2023, November 1). Penerapan Multivariate Analysis of Variance (MANOVA) untuk Mengetahui Pengaruh Body Mass Index (BMI), Total Count (TC) , dan High Density Lipoproteins (HDL) terhadap Resiko Terkena Penyakit Jantung. Retrieved from 

RPubs - Penerapan Multivariate Analysis of Variance (MANOVA) untuk Mengetahui Pengaruh Body Mass Index (BMI)

Consulting, I. (n.d.). Multivariate Analysis of Covariance (MANCOVA). Retrieved from Multivariate Analysis of Covariance (MANCOVA): 

https://www.statisticssolutions.com/free-resources/directory-of-statistical-analyses/multivariate-analysis-of-covariance-mancova/

WHO. (n.d.). Obesity. Retrieved from Obesity: https://www.who.int/health-topics/obesity/#tab=tab_1

unairnews. (2025, Maret 13). Memahami Peran Genetik Reseptor Leptin pada Obesitas. Retrieved from Memahami Peran Genetik Reseptor Leptin pada Obesitas: https://unair.ac.id/memahami-peran-genetik-reseptor-leptin-pada-obesitas/