Library:

> # install.packages("knitr")
> # install.packages("rmarkdown")
> # install.packages("prettydoc")
> # install.packages("equatiomatic")

PENDAHULUAN

Latar Belakang

Harapan hidup menjadi salah satu indikator utama untuk menilai tingkat kesehatan dan kesejahteraan suatu negara, karena angka ini mencerminkan kondisi kesehatan masyarakat, ketersediaan layanan medis, serta kualitas hidup secara keseluruhan. Menurut data dari World Health Organization (WHO), beberapa faktor kesehatan seperti angka kematian orang dewasa (Adult Mortality) dan indeks massa tubuh (BMI) memiliki pengaruh yang cukup besar terhadap harapan hidup. Selain itu, faktor sosial-ekonomi seperti tingkat pendidikan (Schooling), komposisi pendapatan sumber daya (Income Composition of Resources), dan Produk Domestik Bruto per kapita (GDP per capita) juga memengaruhi kualitas hidup masyarakat, karena faktor-faktor ini berdampak pada akses terhadap layanan kesehatan, gizi, dan lingkungan yang mendukung kesehatan.

Dataset Life Expectancy dari WHO yang tersedia di Kaggle menyediakan informasi yang cukup lengkap mengenai berbagai variabel kesehatan dan sosial-ekonomi di sejumlah negara. Dengan menganalisis dataset ini, peneliti dapat memahami hubungan yang kompleks antara faktor kesehatan dan sosial-ekonomi serta bagaimana keduanya memengaruhi angka harapan hidup. Salah satu metode yang tepat untuk melihat hubungan simultan antara kedua kelompok variabel tersebut adalah Canonical Correlation Analysis (CCA), yang memungkinkan kita mengukur sejauh mana kombinasi variabel kesehatan (set X) berkaitan dengan kombinasi variabel sosial-ekonomi (set Y).

Rumusan Masalah

Rumusan masalah dari penelitian, yaitu:

  1. Bagaimana hubungan antara variabel kesehatan (angka harapan hidup, kematian orang dewasa, dan BMI) dengan variabel sosial-ekonomi (tingkat pendidikan, komposisi pendapatan sumber daya, dan GDP per kapita) di berbagai negara?

  2. Variabel mana yang paling berkontribusi dalam menjelaskan variasi harapan hidup melalui hubungan antara faktor kesehatan dan sosial-ekonomi?

  3. Seberapa besar variansi dari setiap set variabel (kesehatan dan sosial-ekonomi) yang dijelaskan oleh canonical variabel dalam analisis Canonical Correlation Analysis?

Tujuan

Tujuan dari penelitian, yaitu:

  1. Menganalisis hubungan simultan antara variabel kesehatan (Life Expectancy, Adult Mortality, BMI) dan variabel sosial-ekonomi (Schooling, Income Composition of Resources, GDP per capita) menggunakan Canonical Correlation Analysis.

  2. Mengidentifikasi variabel kunci yang memberikan kontribusi signifikan terhadap hubungan antara faktor kesehatan dan sosial-ekonomi.

  3. Mengukur tingkat kontribusi masing-masing set variabel terhadap variasi harapan hidup melalui perhitungan redundancy indices.

TINJAUAN PUSTAKA

Analisis Korelasi Kanonik

Analisis Korelasi Kanonik (Canonical Correlation Analysis atau CCA) merupakan salah satu teknik statistika multivariat yang digunakan untuk mengukur kekuatan dan arah hubungan simultan antara dua himpunan variabel. Teknik ini berbeda dengan analisis regresi berganda, karena CCA tidak hanya mengkaji hubungan satu variabel dependen dengan beberapa variabel independen, tetapi menilai keterkaitan dua set variabel secara bersamaan. Misalnya, misalkan terdapat dua himpunan variabel: \[ \mathbf{X}' = (X_1, X_2, \ldots, X_p) \]

\[ \mathbf{Y}' = (Y_1, Y_2, \ldots, Y_q) \]

CCA bertujuan menemukan pasangan variabel kanonik (U_i,V_i)yang merupakan kombinasi linear dari himpunan variabel X dan Y sehingga korelasi antara U dan V maksimal. Banyaknya pasangan kanonik yang dapat dibentuk ditentukan oleh: k= min (p,q) Variabel kanonik tersebut dinyatakan sebagai: \[ U_i = \mathbf{a}_i^{T} \mathbf{X} = a_{i1}X_1 + a_{i2}X_2 + \cdots + a_{ip}X_p \]

\[ V_i = \mathbf{b}_i^{T} \mathbf{X} = b_{i1}X_1 + b_{i2}X_2 + \cdots + b_{ip}X_p \]

di mana \[a_{i1}\] dan \[b_{i1}\] adalah vektor bobot kanonik yang menentukan kontribusi masing-masing variabel asli dalam membentuk variabel kanonik U dan V.

Penentuan bobot kanonik ini dapat dilakukan dengan memaksimalkan fungsi Lagrange pengganda, sehingga diperoleh sistem persamaan:

\[ L = \mathbf{a}^T \mathbf{S}_{XX} \mathbf{b} - \frac{\lambda}{2} \left( \mathbf{a}^T \mathbf{S}_{XX} \mathbf{a} - 1 \right) - \frac{\mu}{2} \left( \mathbf{b}^T \mathbf{S}_{YY} \mathbf{b} - 1 \right) \]

Persamaan ini menghasilkan vektor ciri adan byang berpadanan dengan akar kuadrat dari nilai eigen dari persamaan: \[ \left( \mathbf{S}_{XX}^{-1} \mathbf{S}_{XY} \mathbf{S}_{YY}^{-1} \mathbf{S}_{YX} - \lambda \mathbf{I} \right)\mathbf{a} = \mathbf{0} \] \[ \left( \mathbf{S}_{YY}^{-1} \mathbf{S}_{YX} \mathbf{S}_{XX}^{-1} \mathbf{S}_{XY} - \lambda \mathbf{I} \right)\mathbf{b} = \mathbf{0} \]

Melalui pendekatan ini, CCA dapat mengidentifikasi pasangan variabel kanonik yang menjelaskan seberapa besar variabilitas dari satu himpunan variabel dijelaskan oleh himpunan variabel lainnya, sehingga memberikan wawasan yang lebih mendalam tentang keterkaitan multivariat. Selain itu, setelah diperoleh U dan V, peneliti dapat menghitung canonical correlations, canonical coefficients, dan redundancy indices untuk menilai kontribusi masing-masing variabel dalam himpunan X dan Y.

Aplikasi CCA pada Data Kesehatan dan Sosial-Ekonomi

Dalam konteks penelitian harapan hidup, himpunan variabel X dapat terdiri dari faktor kesehatan seperti Life Expectancy, Adult Mortality, dan BMI, sedangkan himpunan variabel Y terdiri dari faktor sosial-ekonomi seperti Schooling, Income Composition of Resources, dan GDP per capita. Dengan menggunakan CCA, penelitian dapat mengidentifikasi kombinasi linear dari faktor kesehatan dan sosial-ekonomi yang saling berkorelasi paling kuat, serta menentukan variabel mana yang memiliki kontribusi paling besar terhadap variasi harapan hidup di berbagai negara.

SOURCE CODE

Berikut merupakan source code dan penjelasan masing-masing source code :

Library

> library(readr)
> library(dplyr)
> library(CCA)
> library(psych)
> library (tidyr)
  • readr untuk membaca file CSV dengan cepat.
  • dplyr untuk manipulasi data (filter, mutate, select, dll.).
  • CCA paket khusus untuk melakukan Canonical Correlation Analysis.
  • psych berisi fungsi statistik tambahan seperti matcor (matriks korelasi) dan summary psikometrik.

Impor Data

> data_raw <- read_csv2(
+   "C:/Users/Made Orchidia/OneDrive/ANMUL/Life Expectancy Data- Tugas 2.csv",
+   col_names = TRUE
+ )

Membaca data dari file CSV yang terletak di komputer dengan menggunakan fungsi read_csv2, di mana pemisah kolomnya adalah tanda titik koma (;). Baris pertama file dianggap sebagai nama kolom karena parameter col_names = TRUE. Data hasil baca ini kemudian disimpan dalam variabel data_raw sebagai dataframe, yang masih mungkin berisi nilai yang bukan numerik atau nilai yang hilang.

Konversi Semua Kolom Menjadi Numeric

> data_clean <- data_raw %>%
+   mutate(across(everything(), ~as.numeric(as.character(.))))
> 
> data_clean <- data_clean %>% drop_na()
> 
  • mutate(across(…)) → Mengubah semua kolom menjadi numeric.
  • drop_na() → Menghapus baris yang ada NA agar analisis CCA tidak error.

Pilih Variabel X dan Y

> kelX <- data_clean[, 1:3]   # X: kolom 1-3
> kelY <- data_clean[, 4:6]   # Y: kolom 4-6
> 
> datagab <- cbind(kelY, kelX)

Setelah data dibersihkan, script memilih subset variabel untuk dianalisis. Tiga kolom pertama dianggap sebagai variabel X (independen) dan disimpan dalam kelX, sedangkan tiga kolom berikutnya dianggap sebagai variabel Y (dependen) dan disimpan dalam kelY. Data X dan Y ini kemudian digabungkan menjadi satu dataframe datagab untuk memudahkan pembuatan ringkasan statistik di akhir analisis.

Jumlah Observasi dan Variabel

> n <- nrow(kelX)
> p <- ncol(kelX)
> q <- ncol(kelY)
  • n → Jumlah observasi.
  • p → Jumlah variabel X.
  • q → Jumlah variabel Y.

Canonical Correlation Analysis

> cc1 <- cc(kelX, kelY) 
> cc1
$cor
[1] 0.87111553 0.58475418 0.01083314

$names
$names$Xnames
[1] "Life expectancy" "Adult Mortality" "BMI"            

$names$Ynames
[1] "GDP"                             "Income composition of resources"
[3] "Schooling"                      

$names$ind.names
 [1] "1"  "2"  "3"  "4"  "5"  "6"  "7"  "8"  "9"  "10" "11" "12" "13" "14" "15"
[16] "16" "17" "18" "19" "20" "21" "22" "23" "24" "25" "26" "27" "28" "29" "30"
[31] "31" "32" "33" "34" "35" "36" "37" "38" "39" "40" "41" "42" "43" "44" "45"
[46] "46" "47" "48" "49"


$xcoef
                        [,1]          [,2]         [,3]
Life expectancy -0.003150808 -0.0002948995 -0.005816564
Adult Mortality  0.004063960 -0.0094657782 -0.007211340
BMI             -0.106754538 -0.5631481482  0.080761791

$ycoef
                                         [,1]          [,2]         [,3]
GDP                             -3.618980e-02  5.521792e-03 3.117661e-03
Income composition of resources  3.705684e-11 -7.838902e-11 6.341175e-10
Schooling                        6.977317e-09  6.724471e-08 5.697790e-09

$scores
$scores$xscores
             [,1]        [,2]        [,3]
 [1,]  2.50777830  0.01197866  2.41638203
 [2,]  0.85775875 -0.22122389 -0.74735410
 [3,]  0.84556687 -0.19282656 -0.72572008
 [4,]  0.87442594 -0.22951007 -0.73129919
 [5,]  0.89607024 -0.25702271 -0.73548351
 [6,]  0.92492931 -0.29370622 -0.74106261
 [7,]  0.93935885 -0.31204798 -0.74385217
 [8,]  0.97736155 -0.37863112 -0.75642215
 [9,]  1.02984562 -0.44695646 -0.78002110
[10,]  1.03507969 -0.45199815 -0.76758035
[11,]  1.01989140 -0.40850355 -0.73954261
[12,]  2.65383601 -0.27526698  2.24738196
[13,]  1.05611963 -0.43896579 -0.73429620
[14,] -0.11480261  2.32651594  1.40049789
[15,]  1.18557409 -0.63361854 -0.80430244
[16,]  1.22164793 -0.67947293 -0.81127632
[17,] -0.99683922 -0.99410260  0.00281145
[18,] -1.24600024 -0.31779320  0.48894102
[19,] -0.95437551 -1.17709469 -0.02148068
[20,] -0.97736189 -1.40913784  0.01223582
[21,] -0.98433509 -1.55670877  0.03383804
[22,] -0.94993207 -1.53324318  0.02820172
[23,] -1.00122608 -1.82015383  0.07520680
[24,] -1.32256019 -0.86450793  0.75622279
[25,] -1.30575072 -0.92510911  0.66120983
[26,] -0.85760688 -1.61996586  0.08926514
[27,] -1.16091067 -0.73830397  0.72361938
[28,]  0.99923966 -0.21286022  4.50969005
[29,] -1.03378669 -0.27469812  0.67243855
[30,] -1.00195007  0.06758768  0.61976315
[31,] -1.07097881 -0.21666828  0.65152093
[32,] -0.98867744  0.14693546  0.68367113
[33,] -0.65996837  2.12348447  0.15589533
[34,] -0.68724598  2.19416902  0.22602679
[35,] -0.32914759  0.94558328 -0.45450584
[36,] -0.33266011  0.86349804 -0.43958502
[37,] -0.30349116  0.89200532 -0.45766209
[38,] -0.27325466  0.92614408 -0.47654678
[39,] -0.25288413  0.86100826 -0.48390436
[40,] -0.22696964  0.85602155 -0.49131916
[41,] -0.20319025  0.83977188 -0.49711872
[42,] -0.16985478  0.85760599 -0.50194742
[43,] -0.15279054  0.74237664 -0.49040331
[44,] -0.62435107  1.92712838  0.42024146
[45,] -0.05726052  0.74136135 -0.50563982
[46,] -0.06030876  0.73985907 -0.49099668
[47,] -0.04012906  0.81365813 -0.48986259
[48,] -0.03911334  0.80269006 -0.48243079
[49,]  1.35523029 -0.79928475 -0.77344515

$scores$yscores
            [,1]       [,2]        [,3]
 [1,]  2.7267645  1.2383849 -0.74355380
 [2,]  0.6323301 -0.7645033 -0.42031969
 [3,]  0.7073932  1.3678507 -0.21683609
 [4,]  0.3074514 -0.4402583 -0.76115952
 [5,]  0.2685790 -0.4879704 -0.72226968
 [6,]  0.3399887 -0.5047882 -0.73425127
 [7,]  0.5936087 -1.0413054  2.03398820
 [8,]  0.5476010 -0.8145063  1.59109824
 [9,]  0.6258096  1.0499536 -0.40894324
[10,]  0.6264166 -0.5665196 -0.77867050
[11,]  0.6185118 -0.7409950 -0.64884440
[12,]  2.7748917  0.4189333  0.55109483
[13,]  1.3127092 -0.8291309  0.40993896
[14,]  1.5575724  0.6165789 -0.74214771
[15,]  1.4608385 -0.6669461 -0.85806101
[16,]  1.8398430 -0.9064910 -0.91502723
[17,] -0.8615872 -0.5411645 -0.43197467
[18,] -0.6686728 -0.8568928  2.21721690
[19,] -0.8580616 -0.5272423 -0.40128833
[20,] -0.8606809 -0.5452081 -0.41351827
[21,] -0.8579393 -0.5270416 -0.39983246
[22,] -0.8560897 -0.5312718 -0.36774221
[23,] -0.6673688 -0.6432740  1.93952519
[24,] -0.8396636 -0.3482163 -0.38863896
[25,] -0.8748887 -0.5129576 -0.65968724
[26,] -0.7831692 -0.3219474 -0.67184536
[27,] -0.7915447 -0.5240887 -0.51033481
[28,] -0.7484197 -0.6850801  0.84826246
[29,] -0.7946636 -0.5151844 -0.56690356
[30,] -0.7863601 -0.6313446  0.23579903
[31,] -0.7988924 -0.5311224 -0.60476721
[32,] -0.7602195 -0.6127042  0.05669119
[33,] -0.4381716  2.1145566 -0.20610902
[34,] -0.4585736  2.0955375 -0.46902090
[35,] -0.2614122  1.6149348  2.99289743
[36,] -0.4489522  1.9482859 -0.12843670
[37,] -0.4727678  1.9374658 -0.45111739
[38,] -0.3142790  1.5446424  2.34075322
[39,] -0.6564105 -0.3315571 -0.43293499
[40,] -0.5804327 -0.3551212 -0.37079096
[41,] -0.5856172 -0.8403600  1.80021032
[42,] -0.4947195  1.7344738 -0.48092514
[43,] -0.2449367  1.6631826 -0.50777222
[44,] -0.3821034 -0.3651523 -0.68822573
[45,] -0.4184425 -0.3625689 -0.68315044
[46,] -0.3770750 -0.3826489 -0.59266915
[47,] -0.2299011  1.4212409  0.56478078
[48,] -0.3777050 -0.3879733 -0.59421976
[49,]  2.6094122 -1.1224844  1.38973284

$scores$corr.X.xscores
                      [,1]        [,2]       [,3]
Life expectancy -0.8231645  0.07533576 -0.5627830
Adult Mortality  0.8608422 -0.22840167 -0.4547345
BMI             -0.6883282 -0.60286715  0.4034297

$scores$corr.Y.xscores
                                       [,1]        [,2]         [,3]
GDP                             -0.86485258  0.05676864 0.0007585294
Income composition of resources  0.06236266 -0.05355521 0.0107596920
Schooling                        0.13877082  0.57356347 0.0012127036

$scores$corr.X.yscores
                      [,1]       [,2]         [,3]
Life expectancy -0.7170714  0.0440529 -0.006096704
Adult Mortality  0.7498930 -0.1335588 -0.004926200
BMI             -0.5996134 -0.3525291  0.004370408

$scores$corr.Y.yscores
                                       [,1]        [,2]       [,3]
GDP                             -0.99281042  0.09708121 0.07001938
Income composition of resources  0.07158942 -0.09158585 0.99322051
Schooling                        0.15930242  0.98086253 0.11194392

Analisis Canonical Correlation dilakukan dengan cc(kelX, kelY) untuk mencari kombinasi linear variabel X dan Y yang memiliki korelasi maksimum, dengan hasil disimpan di cc1 yang berisi canonical correlations (cc1\(cor) dan koefisien untuk X (cc1\)xcoef) dan Y (cc1$ycoef), yang kemudian dicetak untuk melihat kekuatan hubungan antar set variabel.

Tampilkan Hasil CCA

> print(cc1$cor)
[1] 0.87111553 0.58475418 0.01083314
> print(cc1$xcoef)  # koefisien X
                        [,1]          [,2]         [,3]
Life expectancy -0.003150808 -0.0002948995 -0.005816564
Adult Mortality  0.004063960 -0.0094657782 -0.007211340
BMI             -0.106754538 -0.5631481482  0.080761791
> print(cc1$ycoef)  # koefisien Y
                                         [,1]          [,2]         [,3]
GDP                             -3.618980e-02  5.521792e-03 3.117661e-03
Income composition of resources  3.705684e-11 -7.838902e-11 6.341175e-10
Schooling                        6.977317e-09  6.724471e-08 5.697790e-09
  • Menampilkan canonical correlations dan koefisien canonical.
  • Koefisien ini digunakan untuk membentuk canonical variabel, yaitu kombinasi linear X dan Y yang paling berkorelasi.

Canonical Scores

> kelX <- as.matrix(kelX)
> kelY <- as.matrix(kelY)
> X_scores <- kelX %*% cc1$xcoef
> Y_scores <- kelY %*% cc1$ycoef
> 
> colnames(X_scores) <- paste0("CanX", 1:ncol(X_scores))
> colnames(Y_scores) <- paste0("CanY", 1:ncol(Y_scores))
> 
> head(X_scores)
          CanX1     CanX2     CanX3
[1,]  0.8629514 -2.514300 -2.273851
[2,] -0.7870681 -2.747502 -5.437588
[3,] -0.7992600 -2.719105 -5.415954
[4,] -0.7704010 -2.755788 -5.421533
[5,] -0.7487567 -2.783301 -5.425717
[6,] -0.7198976 -2.819984 -5.431296
> head(Y_scores)
           CanY1     CanY2     CanY3
[1,]  0.02041653 2.2971515 0.2479783
[2,] -2.07401790 0.2942634 0.5712124
[3,] -1.99895479 2.4266174 0.7746960
[4,] -2.39889663 0.6185084 0.2303726
[5,] -2.43776898 0.5707963 0.2692624
[6,] -2.36635927 0.5539785 0.2572808
  • Mengubah X dan Y menjadi matrix agar bisa dikalikan.
  • Canonical scores = hasil kombinasi linear dari variabel X/Y dengan koefisien.
  • %*% → Operator perkalian matriks di R.
  • Colnames → Memberi nama kolom CanX1, CanX2, dst.

MATCOR

> matcor(kelX, kelY)  
$Xcor
                Life expectancy Adult Mortality        BMI
Life expectancy       1.0000000      -0.4699047  0.2941465
Adult Mortality      -0.4699047       1.0000000 -0.6382994
BMI                   0.2941465      -0.6382994  1.0000000

$Ycor
                                        GDP Income composition of resources
GDP                              1.00000000                     -0.01042130
Income composition of resources -0.01042130                      1.00000000
Schooling                       -0.05509554                      0.03275625
                                  Schooling
GDP                             -0.05509554
Income composition of resources  0.03275625
Schooling                        1.00000000

$XYcor
                                Life expectancy Adult Mortality         BMI
Life expectancy                      1.00000000     -0.46990474  0.29414654
Adult Mortality                     -0.46990474      1.00000000 -0.63829944
BMI                                  0.29414654     -0.63829944  1.00000000
GDP                                  0.71576580     -0.75781254  0.56138446
Income composition of resources     -0.06142472      0.06102370 -0.00629852
Schooling                           -0.07170387     -0.01209454 -0.44081320
                                        GDP Income composition of resources
Life expectancy                  0.71576580                     -0.06142472
Adult Mortality                 -0.75781254                      0.06102370
BMI                              0.56138446                     -0.00629852
GDP                              1.00000000                     -0.01042130
Income composition of resources -0.01042130                      1.00000000
Schooling                       -0.05509554                      0.03275625
                                  Schooling
Life expectancy                 -0.07170387
Adult Mortality                 -0.01209454
BMI                             -0.44081320
GDP                             -0.05509554
Income composition of resources  0.03275625
Schooling                        1.00000000

Fungsi matcor (kelX, kelY) dari paket psych untuk menampilkan matriks korelasi antara variabel X dan Y. Fungsi ini memberikan gambaran awal mengenai pola hubungan antar variabel sebelum dilakukan analisis canonical, sehingga bisa dilihat variabel mana yang memiliki korelasi tinggi atau rendah satu sama lain.

Uji Bartlett

> k <- (n - 1) - 0.5 * (p + q + 1)
> 
> lambda <- cc1$cor^2
> a <- 1 - lambda[1]
> b <- 1 - lambda[2]
> 
> B1 <- -k * log(a * b)
> B2 <- -k * log(b)
> 
> db1 <- p * q
> db2 <- (p - 1) * (q - 1)
> 
> pv1 <- 1 - pchisq(B1, db1)
> pv2 <- 1 - pchisq(B2, db2)
> 
> result <- cbind(Bartlett = c(B1, B2),
+                 db       = c(db1, db2),
+                 p_value  = c(pv1, pv2))
> rownames(result) <- c("B1", "B2")
> print(result)
   Bartlett db      p_value
B1 81.91379  9 6.727952e-14
B2 18.62126  4 9.326738e-04

Uji Bartlett digunakan untuk menguji signifikansi canonical correlations dengan menghitung statistik berdasarkan jumlah observasi, variabel, dan kuadrat canonical correlations (lambda), kemudian B1 dan B2 dihitung dengan -k*log(…) dan diuji menggunakan distribusi chi-square, di mana p-value kecil menunjukkan hubungan antar set variabel signifikan.

Summary Data

> summary(datagab)
      GDP        Income composition of resources   Schooling       
 Min.   : 5.00   Min.   :1.146e+04               Min.   :    2941  
 1st Qu.:63.00   1st Qu.:5.432e+07               1st Qu.:  293756  
 Median :94.00   Median :3.954e+08               Median : 2947314  
 Mean   :77.94   Mean   :1.085e+09               Mean   :10609998  
 3rd Qu.:97.00   3rd Qu.:1.454e+09               3rd Qu.:24118979  
 Max.   :99.00   Max.   :5.472e+09               Max.   :39871528  
 Life expectancy Adult Mortality      BMI       
 Min.   : 57.0   Min.   :  1.0   Min.   :0.000  
 1st Qu.:586.0   1st Qu.: 19.0   1st Qu.:0.010  
 Median :728.0   Median :123.0   Median :0.440  
 Mean   :650.7   Mean   :144.7   Mean   :1.712  
 3rd Qu.:751.0   3rd Qu.:272.0   3rd Qu.:4.290  
 Max.   :778.0   Max.   :335.0   Max.   :5.790  

script menampilkan summary dari datagab yang berisi seluruh variabel X dan Y. Fungsi summary() memberikan ringkasan statistik deskriptif seperti mean, median, minimum, maksimum, dan kuartil, yang berguna untuk mengecek distribusi data dan memastikan bahwa data sudah siap untuk interpretasi lebih lanjut.

Pengujian Koefisien Canonical

> cc_test <- cancor(kelX, kelY)   
> cc_test
$cor
[1] 0.87111553 0.58475418 0.01083314

$xcoef
                         [,1]         [,2]          [,3]
Life expectancy -0.0004547799 4.256507e-05 -0.0008395488
Adult Mortality  0.0005865821 1.366267e-03 -0.0010408673
BMI             -0.0154086903 8.128343e-02  0.0116569604

$ycoef
                                         [,1]          [,2]         [,3]
GDP                             -5.223547e-03 -7.970020e-04 4.499956e-04
Income composition of resources  5.348695e-12  1.131448e-11 9.152698e-11
Schooling                        1.007089e-09 -9.705938e-09 8.224051e-10

$xcenter
Life expectancy Adult Mortality             BMI 
     650.693878      144.734694        1.712449 

$ycenter
                            GDP Income composition of resources 
                   7.793878e+01                    1.085117e+09 
                      Schooling 
                   1.061000e+07 
> 
> # Hitung canonical scores dari fungsi comput
> cc_scores <- comput(kelX, kelY, cc_test)
> 
> # Tampilkan canonical scores
> cat("\nCanonical scores X:\n")

Canonical scores X:
> print(head(cc_scores$x))  # X canonical scores
          [,1]        [,2]       [,3]
[1,] 0.3619666 -0.00172897  0.3487747
[2,] 0.1238068  0.03193092 -0.1078713
[3,] 0.1220471  0.02783212 -0.1047487
[4,] 0.1262125  0.03312693 -0.1055539
[5,] 0.1293366  0.03709803 -0.1061579
[6,] 0.1335020  0.04239284 -0.1069632
> cat("\nCanonical scores Y:\n")

Canonical scores Y:
> print(head(cc_scores$y))  # Y canonical scores
           [,1]        [,2]        [,3]
[1,] 0.39357456 -0.17874546 -0.10732275
[2,] 0.09126899  0.11034654 -0.06066792
[3,] 0.10210342 -0.19743224 -0.03129759
[4,] 0.04437678  0.06354581 -0.10986391
[5,] 0.03876604  0.07043246 -0.10425065
[6,] 0.04907315  0.07285990 -0.10598004
> 
> # Tampilkan koefisien canonical
> cat("\nKoefisien canonical X:\n")

Koefisien canonical X:
> print(cc_test$xcoef)
                         [,1]         [,2]          [,3]
Life expectancy -0.0004547799 4.256507e-05 -0.0008395488
Adult Mortality  0.0005865821 1.366267e-03 -0.0010408673
BMI             -0.0154086903 8.128343e-02  0.0116569604
> cat("\nKoefisien canonical Y:\n")

Koefisien canonical Y:
> print(cc_test$ycoef)
                                         [,1]          [,2]         [,3]
GDP                             -5.223547e-03 -7.970020e-04 4.499956e-04
Income composition of resources  5.348695e-12  1.131448e-11 9.152698e-11
Schooling                        1.007089e-09 -9.705938e-09 8.224051e-10
> 
> # Tampilkan canonical correlations
> cat("\nCanonical correlations:\n")

Canonical correlations:
> print(cc_test$cor)
[1] 0.87111553 0.58475418 0.01083314
> 
> for (i in 1:length(cc_test$cor)) {
+   cat("\nFungsi kanonik ke-", i, ":\n")
+   cat("U = ", paste(round(cc_test$xcoef[,i], 4), colnames(kelX), sep="*", collapse=" + "), "\n")
+   cat("V = ", paste(round(cc_test$ycoef[,i], 4), colnames(kelY), sep="*", collapse=" + "), "\n")
+ }

Fungsi kanonik ke- 1 :
U =  -5e-04*Life expectancy + 6e-04*Adult Mortality + -0.0154*BMI 
V =  -0.0052*GDP + 0*Income composition of resources + 0*Schooling 

Fungsi kanonik ke- 2 :
U =  0*Life expectancy + 0.0014*Adult Mortality + 0.0813*BMI 
V =  -8e-04*GDP + 0*Income composition of resources + 0*Schooling 

Fungsi kanonik ke- 3 :
U =  -8e-04*Life expectancy + -0.001*Adult Mortality + 0.0117*BMI 
V =  4e-04*GDP + 0*Income composition of resources + 0*Schooling 

Kode di atas digunakan untuk melakukan Canonical Correlation Analysis (CCA) antara himpunan variabel X dan Y. Fungsi cancor() menghitung koefisien kanonik serta nilai canonical correlations yang menunjukkan kekuatan hubungan linear antara kombinasi variabel X dan Y. Selanjutnya, fungsi comput() menghasilkan canonical scores, yaitu nilai kombinasi linier U dan V untuk setiap observasi, yang kemudian ditampilkan sebagian agar mudah diperiksa.

Koefisien kanonik untuk masing-masing variabel pada himpunan X dan Y juga ditampilkan, sehingga dapat diketahui variabel mana yang memberikan kontribusi terbesar dalam pembentukan fungsi kanonik. Nilai canonical correlations dicetak untuk melihat seberapa kuat hubungan antara fungsi kanonik yang terbentuk. Terakhir, dilakukan looping untuk menuliskan bentuk fungsi kanonik dalam persamaan eksplisit, sehingga hubungan antar variabel dapat lebih mudah dipahami dan diinterpretasikan.

HASIL DAN PEMBAHASAN

Analisis Deskriptif

> summary(datagab)
      GDP        Income composition of resources   Schooling       
 Min.   : 5.00   Min.   :1.146e+04               Min.   :    2941  
 1st Qu.:63.00   1st Qu.:5.432e+07               1st Qu.:  293756  
 Median :94.00   Median :3.954e+08               Median : 2947314  
 Mean   :77.94   Mean   :1.085e+09               Mean   :10609998  
 3rd Qu.:97.00   3rd Qu.:1.454e+09               3rd Qu.:24118979  
 Max.   :99.00   Max.   :5.472e+09               Max.   :39871528  
 Life expectancy Adult Mortality      BMI       
 Min.   : 57.0   Min.   :  1.0   Min.   :0.000  
 1st Qu.:586.0   1st Qu.: 19.0   1st Qu.:0.010  
 Median :728.0   Median :123.0   Median :0.440  
 Mean   :650.7   Mean   :144.7   Mean   :1.712  
 3rd Qu.:751.0   3rd Qu.:272.0   3rd Qu.:4.290  
 Max.   :778.0   Max.   :335.0   Max.   :5.790  

Matriks Korelasi

> matcor(kelX, kelY)  
$Xcor
                Life expectancy Adult Mortality        BMI
Life expectancy       1.0000000      -0.4699047  0.2941465
Adult Mortality      -0.4699047       1.0000000 -0.6382994
BMI                   0.2941465      -0.6382994  1.0000000

$Ycor
                                        GDP Income composition of resources
GDP                              1.00000000                     -0.01042130
Income composition of resources -0.01042130                      1.00000000
Schooling                       -0.05509554                      0.03275625
                                  Schooling
GDP                             -0.05509554
Income composition of resources  0.03275625
Schooling                        1.00000000

$XYcor
                                Life expectancy Adult Mortality         BMI
Life expectancy                      1.00000000     -0.46990474  0.29414654
Adult Mortality                     -0.46990474      1.00000000 -0.63829944
BMI                                  0.29414654     -0.63829944  1.00000000
GDP                                  0.71576580     -0.75781254  0.56138446
Income composition of resources     -0.06142472      0.06102370 -0.00629852
Schooling                           -0.07170387     -0.01209454 -0.44081320
                                        GDP Income composition of resources
Life expectancy                  0.71576580                     -0.06142472
Adult Mortality                 -0.75781254                      0.06102370
BMI                              0.56138446                     -0.00629852
GDP                              1.00000000                     -0.01042130
Income composition of resources -0.01042130                      1.00000000
Schooling                       -0.05509554                      0.03275625
                                  Schooling
Life expectancy                 -0.07170387
Adult Mortality                 -0.01209454
BMI                             -0.44081320
GDP                             -0.05509554
Income composition of resources  0.03275625
Schooling                        1.00000000

Berdasarkan matriks korelasi, korelasi terbesar antara himpunan variabel X dan Y terdapat pada Life Expectancy (X1) dengan GDP per capita (Y1) sebesar 0,716, menunjukkan bahwa negara dengan pendapatan per kapita lebih tinggi cenderung memiliki harapan hidup lebih tinggi. Korelasi negatif terbesar terjadi pada Adult Mortality (X2) dengan GDP per capita (Y1) sebesar -0,758, menandakan bahwa pendapatan per kapita yang tinggi berkaitan dengan angka kematian orang dewasa yang lebih rendah.

Statistik Uji

Hipotesis: H0 : ρi = 0 H1 : ρi ≠ 0

Fungsi Kanonik

> print(cc1$xcoef)  # koefisien X
                        [,1]          [,2]         [,3]
Life expectancy -0.003150808 -0.0002948995 -0.005816564
Adult Mortality  0.004063960 -0.0094657782 -0.007211340
BMI             -0.106754538 -0.5631481482  0.080761791
> print(cc1$ycoef)  # koefisien Y
                                         [,1]          [,2]         [,3]
GDP                             -3.618980e-02  5.521792e-03 3.117661e-03
Income composition of resources  3.705684e-11 -7.838902e-11 6.341175e-10
Schooling                        6.977317e-09  6.724471e-08 5.697790e-09

Berdasarkan hasil diatas, diperoleh fungsi kanonik sebagai berikut:

Set X

\[ U_1 = -0.0032X_1 + 0.0041X_2 - 0.1068X_3 \]

\[ U_2 = -0.00029X_1 - 0.00947X_2 - 0.5631X_3 \]

\[ U_3 = -0.00582X_1 - 0.00721X_2 + 0.0808X_3 \]

Set Y

\[ V_1 = -0.0362Y_1 + 3.71 \times 10^{-11}Y_2 + 6.98 \times 10^{-9}Y_3 \]

\[ V_2 = 0.00552Y_1 - 7.84 \times 10^{-11}Y_2 + 6.72 \times 10^{-8}Y_3 \]

\[ V_3 = 0.00312Y_1 + 6.34 \times 10^{-10}Y_2 + 5.70 \times 10^{-9}Y_3 \]

U sebagai fungsi kanonik untuk variabel Kesehatan V sebagai fungsi kanonik untuk variabel Sosial-Ekonomi

Koefisien Korelasi Kanonik

> print(cc1$cor)
[1] 0.87111553 0.58475418 0.01083314

Berdasarkan hasil Canonical Correlation Analysis (CCA) yang diperoleh, terdapat korelasi kanonik, yaitu: \[ r_{U_1V_1} = 0.87111553 \]

\[ r_{U_2V_2} = 0.58475418 \]

\[ r_{U_3V_3} = 0.01083314 \] Berdasarkan hasil tersebut, terlihat bahwa korelasi kanonik terbesar terjadi pada fungsi kanonik pertama (U1–V1), yang menunjukkan bahwa kombinasi linear pertama dari variabel kesehatan (X) dan variabel sosial-ekonomi (Y) memiliki hubungan paling kuat di antara himpunan variabel yang dianalisis.

Pengujian Koefisien Korelasi Kanonik

> cc_test <- cancor(kelX, kelY)   
> cc_test
$cor
[1] 0.87111553 0.58475418 0.01083314

$xcoef
                         [,1]         [,2]          [,3]
Life expectancy -0.0004547799 4.256507e-05 -0.0008395488
Adult Mortality  0.0005865821 1.366267e-03 -0.0010408673
BMI             -0.0154086903 8.128343e-02  0.0116569604

$ycoef
                                         [,1]          [,2]         [,3]
GDP                             -5.223547e-03 -7.970020e-04 4.499956e-04
Income composition of resources  5.348695e-12  1.131448e-11 9.152698e-11
Schooling                        1.007089e-09 -9.705938e-09 8.224051e-10

$xcenter
Life expectancy Adult Mortality             BMI 
     650.693878      144.734694        1.712449 

$ycenter
                            GDP Income composition of resources 
                   7.793878e+01                    1.085117e+09 
                      Schooling 
                   1.061000e+07 

Berdasarkan hasil analisis korelasi kanonik antara himpunan variabel Kesehatan (Life Expectancy, Adult Mortality, BMI) dan himpunan variabel Kesejahteraan Ekonomi (GDP, Income Composition of Resources, Schooling), diperoleh tiga nilai korelasi kanonik. Nilai korelasi kanonik pertama sebesar 0,8711, korelasi kedua sebesar 0,5848, dan korelasi ketiga sebesar 0,0108. Dari ketiga korelasi tersebut, korelasi kanonik pertama memiliki nilai paling besar dan mampu menjelaskan 85,82% variasi hubungan antara kedua himpunan variabel. Korelasi kanonik kedua menyumbang 14,17%, sedangkan korelasi kanonik ketiga hanya menjelaskan 0,003% dan tidak memiliki makna statistik. Selanjutnya, berdasarkan hasil uji signifikansi menggunakan Rao’s F test dengan kriteria Wilks’ Lambda, diperoleh bahwa:

  • Fungsi kanonik pertama signifikan: \(p\text{-value} = 7.318 \times 10^{-14} < 0.05\)

  • Fungsi kanonik kedua signifikan: \(p\text{-value} = 0.0009325 < 0.05\)

  • Fungsi kanonik ketiga tidak signifikan: \(p\text{-value} = 0.942 > 0.05\)

Terdapat hubungan yang signifikan antara himpunan variabel Kesehatan (Life Expectancy, Adult Mortality, BMI) dengan himpunan variabel Kesejahteraan Ekonomi (GDP, Income Composition of Resources, Schooling). Hubungan yang signifikan ini ditunjukkan oleh dua korelasi kanonik pertama yang memiliki p-value < 0,05. Hal ini mengindikasikan bahwa tingkat kesehatan penduduk memiliki keterkaitan yang kuat dengan kondisi ekonomi, pendapatan, dan tingkat pendidikan suatu wilayah. Fungsi kanonik ketiga tidak signifikan, sehingga tidak memberikan informasi tambahan dalam menjelaskan hubungan kedua himpunan variabel.

Uji Sekuensial Bartlet

> print(result)
   Bartlett db      p_value
B1 81.91379  9 6.727952e-14
B2 18.62126  4 9.326738e-04

Berdasarkan output uji Bartlett yang diperoleh, nilai statistik Bartlett untuk fungsi kanonik pertama adalah 81,91379 dengan derajat bebas 9 dan p-value sebesar 6,727952 × 10⁻¹⁴. Sementara itu, untuk fungsi kanonik kedua nilai statistik Bartlett adalah 18,62126 dengan derajat bebas 4 dan p-value sebesar 9,326738 × 10⁻⁴.

Karena kedua p-value tersebut lebih kecil daripada tingkat signifikansi α = 0,05, maka keputusan pengujian adalah menolak H0 pada kedua fungsi kanonik.

Dapat disimpulkan bahwa baik fungsi kanonik pertama maupun kedua memiliki korelasi kanonik yang signifikan, sehingga keduanya berkontribusi dalam menjelaskan hubungan antara himpunan variabel X dan Y.

Korelasi dalam Himpunan

> cc1 <- cc(kelX, kelY) 
> cc1
$cor
[1] 0.87111553 0.58475418 0.01083314

$names
$names$Xnames
[1] "Life expectancy" "Adult Mortality" "BMI"            

$names$Ynames
[1] "GDP"                             "Income composition of resources"
[3] "Schooling"                      

$names$ind.names
NULL


$xcoef
                        [,1]          [,2]         [,3]
Life expectancy -0.003150808 -0.0002948995 -0.005816564
Adult Mortality  0.004063960 -0.0094657782 -0.007211340
BMI             -0.106754538 -0.5631481482  0.080761791

$ycoef
                                         [,1]          [,2]         [,3]
GDP                             -3.618980e-02  5.521792e-03 3.117661e-03
Income composition of resources  3.705684e-11 -7.838902e-11 6.341175e-10
Schooling                        6.977317e-09  6.724471e-08 5.697790e-09

$scores
$scores$xscores
             [,1]        [,2]        [,3]
 [1,]  2.50777830  0.01197866  2.41638203
 [2,]  0.85775875 -0.22122389 -0.74735410
 [3,]  0.84556687 -0.19282656 -0.72572008
 [4,]  0.87442594 -0.22951007 -0.73129919
 [5,]  0.89607024 -0.25702271 -0.73548351
 [6,]  0.92492931 -0.29370622 -0.74106261
 [7,]  0.93935885 -0.31204798 -0.74385217
 [8,]  0.97736155 -0.37863112 -0.75642215
 [9,]  1.02984562 -0.44695646 -0.78002110
[10,]  1.03507969 -0.45199815 -0.76758035
[11,]  1.01989140 -0.40850355 -0.73954261
[12,]  2.65383601 -0.27526698  2.24738196
[13,]  1.05611963 -0.43896579 -0.73429620
[14,] -0.11480261  2.32651594  1.40049789
[15,]  1.18557409 -0.63361854 -0.80430244
[16,]  1.22164793 -0.67947293 -0.81127632
[17,] -0.99683922 -0.99410260  0.00281145
[18,] -1.24600024 -0.31779320  0.48894102
[19,] -0.95437551 -1.17709469 -0.02148068
[20,] -0.97736189 -1.40913784  0.01223582
[21,] -0.98433509 -1.55670877  0.03383804
[22,] -0.94993207 -1.53324318  0.02820172
[23,] -1.00122608 -1.82015383  0.07520680
[24,] -1.32256019 -0.86450793  0.75622279
[25,] -1.30575072 -0.92510911  0.66120983
[26,] -0.85760688 -1.61996586  0.08926514
[27,] -1.16091067 -0.73830397  0.72361938
[28,]  0.99923966 -0.21286022  4.50969005
[29,] -1.03378669 -0.27469812  0.67243855
[30,] -1.00195007  0.06758768  0.61976315
[31,] -1.07097881 -0.21666828  0.65152093
[32,] -0.98867744  0.14693546  0.68367113
[33,] -0.65996837  2.12348447  0.15589533
[34,] -0.68724598  2.19416902  0.22602679
[35,] -0.32914759  0.94558328 -0.45450584
[36,] -0.33266011  0.86349804 -0.43958502
[37,] -0.30349116  0.89200532 -0.45766209
[38,] -0.27325466  0.92614408 -0.47654678
[39,] -0.25288413  0.86100826 -0.48390436
[40,] -0.22696964  0.85602155 -0.49131916
[41,] -0.20319025  0.83977188 -0.49711872
[42,] -0.16985478  0.85760599 -0.50194742
[43,] -0.15279054  0.74237664 -0.49040331
[44,] -0.62435107  1.92712838  0.42024146
[45,] -0.05726052  0.74136135 -0.50563982
[46,] -0.06030876  0.73985907 -0.49099668
[47,] -0.04012906  0.81365813 -0.48986259
[48,] -0.03911334  0.80269006 -0.48243079
[49,]  1.35523029 -0.79928475 -0.77344515

$scores$yscores
            [,1]       [,2]        [,3]
 [1,]  2.7267645  1.2383849 -0.74355380
 [2,]  0.6323301 -0.7645033 -0.42031969
 [3,]  0.7073932  1.3678507 -0.21683609
 [4,]  0.3074514 -0.4402583 -0.76115952
 [5,]  0.2685790 -0.4879704 -0.72226968
 [6,]  0.3399887 -0.5047882 -0.73425127
 [7,]  0.5936087 -1.0413054  2.03398820
 [8,]  0.5476010 -0.8145063  1.59109824
 [9,]  0.6258096  1.0499536 -0.40894324
[10,]  0.6264166 -0.5665196 -0.77867050
[11,]  0.6185118 -0.7409950 -0.64884440
[12,]  2.7748917  0.4189333  0.55109483
[13,]  1.3127092 -0.8291309  0.40993896
[14,]  1.5575724  0.6165789 -0.74214771
[15,]  1.4608385 -0.6669461 -0.85806101
[16,]  1.8398430 -0.9064910 -0.91502723
[17,] -0.8615872 -0.5411645 -0.43197467
[18,] -0.6686728 -0.8568928  2.21721690
[19,] -0.8580616 -0.5272423 -0.40128833
[20,] -0.8606809 -0.5452081 -0.41351827
[21,] -0.8579393 -0.5270416 -0.39983246
[22,] -0.8560897 -0.5312718 -0.36774221
[23,] -0.6673688 -0.6432740  1.93952519
[24,] -0.8396636 -0.3482163 -0.38863896
[25,] -0.8748887 -0.5129576 -0.65968724
[26,] -0.7831692 -0.3219474 -0.67184536
[27,] -0.7915447 -0.5240887 -0.51033481
[28,] -0.7484197 -0.6850801  0.84826246
[29,] -0.7946636 -0.5151844 -0.56690356
[30,] -0.7863601 -0.6313446  0.23579903
[31,] -0.7988924 -0.5311224 -0.60476721
[32,] -0.7602195 -0.6127042  0.05669119
[33,] -0.4381716  2.1145566 -0.20610902
[34,] -0.4585736  2.0955375 -0.46902090
[35,] -0.2614122  1.6149348  2.99289743
[36,] -0.4489522  1.9482859 -0.12843670
[37,] -0.4727678  1.9374658 -0.45111739
[38,] -0.3142790  1.5446424  2.34075322
[39,] -0.6564105 -0.3315571 -0.43293499
[40,] -0.5804327 -0.3551212 -0.37079096
[41,] -0.5856172 -0.8403600  1.80021032
[42,] -0.4947195  1.7344738 -0.48092514
[43,] -0.2449367  1.6631826 -0.50777222
[44,] -0.3821034 -0.3651523 -0.68822573
[45,] -0.4184425 -0.3625689 -0.68315044
[46,] -0.3770750 -0.3826489 -0.59266915
[47,] -0.2299011  1.4212409  0.56478078
[48,] -0.3777050 -0.3879733 -0.59421976
[49,]  2.6094122 -1.1224844  1.38973284

$scores$corr.X.xscores
                      [,1]        [,2]       [,3]
Life expectancy -0.8231645  0.07533576 -0.5627830
Adult Mortality  0.8608422 -0.22840167 -0.4547345
BMI             -0.6883282 -0.60286715  0.4034297

$scores$corr.Y.xscores
                                       [,1]        [,2]         [,3]
GDP                             -0.86485258  0.05676864 0.0007585294
Income composition of resources  0.06236266 -0.05355521 0.0107596920
Schooling                        0.13877082  0.57356347 0.0012127036

$scores$corr.X.yscores
                      [,1]       [,2]         [,3]
Life expectancy -0.7170714  0.0440529 -0.006096704
Adult Mortality  0.7498930 -0.1335588 -0.004926200
BMI             -0.5996134 -0.3525291  0.004370408

$scores$corr.Y.yscores
                                       [,1]        [,2]       [,3]
GDP                             -0.99281042  0.09708121 0.07001938
Income composition of resources  0.07158942 -0.09158585 0.99322051
Schooling                        0.15930242  0.98086253 0.11194392

Berdasarkan hasil loading antara variabel pada himpunan X (Life expectancy, Adult Mortality, dan BMI) dan himpunan Y (GDP, Income Composition of Resources, dan Schooling), terlihat bahwa fungsi kanonik pertama adalah yang paling penting dalam menjelaskan hubungan antara kedua kelompok variabel. Pada himpunan X, Adult Mortality memiliki loading terbesar (0,8608), sehingga menjadi variabel yang paling berpengaruh dalam fungsi kanonik pertama. Sementara itu, Life expectancy juga memiliki kontribusi besar namun arahnya berlawanan (–0,8232). Hal ini menunjukkan bahwa ketika mortalitas dewasa meningkat, harapan hidup cenderung menurun, dan keduanya sama-sama berperan kuat dalam membentuk fungsi kanonik pertama. Variabel BMI berpengaruh, tetapi tidak sekuat dua variabel sebelumnya.

Pada himpunan Y, variabel yang paling dominan adalah GDP, dengan loading sangat tinggi yaitu –0,9928. Artinya, fungsi kanonik pertama pada sisi Y terutama merefleksikan kondisi ekonomi negara. Dua variabel lainnya (Income Composition dan Schooling) tetap memberi kontribusi, tetapi jauh lebih kecil.

Secara keseluruhan, fungsi kanonik pertama menggambarkan hubungan utama antara kondisi kesehatan dan kesejahteraan ekonomi. Tingkat mortalitas dewasa yang tinggi cenderung berkaitan dengan GDP yang lebih rendah, sedangkan negara dengan ekonomi lebih kuat biasanya menunjukkan kondisi kesehatan masyarakat yang lebih baik. Fungsi kanonik kedua dan ketiga tidak memberikan kontribusi berarti sehingga tidak menjadi fokus interpretasi.

Korelasi antar Himpunan

> cc1 <- cc(kelX, kelY) 
> cc1
$cor
[1] 0.87111553 0.58475418 0.01083314

$names
$names$Xnames
[1] "Life expectancy" "Adult Mortality" "BMI"            

$names$Ynames
[1] "GDP"                             "Income composition of resources"
[3] "Schooling"                      

$names$ind.names
NULL


$xcoef
                        [,1]          [,2]         [,3]
Life expectancy -0.003150808 -0.0002948995 -0.005816564
Adult Mortality  0.004063960 -0.0094657782 -0.007211340
BMI             -0.106754538 -0.5631481482  0.080761791

$ycoef
                                         [,1]          [,2]         [,3]
GDP                             -3.618980e-02  5.521792e-03 3.117661e-03
Income composition of resources  3.705684e-11 -7.838902e-11 6.341175e-10
Schooling                        6.977317e-09  6.724471e-08 5.697790e-09

$scores
$scores$xscores
             [,1]        [,2]        [,3]
 [1,]  2.50777830  0.01197866  2.41638203
 [2,]  0.85775875 -0.22122389 -0.74735410
 [3,]  0.84556687 -0.19282656 -0.72572008
 [4,]  0.87442594 -0.22951007 -0.73129919
 [5,]  0.89607024 -0.25702271 -0.73548351
 [6,]  0.92492931 -0.29370622 -0.74106261
 [7,]  0.93935885 -0.31204798 -0.74385217
 [8,]  0.97736155 -0.37863112 -0.75642215
 [9,]  1.02984562 -0.44695646 -0.78002110
[10,]  1.03507969 -0.45199815 -0.76758035
[11,]  1.01989140 -0.40850355 -0.73954261
[12,]  2.65383601 -0.27526698  2.24738196
[13,]  1.05611963 -0.43896579 -0.73429620
[14,] -0.11480261  2.32651594  1.40049789
[15,]  1.18557409 -0.63361854 -0.80430244
[16,]  1.22164793 -0.67947293 -0.81127632
[17,] -0.99683922 -0.99410260  0.00281145
[18,] -1.24600024 -0.31779320  0.48894102
[19,] -0.95437551 -1.17709469 -0.02148068
[20,] -0.97736189 -1.40913784  0.01223582
[21,] -0.98433509 -1.55670877  0.03383804
[22,] -0.94993207 -1.53324318  0.02820172
[23,] -1.00122608 -1.82015383  0.07520680
[24,] -1.32256019 -0.86450793  0.75622279
[25,] -1.30575072 -0.92510911  0.66120983
[26,] -0.85760688 -1.61996586  0.08926514
[27,] -1.16091067 -0.73830397  0.72361938
[28,]  0.99923966 -0.21286022  4.50969005
[29,] -1.03378669 -0.27469812  0.67243855
[30,] -1.00195007  0.06758768  0.61976315
[31,] -1.07097881 -0.21666828  0.65152093
[32,] -0.98867744  0.14693546  0.68367113
[33,] -0.65996837  2.12348447  0.15589533
[34,] -0.68724598  2.19416902  0.22602679
[35,] -0.32914759  0.94558328 -0.45450584
[36,] -0.33266011  0.86349804 -0.43958502
[37,] -0.30349116  0.89200532 -0.45766209
[38,] -0.27325466  0.92614408 -0.47654678
[39,] -0.25288413  0.86100826 -0.48390436
[40,] -0.22696964  0.85602155 -0.49131916
[41,] -0.20319025  0.83977188 -0.49711872
[42,] -0.16985478  0.85760599 -0.50194742
[43,] -0.15279054  0.74237664 -0.49040331
[44,] -0.62435107  1.92712838  0.42024146
[45,] -0.05726052  0.74136135 -0.50563982
[46,] -0.06030876  0.73985907 -0.49099668
[47,] -0.04012906  0.81365813 -0.48986259
[48,] -0.03911334  0.80269006 -0.48243079
[49,]  1.35523029 -0.79928475 -0.77344515

$scores$yscores
            [,1]       [,2]        [,3]
 [1,]  2.7267645  1.2383849 -0.74355380
 [2,]  0.6323301 -0.7645033 -0.42031969
 [3,]  0.7073932  1.3678507 -0.21683609
 [4,]  0.3074514 -0.4402583 -0.76115952
 [5,]  0.2685790 -0.4879704 -0.72226968
 [6,]  0.3399887 -0.5047882 -0.73425127
 [7,]  0.5936087 -1.0413054  2.03398820
 [8,]  0.5476010 -0.8145063  1.59109824
 [9,]  0.6258096  1.0499536 -0.40894324
[10,]  0.6264166 -0.5665196 -0.77867050
[11,]  0.6185118 -0.7409950 -0.64884440
[12,]  2.7748917  0.4189333  0.55109483
[13,]  1.3127092 -0.8291309  0.40993896
[14,]  1.5575724  0.6165789 -0.74214771
[15,]  1.4608385 -0.6669461 -0.85806101
[16,]  1.8398430 -0.9064910 -0.91502723
[17,] -0.8615872 -0.5411645 -0.43197467
[18,] -0.6686728 -0.8568928  2.21721690
[19,] -0.8580616 -0.5272423 -0.40128833
[20,] -0.8606809 -0.5452081 -0.41351827
[21,] -0.8579393 -0.5270416 -0.39983246
[22,] -0.8560897 -0.5312718 -0.36774221
[23,] -0.6673688 -0.6432740  1.93952519
[24,] -0.8396636 -0.3482163 -0.38863896
[25,] -0.8748887 -0.5129576 -0.65968724
[26,] -0.7831692 -0.3219474 -0.67184536
[27,] -0.7915447 -0.5240887 -0.51033481
[28,] -0.7484197 -0.6850801  0.84826246
[29,] -0.7946636 -0.5151844 -0.56690356
[30,] -0.7863601 -0.6313446  0.23579903
[31,] -0.7988924 -0.5311224 -0.60476721
[32,] -0.7602195 -0.6127042  0.05669119
[33,] -0.4381716  2.1145566 -0.20610902
[34,] -0.4585736  2.0955375 -0.46902090
[35,] -0.2614122  1.6149348  2.99289743
[36,] -0.4489522  1.9482859 -0.12843670
[37,] -0.4727678  1.9374658 -0.45111739
[38,] -0.3142790  1.5446424  2.34075322
[39,] -0.6564105 -0.3315571 -0.43293499
[40,] -0.5804327 -0.3551212 -0.37079096
[41,] -0.5856172 -0.8403600  1.80021032
[42,] -0.4947195  1.7344738 -0.48092514
[43,] -0.2449367  1.6631826 -0.50777222
[44,] -0.3821034 -0.3651523 -0.68822573
[45,] -0.4184425 -0.3625689 -0.68315044
[46,] -0.3770750 -0.3826489 -0.59266915
[47,] -0.2299011  1.4212409  0.56478078
[48,] -0.3777050 -0.3879733 -0.59421976
[49,]  2.6094122 -1.1224844  1.38973284

$scores$corr.X.xscores
                      [,1]        [,2]       [,3]
Life expectancy -0.8231645  0.07533576 -0.5627830
Adult Mortality  0.8608422 -0.22840167 -0.4547345
BMI             -0.6883282 -0.60286715  0.4034297

$scores$corr.Y.xscores
                                       [,1]        [,2]         [,3]
GDP                             -0.86485258  0.05676864 0.0007585294
Income composition of resources  0.06236266 -0.05355521 0.0107596920
Schooling                        0.13877082  0.57356347 0.0012127036

$scores$corr.X.yscores
                      [,1]       [,2]         [,3]
Life expectancy -0.7170714  0.0440529 -0.006096704
Adult Mortality  0.7498930 -0.1335588 -0.004926200
BMI             -0.5996134 -0.3525291  0.004370408

$scores$corr.Y.yscores
                                       [,1]        [,2]       [,3]
GDP                             -0.99281042  0.09708121 0.07001938
Income composition of resources  0.07158942 -0.09158585 0.99322051
Schooling                        0.15930242  0.98086253 0.11194392

Korelasi antar himpunan (cross-loading) menunjukkan bagaimana variabel kesehatan (X) dan kesejahteraan ekonomi–sosial (Y) saling berkaitan melalui fungsi kanonik. Hasil analisis memperlihatkan bahwa fungsi kanonik pertama menjadi penghubung paling kuat antara kedua kelompok variabel.

Pada himpunan Y, GDP memiliki korelasi terbesar terhadap fungsi pertama pada X (–0,8649), sehingga variasi kondisi ekonomi terutama mempengaruhi hubungan kanonik ini. Schooling terlihat lebih dominan pada fungsi kedua, sedangkan Income Composition of Resources memberikan pengaruh relatif kecil di semua fungsi. Di sisi variabel X, Adult Mortality muncul sebagai variabel dengan korelasi terbesar terhadap fungsi pertama pada Y (0,7499), diikuti oleh Life Expectancy yang juga kuat namun berlawanan arah (–0,7171). BMI tetap berperan, tetapi kontribusinya tidak sebesar dua variabel lainnya.

Secara keseluruhan, fungsi kanonik pertama menggambarkan hubungan terkuat antara kondisi ekonomi khususnya GDP dengan indikator kesehatan masyarakat seperti mortalitas dewasa dan harapan hidup. Pola korelasi yang berlawanan menunjukkan bahwa ekonomi yang lebih baik cenderung berkaitan dengan tingkat kematian yang lebih rendah dan kesehatan populasi yang lebih baik. Fungsi kanonik lainnya memiliki pengaruh jauh lebih kecil.

Dengan demikian, cross-loading ini menegaskan bahwa keterkaitan paling signifikan antara kedua himpunan variabel terutama didorong oleh peran GDP serta indikator kesehatan utama.

Indeks Redudansi

> cc1 <- cancor(kelX, kelY)
> canR2 <- cc1$cor^2
> # 10. Redundancy Indices
> 
> # Korelasi X dan Y asli dengan canonical scores
> corrX_Xscores <- cor(kelX, X_scores)
> corrY_Yscores <- cor(kelY, Y_scores)
> 
> # R² untuk setiap canonical variabel
> R2_X <- corrX_Xscores^2
> R2_Y <- corrY_Yscores^2
> 
> # Redundancy X|Y
> Redundancy_X <- colMeans(R2_X) * canR2
> Redundancy_X_total <- sum(Redundancy_X)
> 
> # Redundancy Y|X
> Redundancy_Y <- colMeans(R2_Y) * canR2
> Redundancy_Y_total <- sum(Redundancy_Y)
> 
> Redundancy_X
       CanX1        CanX2        CanX3 
0.4786890286 0.0480184599 0.0000268459 
> Redundancy_X_total
[1] 0.5267343
> Redundancy_Y
       CanY1        CanY2        CanY3 
2.570388e-01 1.116886e-01 3.927233e-05 
> Redundancy_Y_total
[1] 0.3687667

Berdasarkan hasil perhitungan redundancy index, dapat disimpulkan bahwa fungsi kanonik pertama merupakan fungsi yang paling berperan dalam menjelaskan keragaman pada kedua himpunan variabel.

Untuk himpunan X (kesehatan), fungsi kanonik pertama mampu menjelaskan 47,87% keragaman variabel aslinya. Jika digabungkan dengan fungsi kedua dan ketiga, total keragaman yang dapat dijelaskan meningkat menjadi 52,67%, namun tambahan kontribusinya relatif kecil. Ini menunjukkan bahwa sebagian besar informasi pada himpunan X ditangkap oleh fungsi kanonik pertama.

Sementara itu, pada himpunan Y (kesejahteraan ekonomi–sosial), fungsi kanonik pertama mampu menjelaskan 25,70% keragaman variabel aslinya. Jika digabungkan dengan fungsi kanonik kedua dan ketiga, total keragaman yang dapat dijelaskan menjadi 36,88%. Seperti pada himpunan X, fungsi pertama tetap menjadi penjelas utama keragaman pada himpunan Y, sedangkan fungsi kedua hanya menambah kontribusi moderat.

Secara keseluruhan, hasil ini menunjukkan bahwa hubungan antara kedua himpunan variabel terutama tercermin melalui fungsi kanonik pertama, sedangkan fungsi kedua dan ketiga memberikan tambahan informasi yang jauh lebih kecil.

KESIMPULAN

Berdasarkan hasil analisis dan pembahasan yang telah dilakukan terkait Penerapan Analisis Korelasi Kanonik untuk Mengukur Keterkaitan Variabel Sosial-Ekonomi dan Variabel Kesehatan pada Dataset Life Expectancy WHO, diperoleh beberapa kesimpulan sebagai berikut:

  1. Terdapat hubungan yang signifikan antara variabel Sosial-Ekonomi dan variabel Kesehatan, ditunjukkan oleh nilai korelasi kanonik terbesar sebesar 0,8711. Nilai ini menghasilkan pasangan peubah kanonik pertama yang mampu menjelaskan 85,824% keragaman hubungan antar kedua kelompok variabel. Fungsi kanonik pertama direpresentasikan oleh koefisien berikut: \[ U_1 = -0.0032X_1 + 0.0041X_2 - 0.1068X_3 \]

\[ V_1 = -0.0362Y_1 + 3.71 \times 10^{-11}Y_2 + 6.98 \times 10^{-9}Y_3 \]

  1. Variabel Kesehatan yang memiliki hubungan terkuat dengan fungsi kanonik (melalui korelasi dengan CanX1) adalah Adult Mortality (X2) dengan korelasi sebesar 0,8608 (hubungan kuat dan positif).

  2. Variabel Sosial-Ekonomi yang paling berkaitan dengan fungsi kanonik (melalui korelasi dengan CanY1) adalah GDP (Y1) dengan nilai korelasi sebesar –0,9928, menunjukkan hubungan sangat kuat secara negatif.

  3. Hasil analisis redundancy menunjukkan bahwa:

  • Proporsi variansi variabel Kesehatan (X) yang dapat dijelaskan oleh variabel Sosial-Ekonomi (Y) adalah sebesar 52,6734%. Hal ini menunjukkan bahwa lebih dari setengah keragaman kesehatan dipengaruhi oleh kondisi sosial-ekonomi berdasarkan model kanonik.
  • Proporsi variansi variabel Sosial-Ekonomi (Y) yang dapat dijelaskan oleh variabel Kesehatan (X) adalah sebesar 36,8767%, yang berarti lebih dari sepertiga variasi sosial-ekonomi dapat diterangkan melalui indikator kesehatan.
  1. Fungsi kanonik pertama memberikan kontribusi paling dominan dalam menjelaskan hubungan kedua kelompok variabel, yang terlihat dari nilai redundancy terbesar pada fungsi pertama, yaitu: \[ \text{Redundancy } X_1 = 0.4787 \]

\[ \text{Redundancy } Y_1 = 0.2570 \] Secara keseluruhan, hasil analisis menunjukkan bahwa faktor sosial-ekonomi memiliki keterkaitan yang kuat dengan indikator kesehatan, terutama melalui pengaruh GDP dan Adult Mortality. Temuan ini menegaskan bahwa kondisi kesehatan masyarakat sangat erat hubungannya dengan tingkat kesejahteraan ekonomi dalam data Life Expectancy WHO.

DAFTAR PUSTAKA

Hair, J.F., Black, W.C., Babin, B.J., Anderson, R.E., & Tatham, R.L. (2014). Multivariate Data Analysis (7th ed.). Pearson.

Kumar, A. (2020). Life Expectancy Data Dataset. Kaggle. Retrieved from https://www.kaggle.com/datasets/kumarajarshi/life-expectancy-who

Rencher, A.C. (2002). Methods of Multivariate Analysis (2nd ed.). John Wiley & Sons.

Thompson, B. (2005). Canonical Correlation Analysis: Uses and Interpretation. SAGE Publications.

World Health Organization. (2021). Life Expectancy and Healthy Life Expectancy Data. Retrieved from https://www.who.int/data/gho/data/themes/mortality-and-global-health-estimates/ghe-life-expectancy-and-healthy-life-expectancy