Library:
> # install.packages("knitr")
> # install.packages("rmarkdown")
> # install.packages("prettydoc")
> # install.packages("equatiomatic")
Harapan hidup menjadi salah satu indikator utama untuk menilai tingkat kesehatan dan kesejahteraan suatu negara, karena angka ini mencerminkan kondisi kesehatan masyarakat, ketersediaan layanan medis, serta kualitas hidup secara keseluruhan. Menurut data dari World Health Organization (WHO), beberapa faktor kesehatan seperti angka kematian orang dewasa (Adult Mortality) dan indeks massa tubuh (BMI) memiliki pengaruh yang cukup besar terhadap harapan hidup. Selain itu, faktor sosial-ekonomi seperti tingkat pendidikan (Schooling), komposisi pendapatan sumber daya (Income Composition of Resources), dan Produk Domestik Bruto per kapita (GDP per capita) juga memengaruhi kualitas hidup masyarakat, karena faktor-faktor ini berdampak pada akses terhadap layanan kesehatan, gizi, dan lingkungan yang mendukung kesehatan.
Dataset Life Expectancy dari WHO yang tersedia di Kaggle menyediakan informasi yang cukup lengkap mengenai berbagai variabel kesehatan dan sosial-ekonomi di sejumlah negara. Dengan menganalisis dataset ini, peneliti dapat memahami hubungan yang kompleks antara faktor kesehatan dan sosial-ekonomi serta bagaimana keduanya memengaruhi angka harapan hidup. Salah satu metode yang tepat untuk melihat hubungan simultan antara kedua kelompok variabel tersebut adalah Canonical Correlation Analysis (CCA), yang memungkinkan kita mengukur sejauh mana kombinasi variabel kesehatan (set X) berkaitan dengan kombinasi variabel sosial-ekonomi (set Y).
Rumusan masalah dari penelitian, yaitu:
Bagaimana hubungan antara variabel kesehatan (angka harapan hidup, kematian orang dewasa, dan BMI) dengan variabel sosial-ekonomi (tingkat pendidikan, komposisi pendapatan sumber daya, dan GDP per kapita) di berbagai negara?
Variabel mana yang paling berkontribusi dalam menjelaskan variasi harapan hidup melalui hubungan antara faktor kesehatan dan sosial-ekonomi?
Seberapa besar variansi dari setiap set variabel (kesehatan dan sosial-ekonomi) yang dijelaskan oleh canonical variabel dalam analisis Canonical Correlation Analysis?
Tujuan dari penelitian, yaitu:
Menganalisis hubungan simultan antara variabel kesehatan (Life Expectancy, Adult Mortality, BMI) dan variabel sosial-ekonomi (Schooling, Income Composition of Resources, GDP per capita) menggunakan Canonical Correlation Analysis.
Mengidentifikasi variabel kunci yang memberikan kontribusi signifikan terhadap hubungan antara faktor kesehatan dan sosial-ekonomi.
Mengukur tingkat kontribusi masing-masing set variabel terhadap variasi harapan hidup melalui perhitungan redundancy indices.
Analisis Korelasi Kanonik (Canonical Correlation Analysis atau CCA) merupakan salah satu teknik statistika multivariat yang digunakan untuk mengukur kekuatan dan arah hubungan simultan antara dua himpunan variabel. Teknik ini berbeda dengan analisis regresi berganda, karena CCA tidak hanya mengkaji hubungan satu variabel dependen dengan beberapa variabel independen, tetapi menilai keterkaitan dua set variabel secara bersamaan. Misalnya, misalkan terdapat dua himpunan variabel: \[ \mathbf{X}' = (X_1, X_2, \ldots, X_p) \]
\[ \mathbf{Y}' = (Y_1, Y_2, \ldots, Y_q) \]
CCA bertujuan menemukan pasangan variabel kanonik (U_i,V_i)yang merupakan kombinasi linear dari himpunan variabel X dan Y sehingga korelasi antara U dan V maksimal. Banyaknya pasangan kanonik yang dapat dibentuk ditentukan oleh: k= min (p,q) Variabel kanonik tersebut dinyatakan sebagai: \[ U_i = \mathbf{a}_i^{T} \mathbf{X} = a_{i1}X_1 + a_{i2}X_2 + \cdots + a_{ip}X_p \]
\[ V_i = \mathbf{b}_i^{T} \mathbf{X} = b_{i1}X_1 + b_{i2}X_2 + \cdots + b_{ip}X_p \]
di mana \[a_{i1}\] dan \[b_{i1}\] adalah vektor bobot kanonik yang menentukan kontribusi masing-masing variabel asli dalam membentuk variabel kanonik U dan V.
Penentuan bobot kanonik ini dapat dilakukan dengan memaksimalkan fungsi Lagrange pengganda, sehingga diperoleh sistem persamaan:
\[ L = \mathbf{a}^T \mathbf{S}_{XX} \mathbf{b} - \frac{\lambda}{2} \left( \mathbf{a}^T \mathbf{S}_{XX} \mathbf{a} - 1 \right) - \frac{\mu}{2} \left( \mathbf{b}^T \mathbf{S}_{YY} \mathbf{b} - 1 \right) \]
Persamaan ini menghasilkan vektor ciri adan byang berpadanan dengan akar kuadrat dari nilai eigen dari persamaan: \[ \left( \mathbf{S}_{XX}^{-1} \mathbf{S}_{XY} \mathbf{S}_{YY}^{-1} \mathbf{S}_{YX} - \lambda \mathbf{I} \right)\mathbf{a} = \mathbf{0} \] \[ \left( \mathbf{S}_{YY}^{-1} \mathbf{S}_{YX} \mathbf{S}_{XX}^{-1} \mathbf{S}_{XY} - \lambda \mathbf{I} \right)\mathbf{b} = \mathbf{0} \]
Melalui pendekatan ini, CCA dapat mengidentifikasi pasangan variabel kanonik yang menjelaskan seberapa besar variabilitas dari satu himpunan variabel dijelaskan oleh himpunan variabel lainnya, sehingga memberikan wawasan yang lebih mendalam tentang keterkaitan multivariat. Selain itu, setelah diperoleh U dan V, peneliti dapat menghitung canonical correlations, canonical coefficients, dan redundancy indices untuk menilai kontribusi masing-masing variabel dalam himpunan X dan Y.
Dalam konteks penelitian harapan hidup, himpunan variabel X dapat terdiri dari faktor kesehatan seperti Life Expectancy, Adult Mortality, dan BMI, sedangkan himpunan variabel Y terdiri dari faktor sosial-ekonomi seperti Schooling, Income Composition of Resources, dan GDP per capita. Dengan menggunakan CCA, penelitian dapat mengidentifikasi kombinasi linear dari faktor kesehatan dan sosial-ekonomi yang saling berkorelasi paling kuat, serta menentukan variabel mana yang memiliki kontribusi paling besar terhadap variasi harapan hidup di berbagai negara.
Berikut merupakan source code dan penjelasan masing-masing source code :
Library
> library(readr)
> library(dplyr)
> library(CCA)
> library(psych)
> library (tidyr)
> data_raw <- read_csv2(
+ "C:/Users/Made Orchidia/OneDrive/ANMUL/Life Expectancy Data- Tugas 2.csv",
+ col_names = TRUE
+ )
Membaca data dari file CSV yang terletak di komputer dengan menggunakan fungsi read_csv2, di mana pemisah kolomnya adalah tanda titik koma (;). Baris pertama file dianggap sebagai nama kolom karena parameter col_names = TRUE. Data hasil baca ini kemudian disimpan dalam variabel data_raw sebagai dataframe, yang masih mungkin berisi nilai yang bukan numerik atau nilai yang hilang.
> data_clean <- data_raw %>%
+ mutate(across(everything(), ~as.numeric(as.character(.))))
>
> data_clean <- data_clean %>% drop_na()
>
> kelX <- data_clean[, 1:3] # X: kolom 1-3
> kelY <- data_clean[, 4:6] # Y: kolom 4-6
>
> datagab <- cbind(kelY, kelX)
Setelah data dibersihkan, script memilih subset variabel untuk dianalisis. Tiga kolom pertama dianggap sebagai variabel X (independen) dan disimpan dalam kelX, sedangkan tiga kolom berikutnya dianggap sebagai variabel Y (dependen) dan disimpan dalam kelY. Data X dan Y ini kemudian digabungkan menjadi satu dataframe datagab untuk memudahkan pembuatan ringkasan statistik di akhir analisis.
> n <- nrow(kelX)
> p <- ncol(kelX)
> q <- ncol(kelY)
> cc1 <- cc(kelX, kelY)
> cc1
$cor
[1] 0.87111553 0.58475418 0.01083314
$names
$names$Xnames
[1] "Life expectancy" "Adult Mortality" "BMI"
$names$Ynames
[1] "GDP" "Income composition of resources"
[3] "Schooling"
$names$ind.names
[1] "1" "2" "3" "4" "5" "6" "7" "8" "9" "10" "11" "12" "13" "14" "15"
[16] "16" "17" "18" "19" "20" "21" "22" "23" "24" "25" "26" "27" "28" "29" "30"
[31] "31" "32" "33" "34" "35" "36" "37" "38" "39" "40" "41" "42" "43" "44" "45"
[46] "46" "47" "48" "49"
$xcoef
[,1] [,2] [,3]
Life expectancy -0.003150808 -0.0002948995 -0.005816564
Adult Mortality 0.004063960 -0.0094657782 -0.007211340
BMI -0.106754538 -0.5631481482 0.080761791
$ycoef
[,1] [,2] [,3]
GDP -3.618980e-02 5.521792e-03 3.117661e-03
Income composition of resources 3.705684e-11 -7.838902e-11 6.341175e-10
Schooling 6.977317e-09 6.724471e-08 5.697790e-09
$scores
$scores$xscores
[,1] [,2] [,3]
[1,] 2.50777830 0.01197866 2.41638203
[2,] 0.85775875 -0.22122389 -0.74735410
[3,] 0.84556687 -0.19282656 -0.72572008
[4,] 0.87442594 -0.22951007 -0.73129919
[5,] 0.89607024 -0.25702271 -0.73548351
[6,] 0.92492931 -0.29370622 -0.74106261
[7,] 0.93935885 -0.31204798 -0.74385217
[8,] 0.97736155 -0.37863112 -0.75642215
[9,] 1.02984562 -0.44695646 -0.78002110
[10,] 1.03507969 -0.45199815 -0.76758035
[11,] 1.01989140 -0.40850355 -0.73954261
[12,] 2.65383601 -0.27526698 2.24738196
[13,] 1.05611963 -0.43896579 -0.73429620
[14,] -0.11480261 2.32651594 1.40049789
[15,] 1.18557409 -0.63361854 -0.80430244
[16,] 1.22164793 -0.67947293 -0.81127632
[17,] -0.99683922 -0.99410260 0.00281145
[18,] -1.24600024 -0.31779320 0.48894102
[19,] -0.95437551 -1.17709469 -0.02148068
[20,] -0.97736189 -1.40913784 0.01223582
[21,] -0.98433509 -1.55670877 0.03383804
[22,] -0.94993207 -1.53324318 0.02820172
[23,] -1.00122608 -1.82015383 0.07520680
[24,] -1.32256019 -0.86450793 0.75622279
[25,] -1.30575072 -0.92510911 0.66120983
[26,] -0.85760688 -1.61996586 0.08926514
[27,] -1.16091067 -0.73830397 0.72361938
[28,] 0.99923966 -0.21286022 4.50969005
[29,] -1.03378669 -0.27469812 0.67243855
[30,] -1.00195007 0.06758768 0.61976315
[31,] -1.07097881 -0.21666828 0.65152093
[32,] -0.98867744 0.14693546 0.68367113
[33,] -0.65996837 2.12348447 0.15589533
[34,] -0.68724598 2.19416902 0.22602679
[35,] -0.32914759 0.94558328 -0.45450584
[36,] -0.33266011 0.86349804 -0.43958502
[37,] -0.30349116 0.89200532 -0.45766209
[38,] -0.27325466 0.92614408 -0.47654678
[39,] -0.25288413 0.86100826 -0.48390436
[40,] -0.22696964 0.85602155 -0.49131916
[41,] -0.20319025 0.83977188 -0.49711872
[42,] -0.16985478 0.85760599 -0.50194742
[43,] -0.15279054 0.74237664 -0.49040331
[44,] -0.62435107 1.92712838 0.42024146
[45,] -0.05726052 0.74136135 -0.50563982
[46,] -0.06030876 0.73985907 -0.49099668
[47,] -0.04012906 0.81365813 -0.48986259
[48,] -0.03911334 0.80269006 -0.48243079
[49,] 1.35523029 -0.79928475 -0.77344515
$scores$yscores
[,1] [,2] [,3]
[1,] 2.7267645 1.2383849 -0.74355380
[2,] 0.6323301 -0.7645033 -0.42031969
[3,] 0.7073932 1.3678507 -0.21683609
[4,] 0.3074514 -0.4402583 -0.76115952
[5,] 0.2685790 -0.4879704 -0.72226968
[6,] 0.3399887 -0.5047882 -0.73425127
[7,] 0.5936087 -1.0413054 2.03398820
[8,] 0.5476010 -0.8145063 1.59109824
[9,] 0.6258096 1.0499536 -0.40894324
[10,] 0.6264166 -0.5665196 -0.77867050
[11,] 0.6185118 -0.7409950 -0.64884440
[12,] 2.7748917 0.4189333 0.55109483
[13,] 1.3127092 -0.8291309 0.40993896
[14,] 1.5575724 0.6165789 -0.74214771
[15,] 1.4608385 -0.6669461 -0.85806101
[16,] 1.8398430 -0.9064910 -0.91502723
[17,] -0.8615872 -0.5411645 -0.43197467
[18,] -0.6686728 -0.8568928 2.21721690
[19,] -0.8580616 -0.5272423 -0.40128833
[20,] -0.8606809 -0.5452081 -0.41351827
[21,] -0.8579393 -0.5270416 -0.39983246
[22,] -0.8560897 -0.5312718 -0.36774221
[23,] -0.6673688 -0.6432740 1.93952519
[24,] -0.8396636 -0.3482163 -0.38863896
[25,] -0.8748887 -0.5129576 -0.65968724
[26,] -0.7831692 -0.3219474 -0.67184536
[27,] -0.7915447 -0.5240887 -0.51033481
[28,] -0.7484197 -0.6850801 0.84826246
[29,] -0.7946636 -0.5151844 -0.56690356
[30,] -0.7863601 -0.6313446 0.23579903
[31,] -0.7988924 -0.5311224 -0.60476721
[32,] -0.7602195 -0.6127042 0.05669119
[33,] -0.4381716 2.1145566 -0.20610902
[34,] -0.4585736 2.0955375 -0.46902090
[35,] -0.2614122 1.6149348 2.99289743
[36,] -0.4489522 1.9482859 -0.12843670
[37,] -0.4727678 1.9374658 -0.45111739
[38,] -0.3142790 1.5446424 2.34075322
[39,] -0.6564105 -0.3315571 -0.43293499
[40,] -0.5804327 -0.3551212 -0.37079096
[41,] -0.5856172 -0.8403600 1.80021032
[42,] -0.4947195 1.7344738 -0.48092514
[43,] -0.2449367 1.6631826 -0.50777222
[44,] -0.3821034 -0.3651523 -0.68822573
[45,] -0.4184425 -0.3625689 -0.68315044
[46,] -0.3770750 -0.3826489 -0.59266915
[47,] -0.2299011 1.4212409 0.56478078
[48,] -0.3777050 -0.3879733 -0.59421976
[49,] 2.6094122 -1.1224844 1.38973284
$scores$corr.X.xscores
[,1] [,2] [,3]
Life expectancy -0.8231645 0.07533576 -0.5627830
Adult Mortality 0.8608422 -0.22840167 -0.4547345
BMI -0.6883282 -0.60286715 0.4034297
$scores$corr.Y.xscores
[,1] [,2] [,3]
GDP -0.86485258 0.05676864 0.0007585294
Income composition of resources 0.06236266 -0.05355521 0.0107596920
Schooling 0.13877082 0.57356347 0.0012127036
$scores$corr.X.yscores
[,1] [,2] [,3]
Life expectancy -0.7170714 0.0440529 -0.006096704
Adult Mortality 0.7498930 -0.1335588 -0.004926200
BMI -0.5996134 -0.3525291 0.004370408
$scores$corr.Y.yscores
[,1] [,2] [,3]
GDP -0.99281042 0.09708121 0.07001938
Income composition of resources 0.07158942 -0.09158585 0.99322051
Schooling 0.15930242 0.98086253 0.11194392
Analisis Canonical Correlation dilakukan dengan cc(kelX, kelY) untuk mencari kombinasi linear variabel X dan Y yang memiliki korelasi maksimum, dengan hasil disimpan di cc1 yang berisi canonical correlations (cc1\(cor) dan koefisien untuk X (cc1\)xcoef) dan Y (cc1$ycoef), yang kemudian dicetak untuk melihat kekuatan hubungan antar set variabel.
> print(cc1$cor)
[1] 0.87111553 0.58475418 0.01083314
> print(cc1$xcoef) # koefisien X
[,1] [,2] [,3]
Life expectancy -0.003150808 -0.0002948995 -0.005816564
Adult Mortality 0.004063960 -0.0094657782 -0.007211340
BMI -0.106754538 -0.5631481482 0.080761791
> print(cc1$ycoef) # koefisien Y
[,1] [,2] [,3]
GDP -3.618980e-02 5.521792e-03 3.117661e-03
Income composition of resources 3.705684e-11 -7.838902e-11 6.341175e-10
Schooling 6.977317e-09 6.724471e-08 5.697790e-09
> kelX <- as.matrix(kelX)
> kelY <- as.matrix(kelY)
> X_scores <- kelX %*% cc1$xcoef
> Y_scores <- kelY %*% cc1$ycoef
>
> colnames(X_scores) <- paste0("CanX", 1:ncol(X_scores))
> colnames(Y_scores) <- paste0("CanY", 1:ncol(Y_scores))
>
> head(X_scores)
CanX1 CanX2 CanX3
[1,] 0.8629514 -2.514300 -2.273851
[2,] -0.7870681 -2.747502 -5.437588
[3,] -0.7992600 -2.719105 -5.415954
[4,] -0.7704010 -2.755788 -5.421533
[5,] -0.7487567 -2.783301 -5.425717
[6,] -0.7198976 -2.819984 -5.431296
> head(Y_scores)
CanY1 CanY2 CanY3
[1,] 0.02041653 2.2971515 0.2479783
[2,] -2.07401790 0.2942634 0.5712124
[3,] -1.99895479 2.4266174 0.7746960
[4,] -2.39889663 0.6185084 0.2303726
[5,] -2.43776898 0.5707963 0.2692624
[6,] -2.36635927 0.5539785 0.2572808
> matcor(kelX, kelY)
$Xcor
Life expectancy Adult Mortality BMI
Life expectancy 1.0000000 -0.4699047 0.2941465
Adult Mortality -0.4699047 1.0000000 -0.6382994
BMI 0.2941465 -0.6382994 1.0000000
$Ycor
GDP Income composition of resources
GDP 1.00000000 -0.01042130
Income composition of resources -0.01042130 1.00000000
Schooling -0.05509554 0.03275625
Schooling
GDP -0.05509554
Income composition of resources 0.03275625
Schooling 1.00000000
$XYcor
Life expectancy Adult Mortality BMI
Life expectancy 1.00000000 -0.46990474 0.29414654
Adult Mortality -0.46990474 1.00000000 -0.63829944
BMI 0.29414654 -0.63829944 1.00000000
GDP 0.71576580 -0.75781254 0.56138446
Income composition of resources -0.06142472 0.06102370 -0.00629852
Schooling -0.07170387 -0.01209454 -0.44081320
GDP Income composition of resources
Life expectancy 0.71576580 -0.06142472
Adult Mortality -0.75781254 0.06102370
BMI 0.56138446 -0.00629852
GDP 1.00000000 -0.01042130
Income composition of resources -0.01042130 1.00000000
Schooling -0.05509554 0.03275625
Schooling
Life expectancy -0.07170387
Adult Mortality -0.01209454
BMI -0.44081320
GDP -0.05509554
Income composition of resources 0.03275625
Schooling 1.00000000
Fungsi matcor (kelX, kelY) dari paket psych untuk menampilkan matriks korelasi antara variabel X dan Y. Fungsi ini memberikan gambaran awal mengenai pola hubungan antar variabel sebelum dilakukan analisis canonical, sehingga bisa dilihat variabel mana yang memiliki korelasi tinggi atau rendah satu sama lain.
> k <- (n - 1) - 0.5 * (p + q + 1)
>
> lambda <- cc1$cor^2
> a <- 1 - lambda[1]
> b <- 1 - lambda[2]
>
> B1 <- -k * log(a * b)
> B2 <- -k * log(b)
>
> db1 <- p * q
> db2 <- (p - 1) * (q - 1)
>
> pv1 <- 1 - pchisq(B1, db1)
> pv2 <- 1 - pchisq(B2, db2)
>
> result <- cbind(Bartlett = c(B1, B2),
+ db = c(db1, db2),
+ p_value = c(pv1, pv2))
> rownames(result) <- c("B1", "B2")
> print(result)
Bartlett db p_value
B1 81.91379 9 6.727952e-14
B2 18.62126 4 9.326738e-04
Uji Bartlett digunakan untuk menguji signifikansi canonical correlations dengan menghitung statistik berdasarkan jumlah observasi, variabel, dan kuadrat canonical correlations (lambda), kemudian B1 dan B2 dihitung dengan -k*log(…) dan diuji menggunakan distribusi chi-square, di mana p-value kecil menunjukkan hubungan antar set variabel signifikan.
> summary(datagab)
GDP Income composition of resources Schooling
Min. : 5.00 Min. :1.146e+04 Min. : 2941
1st Qu.:63.00 1st Qu.:5.432e+07 1st Qu.: 293756
Median :94.00 Median :3.954e+08 Median : 2947314
Mean :77.94 Mean :1.085e+09 Mean :10609998
3rd Qu.:97.00 3rd Qu.:1.454e+09 3rd Qu.:24118979
Max. :99.00 Max. :5.472e+09 Max. :39871528
Life expectancy Adult Mortality BMI
Min. : 57.0 Min. : 1.0 Min. :0.000
1st Qu.:586.0 1st Qu.: 19.0 1st Qu.:0.010
Median :728.0 Median :123.0 Median :0.440
Mean :650.7 Mean :144.7 Mean :1.712
3rd Qu.:751.0 3rd Qu.:272.0 3rd Qu.:4.290
Max. :778.0 Max. :335.0 Max. :5.790
script menampilkan summary dari datagab yang berisi seluruh variabel X dan Y. Fungsi summary() memberikan ringkasan statistik deskriptif seperti mean, median, minimum, maksimum, dan kuartil, yang berguna untuk mengecek distribusi data dan memastikan bahwa data sudah siap untuk interpretasi lebih lanjut.
> cc_test <- cancor(kelX, kelY)
> cc_test
$cor
[1] 0.87111553 0.58475418 0.01083314
$xcoef
[,1] [,2] [,3]
Life expectancy -0.0004547799 4.256507e-05 -0.0008395488
Adult Mortality 0.0005865821 1.366267e-03 -0.0010408673
BMI -0.0154086903 8.128343e-02 0.0116569604
$ycoef
[,1] [,2] [,3]
GDP -5.223547e-03 -7.970020e-04 4.499956e-04
Income composition of resources 5.348695e-12 1.131448e-11 9.152698e-11
Schooling 1.007089e-09 -9.705938e-09 8.224051e-10
$xcenter
Life expectancy Adult Mortality BMI
650.693878 144.734694 1.712449
$ycenter
GDP Income composition of resources
7.793878e+01 1.085117e+09
Schooling
1.061000e+07
>
> # Hitung canonical scores dari fungsi comput
> cc_scores <- comput(kelX, kelY, cc_test)
>
> # Tampilkan canonical scores
> cat("\nCanonical scores X:\n")
Canonical scores X:
> print(head(cc_scores$x)) # X canonical scores
[,1] [,2] [,3]
[1,] 0.3619666 -0.00172897 0.3487747
[2,] 0.1238068 0.03193092 -0.1078713
[3,] 0.1220471 0.02783212 -0.1047487
[4,] 0.1262125 0.03312693 -0.1055539
[5,] 0.1293366 0.03709803 -0.1061579
[6,] 0.1335020 0.04239284 -0.1069632
> cat("\nCanonical scores Y:\n")
Canonical scores Y:
> print(head(cc_scores$y)) # Y canonical scores
[,1] [,2] [,3]
[1,] 0.39357456 -0.17874546 -0.10732275
[2,] 0.09126899 0.11034654 -0.06066792
[3,] 0.10210342 -0.19743224 -0.03129759
[4,] 0.04437678 0.06354581 -0.10986391
[5,] 0.03876604 0.07043246 -0.10425065
[6,] 0.04907315 0.07285990 -0.10598004
>
> # Tampilkan koefisien canonical
> cat("\nKoefisien canonical X:\n")
Koefisien canonical X:
> print(cc_test$xcoef)
[,1] [,2] [,3]
Life expectancy -0.0004547799 4.256507e-05 -0.0008395488
Adult Mortality 0.0005865821 1.366267e-03 -0.0010408673
BMI -0.0154086903 8.128343e-02 0.0116569604
> cat("\nKoefisien canonical Y:\n")
Koefisien canonical Y:
> print(cc_test$ycoef)
[,1] [,2] [,3]
GDP -5.223547e-03 -7.970020e-04 4.499956e-04
Income composition of resources 5.348695e-12 1.131448e-11 9.152698e-11
Schooling 1.007089e-09 -9.705938e-09 8.224051e-10
>
> # Tampilkan canonical correlations
> cat("\nCanonical correlations:\n")
Canonical correlations:
> print(cc_test$cor)
[1] 0.87111553 0.58475418 0.01083314
>
> for (i in 1:length(cc_test$cor)) {
+ cat("\nFungsi kanonik ke-", i, ":\n")
+ cat("U = ", paste(round(cc_test$xcoef[,i], 4), colnames(kelX), sep="*", collapse=" + "), "\n")
+ cat("V = ", paste(round(cc_test$ycoef[,i], 4), colnames(kelY), sep="*", collapse=" + "), "\n")
+ }
Fungsi kanonik ke- 1 :
U = -5e-04*Life expectancy + 6e-04*Adult Mortality + -0.0154*BMI
V = -0.0052*GDP + 0*Income composition of resources + 0*Schooling
Fungsi kanonik ke- 2 :
U = 0*Life expectancy + 0.0014*Adult Mortality + 0.0813*BMI
V = -8e-04*GDP + 0*Income composition of resources + 0*Schooling
Fungsi kanonik ke- 3 :
U = -8e-04*Life expectancy + -0.001*Adult Mortality + 0.0117*BMI
V = 4e-04*GDP + 0*Income composition of resources + 0*Schooling
Kode di atas digunakan untuk melakukan Canonical Correlation Analysis (CCA) antara himpunan variabel X dan Y. Fungsi cancor() menghitung koefisien kanonik serta nilai canonical correlations yang menunjukkan kekuatan hubungan linear antara kombinasi variabel X dan Y. Selanjutnya, fungsi comput() menghasilkan canonical scores, yaitu nilai kombinasi linier U dan V untuk setiap observasi, yang kemudian ditampilkan sebagian agar mudah diperiksa.
Koefisien kanonik untuk masing-masing variabel pada himpunan X dan Y juga ditampilkan, sehingga dapat diketahui variabel mana yang memberikan kontribusi terbesar dalam pembentukan fungsi kanonik. Nilai canonical correlations dicetak untuk melihat seberapa kuat hubungan antara fungsi kanonik yang terbentuk. Terakhir, dilakukan looping untuk menuliskan bentuk fungsi kanonik dalam persamaan eksplisit, sehingga hubungan antar variabel dapat lebih mudah dipahami dan diinterpretasikan.
> summary(datagab)
GDP Income composition of resources Schooling
Min. : 5.00 Min. :1.146e+04 Min. : 2941
1st Qu.:63.00 1st Qu.:5.432e+07 1st Qu.: 293756
Median :94.00 Median :3.954e+08 Median : 2947314
Mean :77.94 Mean :1.085e+09 Mean :10609998
3rd Qu.:97.00 3rd Qu.:1.454e+09 3rd Qu.:24118979
Max. :99.00 Max. :5.472e+09 Max. :39871528
Life expectancy Adult Mortality BMI
Min. : 57.0 Min. : 1.0 Min. :0.000
1st Qu.:586.0 1st Qu.: 19.0 1st Qu.:0.010
Median :728.0 Median :123.0 Median :0.440
Mean :650.7 Mean :144.7 Mean :1.712
3rd Qu.:751.0 3rd Qu.:272.0 3rd Qu.:4.290
Max. :778.0 Max. :335.0 Max. :5.790
> matcor(kelX, kelY)
$Xcor
Life expectancy Adult Mortality BMI
Life expectancy 1.0000000 -0.4699047 0.2941465
Adult Mortality -0.4699047 1.0000000 -0.6382994
BMI 0.2941465 -0.6382994 1.0000000
$Ycor
GDP Income composition of resources
GDP 1.00000000 -0.01042130
Income composition of resources -0.01042130 1.00000000
Schooling -0.05509554 0.03275625
Schooling
GDP -0.05509554
Income composition of resources 0.03275625
Schooling 1.00000000
$XYcor
Life expectancy Adult Mortality BMI
Life expectancy 1.00000000 -0.46990474 0.29414654
Adult Mortality -0.46990474 1.00000000 -0.63829944
BMI 0.29414654 -0.63829944 1.00000000
GDP 0.71576580 -0.75781254 0.56138446
Income composition of resources -0.06142472 0.06102370 -0.00629852
Schooling -0.07170387 -0.01209454 -0.44081320
GDP Income composition of resources
Life expectancy 0.71576580 -0.06142472
Adult Mortality -0.75781254 0.06102370
BMI 0.56138446 -0.00629852
GDP 1.00000000 -0.01042130
Income composition of resources -0.01042130 1.00000000
Schooling -0.05509554 0.03275625
Schooling
Life expectancy -0.07170387
Adult Mortality -0.01209454
BMI -0.44081320
GDP -0.05509554
Income composition of resources 0.03275625
Schooling 1.00000000
Berdasarkan matriks korelasi, korelasi terbesar antara himpunan variabel X dan Y terdapat pada Life Expectancy (X1) dengan GDP per capita (Y1) sebesar 0,716, menunjukkan bahwa negara dengan pendapatan per kapita lebih tinggi cenderung memiliki harapan hidup lebih tinggi. Korelasi negatif terbesar terjadi pada Adult Mortality (X2) dengan GDP per capita (Y1) sebesar -0,758, menandakan bahwa pendapatan per kapita yang tinggi berkaitan dengan angka kematian orang dewasa yang lebih rendah.
Hipotesis: H0 : ρi = 0 H1 : ρi ≠ 0
> print(cc1$xcoef) # koefisien X
[,1] [,2] [,3]
Life expectancy -0.003150808 -0.0002948995 -0.005816564
Adult Mortality 0.004063960 -0.0094657782 -0.007211340
BMI -0.106754538 -0.5631481482 0.080761791
> print(cc1$ycoef) # koefisien Y
[,1] [,2] [,3]
GDP -3.618980e-02 5.521792e-03 3.117661e-03
Income composition of resources 3.705684e-11 -7.838902e-11 6.341175e-10
Schooling 6.977317e-09 6.724471e-08 5.697790e-09
Berdasarkan hasil diatas, diperoleh fungsi kanonik sebagai berikut:
\[ U_1 = -0.0032X_1 + 0.0041X_2 - 0.1068X_3 \]
\[ U_2 = -0.00029X_1 - 0.00947X_2 - 0.5631X_3 \]
\[ U_3 = -0.00582X_1 - 0.00721X_2 + 0.0808X_3 \]
\[ V_1 = -0.0362Y_1 + 3.71 \times 10^{-11}Y_2 + 6.98 \times 10^{-9}Y_3 \]
\[ V_2 = 0.00552Y_1 - 7.84 \times 10^{-11}Y_2 + 6.72 \times 10^{-8}Y_3 \]
\[ V_3 = 0.00312Y_1 + 6.34 \times 10^{-10}Y_2 + 5.70 \times 10^{-9}Y_3 \]
U sebagai fungsi kanonik untuk variabel Kesehatan V sebagai fungsi kanonik untuk variabel Sosial-Ekonomi
> print(cc1$cor)
[1] 0.87111553 0.58475418 0.01083314
Berdasarkan hasil Canonical Correlation Analysis (CCA) yang diperoleh, terdapat korelasi kanonik, yaitu: \[ r_{U_1V_1} = 0.87111553 \]
\[ r_{U_2V_2} = 0.58475418 \]
\[ r_{U_3V_3} = 0.01083314 \] Berdasarkan hasil tersebut, terlihat bahwa korelasi kanonik terbesar terjadi pada fungsi kanonik pertama (U1–V1), yang menunjukkan bahwa kombinasi linear pertama dari variabel kesehatan (X) dan variabel sosial-ekonomi (Y) memiliki hubungan paling kuat di antara himpunan variabel yang dianalisis.
> cc_test <- cancor(kelX, kelY)
> cc_test
$cor
[1] 0.87111553 0.58475418 0.01083314
$xcoef
[,1] [,2] [,3]
Life expectancy -0.0004547799 4.256507e-05 -0.0008395488
Adult Mortality 0.0005865821 1.366267e-03 -0.0010408673
BMI -0.0154086903 8.128343e-02 0.0116569604
$ycoef
[,1] [,2] [,3]
GDP -5.223547e-03 -7.970020e-04 4.499956e-04
Income composition of resources 5.348695e-12 1.131448e-11 9.152698e-11
Schooling 1.007089e-09 -9.705938e-09 8.224051e-10
$xcenter
Life expectancy Adult Mortality BMI
650.693878 144.734694 1.712449
$ycenter
GDP Income composition of resources
7.793878e+01 1.085117e+09
Schooling
1.061000e+07
Berdasarkan hasil analisis korelasi kanonik antara himpunan variabel Kesehatan (Life Expectancy, Adult Mortality, BMI) dan himpunan variabel Kesejahteraan Ekonomi (GDP, Income Composition of Resources, Schooling), diperoleh tiga nilai korelasi kanonik. Nilai korelasi kanonik pertama sebesar 0,8711, korelasi kedua sebesar 0,5848, dan korelasi ketiga sebesar 0,0108. Dari ketiga korelasi tersebut, korelasi kanonik pertama memiliki nilai paling besar dan mampu menjelaskan 85,82% variasi hubungan antara kedua himpunan variabel. Korelasi kanonik kedua menyumbang 14,17%, sedangkan korelasi kanonik ketiga hanya menjelaskan 0,003% dan tidak memiliki makna statistik. Selanjutnya, berdasarkan hasil uji signifikansi menggunakan Rao’s F test dengan kriteria Wilks’ Lambda, diperoleh bahwa:
Fungsi kanonik pertama signifikan: \(p\text{-value} = 7.318 \times 10^{-14} < 0.05\)
Fungsi kanonik kedua signifikan: \(p\text{-value} = 0.0009325 < 0.05\)
Fungsi kanonik ketiga tidak signifikan: \(p\text{-value} = 0.942 > 0.05\)
Terdapat hubungan yang signifikan antara himpunan variabel Kesehatan (Life Expectancy, Adult Mortality, BMI) dengan himpunan variabel Kesejahteraan Ekonomi (GDP, Income Composition of Resources, Schooling). Hubungan yang signifikan ini ditunjukkan oleh dua korelasi kanonik pertama yang memiliki p-value < 0,05. Hal ini mengindikasikan bahwa tingkat kesehatan penduduk memiliki keterkaitan yang kuat dengan kondisi ekonomi, pendapatan, dan tingkat pendidikan suatu wilayah. Fungsi kanonik ketiga tidak signifikan, sehingga tidak memberikan informasi tambahan dalam menjelaskan hubungan kedua himpunan variabel.
> print(result)
Bartlett db p_value
B1 81.91379 9 6.727952e-14
B2 18.62126 4 9.326738e-04
Berdasarkan output uji Bartlett yang diperoleh, nilai statistik Bartlett untuk fungsi kanonik pertama adalah 81,91379 dengan derajat bebas 9 dan p-value sebesar 6,727952 × 10⁻¹⁴. Sementara itu, untuk fungsi kanonik kedua nilai statistik Bartlett adalah 18,62126 dengan derajat bebas 4 dan p-value sebesar 9,326738 × 10⁻⁴.
Karena kedua p-value tersebut lebih kecil daripada tingkat signifikansi α = 0,05, maka keputusan pengujian adalah menolak H0 pada kedua fungsi kanonik.
Dapat disimpulkan bahwa baik fungsi kanonik pertama maupun kedua memiliki korelasi kanonik yang signifikan, sehingga keduanya berkontribusi dalam menjelaskan hubungan antara himpunan variabel X dan Y.
> cc1 <- cc(kelX, kelY)
> cc1
$cor
[1] 0.87111553 0.58475418 0.01083314
$names
$names$Xnames
[1] "Life expectancy" "Adult Mortality" "BMI"
$names$Ynames
[1] "GDP" "Income composition of resources"
[3] "Schooling"
$names$ind.names
NULL
$xcoef
[,1] [,2] [,3]
Life expectancy -0.003150808 -0.0002948995 -0.005816564
Adult Mortality 0.004063960 -0.0094657782 -0.007211340
BMI -0.106754538 -0.5631481482 0.080761791
$ycoef
[,1] [,2] [,3]
GDP -3.618980e-02 5.521792e-03 3.117661e-03
Income composition of resources 3.705684e-11 -7.838902e-11 6.341175e-10
Schooling 6.977317e-09 6.724471e-08 5.697790e-09
$scores
$scores$xscores
[,1] [,2] [,3]
[1,] 2.50777830 0.01197866 2.41638203
[2,] 0.85775875 -0.22122389 -0.74735410
[3,] 0.84556687 -0.19282656 -0.72572008
[4,] 0.87442594 -0.22951007 -0.73129919
[5,] 0.89607024 -0.25702271 -0.73548351
[6,] 0.92492931 -0.29370622 -0.74106261
[7,] 0.93935885 -0.31204798 -0.74385217
[8,] 0.97736155 -0.37863112 -0.75642215
[9,] 1.02984562 -0.44695646 -0.78002110
[10,] 1.03507969 -0.45199815 -0.76758035
[11,] 1.01989140 -0.40850355 -0.73954261
[12,] 2.65383601 -0.27526698 2.24738196
[13,] 1.05611963 -0.43896579 -0.73429620
[14,] -0.11480261 2.32651594 1.40049789
[15,] 1.18557409 -0.63361854 -0.80430244
[16,] 1.22164793 -0.67947293 -0.81127632
[17,] -0.99683922 -0.99410260 0.00281145
[18,] -1.24600024 -0.31779320 0.48894102
[19,] -0.95437551 -1.17709469 -0.02148068
[20,] -0.97736189 -1.40913784 0.01223582
[21,] -0.98433509 -1.55670877 0.03383804
[22,] -0.94993207 -1.53324318 0.02820172
[23,] -1.00122608 -1.82015383 0.07520680
[24,] -1.32256019 -0.86450793 0.75622279
[25,] -1.30575072 -0.92510911 0.66120983
[26,] -0.85760688 -1.61996586 0.08926514
[27,] -1.16091067 -0.73830397 0.72361938
[28,] 0.99923966 -0.21286022 4.50969005
[29,] -1.03378669 -0.27469812 0.67243855
[30,] -1.00195007 0.06758768 0.61976315
[31,] -1.07097881 -0.21666828 0.65152093
[32,] -0.98867744 0.14693546 0.68367113
[33,] -0.65996837 2.12348447 0.15589533
[34,] -0.68724598 2.19416902 0.22602679
[35,] -0.32914759 0.94558328 -0.45450584
[36,] -0.33266011 0.86349804 -0.43958502
[37,] -0.30349116 0.89200532 -0.45766209
[38,] -0.27325466 0.92614408 -0.47654678
[39,] -0.25288413 0.86100826 -0.48390436
[40,] -0.22696964 0.85602155 -0.49131916
[41,] -0.20319025 0.83977188 -0.49711872
[42,] -0.16985478 0.85760599 -0.50194742
[43,] -0.15279054 0.74237664 -0.49040331
[44,] -0.62435107 1.92712838 0.42024146
[45,] -0.05726052 0.74136135 -0.50563982
[46,] -0.06030876 0.73985907 -0.49099668
[47,] -0.04012906 0.81365813 -0.48986259
[48,] -0.03911334 0.80269006 -0.48243079
[49,] 1.35523029 -0.79928475 -0.77344515
$scores$yscores
[,1] [,2] [,3]
[1,] 2.7267645 1.2383849 -0.74355380
[2,] 0.6323301 -0.7645033 -0.42031969
[3,] 0.7073932 1.3678507 -0.21683609
[4,] 0.3074514 -0.4402583 -0.76115952
[5,] 0.2685790 -0.4879704 -0.72226968
[6,] 0.3399887 -0.5047882 -0.73425127
[7,] 0.5936087 -1.0413054 2.03398820
[8,] 0.5476010 -0.8145063 1.59109824
[9,] 0.6258096 1.0499536 -0.40894324
[10,] 0.6264166 -0.5665196 -0.77867050
[11,] 0.6185118 -0.7409950 -0.64884440
[12,] 2.7748917 0.4189333 0.55109483
[13,] 1.3127092 -0.8291309 0.40993896
[14,] 1.5575724 0.6165789 -0.74214771
[15,] 1.4608385 -0.6669461 -0.85806101
[16,] 1.8398430 -0.9064910 -0.91502723
[17,] -0.8615872 -0.5411645 -0.43197467
[18,] -0.6686728 -0.8568928 2.21721690
[19,] -0.8580616 -0.5272423 -0.40128833
[20,] -0.8606809 -0.5452081 -0.41351827
[21,] -0.8579393 -0.5270416 -0.39983246
[22,] -0.8560897 -0.5312718 -0.36774221
[23,] -0.6673688 -0.6432740 1.93952519
[24,] -0.8396636 -0.3482163 -0.38863896
[25,] -0.8748887 -0.5129576 -0.65968724
[26,] -0.7831692 -0.3219474 -0.67184536
[27,] -0.7915447 -0.5240887 -0.51033481
[28,] -0.7484197 -0.6850801 0.84826246
[29,] -0.7946636 -0.5151844 -0.56690356
[30,] -0.7863601 -0.6313446 0.23579903
[31,] -0.7988924 -0.5311224 -0.60476721
[32,] -0.7602195 -0.6127042 0.05669119
[33,] -0.4381716 2.1145566 -0.20610902
[34,] -0.4585736 2.0955375 -0.46902090
[35,] -0.2614122 1.6149348 2.99289743
[36,] -0.4489522 1.9482859 -0.12843670
[37,] -0.4727678 1.9374658 -0.45111739
[38,] -0.3142790 1.5446424 2.34075322
[39,] -0.6564105 -0.3315571 -0.43293499
[40,] -0.5804327 -0.3551212 -0.37079096
[41,] -0.5856172 -0.8403600 1.80021032
[42,] -0.4947195 1.7344738 -0.48092514
[43,] -0.2449367 1.6631826 -0.50777222
[44,] -0.3821034 -0.3651523 -0.68822573
[45,] -0.4184425 -0.3625689 -0.68315044
[46,] -0.3770750 -0.3826489 -0.59266915
[47,] -0.2299011 1.4212409 0.56478078
[48,] -0.3777050 -0.3879733 -0.59421976
[49,] 2.6094122 -1.1224844 1.38973284
$scores$corr.X.xscores
[,1] [,2] [,3]
Life expectancy -0.8231645 0.07533576 -0.5627830
Adult Mortality 0.8608422 -0.22840167 -0.4547345
BMI -0.6883282 -0.60286715 0.4034297
$scores$corr.Y.xscores
[,1] [,2] [,3]
GDP -0.86485258 0.05676864 0.0007585294
Income composition of resources 0.06236266 -0.05355521 0.0107596920
Schooling 0.13877082 0.57356347 0.0012127036
$scores$corr.X.yscores
[,1] [,2] [,3]
Life expectancy -0.7170714 0.0440529 -0.006096704
Adult Mortality 0.7498930 -0.1335588 -0.004926200
BMI -0.5996134 -0.3525291 0.004370408
$scores$corr.Y.yscores
[,1] [,2] [,3]
GDP -0.99281042 0.09708121 0.07001938
Income composition of resources 0.07158942 -0.09158585 0.99322051
Schooling 0.15930242 0.98086253 0.11194392
Berdasarkan hasil loading antara variabel pada himpunan X (Life expectancy, Adult Mortality, dan BMI) dan himpunan Y (GDP, Income Composition of Resources, dan Schooling), terlihat bahwa fungsi kanonik pertama adalah yang paling penting dalam menjelaskan hubungan antara kedua kelompok variabel. Pada himpunan X, Adult Mortality memiliki loading terbesar (0,8608), sehingga menjadi variabel yang paling berpengaruh dalam fungsi kanonik pertama. Sementara itu, Life expectancy juga memiliki kontribusi besar namun arahnya berlawanan (–0,8232). Hal ini menunjukkan bahwa ketika mortalitas dewasa meningkat, harapan hidup cenderung menurun, dan keduanya sama-sama berperan kuat dalam membentuk fungsi kanonik pertama. Variabel BMI berpengaruh, tetapi tidak sekuat dua variabel sebelumnya.
Pada himpunan Y, variabel yang paling dominan adalah GDP, dengan loading sangat tinggi yaitu –0,9928. Artinya, fungsi kanonik pertama pada sisi Y terutama merefleksikan kondisi ekonomi negara. Dua variabel lainnya (Income Composition dan Schooling) tetap memberi kontribusi, tetapi jauh lebih kecil.
Secara keseluruhan, fungsi kanonik pertama menggambarkan hubungan utama antara kondisi kesehatan dan kesejahteraan ekonomi. Tingkat mortalitas dewasa yang tinggi cenderung berkaitan dengan GDP yang lebih rendah, sedangkan negara dengan ekonomi lebih kuat biasanya menunjukkan kondisi kesehatan masyarakat yang lebih baik. Fungsi kanonik kedua dan ketiga tidak memberikan kontribusi berarti sehingga tidak menjadi fokus interpretasi.
> cc1 <- cc(kelX, kelY)
> cc1
$cor
[1] 0.87111553 0.58475418 0.01083314
$names
$names$Xnames
[1] "Life expectancy" "Adult Mortality" "BMI"
$names$Ynames
[1] "GDP" "Income composition of resources"
[3] "Schooling"
$names$ind.names
NULL
$xcoef
[,1] [,2] [,3]
Life expectancy -0.003150808 -0.0002948995 -0.005816564
Adult Mortality 0.004063960 -0.0094657782 -0.007211340
BMI -0.106754538 -0.5631481482 0.080761791
$ycoef
[,1] [,2] [,3]
GDP -3.618980e-02 5.521792e-03 3.117661e-03
Income composition of resources 3.705684e-11 -7.838902e-11 6.341175e-10
Schooling 6.977317e-09 6.724471e-08 5.697790e-09
$scores
$scores$xscores
[,1] [,2] [,3]
[1,] 2.50777830 0.01197866 2.41638203
[2,] 0.85775875 -0.22122389 -0.74735410
[3,] 0.84556687 -0.19282656 -0.72572008
[4,] 0.87442594 -0.22951007 -0.73129919
[5,] 0.89607024 -0.25702271 -0.73548351
[6,] 0.92492931 -0.29370622 -0.74106261
[7,] 0.93935885 -0.31204798 -0.74385217
[8,] 0.97736155 -0.37863112 -0.75642215
[9,] 1.02984562 -0.44695646 -0.78002110
[10,] 1.03507969 -0.45199815 -0.76758035
[11,] 1.01989140 -0.40850355 -0.73954261
[12,] 2.65383601 -0.27526698 2.24738196
[13,] 1.05611963 -0.43896579 -0.73429620
[14,] -0.11480261 2.32651594 1.40049789
[15,] 1.18557409 -0.63361854 -0.80430244
[16,] 1.22164793 -0.67947293 -0.81127632
[17,] -0.99683922 -0.99410260 0.00281145
[18,] -1.24600024 -0.31779320 0.48894102
[19,] -0.95437551 -1.17709469 -0.02148068
[20,] -0.97736189 -1.40913784 0.01223582
[21,] -0.98433509 -1.55670877 0.03383804
[22,] -0.94993207 -1.53324318 0.02820172
[23,] -1.00122608 -1.82015383 0.07520680
[24,] -1.32256019 -0.86450793 0.75622279
[25,] -1.30575072 -0.92510911 0.66120983
[26,] -0.85760688 -1.61996586 0.08926514
[27,] -1.16091067 -0.73830397 0.72361938
[28,] 0.99923966 -0.21286022 4.50969005
[29,] -1.03378669 -0.27469812 0.67243855
[30,] -1.00195007 0.06758768 0.61976315
[31,] -1.07097881 -0.21666828 0.65152093
[32,] -0.98867744 0.14693546 0.68367113
[33,] -0.65996837 2.12348447 0.15589533
[34,] -0.68724598 2.19416902 0.22602679
[35,] -0.32914759 0.94558328 -0.45450584
[36,] -0.33266011 0.86349804 -0.43958502
[37,] -0.30349116 0.89200532 -0.45766209
[38,] -0.27325466 0.92614408 -0.47654678
[39,] -0.25288413 0.86100826 -0.48390436
[40,] -0.22696964 0.85602155 -0.49131916
[41,] -0.20319025 0.83977188 -0.49711872
[42,] -0.16985478 0.85760599 -0.50194742
[43,] -0.15279054 0.74237664 -0.49040331
[44,] -0.62435107 1.92712838 0.42024146
[45,] -0.05726052 0.74136135 -0.50563982
[46,] -0.06030876 0.73985907 -0.49099668
[47,] -0.04012906 0.81365813 -0.48986259
[48,] -0.03911334 0.80269006 -0.48243079
[49,] 1.35523029 -0.79928475 -0.77344515
$scores$yscores
[,1] [,2] [,3]
[1,] 2.7267645 1.2383849 -0.74355380
[2,] 0.6323301 -0.7645033 -0.42031969
[3,] 0.7073932 1.3678507 -0.21683609
[4,] 0.3074514 -0.4402583 -0.76115952
[5,] 0.2685790 -0.4879704 -0.72226968
[6,] 0.3399887 -0.5047882 -0.73425127
[7,] 0.5936087 -1.0413054 2.03398820
[8,] 0.5476010 -0.8145063 1.59109824
[9,] 0.6258096 1.0499536 -0.40894324
[10,] 0.6264166 -0.5665196 -0.77867050
[11,] 0.6185118 -0.7409950 -0.64884440
[12,] 2.7748917 0.4189333 0.55109483
[13,] 1.3127092 -0.8291309 0.40993896
[14,] 1.5575724 0.6165789 -0.74214771
[15,] 1.4608385 -0.6669461 -0.85806101
[16,] 1.8398430 -0.9064910 -0.91502723
[17,] -0.8615872 -0.5411645 -0.43197467
[18,] -0.6686728 -0.8568928 2.21721690
[19,] -0.8580616 -0.5272423 -0.40128833
[20,] -0.8606809 -0.5452081 -0.41351827
[21,] -0.8579393 -0.5270416 -0.39983246
[22,] -0.8560897 -0.5312718 -0.36774221
[23,] -0.6673688 -0.6432740 1.93952519
[24,] -0.8396636 -0.3482163 -0.38863896
[25,] -0.8748887 -0.5129576 -0.65968724
[26,] -0.7831692 -0.3219474 -0.67184536
[27,] -0.7915447 -0.5240887 -0.51033481
[28,] -0.7484197 -0.6850801 0.84826246
[29,] -0.7946636 -0.5151844 -0.56690356
[30,] -0.7863601 -0.6313446 0.23579903
[31,] -0.7988924 -0.5311224 -0.60476721
[32,] -0.7602195 -0.6127042 0.05669119
[33,] -0.4381716 2.1145566 -0.20610902
[34,] -0.4585736 2.0955375 -0.46902090
[35,] -0.2614122 1.6149348 2.99289743
[36,] -0.4489522 1.9482859 -0.12843670
[37,] -0.4727678 1.9374658 -0.45111739
[38,] -0.3142790 1.5446424 2.34075322
[39,] -0.6564105 -0.3315571 -0.43293499
[40,] -0.5804327 -0.3551212 -0.37079096
[41,] -0.5856172 -0.8403600 1.80021032
[42,] -0.4947195 1.7344738 -0.48092514
[43,] -0.2449367 1.6631826 -0.50777222
[44,] -0.3821034 -0.3651523 -0.68822573
[45,] -0.4184425 -0.3625689 -0.68315044
[46,] -0.3770750 -0.3826489 -0.59266915
[47,] -0.2299011 1.4212409 0.56478078
[48,] -0.3777050 -0.3879733 -0.59421976
[49,] 2.6094122 -1.1224844 1.38973284
$scores$corr.X.xscores
[,1] [,2] [,3]
Life expectancy -0.8231645 0.07533576 -0.5627830
Adult Mortality 0.8608422 -0.22840167 -0.4547345
BMI -0.6883282 -0.60286715 0.4034297
$scores$corr.Y.xscores
[,1] [,2] [,3]
GDP -0.86485258 0.05676864 0.0007585294
Income composition of resources 0.06236266 -0.05355521 0.0107596920
Schooling 0.13877082 0.57356347 0.0012127036
$scores$corr.X.yscores
[,1] [,2] [,3]
Life expectancy -0.7170714 0.0440529 -0.006096704
Adult Mortality 0.7498930 -0.1335588 -0.004926200
BMI -0.5996134 -0.3525291 0.004370408
$scores$corr.Y.yscores
[,1] [,2] [,3]
GDP -0.99281042 0.09708121 0.07001938
Income composition of resources 0.07158942 -0.09158585 0.99322051
Schooling 0.15930242 0.98086253 0.11194392
Korelasi antar himpunan (cross-loading) menunjukkan bagaimana variabel kesehatan (X) dan kesejahteraan ekonomi–sosial (Y) saling berkaitan melalui fungsi kanonik. Hasil analisis memperlihatkan bahwa fungsi kanonik pertama menjadi penghubung paling kuat antara kedua kelompok variabel.
Pada himpunan Y, GDP memiliki korelasi terbesar terhadap fungsi pertama pada X (–0,8649), sehingga variasi kondisi ekonomi terutama mempengaruhi hubungan kanonik ini. Schooling terlihat lebih dominan pada fungsi kedua, sedangkan Income Composition of Resources memberikan pengaruh relatif kecil di semua fungsi. Di sisi variabel X, Adult Mortality muncul sebagai variabel dengan korelasi terbesar terhadap fungsi pertama pada Y (0,7499), diikuti oleh Life Expectancy yang juga kuat namun berlawanan arah (–0,7171). BMI tetap berperan, tetapi kontribusinya tidak sebesar dua variabel lainnya.
Secara keseluruhan, fungsi kanonik pertama menggambarkan hubungan terkuat antara kondisi ekonomi khususnya GDP dengan indikator kesehatan masyarakat seperti mortalitas dewasa dan harapan hidup. Pola korelasi yang berlawanan menunjukkan bahwa ekonomi yang lebih baik cenderung berkaitan dengan tingkat kematian yang lebih rendah dan kesehatan populasi yang lebih baik. Fungsi kanonik lainnya memiliki pengaruh jauh lebih kecil.
Dengan demikian, cross-loading ini menegaskan bahwa keterkaitan paling signifikan antara kedua himpunan variabel terutama didorong oleh peran GDP serta indikator kesehatan utama.
> cc1 <- cancor(kelX, kelY)
> canR2 <- cc1$cor^2
> # 10. Redundancy Indices
>
> # Korelasi X dan Y asli dengan canonical scores
> corrX_Xscores <- cor(kelX, X_scores)
> corrY_Yscores <- cor(kelY, Y_scores)
>
> # R² untuk setiap canonical variabel
> R2_X <- corrX_Xscores^2
> R2_Y <- corrY_Yscores^2
>
> # Redundancy X|Y
> Redundancy_X <- colMeans(R2_X) * canR2
> Redundancy_X_total <- sum(Redundancy_X)
>
> # Redundancy Y|X
> Redundancy_Y <- colMeans(R2_Y) * canR2
> Redundancy_Y_total <- sum(Redundancy_Y)
>
> Redundancy_X
CanX1 CanX2 CanX3
0.4786890286 0.0480184599 0.0000268459
> Redundancy_X_total
[1] 0.5267343
> Redundancy_Y
CanY1 CanY2 CanY3
2.570388e-01 1.116886e-01 3.927233e-05
> Redundancy_Y_total
[1] 0.3687667
Berdasarkan hasil perhitungan redundancy index, dapat disimpulkan bahwa fungsi kanonik pertama merupakan fungsi yang paling berperan dalam menjelaskan keragaman pada kedua himpunan variabel.
Untuk himpunan X (kesehatan), fungsi kanonik pertama mampu menjelaskan 47,87% keragaman variabel aslinya. Jika digabungkan dengan fungsi kedua dan ketiga, total keragaman yang dapat dijelaskan meningkat menjadi 52,67%, namun tambahan kontribusinya relatif kecil. Ini menunjukkan bahwa sebagian besar informasi pada himpunan X ditangkap oleh fungsi kanonik pertama.
Sementara itu, pada himpunan Y (kesejahteraan ekonomi–sosial), fungsi kanonik pertama mampu menjelaskan 25,70% keragaman variabel aslinya. Jika digabungkan dengan fungsi kanonik kedua dan ketiga, total keragaman yang dapat dijelaskan menjadi 36,88%. Seperti pada himpunan X, fungsi pertama tetap menjadi penjelas utama keragaman pada himpunan Y, sedangkan fungsi kedua hanya menambah kontribusi moderat.
Secara keseluruhan, hasil ini menunjukkan bahwa hubungan antara kedua himpunan variabel terutama tercermin melalui fungsi kanonik pertama, sedangkan fungsi kedua dan ketiga memberikan tambahan informasi yang jauh lebih kecil.
Berdasarkan hasil analisis dan pembahasan yang telah dilakukan terkait Penerapan Analisis Korelasi Kanonik untuk Mengukur Keterkaitan Variabel Sosial-Ekonomi dan Variabel Kesehatan pada Dataset Life Expectancy WHO, diperoleh beberapa kesimpulan sebagai berikut:
\[ V_1 = -0.0362Y_1 + 3.71 \times 10^{-11}Y_2 + 6.98 \times 10^{-9}Y_3 \]
Variabel Kesehatan yang memiliki hubungan terkuat dengan fungsi kanonik (melalui korelasi dengan CanX1) adalah Adult Mortality (X2) dengan korelasi sebesar 0,8608 (hubungan kuat dan positif).
Variabel Sosial-Ekonomi yang paling berkaitan dengan fungsi kanonik (melalui korelasi dengan CanY1) adalah GDP (Y1) dengan nilai korelasi sebesar –0,9928, menunjukkan hubungan sangat kuat secara negatif.
Hasil analisis redundancy menunjukkan bahwa:
\[ \text{Redundancy } Y_1 = 0.2570 \] Secara keseluruhan, hasil analisis menunjukkan bahwa faktor sosial-ekonomi memiliki keterkaitan yang kuat dengan indikator kesehatan, terutama melalui pengaruh GDP dan Adult Mortality. Temuan ini menegaskan bahwa kondisi kesehatan masyarakat sangat erat hubungannya dengan tingkat kesejahteraan ekonomi dalam data Life Expectancy WHO.
Hair, J.F., Black, W.C., Babin, B.J., Anderson, R.E., & Tatham, R.L. (2014). Multivariate Data Analysis (7th ed.). Pearson.
Kumar, A. (2020). Life Expectancy Data Dataset. Kaggle. Retrieved from https://www.kaggle.com/datasets/kumarajarshi/life-expectancy-who
Rencher, A.C. (2002). Methods of Multivariate Analysis (2nd ed.). John Wiley & Sons.
Thompson, B. (2005). Canonical Correlation Analysis: Uses and Interpretation. SAGE Publications.
World Health Organization. (2021). Life Expectancy and Healthy Life Expectancy Data. Retrieved from https://www.who.int/data/gho/data/themes/mortality-and-global-health-estimates/ghe-life-expectancy-and-healthy-life-expectancy