Penerapan Analisis Korelasi Kanonik pada Pengaruh Kelompok Kondisi Demografi dengan Kelompok Konsumsi dan Pengeluaran setiap Provinsi di Indonesia Tahun 2024

PENDAHULUAN

Latar Belakang

Korelasi adalah teknik analisis yang tergolong dalam pengukuran asosiasi (measures of association). Istilah ini merujuk pada serangkaian metode statistik yang berfungsi untuk menentukan kekuatan hubungan linier antara dua atau lebih variabel. Salah satu aspek analisis asosiasi adalah untuk memutuskan apakah data sampel yang teramati menyediakan bukti yang cukup untuk menyimpulkan bahwa variabel-variabel dalam populasi asal sampel saling berkaitan atau berhubungan. 

Dalam konteks penelitian statistika multivariat, peneliti tidak selalu hanya berfokus pada pembentukan model regresi linier sederhana (satu variabel dependen dan satu variabel independen). Sebaliknya, perhatian seringkali beralih ke hubungan dan keterikatan linier antara dua kelompok variabel sekaligus. Untuk mengatasi masalah penelitian yang kompleks ini, solusi yang paling tepat adalah dengan menggunakan analisis korelasi kanonik.

Analisis kanonik adalah teknik statistik multivariat yang dirancang secara spesifik untuk mengidentifikasi dan mengukur hubungan antara dua set variabel multivariat. Tujuan utama korelasi kanonik ini adalah mencari kombinasi linier dari variabel-variabel dalam setiap himpunan dimana pasangan kombinasi liniernya disebut fungsi kanonik, dan korelasinya disebut koefisien korelasi kanonik.

Penerapan analisis korelasi kanonik telah meningkat sejalan dengan software statistik yang telah banyak tersedia. Analisis korelasi kanonik diterapkan di berbagai disiplin ilmu, salah satunya di bidang demografi dan ekonomi. Pada studi penelitian ini, analisis korelasi kanonik digunakan untuk mengidentifikasi dan mengukur tingkat keeratan hubungan linier antara himpunan variabel \(\mathbf{X}\) yang mewakili kondisi demografi setiap provinsi di Indonesia, dimana \(X_1\) = Persentase laju pertumbuhan, \(X_2\) = Jumlah Penduduk, dan \(X_3\) = Kepadatan Penduduk (per km persegi), dengan himpunan variabel \(\mathbf{Y}\) yang mewakili konsumsi dan pengeluaran per provinsi di Indonesia, dimana \(Y_1\)= Pengeluaran perkapita setiap orang, \(Y_2\) = Garis Kemiskinan Makanan, dan \(Y_3\) = Gini Ratio (tingkat ketimpangan distribusi pendapatan atau kekayaan).

Tinjauan Pustaka

Pengertian Analisis Korelas Kanonkik

Analisis korelasi kanonik (Canonical Correlation Analysis) atau CCA merupakan metode statistik multivariat yang bertujuan untuk mengukur dan menganalisis hubungan antara dua himpunan variabel secara simultan. Berbeda dengan korelasi sederhana yang hanya melibatkan dua variabel, korelasi kanonik mengidentifikasi pasangan kombinasi linier dari masing-masing himpunan variabel yang memiliki korelasi paling kuat. Kombinasi linier tersebut disebut variabel kanonik (canonical variates).

Konsep dasar CCA diperkenalkan oleh Harold Hotelling (1936) sebagai perluasan dari analisis korelasi ke dalam konteks multivariat. Pendekatan ini memungkinkan peneliti untuk memahami hubungan struktural yang lebih kompleks antar kelompok variabel, sehingga banyak digunakan dalam bidang psikologi, ekonomi, pendidikan, ilmu sosial, dan biologi.

Misalkan terdapat dua himpunan variabel:

\[\mathbf{X} = (X_1, X_2, \ldots, X_p)\]

\[\mathbf{Y} = (Y_1, Y_2, \ldots, Y_q)\]

Maka tujuan CCA adalah mencari kombinasi linier di antara kedua himpunan variabel, sehingga korelasi antara \(U\) dan \(V\) maksimum. Korelasi maksimum ini disebut korelasi kanonik.

\[U=a_1X_1+a_2X_2+...+a_pX_p = a'X\]

\[V=b_1Y_1+b_2Y_2+...+b_qY_q = b'Y\]

Asumsi pada Analisis Korelasi Kanonik

Analisis Korelasi Kanonik (CCA) merupakan metode multivariat yang memiliki beberapa asumsi dasar agar hasil interpretasi dan pengujian signifikansinya valid. Beberapa asumsi tersebut dijelaskan sebagai berikut.

Asumsi Linearitas

CCA mengasumsikan bahwa hubungan antara peubah-peubah dalam himpunan \(\mathbf{X}\) dan set \(\mathbf{Y}\) bersifat linier. Artinya:

  1. Variabel-variabel dalam masing-masing set dapat dikombinasikan secara linier.
  2. Hubungan antara kombinasi linier tersebut (variabel kanonik) juga harus linier.
  3. Jika terdapat hubungan non-linier, maka korelasi kanonik yang dihasilkan bisa bias atau justru melemah.

Normalitas Multivariat

CCA juga mengasumsikan bahwa variabel dalam masing-masing himpunan mengikuti distribusi normal multivariat. Asumsi ini diperlukan terutama untuk:

  1. Uji signifikansi korelasi kanonik (misalnya Wilks’ Lambda)
  2. Perhitungan confidence interval
  3. Inferensi statistik secara umum

Korelasi kanonik merupakan fungsi dari kovarians antar variabel. Estimasi kovarians akan lebih stabil dan uji statistik lebih akurat bila data berdistribusi normal multivariat.

Tidak Ada Multikolinieritas

Multikolinieritas berarti dua atau lebih variabel dalam satu himpunan, misalnya himpunan \(\mathbf{X}\) atau himpunan \(\mathbf{Y}\) saling berkorelasi sangat tinggi. CCA membentuk kombinasi linier menggunakan invers matriks kovarians \(\Sigma_{XX}^{-1}\) atau \(\Sigma_{YY}^{-1}\). Jika variabel sangat berkorelasi, matriks tersebut menjadi singular atau hampir tidak dapat diinvers. Hal ini dapat menyebabkan solusi fungsi kanonik tidak stabil, bobot kanonik menjadi sangat besar atau tidak masuk akal, dan variabel kanonik sulit diinterpretasikan.

Data

Data yang digunakan adalah data yang terdiri dari dua himpunan yaitu himpunan \(\mathbf{X}\) yang mewakili kondisi demografi setiap provinsi di Indonesia tahun 2024 dan himpunan \(\mathbf{Y}\) yang mewakili konsumsi dan pengeluaran setiap provinsi di Indonesia tahun 2024.

Dimana:

\(X_1\) = Persentase laju pertumbuhan

\(X_2\) = Jumlah Penduduk

\(X_3\) = Kepadatan Penduduk (per km persegi)

\(Y_1\) = Pengeluaran perkapita setiap orang

\(Y_2\) = Garis Kemiskinan Makanan

\(Y_3\) = Gini Ratio (tingkat ketimpangan distribusi pendapatan atau kekayaan)

Data diperoleh dari website BPS.

> library(readxl)
> Data <- read_excel("C:/Users/user/OneDrive/Documents/Data Praktikum 2 Anmul.xlsx", sheet = "Sheet3")
> head(Data)
# A tibble: 6 × 7
  Provinsi            X1     X2    X3    Y1    Y2    Y3
  <chr>            <dbl>  <dbl> <dbl> <dbl> <dbl> <dbl>
1 Aceh              1.39  5555.    98  9.95  14.4  81.6
2 Sumatera Utara    1.4  15588.   215 10.2   13.5  78.6
3 Sumatera Barat    1.43  5836.   139  9.72  14.3  84.4
4 Riau              1.37  6728.    75  9.69  13.4  78.5
5 Jambi             1.3   3724.    76  9.26  13.1  72.0
6 Sumatera Selatan  1.15  8837.   102  8.98  12.6  70.8

Rumusan Masalah

Berdasarkan latar belakang yang telah dijelaskan sebelumnya, permasalahan dalam analisis ini dirumuskan sebagai berikut.

  1. Apakah terdapat hubungan antara kelompok kondisi demografi dengan kelompok konsumsi dan pengeluraran di setiap provinsi di Indonesia?

  2. Pada fungsi kanonik mana yang memberikan hubungan paling kuat dan signifikan antara kedua himpunan variabel?

  3. Variabel apa dari masing-masing himpunan yang memberikan kontribusi paling besar dalam membentuk hubungan pada fungsi kanonik?

  4. Bagaimana arah hubungan antar variabel pada fungsi kanonik ditinjau dari bobot, muatan, dan muatan silang kanonik?

  5. Bagaimana proporsi keragaman variabel yang dapat dijelaskan oleh fungsi kanonik berdasarkan analisis redudansi?

Tujuan Analisis

Berdasarkan rumusan masalah yang telah diuraikan, tujuan yang ingin dicapai dalam analisis ini sebagai berikut.

  1. Mengetahui hubungan antarakelompok kondisi demografi dengan kelompok konsumsi dan pengeluraran di setiap provinsi di Indonesia berdasarkan analisis korelasi kanonik.

  2. Mengetahui fungsi kanonik mana yang memberikan hubungan paling kuat dan signifikan antara kedua himpunan variabel.

  3. Mengetahui variabel apa dari masing-masing himpunan yang memberikan kontribusi paling besar dalam membentuk hubungan pada fungsi kanonik.

  4. Mengetahui arah hubungan antar variabel pada fungsi kanonik ditinjau dari bobot, muatan, dan muatan silang kanonik.

  5. Memperoleh proporsi keragaman variabel yang dapat dijelaskan oleh fungsi kanonik berdasarkan analisis redundansi.

SOURCE CODE

Library

> library(candisc)
> library(readxl)
> library(car)
> library(dplyr)
> library(CCA)
> library(rmarkdown)

Input Data

> data1 <- read_excel("C:/Users/user/OneDrive/Documents/Data Praktikum 2 Anmul.xlsx", sheet = "X")
> data2 <- read_excel("C:/Users/user/OneDrive/Documents/Data Praktikum 2 Anmul.xlsx", sheet = "Y")
> cc <- cancor(data1, data2) 
> cc1=cc(data1, data2) 
> cc2=comput(data1, data2, cc1) 

Uji Asumsi Analisis Korelasi Kanonik

> dataCCA <- cbind(data2, data1) 
> dataCCA2 <- data.frame(dataCCA)
> model <- lm(Y1 + Y2 + Y3 ~ X1 + X2 + X3, data = dataCCA2)
> Vif <- vif(model)
> Vif

Mendefinisikan n, p, q, dan k

> n=38 
> p=3  
> q=3  
> k=(n-1)-0.5*(p+q+1)
> a=1-0.58623
> b=1-0.20027
> c=1-0.02512

Statistik Uji Sekuensial Bartlett

> B1=-k*log(a*b*c)
> B2=-k*log(b*c)
> B3=-k*log(c)
> db1=p*q
> db2=(p-1)*(q-1)
> db3=(p-2)*(q-2)
> pv1=1-pchisq(B1, db1)
> pv2=1-pchisq(B2, db2)
> pv3=1-pchisq(B3, db3)
> B=rbind(B1,B2,B3)
> d=rbind(db1, db2, db3)
> pv=rbind(pv1,pv2,pv3)

Menampilkan Hasil

> result <- cbind(B , d,  pv)
> colnames(result) <- c("Bartlett", "db", "p-value")
> print(result)

Nilai Redundansi

> redundancy(cc)

HASIL DAN PEMBAHASAN

Uji Asumsi Analisis Korelasi Kanonik

> dataCCA <- cbind(data2, data1) 
> dataCCA2 <- data.frame(dataCCA)
> model <- lm(Y1 + Y2 + Y3 ~ X1 + X2 + X3, data = dataCCA2)
> Vif <- vif(model)
> Vif
      X1       X2       X3 
1.767612 1.184401 1.543153 

Karena nilai Variance Inflation Factor (VIF) masing-masing variabel himpunan \(\mathbf{X}\) dan \(\mathbf{Y}\) kurang dari 10, maka dapat disimpulkan bahwa tidak terjadi multikolinieritas atau asumsi non-multikolinieritas terpenuhi.

Fungsi Kanonik

> cc1$xcoef
            [,1]          [,2]         [,3]
X1 -1.2493297853 -2.5918669223 -2.986034849
X2  0.0094900810  0.1170976993 -0.243601065
X3  0.0002678903 -0.0003374811 -0.000202407
> cc1$ycoef
           [,1]          [,2]          [,3]
Y1 3.450701e-04 -3.746258e-06  2.394723e-04
Y2 2.525624e-06 -1.009266e-05 -1.541696e-06
Y3 9.136930e+00 -1.005848e+00 -2.038844e+01

Fungsi kanonik yang didapat untuk variabel demografi setiap provinsi di Indonesia:

\[U_1=-1,2493X_1+0,0095X_2+0,0003X_3\]

\[U_2=-2,5919X_1+0,1171X_2-0,0003X_3\]

\[U_3=-2,9860_X1-0,2436X_2-0,0002X_3\]

Fungsi kanonik yang didapat untuk variabel konsumsi dan pengeluaran setiap provinsi di Indonesia:

\[V_1=0,0003Y_1+0,0000Y_2+9,1369Y_3\]

\[V_2=-0,0000Y_1-0,0000Y_2-1,0058Y_3\]

\[V_3=0,0002Y_1-0,0000Y_2-2,0388Y_3\]

Koefisien Korelasi Kanonik

> cc

Canonical correlation analysis of:
     3   X  variables:  X1, X2, X3 
  with   3   Y  variables:  Y1, Y2, Y3 

    CanR  CanRSQ   Eigen percent    cum                          scree
1 0.7657 0.58623 1.41683  83.692  83.69 ******************************
2 0.4475 0.20027 0.25043  14.793  98.48 *****                         
3 0.1582 0.02502 0.02566   1.516 100.00 *                             

Test of H0: The canonical correlations in the 
current row and all that follow are zero

     CanR LR test stat approx F numDF denDF  Pr(> F)    
1 0.76566      0.32262   5.1304     9 78.03 1.88e-05 ***
2 0.44752      0.77972   2.1859     4 66.00  0.08011 .  
3 0.15816      0.97498   0.8724     1 34.00  0.35689    
---
Signif. codes:  0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1

Korelasi kanonik dari gugus variabel dependen dengan variabel independen menghasilkan 3 fungsi kanonik. Koefisien korelasi kanonik pertama pada fungsi pertama sebesar 0,7657 dan dapat menjelaskan 58,623% hubungan antar variabel kanonik menunjukkan secara nyata hubungan derajat yang cukup tinggi antar variabel kanonik. Koefisien korelasi kanonik kedua sebesar 0,4475. Sedangkan koefisien korelasi kanonik ketiga hanya menunjukkan hubungan sebesar 0,1582. Karena koefisien korelasi kanonik kedua dan ketiga hanya dapat menjelaskan hubungan kanonik sebesar 20,027% dan 2,502%, maka selanjutnya fungsi kedua dan ketiga tidak dianalisis lebih lanjut. 

Pengujian Koefisien Korelasi Kanonik

Uji Korelasi Kanonik secara Keseluruhan

Hipotesis

\[ H_0 : \rho_{1} = \rho{_2} = \rho{_3}=0 \]

\[ H_1 : \text{Setidaknya terdapat satu } \rho_i \neq 0 \] Digunakan taraf signifikansi sebesar 5% dan nilai p yang didapatkan dari analisis adalah 0,00002. 

Keputusan

Karena nilai p (0,00002) < taraf nyata (0,05), maka \(H_0\) ditolak.

Kesimpulan

Pada taraf nyata 5% didapat cukup bukti untuk menyatakan bahwa paling tidak terdapat satu korelasi kanonik yang tidak bernilai nol atau terdapat korelasi yang signifikan sehingga analisis ini dapat diproses secara lanjut. Artinya, terdapat hubungan keeratan antara himpunan variabel kondisi demografi dan konsumsi pengeluaran setiap provinsi di Indonesia.

Uji Korelasi Kanonik secara Sebagian

Korelasi Kanonik Approx F \(df_1\) \(df_2\) Nilai p Keputusan Kesimpulan
1 0,76566 5,1304 9 78 0,00002 \(H_0\) ditolak \(r_{c1}\) signifikan
2 0,44752 2,1859 4 66 0,08011 \(H_0\) diterima \(r_{c2}\) tidak signifikan
3 0,15816 0,8724 1 34 0,35689 \(H_0\) diterima \(r_{c3}\) tidak signifikan

Berdasarkan uji korelasi kanonik sebagian diketahui bahwa hanya korelasi kanonik pertama saja yang signifikan secara statistik, maka fungsi pertama dapat dilakukan analisis lebih lanjut. Sedangkan korelasi kanonik kedua dan ketiga tidak signifikan secara statistik sehingga tidak perlu dianalisis.

Uji Sekuensial Bartlett

Uji Sekuensial Bartlett digunakan untuk menelusuri korelasi mana yang signifikan.

> n=38 
> p=3  
> q=3  
> k=(n-1)-0.5*(p+q+1)
> a=1-0.58623
> b=1-0.20027
> c=1-0.02512
> B1=-k*log(a*b*c)
> B2=-k*log(b*c)
> B3=-k*log(c)
> db1=p*q
> db2=(p-1)*(q-1)
> db3=(p-2)*(q-2)
> pv1=1-pchisq(B1, db1)
> pv2=1-pchisq(B2, db2)
> pv3=1-pchisq(B3, db3)
> B=rbind(B1,B2,B3)
> d=rbind(db1, db2, db3)
> pv=rbind(pv1,pv2,pv3)
> result <- cbind(B , d,  pv)
> colnames(result) <- c("Bartlett", "db", "p-value")
> print(result)
     Bartlett db      p-value
B1 37.9007950  9 1.816034e-05
B2  8.3388870  4 7.992405e-02
B3  0.8522699  1 3.559110e-01

Pengujian Pertama

Hipotesis

\[ H_0 : \rho_{1} = \rho{_2} = \rho{_3}=0 \]

\[ H_1 : \text{Setidaknya terdapat satu } \rho_i \neq 0 \] Berdasarkan output dari uji bartlett dapat diputuskan untuk menolak \(H_0\) , karena terdapat nilai p yang kurang dari 0,05 yakni pada korelasi antara \(U_1\) dan \(V_1\), sehingga dapat dilanjutkan pengujian kedua.

Pengujian Kedua

Hipotesis\[ H_0 : \rho{_2} = \rho{_3}=0 \]

\[ H_1: \rho{_2} \neq \rho{_3} \]

Nilai p pada pengujian kedua adalah 0,0799 dimana nilai p ini lebih besar dari taraf nyata 5%, maka \(H_0\) diterima, sehingga hanya korelasi antara \(U_1\) dan \(V_1\) saja yang signifikan.

Korelasi dalam Himpunan

Variabel Fungsi Kanonik Weight Loading
\(X_1\) \(U_1\) -1,2493 -0,8264
\(X_2\) \(U_1\) 0,0095 0,3003
\(X_3\) \(U_1\) 0,0003 0,9406
\(Y_1\) \(V_1\) 0,0003 0,9030
\(Y_2\) \(V_1\) 0,0000 -0,0344
\(Y_3\) \(V_1\) 9,137 0,5525

Berdasarkan tabel nilai bobot dan loading dari variabel kanonik I, diperoleh informasi sebagai berikut.

  1. Nilai loading antara variabel \(U_1\) dengan \(X_1\) dan \(X_3\) besar, sehingga dapat ditafsirkan sebagai variabel non laju pertumbuhan penduduk dan kepadatan penduduk.

  2. Nilai loading antara variabel \(V_1\) dengan \(Y_1\) besar dan deengan \(Y_3\) cukup besar, sehingga dapat ditafsirkan sebagai variabel pengeluaran perkapita dan gini ratio.

  3. Diketahui nilai korelasi antara \(U_1\) dan \(V_1\) sebesar 0,76566. Terjadi hubungan erat antara variabel non laju pertumbuhan penduduk dan kepadatan penduduk dengan variabel pengeluaran perkapita, atau dapat disimpulkan bahwa pengeluaran perkapita dari provinsi akan meningkat (besar) pada provinsi dengan kepadatan penduduk yang tinggi.

Korelasi Antar Himpunan

> cc2$corr.Y.xscores
          [,1]        [,2]        [,3]
Y1  0.69139411  0.07402039  0.06271459
Y2 -0.02630513 -0.44699711  0.00535866
Y3  0.42305839  0.11602882 -0.12528746
> cc2$corr.X.yscores
         [,1]       [,2]        [,3]
X1 -0.6327593 -0.2211715 -0.04266694
X2  0.2299729  0.2929178 -0.10973517
X3  0.7201504 -0.1427359 -0.01845392

\(U_1\) = Non laju pertumbuhan penduduk dan kepadatan penduduk

\(V_1\) = Variabel pengeluaran perkapita dan gini ratio

Karena variabel yang signifikan hanya variabel kanonik pertama, maka hubungan yang akan dilihat hanya variabel kanonik pertama. Dari tabel nilai cross loading antar variabel kondisi demografi dan konsumsi pengeluaran tiap provinsi di Indonesia dapat diperoleh informasi berikut:

  1. Variabel \(X_1\) paling berkorelasi dengan dengan \(V_1\) secara positif, sehingga dapat disimpulkan apabila persentase laju pertumbuhan penduduk di sebuah provinsi meningkat, maka pengeluaran perkapita setiap orang dan gini ratio (tingkat ketimpangan distribusi pendapatan atau kekayaan) provinsi tersebut juga akan meningkat.

  2. Variabel \(Y_3\) paling berhubungan dengan \(U_1\) secara positif, sehingga dapat disimpulkan bahwa apabila gini ratio sebuah provinsi meningkat maka kepadatan penduduk juga akan meningkat.

Indeks Redundansi

> redundancy(cc)

Redundancies for the X variables & total X canonical redundancy

    Xcan1     Xcan2     Xcan3 total X|Y 
 0.323963  0.051697  0.004734  0.380394 

Redundancies for the Y variables & total Y canonical redundancy

    Ycan1     Ycan2     Ycan3 total Y|X 
 0.219232  0.072916  0.006553  0.298701 

Berdasarkan output di atas dapat diperoleh beberapa informasi yaitu:

  1. Keragaman himpunan variabel X dapat dijelaskan oleh variabel \(U_1\) sebesar 32,396% dan dijelaskan bersama oleh \(U_1\), \(U_2\), dan \(U_3\) sebesar 38,039%.

  2. Keragaman himpunan variabel Y dapat dijelaskan oleh variabel \(V_1\) sebesar 21,923% dan dijelaskan bersama oleh \(V_1\), \(V_2\), dan \(V_3\) sebesar 29,870%.

KESIMPULAN

Hasil analisis korelasi kanonik antara himpunan variabel kondisi demografi dan himpunan variabel konsumsi dan pengeluaran per provinsi di Indonesia memberikan hasil sebagai berikut.

  1. Koefisien korelasi kanonik pertama pada fungsi pertama sebesar 0,76566 dan dapat menjelaskan 58,623% hubungan antar variabel kanonik  menunjukkan secara nyata hubungan derajat yang cukup tinggi antar variabel kanonik. Koefisien korelasi kanonik kedua sebesar  0,44752, dan koefisien korelasi kanonik ketiga menunjukkan hubungan sebesar 0,15816.

  2. Pada uji signifikansi korelasi kanonik secara keseluruhan dan sebagian didapat bahwa hanya korelasi kanonik pertama yang signifikan secara statistik maka fungsi pertama dapat diinterpretasikan lebih lanjut, sedangkan korelasi kanonik kedua dan ketiga tidak signifikan sehingga tidak diinterpretasikan lebih lanjut. 

  3. Pada interpretasi fungsi kanonik, dapat dilihat melalui nilai bobot, muatan, muatan silang kanonik terdapat hubungan yang kuat dan berarti pada fungsi kanonik pertama. 

  4. Pada fungsi kanonik pertama apabila persentase laju pertumbuhan penduduk di sebuah provinsi meningkat, maka pengeluaran perkapita setiap orang dan gini ratio provinsi tersebut juga akan meningkat. Hal ini sejalan dengan  apabila gini ratio sebuah provinsi meningkat maka kepadatan penduduk juga akan meningkat.

  5. Berdasarkan hasil analisis redundansi, dilihat pada indeks redundansi diketahui bahwa keragaman variabel \(\mathbf{X}\) dapat dijelaskan oleh variabel \(U_1\) sebesar 32,396%, dan keragaman himpunan variabel \(\mathbf{Y}\) dapat dijelaskan oleh variabel \(V_1\) sebesar 21,923%. 

DAFTAR PUSTAKA

Asbah, M. F., Sudarno, S., & Safitri, D. (2013). Penentuan Koefisien Korelasi Kanonik dan Interpretasi Fungsi Kanonik Multivariat. Jurnal Gaussian, 2(2), 119-128.

Daniel, W. W., Statistika Non Parametrik, Alih Bahasa oleh Alex Tri Kantjono W, Gramedia, Jakarta, 1978. Hair, et al.,

Hair, J. F., Black, W. C., Babin, B. J., & Anderson, R. E. (2013). Multivariate data analysis: Pearson new international edition PDF eBook. Pearson Higher Ed.

Hotelling, H. (1936). Relations Between Two Sets of Variates. Biometrika, 28(3/4), 321–377.

Johnson, R. A., & Wichern, D. W. (2002). Applied multivariate statistical analysis.

Multivariate Data Analysis, Seventh Edition, Pearson Prentice Hall International Inc, New Jersey, 2010.

Rencher, A. C., Methods of Multivariate Analysis, Second Edition, John Wiley & Sons Inc, New York, 2002.