Analisis Kanonik Hubungan Faktor Lingkungan dan Upaya Pencegahan Nyamuk terhadap Prevalensi Diare, Malaria, dan DBD di Indonesia Berdasarkan Data Survei Kesehatan 2023
Penjelasan Kasus
Latar Belakang
Penyakit menular seperti diare, Demam Berdarah Dengue (DBD), dan
malaria masih menjadi masalah kesehatan masyarakat di Indonesia. Faktor
lingkungan seperti kualitas sanitasi, pengelolaan limbah, dan keberadaan
tempat perkembangbiakan nyamuk memiliki pengaruh terhadap penyebaran
penyakit tersebut.
Upaya pencegahan seperti penutupan penampungan air dan pengelolaan
limbah merupakan intervensi penting yang bisa menurunkan risiko penyakit
menular. Analisis hubungan antara faktor lingkungan / intervensi dengan
prevalensi penyakit menular membutuhkan metode multivariat, salah
satunya Canonical Correlation Analysis (CCA), yang mampu menangkap
hubungan simultan antara beberapa variabel dependen (Y) dan independen
(X).
Studi ini diharapkan dapat memberikan informasi kebijakan kesehatan
yang lebih tepat sasaran, terutama dalam meningkatkan sanitasi dan upaya
pemberantasan nyamuk di tingkat rumah tangga maupun komunitas.
Tujuan
Menganalisis hubungan multivariat antara faktor lingkungan dan upaya
pencegahan nyamuk dengan prevalensi diare, malaria, dan DBD di
provinsi-provinsi di Indonesia.
Menentukan kombinasi variabel lingkungan dan intervensi yang paling
berpengaruh terhadap kombinasi variabel penyakit menular.
Memberikan informasi strategis untuk intervensi kesehatan masyarakat
yang lebih efektif.
Data dan Sumber Data
Sumber data: Survei Kesehatan Indonesia (SKI) 2023
Unit analisis: Provinsi
Jenis data: Persentase (%), numerik, representatif untuk populasi di
tiap provinsi
Peubah yang digunakan
Gugus Y
Prevalensi Diare (% D/G) : Y1 Prevalensi Malaria (%): Y2 Prevalensi DBD (%) : Y3
Gugus X
Fasilitas BAB digunakan sendiri (%) : Proporsi rumah tangga yang memiliki toilet pribadi yang digunakan. Mewakili kualitas sanitasi rumah tangga. (X1)
Penampungan tertutup (%): Proporsi rumah tangga yang memiliki
penampungan limbah tertutup Mewakili pengelolaan limbah aman, mencegah
kontaminasi lingkungan. (X2)
Menutup tempat penampungan air (%): Proporsi rumah tangga yang
menutup tempat penampungan air. Mewakili upaya pencegahan nyamuk (DBD
& malaria). (X3)
Analisis
Input Data
## Warning: package 'candisc' was built under R version 4.5.2
## Loading required package: heplots
## Loading required package: broom
##
## Attaching package: 'candisc'
## The following object is masked from 'package:stats':
##
## cancor
##
## Attaching package: 'dplyr'
## The following objects are masked from 'package:stats':
##
## filter, lag
## The following objects are masked from 'package:base':
##
## intersect, setdiff, setequal, union
## Warning: package 'CCA' was built under R version 4.5.2
## Loading required package: fda
## Warning: package 'fda' was built under R version 4.5.2
## Loading required package: splines
## Loading required package: fds
## Warning: package 'fds' was built under R version 4.5.2
## Loading required package: rainbow
## Warning: package 'rainbow' was built under R version 4.5.2
## Loading required package: MASS
##
## Attaching package: 'MASS'
## The following object is masked from 'package:dplyr':
##
## select
## Loading required package: pcaPP
## Warning: package 'pcaPP' was built under R version 4.5.2
## Loading required package: RCurl
## Warning: package 'RCurl' was built under R version 4.5.2
## Loading required package: deSolve
## Warning: package 'deSolve' was built under R version 4.5.2
##
## Attaching package: 'fda'
## The following object is masked from 'package:graphics':
##
## matplot
## The following object is masked from 'package:datasets':
##
## gait
## Loading required package: fields
## Warning: package 'fields' was built under R version 4.5.2
## Loading required package: spam
## Spam version 2.11-1 (2025-01-20) is loaded.
## Type 'help( Spam)' or 'demo( spam)' for a short introduction
## and overview of this package.
## Help for individual functions is also obtained by adding the
## suffix '.spam' to the function name, e.g. 'help( chol.spam)'.
##
## Attaching package: 'spam'
## The following objects are masked from 'package:base':
##
## backsolve, forwardsolve
## Loading required package: viridisLite
## Loading required package: RColorBrewer
##
## Try help(fields) to get started.
## Warning: package 'DT' was built under R version 4.5.2
## # A tibble: 38 × 7
## Provinsi Y1 Y2 Y3 X1 X2 X3
## <chr> <dbl> <dbl> <dbl> <dbl> <dbl> <dbl>
## 1 Aceh 4.2 0.35 0.58 88.3 18.4 30.2
## 2 Sumatera Utara 4.7 0.38 0.61 94.5 18.3 26
## 3 Sumatera Barat 3.9 0.21 0.56 86.5 21 25.9
## 4 Riau 2.6 0.3 0.53 96.1 15.5 40.1
## 5 Jambi 2.3 0.25 0.46 95.3 34.8 42.6
## 6 Sumatera Selatan 3.1 0.36 0.44 92.6 11.5 26.4
## 7 Bengkulu 3.5 0.63 0.57 94.4 14.3 25.1
## 8 Lampung 2.8 0.48 0.34 95.9 13.2 39.2
## 9 Bangka Belitung 2.3 0.39 0.43 96.1 23.9 35.9
## 10 Kepulauan Riau 2.1 0.12 0.28 97.4 7.8 23.6
## # ℹ 28 more rows
Pengujian Asumsi multikolinieritas
## Warning: package 'GGally' was built under R version 4.5.2
## Loading required package: ggplot2
Pengujian multikolinieritas melalui analisis matriks korelasi
menunjukkan bahwa korelasi antar variabel prediktor (\(X1, X2, X3\)) berada pada tingkat lemah
hingga sedang, dengan nilai koefisien korelasi absolut tertinggi hanya
\(|r| = 0.347\). Karena nilai ini jauh
di bawah ambang batas kritis yang mengindikasikan multikolinieritas
serius (umumnya \(r \ge 0.80\) atau
\(0.90\)), tidak terdeteksi adanya
multikolinieritas yang signifikan dalam gugus data ini.
Korelasi di antara variabel \(Y1,
Y2,\) dan \(Y3\) menunjukkan
keterkaitan yang kuat dan signifikan secara statistik, dengan koefisien
korelasi maksimum mencapai \(|r| =
0.759\). Secara teknis, nilai ini belum melanggar asumsi
multikolinieritas mutlak yang serius (di bawah \(r = 0.80\)). Namun, korelasi yang sangat
kuat ini mengindikasikan adanya tingkat redundansi (tumpang tindih
informasi) yang tinggi di dalam gugus \(Y\).
Secara keseluruhan, tidak ditemukan pelanggaran asumsi
multikolinieritas yang parah pada kedua gugus variabel (\(X\) dan \(Y\)). Oleh karena itu, analisis Analisis
Korelasi Kanonik dapat dilanjutkan menggunakan keenam variabel (\(X1, X2, X3, Y1, Y2, Y3\)) tanpa perlu
melakukan tindakan korektif untuk mengatasi multikolinieritas.
Dominasi \(X1\): Variabel \(X1\) menunjukkan hubungan yang paling kuat
dan signifikan dengan gugus \(Y\).
Hubungan antara \(X1\) dan \(Y1\) sangat kuat (\(r = -0.789\)), mengindikasikan bahwa
peningkatan pada \(X1\) terkait dengan
penurunan signifikan pada \(Y1\).
Keterkaitan Umum: Secara umum, variabel \(X\) dan \(Y\) memiliki hubungan negatif (kecuali
\(X2\) dan \(X3\) yang hubungannya sangat lemah dengan
\(Y2\) dan \(Y3\)). Ini berarti bahwa peningkatan pada
gugus prediktor cenderung terkait dengan penurunan pada gugus
kriteria.Variabel Paling Lemah: Variabel \(X2\) menunjukkan korelasi yang sangat lemah
dan tidak signifikan dengan semua variabel \(Y\), mengindikasikan bahwa \(X2\) mungkin kurang berkontribusi pada
hubungan kanonik.
Pengujian asumsi normal ganda
## Warning: package 'RVAideMemoire' was built under R version 4.5.2
## *** Package RVAideMemoire v 0.9-83-12 ***
##
## Attaching package: 'RVAideMemoire'
## The following object is masked from 'package:broom':
##
## bootstrap
## [1] 38 14
Berdasarkan plot tersebut secara umum X sudah menyebar secara normal ganda.
## [1] 35 37
terlihat peubah y sangat tidak normal maka akan dilakukan transformasi logaritmik.
data_log <- data %>%
mutate(
log_Y1 = log(Y1),
log_Y2 = log(Y2),
log_Y3 = log(Y3)
) %>%
dplyr::select(-Y1, -Y2, -Y3)
gugusYlog<-data_log[,4:6]
mqqnorm(gugusYlog, main = "Multi-normal Q-Q Plot Y")## [1] 11 37
Setelah dilakukan transformasi data Y sudah cukup membaik dan menyebar jauh lebih normal.
Kesimpulan: Transformasi logaritma berhasil mengurangi tingkat
redundansi di gugus \(Y\) (korelasi
tertinggi turun dari \(0.759\) menjadi
\(0.702\)). Pada kedua gugus, \(X\) dan \(\log(Y)\), tidak ditemukan indikasi
multikolinieritas yang serius (semua \(|r|
< 0.80\)). Asumsi ini terpenuhi dengan baik untuk Analisis
Korelasi Kanonik (CCA).
Uji Asumsi LinearitasPola Sebaran pada Scatter Plot:Hubungan \(X\) vs \(\log(Y)\): Setelah transformasi, scatter
plot yang melibatkan \(X\) dan \(\log(Y)\) menunjukkan sebaran titik yang
jauh lebih merata dan terdistribusi, terutama untuk hubungan yang kuat
(misalnya, \(X1\) vs \(\log\_Y1\)). Pola sebaran ini menunjukkan
bahwa hubungan antar variabel kini mendekati pola linear yang lebih baik
dibandingkan sebelumnya. Hubungan \(\log(Y)\) vs \(\log(Y)\): Korelasi yang sangat kuat (\(r > 0.588\)) antara variabel \(\log(Y)\) kini didukung oleh pola sebaran
titik yang terlihat lebih konsisten dan linear.
Kesimpulan: Transformasi logaritma berhasil memperbaiki sebaran data,
sehingga secara visual, asumsi linearitas antar gugus (X dengan \(\log(Y)\)) dan dalam gugus \(\log(Y)\) dianggap terpenuhi atau sangat
diperbaiki, memungkinkan interpretasi koefisien korelasi dan hasil CCA
yang lebih valid.
Asumsi linieritas: Berdasarkan pair plot yang menggunakan variabel
\(\log(Y)\), asumsi linearitas antara
gugus variabel prediktor (\(X\)) dan
variabel kriteria (\(\log(Y)\))
dianggap terpenuhi. Secara visual, sebaran titik-titik data tidak
menunjukkan pola kurva non-linear yang eksplisit (seperti bentuk
parabola atau eksponensial). Korelasi yang paling kuat (\(X1\) vs \(\log\_Y1\)) kini menunjukkan kecenderungan
garis lurus negatif yang jelas, didukung oleh distribusi data yang lebih
normal pasca-transformasi logaritma.
Korelasi Kanonic
## # A tibble: 38 × 3
## X1 X2 X3
## <dbl> <dbl> <dbl>
## 1 88.3 18.4 30.2
## 2 94.5 18.3 26
## 3 86.5 21 25.9
## 4 96.1 15.5 40.1
## 5 95.3 34.8 42.6
## 6 92.6 11.5 26.4
## 7 94.4 14.3 25.1
## 8 95.9 13.2 39.2
## 9 96.1 23.9 35.9
## 10 97.4 7.8 23.6
## # ℹ 28 more rows
## # A tibble: 38 × 3
## log_Y1 log_Y2 log_Y3
## <dbl> <dbl> <dbl>
## 1 1.44 -1.05 -0.545
## 2 1.55 -0.968 -0.494
## 3 1.36 -1.56 -0.580
## 4 0.956 -1.20 -0.635
## 5 0.833 -1.39 -0.777
## 6 1.13 -1.02 -0.821
## 7 1.25 -0.462 -0.562
## 8 1.03 -0.734 -1.08
## 9 0.833 -0.942 -0.844
## 10 0.742 -2.12 -1.27
## # ℹ 28 more rows
## [1] 38
## [1] 38
##
## Canonical correlation analysis of:
## 3 X variables: X1, X2, X3
## with 3 Y variables: log_Y1, log_Y2, log_Y3
##
## CanR CanRSQ Eigen percent cum scree
## 1 0.85240 0.726592 2.657539 88.8826 88.88 ******************************
## 2 0.49527 0.245292 0.325016 10.8703 99.75 ****
## 3 0.08564 0.007334 0.007388 0.2471 100.00
##
## Test of H0: The canonical correlations in the
## current row and all that follow are zero
##
## CanR LR test stat approx F numDF denDF Pr(> F)
## 1 0.85240 0.20483 7.9627 9 78.03 2.964e-08 ***
## 2 0.49527 0.74917 2.5631 4 66.00 0.04634 *
## 3 0.08564 0.99267 0.2512 1 34.00 0.61947
## ---
## Signif. codes: 0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
##
## Raw canonical coefficients
##
## X variables:
## Xcan1 Xcan2 Xcan3
## X1 -0.1001427 -0.021341 -0.053714
## X2 -0.0268225 -0.032866 0.092707
## X3 0.0027721 0.119438 0.039768
##
## Y variables:
## Ycan1 Ycan2 Ycan3
## log_Y1 1.89645 -1.75254 2.029353
## log_Y2 0.41370 0.86284 -0.039362
## log_Y3 -0.76008 -0.98996 -2.582244
Bisa ditemukan dengan menggunakan packages CCA
## [1] 0.85240371 0.49526969 0.08563651
Kesimpulan Utama Analisis Korelasi Kanonik
Berdasarkan hasil analisis korelasi kanonik antara tiga variabel faktor lingkungan (X1, X2, X3) dan tiga variabel prevalensi penyakit menular yang ditransformasikan logaritmik (log_Y1, log_Y2, log_Y3), diperoleh tiga pasangan fungsi kanonik dengan nilai korelasi kanonik sebagai berikut:
Korelasi kanonik pertama : 0,8524
Korelasi kanonik kedua : 0,4953
Korelasi kanonik ketiga : 0,0856
Korelasi Kanonik Pertama
Korelasi kanonik pertama sebesar 0,8524 menunjukkan adanya hubungan
multivariat yang kuat antara kombinasi linear faktor lingkungan dan
kombinasi linear prevalensi penyakit menular. Nilai ini
merepresentasikan korelasi maksimum yang dapat dicapai antara kedua
gugus variabel tersebut. Uji signifikansi menunjukkan bahwa korelasi
kanonik pertama berbeda nyata dengan nol pada taraf signifikansi 1% (Pr
< 0,001), sehingga dapat disimpulkan bahwa terdapat hubungan yang
signifikan secara statistik antara faktor lingkungan dan prevalensi
penyakit menular pada fungsi kanonik pertama.
Korelasi Kanonik Kedua
Korelasi kanonik kedua sebesar 0,4953 menunjukkan hubungan sedang antara
kombinasi linear kedua dari gugus variabel X dan Y. Hasil uji
signifikansi menunjukkan bahwa korelasi kanonik kedua masih signifikan
pada taraf signifikansi 5% (Pr = 0,046). Hal ini mengindikasikan bahwa
selain hubungan utama yang ditangkap oleh fungsi kanonik pertama, masih
terdapat pola hubungan tambahan antara faktor lingkungan dan penyakit
menular yang relevan secara statistik, meskipun dengan kekuatan yang
lebih lemah dibandingkan fungsi kanonik pertama.
Korelasi Kanonik Ketiga
Korelasi kanonik ketiga sebesar 0,0856 menunjukkan hubungan yang sangat
lemah antara kedua gugus variabel. Hasil uji signifikansi menunjukkan
bahwa korelasi ini tidak berbeda nyata dengan nol (Pr > 0,05),
sehingga fungsi kanonik ketiga tidak memiliki makna substantif dalam
menjelaskan hubungan antara faktor lingkungan dan prevalensi penyakit
menular.
Fungsi kanonik pertama dan kedua cocok untuk digunakan.
note: Perlu dicatat bahwa variabel dependen dianalisis dalam skala
logaritmik, sehingga interpretasi hubungan yang diperoleh mencerminkan
perubahan relatif (proporsional) pada prevalensi penyakit, bukan
perubahan absolut. Transformasi logaritmik ini dilakukan untuk
meningkatkan stabilitas analisis dan mengurangi kecondongan distribusi
data.
Koefisien Korelasi Kanonic mentah
## $xcoef
## [,1] [,2] [,3]
## X1 -0.100142740 -0.02134087 -0.05371401
## X2 -0.026822469 -0.03286569 0.09270663
## X3 0.002772144 0.11943818 0.03976802
##
## $ycoef
## [,1] [,2] [,3]
## log_Y1 1.8964460 -1.7525428 2.0293533
## log_Y2 0.4137044 0.8628450 -0.0393617
## log_Y3 -0.7600803 -0.9899621 -2.5822438
Secara keseluruhan, fungsi kanonik pertama menggambarkan bahwa
variasi kondisi sanitasi lingkungan, khususnya akses fasilitas BAB yang
digunakan sendiri, berkaitan kuat dengan variasi prevalensi penyakit
berbasis lingkungan, yang terutama dicerminkan oleh perubahan pada
prevalensi log_Y1.
Menghitung loading kanonic
Korelasi X dengan fungsi kanonik X
## corrplot 0.95 loaded
Diperoleh bahwa untuk fungsi kanonik peubah X peubah-peubah yang
berhubungan paling erat dengan fungsi kanonik pertama adalah (X1),
sedangkan terhadap fungsi kanonik kedua yaitu X3
Korelasi Y dengan fungsi kanonik Y
## [,1] [,2] [,3]
## log_Y1 0.8956944 -0.4338934 -0.09730362
## log_Y2 0.8151960 0.4184985 -0.40039291
## log_Y3 0.5533161 -0.3007320 -0.77678925
Untuk fungsi kanonik peubah Y terlihat bahwa peubah-peubah yang
berhubungan paling erat dengan fungsi kanonik pertama yaitu log_Y1, pada
kanonik dua pun log_Y1 paling erat.
Korelasi silang X dengan fungsi kanonik Y
## [,1] [,2] [,3]
## X1 -0.8222670 0.05108333 -0.02076958
## X2 -0.3466900 -0.13871861 0.07446585
## X3 -0.2732173 0.45475337 0.01993403
Korelasi silang antar peubah-peubah independen terhadap fungsi kanonik
peubah dependen memberikah hasil bahwa yang berhubungan paling erat
dengan fungsi kanonik pertama adalah (X1), dan dengan fungsi kanonik
kedua adalah (X3).
Korelasi silang Y dengan fungsi kanonik X
## [,1] [,2] [,3]
## log_Y1 0.7634933 -0.2148943 -0.008332743
## log_Y2 0.6948761 0.2072696 -0.034288253
## log_Y3 0.4716487 -0.1489434 -0.066521524
Sedangkan korelasi silang antar peubah-peubah Y terhadap fungsi kanonik
peubah X memberikah hasil bahwa yang berhubungan paling erat dengan
fungsi kanonik pertama adalah log_Y1, dan dengan fungsi kanonik kedua
adalah log_Y1 dan log_Y2.
Uji signifikansi korelasi kanonic
## Warning: package 'CCP' was built under R version 4.5.2
## Wilks' Lambda, using F-approximation (Rao's F):
## stat approx df1 df2 p.value
## 1 to 3: 0.2048299 7.9626599 9 78.0302 2.964182e-08
## 2 to 3: 0.7491732 2.5630694 4 66.0000 4.634039e-02
## 3 to 3: 0.9926664 0.2511849 1 34.0000 6.194715e-01
## Hotelling-Lawley Trace, using F-approximation:
## stat approx df1 df2 p.value
## 1 to 3: 2.989942268 10.1879514 9 92 9.754064e-11
## 2 to 3: 0.332403676 2.7146300 4 98 3.417939e-02
## 3 to 3: 0.007387792 0.2561101 1 104 6.138763e-01
## Pillai-Bartlett Trace, using F-approximation:
## stat approx df1 df2 p.value
## 1 to 3: 0.979217764 5.4918344 9 102 3.842345e-06
## 2 to 3: 0.252625679 2.4826953 4 108 4.798373e-02
## 3 to 3: 0.007333613 0.2793602 1 114 5.981484e-01
## Roy's Largest Root, using F-approximation:
## stat approx df1 df2 p.value
## 1 to 1: 0.7265921 30.11877 3 34 1.091395e-09
##
## F statistic for Roy's Greatest Root is an upper bound.
Secara umum, banyak fungsi/dimensi kanonik sama dengan jumlah peubah
dalam himpunan yang lebih kecil, namun banyak dimensi yang signifikan
mungkin lebih kecil lagi. Dimensi kanonik, juga dikenal sebagai fungsi
kanonik, adalah peubah laten yang mirip dengan faktor-faktor yang
diperoleh dalam analisis faktor. Untuk model khusus ini terdapat tiga
dimensi kanonik.
Dari hasil di atas diperoleh bahwa keempat pengujian menunjukkan
bahwa pada fungsi/dimensi kanonik pertama, semuanya signifikan pada
taraf nyata 5%. Artinya, minimal ada satu korelasi kanonik yang nyata.
Selanjutnya dilanjutkan dengan uji parsial.
##
## Canonical correlation analysis of:
## 3 X variables: X1, X2, X3
## with 3 Y variables: log_Y1, log_Y2, log_Y3
##
## CanR CanRSQ Eigen percent cum scree
## 1 0.85240 0.726592 2.657539 88.8826 88.88 ******************************
## 2 0.49527 0.245292 0.325016 10.8703 99.75 ****
## 3 0.08564 0.007334 0.007388 0.2471 100.00
##
## Test of H0: The canonical correlations in the
## current row and all that follow are zero
##
## CanR LR test stat approx F numDF denDF Pr(> F)
## 1 0.85240 0.20483 7.9627 9 78.03 2.964e-08 ***
## 2 0.49527 0.74917 2.5631 4 66.00 0.04634 *
## 3 0.08564 0.99267 0.2512 1 34.00 0.61947
## ---
## Signif. codes: 0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
Berdasarkn hasil uji parsial tersebut terlihat bahwa memang hanya
fungsi kanonik 1 dan 2 yang berbeda nyara dengan 0 dalam taraf nyata 5%
berdasarkan uji LR.
Menghitung koefisien korelasi kanonic terstandarisasi
## [,1] [,2] [,3]
## [1,] -0.93218126 -0.1986521 -0.4999982
## [2,] -0.26628556 -0.3262809 0.9203640
## [3,] 0.02348562 1.0118809 0.3369149
Koefisien kanonik untuk fungsi kanonik pertama menunjukkan bahwa X1
merupakan peubah yang paling dominan dalam membentuk variat kanonik
pertama gugus lingkungan, diikuti oleh X2, sedangkan X3 memberikan
kontribusi yang sangat kecil. Dengan demikian, akses fasilitas BAB
digunakan sendiri menjadi faktor lingkungan utama yang berkaitan dengan
pola penyakit pada fungsi kanonik pertama.
Urutan kontribusi relatif peubah-peubah X terhadap variat kanonik
kedua menunjukkan bahwa upaya pemberantasan sarang nyamuk melalui
penutupan penampungan air (X3) merupakan peubah yang paling dominan,
diikuti oleh kondisi pembuangan limbah (X2), sedangkan fasilitas BAB
(X1) memiliki kontribusi yang lebih kecil pada fungsi ini.
## [,1] [,2] [,3]
## [1,] 0.8385456 -0.7749164 0.89731284
## [2,] 0.5793290 1.2082808 -0.05511997
## [3,] -0.4036522 -0.5257345 -1.37133997
Koefisien kanonik untuk fungsi kanonik pertama menunjukkan bahwa
log_Y1 (pravalensi diare) merupakan peubah yang paling dominan dalam
membentuk variat kanonik pertama gugus penyakit, diikuti oleh
log_Y2(pravalensi malaria) dan log_Y3(pravalensi DBD). Dengan demikian,
fungsi kanonik pertama terutama merepresentasikan pola penyakit yang
didominasi oleh prevalensi log_Y1.
Urutan kontribusi relatif pada fungsi kanonik kedua menunjukkan bahwa
log_Y2 merupakan peubah yang paling berperan, diikuti oleh log_Y1 dan
log_Y3. Fungsi kanonik kedua mencerminkan variasi tambahan pola penyakit
yang berbeda dari fungsi kanonik pertama.
Fungsi Kanonik
Diperoleh beberapa fungsi kanonik sebagai berikut:
U1=−0.931X1−0.266X2+0.02X3
U1=−0.198X1−0.326X2+1.011X3
V1=0.839log(Y1)+0.579log(Y2)-0.403log(Y3)
V1=-0.775log(Y1)+1.208log(Y2)-0.526log(Y3)