Analisis Kanonik Hubungan Faktor Lingkungan dan Upaya Pencegahan Nyamuk terhadap Prevalensi Diare, Malaria, dan DBD di Indonesia Berdasarkan Data Survei Kesehatan 2023

Penjelasan Kasus

Latar Belakang

Penyakit menular seperti diare, Demam Berdarah Dengue (DBD), dan malaria masih menjadi masalah kesehatan masyarakat di Indonesia. Faktor lingkungan seperti kualitas sanitasi, pengelolaan limbah, dan keberadaan tempat perkembangbiakan nyamuk memiliki pengaruh terhadap penyebaran penyakit tersebut.

Upaya pencegahan seperti penutupan penampungan air dan pengelolaan limbah merupakan intervensi penting yang bisa menurunkan risiko penyakit menular. Analisis hubungan antara faktor lingkungan / intervensi dengan prevalensi penyakit menular membutuhkan metode multivariat, salah satunya Canonical Correlation Analysis (CCA), yang mampu menangkap hubungan simultan antara beberapa variabel dependen (Y) dan independen (X).

Studi ini diharapkan dapat memberikan informasi kebijakan kesehatan yang lebih tepat sasaran, terutama dalam meningkatkan sanitasi dan upaya pemberantasan nyamuk di tingkat rumah tangga maupun komunitas.

Tujuan

Menganalisis hubungan multivariat antara faktor lingkungan dan upaya pencegahan nyamuk dengan prevalensi diare, malaria, dan DBD di provinsi-provinsi di Indonesia.

Menentukan kombinasi variabel lingkungan dan intervensi yang paling berpengaruh terhadap kombinasi variabel penyakit menular.

Memberikan informasi strategis untuk intervensi kesehatan masyarakat yang lebih efektif.

Data dan Sumber Data

Sumber data: Survei Kesehatan Indonesia (SKI) 2023
Unit analisis: Provinsi
Jenis data: Persentase (%), numerik, representatif untuk populasi di tiap provinsi

Peubah yang digunakan

Gugus Y

Prevalensi Diare (% D/G) : Y1 Prevalensi Malaria (%): Y2 Prevalensi DBD (%) : Y3

Gugus X

Fasilitas BAB digunakan sendiri (%) : Proporsi rumah tangga yang memiliki toilet pribadi yang digunakan. Mewakili kualitas sanitasi rumah tangga. (X1) 

Penampungan tertutup (%): Proporsi rumah tangga yang memiliki penampungan limbah tertutup Mewakili pengelolaan limbah aman, mencegah kontaminasi lingkungan. (X2)

Menutup tempat penampungan air (%): Proporsi rumah tangga yang menutup tempat penampungan air. Mewakili upaya pencegahan nyamuk (DBD & malaria). (X3)

Analisis

Input Data

library(candisc)
## Warning: package 'candisc' was built under R version 4.5.2
## Loading required package: heplots
## Loading required package: broom
## 
## Attaching package: 'candisc'
## The following object is masked from 'package:stats':
## 
##     cancor
library(readxl)
library(dplyr)
## 
## Attaching package: 'dplyr'
## The following objects are masked from 'package:stats':
## 
##     filter, lag
## The following objects are masked from 'package:base':
## 
##     intersect, setdiff, setequal, union
library(CCA)
## Warning: package 'CCA' was built under R version 4.5.2
## Loading required package: fda
## Warning: package 'fda' was built under R version 4.5.2
## Loading required package: splines
## Loading required package: fds
## Warning: package 'fds' was built under R version 4.5.2
## Loading required package: rainbow
## Warning: package 'rainbow' was built under R version 4.5.2
## Loading required package: MASS
## 
## Attaching package: 'MASS'
## The following object is masked from 'package:dplyr':
## 
##     select
## Loading required package: pcaPP
## Warning: package 'pcaPP' was built under R version 4.5.2
## Loading required package: RCurl
## Warning: package 'RCurl' was built under R version 4.5.2
## Loading required package: deSolve
## Warning: package 'deSolve' was built under R version 4.5.2
## 
## Attaching package: 'fda'
## The following object is masked from 'package:graphics':
## 
##     matplot
## The following object is masked from 'package:datasets':
## 
##     gait
## Loading required package: fields
## Warning: package 'fields' was built under R version 4.5.2
## Loading required package: spam
## Spam version 2.11-1 (2025-01-20) is loaded.
## Type 'help( Spam)' or 'demo( spam)' for a short introduction 
## and overview of this package.
## Help for individual functions is also obtained by adding the
## suffix '.spam' to the function name, e.g. 'help( chol.spam)'.
## 
## Attaching package: 'spam'
## The following objects are masked from 'package:base':
## 
##     backsolve, forwardsolve
## Loading required package: viridisLite
## Loading required package: RColorBrewer
## 
## Try help(fields) to get started.
library(DT)
## Warning: package 'DT' was built under R version 4.5.2
data<-read_excel("D:\\DEPARTEMEN\\SEMESTER 5\\TPG\\datatpg_kanonikal.xlsx")
data
## # A tibble: 38 × 7
##    Provinsi            Y1    Y2    Y3    X1    X2    X3
##    <chr>            <dbl> <dbl> <dbl> <dbl> <dbl> <dbl>
##  1 Aceh               4.2  0.35  0.58  88.3  18.4  30.2
##  2 Sumatera Utara     4.7  0.38  0.61  94.5  18.3  26  
##  3 Sumatera Barat     3.9  0.21  0.56  86.5  21    25.9
##  4 Riau               2.6  0.3   0.53  96.1  15.5  40.1
##  5 Jambi              2.3  0.25  0.46  95.3  34.8  42.6
##  6 Sumatera Selatan   3.1  0.36  0.44  92.6  11.5  26.4
##  7 Bengkulu           3.5  0.63  0.57  94.4  14.3  25.1
##  8 Lampung            2.8  0.48  0.34  95.9  13.2  39.2
##  9 Bangka Belitung    2.3  0.39  0.43  96.1  23.9  35.9
## 10 Kepulauan Riau     2.1  0.12  0.28  97.4   7.8  23.6
## # ℹ 28 more rows
#Pisahkan masing-masing peubah berdasarkan gugusnya.

gugus_X <- data[,5:7]
gugus_Y <- data[,2:4]

Pengujian Asumsi multikolinieritas

library(GGally)
## Warning: package 'GGally' was built under R version 4.5.2
## Loading required package: ggplot2
ggpairs(gugus_X)

Pengujian multikolinieritas melalui analisis matriks korelasi menunjukkan bahwa korelasi antar variabel prediktor (\(X1, X2, X3\)) berada pada tingkat lemah hingga sedang, dengan nilai koefisien korelasi absolut tertinggi hanya \(|r| = 0.347\). Karena nilai ini jauh di bawah ambang batas kritis yang mengindikasikan multikolinieritas serius (umumnya \(r \ge 0.80\) atau \(0.90\)), tidak terdeteksi adanya multikolinieritas yang signifikan dalam gugus data ini.

ggpairs(gugus_Y)

Korelasi di antara variabel \(Y1, Y2,\) dan \(Y3\) menunjukkan keterkaitan yang kuat dan signifikan secara statistik, dengan koefisien korelasi maksimum mencapai \(|r| = 0.759\). Secara teknis, nilai ini belum melanggar asumsi multikolinieritas mutlak yang serius (di bawah \(r = 0.80\)). Namun, korelasi yang sangat kuat ini mengindikasikan adanya tingkat redundansi (tumpang tindih informasi) yang tinggi di dalam gugus \(Y\).

Secara keseluruhan, tidak ditemukan pelanggaran asumsi multikolinieritas yang parah pada kedua gugus variabel (\(X\) dan \(Y\)). Oleh karena itu, analisis Analisis Korelasi Kanonik dapat dilanjutkan menggunakan keenam variabel (\(X1, X2, X3, Y1, Y2, Y3\)) tanpa perlu melakukan tindakan korektif untuk mengatasi multikolinieritas.

data<- data %>% dplyr::select(-Provinsi)
ggpairs(data)

Dominasi \(X1\): Variabel \(X1\) menunjukkan hubungan yang paling kuat dan signifikan dengan gugus \(Y\). Hubungan antara \(X1\) dan \(Y1\) sangat kuat (\(r = -0.789\)), mengindikasikan bahwa peningkatan pada \(X1\) terkait dengan penurunan signifikan pada \(Y1\).
Keterkaitan Umum: Secara umum, variabel \(X\) dan \(Y\) memiliki hubungan negatif (kecuali \(X2\) dan \(X3\) yang hubungannya sangat lemah dengan \(Y2\) dan \(Y3\)). Ini berarti bahwa peningkatan pada gugus prediktor cenderung terkait dengan penurunan pada gugus kriteria.Variabel Paling Lemah: Variabel \(X2\) menunjukkan korelasi yang sangat lemah dan tidak signifikan dengan semua variabel \(Y\), mengindikasikan bahwa \(X2\) mungkin kurang berkontribusi pada hubungan kanonik.

Pengujian asumsi normal ganda

library(RVAideMemoire)
## Warning: package 'RVAideMemoire' was built under R version 4.5.2
## *** Package RVAideMemoire v 0.9-83-12 ***
## 
## Attaching package: 'RVAideMemoire'
## The following object is masked from 'package:broom':
## 
##     bootstrap
mqqnorm(gugus_X, main = "Multi-normal Q-Q Plot X")

## [1] 38 14

Berdasarkan plot tersebut secara umum X sudah menyebar secara normal ganda.

library(RVAideMemoire)
mqqnorm(gugus_Y, main = "Multi-normal Q-Q Plot Y")

## [1] 35 37

terlihat peubah y sangat tidak normal maka akan dilakukan transformasi logaritmik.

data_log <- data %>%
  mutate(
    log_Y1 = log(Y1),
    log_Y2 = log(Y2),
    log_Y3 = log(Y3)
  ) %>%
  dplyr::select(-Y1, -Y2, -Y3)
gugusYlog<-data_log[,4:6]
mqqnorm(gugusYlog, main = "Multi-normal Q-Q Plot Y")

## [1] 11 37

Setelah dilakukan transformasi data Y sudah cukup membaik dan menyebar jauh lebih normal.

# cek kembali linieritas
ggpairs(data_log)

Kesimpulan: Transformasi logaritma berhasil mengurangi tingkat redundansi di gugus \(Y\) (korelasi tertinggi turun dari \(0.759\) menjadi \(0.702\)). Pada kedua gugus, \(X\) dan \(\log(Y)\), tidak ditemukan indikasi multikolinieritas yang serius (semua \(|r| < 0.80\)). Asumsi ini terpenuhi dengan baik untuk Analisis Korelasi Kanonik (CCA).

Uji Asumsi LinearitasPola Sebaran pada Scatter Plot:Hubungan \(X\) vs \(\log(Y)\): Setelah transformasi, scatter plot yang melibatkan \(X\) dan \(\log(Y)\) menunjukkan sebaran titik yang jauh lebih merata dan terdistribusi, terutama untuk hubungan yang kuat (misalnya, \(X1\) vs \(\log\_Y1\)). Pola sebaran ini menunjukkan bahwa hubungan antar variabel kini mendekati pola linear yang lebih baik dibandingkan sebelumnya. Hubungan \(\log(Y)\) vs \(\log(Y)\): Korelasi yang sangat kuat (\(r > 0.588\)) antara variabel \(\log(Y)\) kini didukung oleh pola sebaran titik yang terlihat lebih konsisten dan linear.

Kesimpulan: Transformasi logaritma berhasil memperbaiki sebaran data, sehingga secara visual, asumsi linearitas antar gugus (X dengan \(\log(Y)\)) dan dalam gugus \(\log(Y)\) dianggap terpenuhi atau sangat diperbaiki, memungkinkan interpretasi koefisien korelasi dan hasil CCA yang lebih valid.

Asumsi linieritas: Berdasarkan pair plot yang menggunakan variabel \(\log(Y)\), asumsi linearitas antara gugus variabel prediktor (\(X\)) dan variabel kriteria (\(\log(Y)\)) dianggap terpenuhi. Secara visual, sebaran titik-titik data tidak menunjukkan pola kurva non-linear yang eksplisit (seperti bentuk parabola atau eksponensial). Korelasi yang paling kuat (\(X1\) vs \(\log\_Y1\)) kini menunjukkan kecenderungan garis lurus negatif yang jelas, didukung oleh distribusi data yang lebih normal pasca-transformasi logaritma.

Korelasi Kanonic

# Gugus X
X <- data_log[, c("X1", "X2", "X3")]
X
## # A tibble: 38 × 3
##       X1    X2    X3
##    <dbl> <dbl> <dbl>
##  1  88.3  18.4  30.2
##  2  94.5  18.3  26  
##  3  86.5  21    25.9
##  4  96.1  15.5  40.1
##  5  95.3  34.8  42.6
##  6  92.6  11.5  26.4
##  7  94.4  14.3  25.1
##  8  95.9  13.2  39.2
##  9  96.1  23.9  35.9
## 10  97.4   7.8  23.6
## # ℹ 28 more rows
# Gugus Y (SUDAH LOG)
Y <- data_log[, c("log_Y1", "log_Y2", "log_Y3")]
Y
## # A tibble: 38 × 3
##    log_Y1 log_Y2 log_Y3
##     <dbl>  <dbl>  <dbl>
##  1  1.44  -1.05  -0.545
##  2  1.55  -0.968 -0.494
##  3  1.36  -1.56  -0.580
##  4  0.956 -1.20  -0.635
##  5  0.833 -1.39  -0.777
##  6  1.13  -1.02  -0.821
##  7  1.25  -0.462 -0.562
##  8  1.03  -0.734 -1.08 
##  9  0.833 -0.942 -0.844
## 10  0.742 -2.12  -1.27 
## # ℹ 28 more rows
nrow(X)
## [1] 38
nrow(Y)
## [1] 38
library(candisc)
cca1 <- cancor(X, Y)
summary(cca1)
## 
## Canonical correlation analysis of:
##   3   X  variables:  X1, X2, X3 
##   with    3   Y  variables:  log_Y1, log_Y2, log_Y3 
## 
##      CanR   CanRSQ    Eigen percent    cum                          scree
## 1 0.85240 0.726592 2.657539 88.8826  88.88 ******************************
## 2 0.49527 0.245292 0.325016 10.8703  99.75 ****                          
## 3 0.08564 0.007334 0.007388  0.2471 100.00                               
## 
## Test of H0: The canonical correlations in the 
## current row and all that follow are zero
## 
##      CanR LR test stat approx F numDF denDF   Pr(> F)    
## 1 0.85240      0.20483   7.9627     9 78.03 2.964e-08 ***
## 2 0.49527      0.74917   2.5631     4 66.00   0.04634 *  
## 3 0.08564      0.99267   0.2512     1 34.00   0.61947    
## ---
## Signif. codes:  0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
## 
## Raw canonical coefficients
## 
##    X  variables: 
##         Xcan1     Xcan2     Xcan3
## X1 -0.1001427 -0.021341 -0.053714
## X2 -0.0268225 -0.032866  0.092707
## X3  0.0027721  0.119438  0.039768
## 
##    Y  variables: 
##           Ycan1    Ycan2     Ycan3
## log_Y1  1.89645 -1.75254  2.029353
## log_Y2  0.41370  0.86284 -0.039362
## log_Y3 -0.76008 -0.98996 -2.582244

Bisa ditemukan dengan menggunakan packages CCA

library(CCA)
cc1 <- cc(X, Y)
cc1$cor
## [1] 0.85240371 0.49526969 0.08563651

Kesimpulan Utama Analisis Korelasi Kanonik

Berdasarkan hasil analisis korelasi kanonik antara tiga variabel faktor lingkungan (X1, X2, X3) dan tiga variabel prevalensi penyakit menular yang ditransformasikan logaritmik (log_Y1, log_Y2, log_Y3), diperoleh tiga pasangan fungsi kanonik dengan nilai korelasi kanonik sebagai berikut:

Korelasi kanonik pertama : 0,8524
Korelasi kanonik kedua : 0,4953
Korelasi kanonik ketiga : 0,0856

Korelasi Kanonik Pertama
Korelasi kanonik pertama sebesar 0,8524 menunjukkan adanya hubungan multivariat yang kuat antara kombinasi linear faktor lingkungan dan kombinasi linear prevalensi penyakit menular. Nilai ini merepresentasikan korelasi maksimum yang dapat dicapai antara kedua gugus variabel tersebut. Uji signifikansi menunjukkan bahwa korelasi kanonik pertama berbeda nyata dengan nol pada taraf signifikansi 1% (Pr < 0,001), sehingga dapat disimpulkan bahwa terdapat hubungan yang signifikan secara statistik antara faktor lingkungan dan prevalensi penyakit menular pada fungsi kanonik pertama.

Korelasi Kanonik Kedua
Korelasi kanonik kedua sebesar 0,4953 menunjukkan hubungan sedang antara kombinasi linear kedua dari gugus variabel X dan Y. Hasil uji signifikansi menunjukkan bahwa korelasi kanonik kedua masih signifikan pada taraf signifikansi 5% (Pr = 0,046). Hal ini mengindikasikan bahwa selain hubungan utama yang ditangkap oleh fungsi kanonik pertama, masih terdapat pola hubungan tambahan antara faktor lingkungan dan penyakit menular yang relevan secara statistik, meskipun dengan kekuatan yang lebih lemah dibandingkan fungsi kanonik pertama.

Korelasi Kanonik Ketiga
Korelasi kanonik ketiga sebesar 0,0856 menunjukkan hubungan yang sangat lemah antara kedua gugus variabel. Hasil uji signifikansi menunjukkan bahwa korelasi ini tidak berbeda nyata dengan nol (Pr > 0,05), sehingga fungsi kanonik ketiga tidak memiliki makna substantif dalam menjelaskan hubungan antara faktor lingkungan dan prevalensi penyakit menular.

Fungsi kanonik pertama dan kedua cocok untuk digunakan.
note: Perlu dicatat bahwa variabel dependen dianalisis dalam skala logaritmik, sehingga interpretasi hubungan yang diperoleh mencerminkan perubahan relatif (proporsional) pada prevalensi penyakit, bukan perubahan absolut. Transformasi logaritmik ini dilakukan untuk meningkatkan stabilitas analisis dan mengurangi kecondongan distribusi data.

Koefisien Korelasi Kanonic mentah

# koefisien kanonik mentah
cc1[3:4]
## $xcoef
##            [,1]        [,2]        [,3]
## X1 -0.100142740 -0.02134087 -0.05371401
## X2 -0.026822469 -0.03286569  0.09270663
## X3  0.002772144  0.11943818  0.03976802
## 
## $ycoef
##              [,1]       [,2]       [,3]
## log_Y1  1.8964460 -1.7525428  2.0293533
## log_Y2  0.4137044  0.8628450 -0.0393617
## log_Y3 -0.7600803 -0.9899621 -2.5822438

Secara keseluruhan, fungsi kanonik pertama menggambarkan bahwa variasi kondisi sanitasi lingkungan, khususnya akses fasilitas BAB yang digunakan sendiri, berkaitan kuat dengan variasi prevalensi penyakit berbasis lingkungan, yang terutama dicerminkan oleh perubahan pada prevalensi log_Y1.

Menghitung loading kanonic

cc1_comp <- comput(X, Y, cc1)

Korelasi X dengan fungsi kanonik X

cc1_comp <- comput(X, Y, cc1)
library(corrplot)
## corrplot 0.95 loaded
corrplot(cc1_comp$corr.X.xscores, method = "color", addCoef.col ='white', is.cor = T)

Diperoleh bahwa untuk fungsi kanonik peubah X peubah-peubah yang berhubungan paling erat dengan fungsi kanonik pertama adalah (X1), sedangkan terhadap fungsi kanonik kedua yaitu X3

Korelasi Y dengan fungsi kanonik Y

cc1_comp$corr.Y.yscores
##             [,1]       [,2]        [,3]
## log_Y1 0.8956944 -0.4338934 -0.09730362
## log_Y2 0.8151960  0.4184985 -0.40039291
## log_Y3 0.5533161 -0.3007320 -0.77678925
corrplot(cc1_comp$corr.Y.yscores, method = "color", addCoef.col ='white', is.cor = T)

Untuk fungsi kanonik peubah Y terlihat bahwa peubah-peubah yang berhubungan paling erat dengan fungsi kanonik pertama yaitu log_Y1, pada kanonik dua pun log_Y1 paling erat.

Korelasi silang X dengan fungsi kanonik Y

cc1_comp$corr.X.yscores
##          [,1]        [,2]        [,3]
## X1 -0.8222670  0.05108333 -0.02076958
## X2 -0.3466900 -0.13871861  0.07446585
## X3 -0.2732173  0.45475337  0.01993403
corrplot(cc1_comp$corr.X.yscores, method = "color", addCoef.col ='white', is.cor = T)

Korelasi silang antar peubah-peubah independen terhadap fungsi kanonik peubah dependen memberikah hasil bahwa yang berhubungan paling erat dengan fungsi kanonik pertama adalah (X1), dan dengan fungsi kanonik kedua adalah (X3).

Korelasi silang Y dengan fungsi kanonik X

cc1_comp$corr.Y.xscores
##             [,1]       [,2]         [,3]
## log_Y1 0.7634933 -0.2148943 -0.008332743
## log_Y2 0.6948761  0.2072696 -0.034288253
## log_Y3 0.4716487 -0.1489434 -0.066521524
corrplot(cc1_comp$corr.Y.xscores, method = "color", addCoef.col ='white', is.cor = T)

Sedangkan korelasi silang antar peubah-peubah Y terhadap fungsi kanonik peubah X memberikah hasil bahwa yang berhubungan paling erat dengan fungsi kanonik pertama adalah log_Y1, dan dengan fungsi kanonik kedua adalah log_Y1 dan log_Y2.

Uji signifikansi korelasi kanonic

rho <- cc1$cor
n <- dim(X)[1]
p <- length(X)
q <- length(Y)
# install.packages("CCP")
library(CCP)
## Warning: package 'CCP' was built under R version 4.5.2
p.asym(rho, n, p, q, tstat = "Wilks")
## Wilks' Lambda, using F-approximation (Rao's F):
##               stat    approx df1     df2      p.value
## 1 to 3:  0.2048299 7.9626599   9 78.0302 2.964182e-08
## 2 to 3:  0.7491732 2.5630694   4 66.0000 4.634039e-02
## 3 to 3:  0.9926664 0.2511849   1 34.0000 6.194715e-01
p.asym(rho, n, p, q, tstat = "Hotelling")
##  Hotelling-Lawley Trace, using F-approximation:
##                 stat     approx df1 df2      p.value
## 1 to 3:  2.989942268 10.1879514   9  92 9.754064e-11
## 2 to 3:  0.332403676  2.7146300   4  98 3.417939e-02
## 3 to 3:  0.007387792  0.2561101   1 104 6.138763e-01
p.asym(rho, n, p, q, tstat = "Pillai")
##  Pillai-Bartlett Trace, using F-approximation:
##                 stat    approx df1 df2      p.value
## 1 to 3:  0.979217764 5.4918344   9 102 3.842345e-06
## 2 to 3:  0.252625679 2.4826953   4 108 4.798373e-02
## 3 to 3:  0.007333613 0.2793602   1 114 5.981484e-01
p.asym(rho, n, p, q, tstat = "Roy")
##  Roy's Largest Root, using F-approximation:
##               stat   approx df1 df2      p.value
## 1 to 1:  0.7265921 30.11877   3  34 1.091395e-09
## 
##  F statistic for Roy's Greatest Root is an upper bound.

Secara umum, banyak fungsi/dimensi kanonik sama dengan jumlah peubah dalam himpunan yang lebih kecil, namun banyak dimensi yang signifikan mungkin lebih kecil lagi. Dimensi kanonik, juga dikenal sebagai fungsi kanonik, adalah peubah laten yang mirip dengan faktor-faktor yang diperoleh dalam analisis faktor. Untuk model khusus ini terdapat tiga dimensi kanonik.

Dari hasil di atas diperoleh bahwa keempat pengujian menunjukkan bahwa pada fungsi/dimensi kanonik pertama, semuanya signifikan pada taraf nyata 5%. Artinya, minimal ada satu korelasi kanonik yang nyata. Selanjutnya dilanjutkan dengan uji parsial.

cca1
## 
## Canonical correlation analysis of:
##   3   X  variables:  X1, X2, X3 
##   with    3   Y  variables:  log_Y1, log_Y2, log_Y3 
## 
##      CanR   CanRSQ    Eigen percent    cum                          scree
## 1 0.85240 0.726592 2.657539 88.8826  88.88 ******************************
## 2 0.49527 0.245292 0.325016 10.8703  99.75 ****                          
## 3 0.08564 0.007334 0.007388  0.2471 100.00                               
## 
## Test of H0: The canonical correlations in the 
## current row and all that follow are zero
## 
##      CanR LR test stat approx F numDF denDF   Pr(> F)    
## 1 0.85240      0.20483   7.9627     9 78.03 2.964e-08 ***
## 2 0.49527      0.74917   2.5631     4 66.00   0.04634 *  
## 3 0.08564      0.99267   0.2512     1 34.00   0.61947    
## ---
## Signif. codes:  0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1

Berdasarkn hasil uji parsial tersebut terlihat bahwa memang hanya fungsi kanonik 1 dan 2 yang berbeda nyara dengan 0 dalam taraf nyata 5% berdasarkan uji LR.

Menghitung koefisien korelasi kanonic terstandarisasi

coef_X <- diag(sqrt(diag(cov(X))))
coef_X %*% cc1$xcoef
##             [,1]       [,2]       [,3]
## [1,] -0.93218126 -0.1986521 -0.4999982
## [2,] -0.26628556 -0.3262809  0.9203640
## [3,]  0.02348562  1.0118809  0.3369149

Koefisien kanonik untuk fungsi kanonik pertama menunjukkan bahwa X1 merupakan peubah yang paling dominan dalam membentuk variat kanonik pertama gugus lingkungan, diikuti oleh X2, sedangkan X3 memberikan kontribusi yang sangat kecil. Dengan demikian, akses fasilitas BAB digunakan sendiri menjadi faktor lingkungan utama yang berkaitan dengan pola penyakit pada fungsi kanonik pertama.

Urutan kontribusi relatif peubah-peubah X terhadap variat kanonik kedua menunjukkan bahwa upaya pemberantasan sarang nyamuk melalui penutupan penampungan air (X3) merupakan peubah yang paling dominan, diikuti oleh kondisi pembuangan limbah (X2), sedangkan fasilitas BAB (X1) memiliki kontribusi yang lebih kecil pada fungsi ini.

coef_Y <- diag(sqrt(diag(cov(Y))))
coef_Y %*% cc1$ycoef
##            [,1]       [,2]        [,3]
## [1,]  0.8385456 -0.7749164  0.89731284
## [2,]  0.5793290  1.2082808 -0.05511997
## [3,] -0.4036522 -0.5257345 -1.37133997

Koefisien kanonik untuk fungsi kanonik pertama menunjukkan bahwa log_Y1 (pravalensi diare) merupakan peubah yang paling dominan dalam membentuk variat kanonik pertama gugus penyakit, diikuti oleh log_Y2(pravalensi malaria) dan log_Y3(pravalensi DBD). Dengan demikian, fungsi kanonik pertama terutama merepresentasikan pola penyakit yang didominasi oleh prevalensi log_Y1.

Urutan kontribusi relatif pada fungsi kanonik kedua menunjukkan bahwa log_Y2 merupakan peubah yang paling berperan, diikuti oleh log_Y1 dan log_Y3. Fungsi kanonik kedua mencerminkan variasi tambahan pola penyakit yang berbeda dari fungsi kanonik pertama.

Fungsi Kanonik

Diperoleh beberapa fungsi kanonik sebagai berikut:

U1=−0.931X1−0.266X2+0.02X3
U1=−0.198X1−0.326X2+1.011X3

V1=0.839log(Y1)+0.579log(Y2)-0.403log(Y3)
V1=-0.775log(Y1)+1.208log(Y2)-0.526log(Y3)