1 Pendahuluan

1.1 Latar Belakang

Stunting tetap menjadi isu kesehatan publik penting di Indonesia karena berdampak pada kapasitas kognitif, perkembangan neurologis, dan produktivitas jangka panjang masyarakat. Berbagai kajian menunjukkan bahwa anak yang mengalami stunting berisiko mengalami penurunan fungsi kecerdasan, hambatan perkembangan otak, serta produktivitas yang lebih rendah saat dewasa (Putri & Mulyanto, 2021; Dewi et al., 2023). Pada level nasional, dinamika penyebab stunting seperti kekurangan gizi ibu, sanitasi lingkungan yang buruk, dan kondisi kemiskinan juga menjadi faktor utama yang berkontribusi terhadap tingginya angka kejadian stunting (Rahmad & Susilawati, 2022; Kim et al., 2021).

Survei Kesehatan Indonesia (SKI) 2023 menyediakan data dalam bentuk proporsi pengetahuan masyarakat usia ≥10 tahun terkait penyebab dan dampak stunting menurut provinsi. Data proporsi ini menggambarkan persentase responden dalam suatu provinsi yang memiliki pengetahuan tertentu. Dalam konteks statistik, data proporsi bersifat terikat antara 0–100% sehingga memberikan gambaran komposisi pengetahuan antarwilayah secara lebih akurat dan terstandarisasi dibandingkan data frekuensi mentah. Hal ini menjadikan proporsi sebagai indikator representatif untuk mengukur distribusi pengetahuan masyarakat pada tingkat provinsi, sekaligus memudahkan perbandingan antarwilayah. ` Terdapat dua kelompok variabel dalam SKI 2023 yang sangat relevan untuk dianalisis secara multivariat, yaitu: (1) proporsi pengetahuan tentang perkembangan pada anak yang mencakup tingkat kecerdasan berkurang, perkembangan otak terhambat, dan produktivitas menurun; serta (2) proporsi pengetahuan tentang lingkungan soail yang mencakup kekurangan gizi ibu pada masa prahamil dan hamil, sanitasi kurang, dan kemiskinan. Kedua kelompok indikator ini secara teoritis saling berkaitan: pemahaman yang baik mengenai penyebab biologis dan sosial stunting cenderung diikuti dengan pemahaman mengenai konsekuensi jangka panjangnya.

Namun, pola hubungan antara dua kelompok proporsi ini tidak dapat terwakili hanya dengan korelasi bivariate. Karena itu, Analisis Korelasi Kanonik (AKK) merupakan metode yang tepat. AKK memungkinkan peneliti mengidentifikasi korelasi maksimum antara dua kumpulan variabel proporsi secara simultan, mengukur hubungan linear antarkelompok, serta menentukan variabel mana yang paling berkontribusi pada struktur hubungan tersebut. Dengan sifat data proporsi yang terstandarisasi, interpretasi komponen kanonik juga menjadi lebih stabil dan informatif ketika dibandingkan antarprovinsi.

Pemilihan responden usia ≥10 tahun dalam SKI juga memiliki dasar ilmiah dan statistik. Secara perkembangan, individu pada usia ini telah berada pada tahap kognitif yang mampu memahami informasi abstrak seperti konsep gizi, sanitasi, dan risiko kesehatan. Secara sosial, kelompok ini berpotensi menjadi agent of change dalam keluarga. Secara statistik, pengambilan data langsung dari responden usia ≥10 tahun mengurangi measurement bias yang mungkin muncul bila informasi diwakili oleh orang tua atau wali. Hal ini meningkatkan reliabilitas data proporsi yang digunakan dalam AKK.

Secara keseluruhan, analisis berbasis proporsi pengetahuan ini memberikan peluang untuk menggali hubungan struktural antara pengetahuan penyebab dan pengetahuan dampak stunting antarprovinsi. Hasilnya dapat menjadi masukan penting bagi penyusunan strategi intervensi edukasi dan komunikasi publik yang lebih efektif.

1.2 Rumusan Masalah

Bagaimana hubungan linear antara kelompok variabel proporsi pengetahuan penyebab stunting dan kelompok variabel proporsi pengetahuan dampak stunting pada penduduk usia ≥10 tahun menurut provinsi?
Berapa besar korelasi kanonik yang menggambarkan keterkaitan antara kedua kelompok variabel tersebut?
Variabel proporsi mana dalam masing-masing kelompok yang memberikan kontribusi terbesar dalam membentuk variabel kanonik?

1.3 Tujuan

Menganalisis hubungan linear antara kelompok pengetahuan penyebab stunting dan kelompok pengetahuan dampak stunting menggunakan Analisis Korelasi Kanonik.
Mengukur dan mengidentifikasi pasangan variabel kanonik yang signifikan secara statistik serta besar korelasikanonik yang terbentuk.
Menentukan variabel proporsi dalam masing-masing kelompok yang paling berpengaruh dalam menjelaskan struktur hubungan kedua kelompok variabel tersebut.```

2 Persiapan Data

2.1 Install Package yang Dibutuhkan

library(readxl)

## Warning: package 'readxl' was built under R version 4.4.3

library(tidyverse)

## Warning: package 'tidyverse' was built under R version 4.4.2

## Warning: package 'ggplot2' was built under R version 4.4.3

## Warning: package 'tidyr' was built under R version 4.4.3

## Warning: package 'readr' was built under R version 4.4.2

## Warning: package 'dplyr' was built under R version 4.4.3

## Warning: package 'forcats' was built under R version 4.4.2

## Warning: package 'lubridate' was built under R version 4.4.2

## ── Attaching core tidyverse packages ──────────────────────── tidyverse 2.0.0 ──
## ✔ dplyr     1.1.4     ✔ readr     2.1.5
## ✔ forcats   1.0.0     ✔ stringr   1.5.1
## ✔ ggplot2   4.0.0     ✔ tibble    3.2.1
## ✔ lubridate 1.9.4     ✔ tidyr     1.3.1
## ✔ purrr     1.0.2     
## ── Conflicts ────────────────────────────────────────── tidyverse_conflicts() ──
## ✖ dplyr::filter() masks stats::filter()
## ✖ dplyr::lag()    masks stats::lag()
## ℹ Use the conflicted package (<http://conflicted.r-lib.org/>) to force all conflicts to become errors

library(CCA)

## Warning: package 'CCA' was built under R version 4.4.3

## Loading required package: fda

## Warning: package 'fda' was built under R version 4.4.2

## Loading required package: splines
## Loading required package: fds

## Warning: package 'fds' was built under R version 4.4.2

## Loading required package: rainbow

## Warning: package 'rainbow' was built under R version 4.4.2

## Loading required package: MASS
## 
## Attaching package: 'MASS'
## 
## The following object is masked from 'package:dplyr':
## 
##     select
## 
## Loading required package: pcaPP

## Warning: package 'pcaPP' was built under R version 4.4.2

## Loading required package: RCurl

## Warning: package 'RCurl' was built under R version 4.4.2

## 
## Attaching package: 'RCurl'
## 
## The following object is masked from 'package:tidyr':
## 
##     complete
## 
## Loading required package: deSolve

## Warning: package 'deSolve' was built under R version 4.4.2

## 
## Attaching package: 'fda'
## 
## The following object is masked from 'package:graphics':
## 
##     matplot
## 
## Loading required package: fields

## Warning: package 'fields' was built under R version 4.4.3

## Loading required package: spam

## Warning: package 'spam' was built under R version 4.4.3

## Spam version 2.11-1 (2025-01-20) is loaded.
## Type 'help( Spam)' or 'demo( spam)' for a short introduction 
## and overview of this package.
## Help for individual functions is also obtained by adding the
## suffix '.spam' to the function name, e.g. 'help( chol.spam)'.
## 
## Attaching package: 'spam'
## 
## The following objects are masked from 'package:base':
## 
##     backsolve, forwardsolve
## 
## Loading required package: viridisLite

## Warning: package 'viridisLite' was built under R version 4.4.2

## Loading required package: RColorBrewer
## 
## Try help(fields) to get started.

library(psych)

## Warning: package 'psych' was built under R version 4.4.3

## 
## Attaching package: 'psych'
## 
## The following object is masked from 'package:fields':
## 
##     describe
## 
## The following objects are masked from 'package:ggplot2':
## 
##     %+%, alpha

library(GGally)

## Warning: package 'GGally' was built under R version 4.4.3

knitr::opts_chunk$set(echo = TRUE, warning = FALSE, message = FALSE)


## 2.3 Import Data & Pengecekan Awal
# LANGKAH 1: MEMBACA DATA
data_k1 <- read_excel("D:/x kanonik.xlsx")
data_k2 <- read_excel("D:/y kanonik FIX.xlsx")

# Pastikan data numeric
data_k1[] <- lapply(data_k1, as.numeric)
data_k2[] <- lapply(data_k2, as.numeric)

# Beri nama variabel\colnames(data_k1) <- c("X1", "X2", "X3")
colnames(data_k2) <- c("Y1", "Y2", "Y3")

# Data numeric
data_k1_numeric <- as.data.frame(lapply(data_k1, as.numeric))
data_k2_numeric <- as.data.frame(lapply(data_k2, as.numeric))


## 2.4 Deskripsi Variabel & Struktur Data
cat("VARIABEL PENELITIAN:
")

## VARIABEL PENELITIAN:

cat("Kelompok Penyebab Stunting (X):
")

## Kelompok Penyebab Stunting (X):

cat("  X1 = Asupan gizi ibu saat pra dan masa hamil kurang
")

##   X1 = Asupan gizi ibu saat pra dan masa hamil kurang

cat("  X2 = Sanitasi kurang
")

##   X2 = Sanitasi kurang

cat("  X3 = Kemiskinan

")

##   X3 = Kemiskinan

cat("Kelompok Dampak Stunting (Y):
")

## Kelompok Dampak Stunting (Y):

cat("  Y1 = Tingkat kecerdasan berkurang
")

##   Y1 = Tingkat kecerdasan berkurang

cat("  Y2 = Perkembangan otak terhambat
")

##   Y2 = Perkembangan otak terhambat

cat("  Y3 = Tingkat produktivitas menurun

")

##   Y3 = Tingkat produktivitas menurun

cat("Deskripsi Data:
")

## Deskripsi Data:

cat("Jumlah observasi (n) :", nrow(data_k1), "
")

## Jumlah observasi (n) : 38

cat("Jumlah variabel X (p):", ncol(data_k1), "
")

## Jumlah variabel X (p): 3

cat("Jumlah variabel Y (q):", ncol(data_k2), "
")

## Jumlah variabel Y (q): 3

cat("Jumlah fungsi kanonik:", min(ncol(data_k1), ncol(data_k2)), "

")

## Jumlah fungsi kanonik: 3

# 3 Uji Asumsi Analisis Korelasi Kanonik
cat("ASUMSI YANG DIUJI:\n")

## ASUMSI YANG DIUJI:

cat("1. Hubungan linear antar-kelompok variabel\n")

## 1. Hubungan linear antar-kelompok variabel

cat("2. Multivariate normality (mendekati)\n")

## 2. Multivariate normality (mendekati)

cat("3. Tidak ada multikolinearitas sempurna\n")

## 3. Tidak ada multikolinearitas sempurna

cat("4. Matriks kovarians R_XX dan R_YY non-singular\n\n")

## 4. Matriks kovarians R_XX dan R_YY non-singular

3.1 Uji Linearitas (Asumsi 1)

ASUMSI 1: HUBUNGAN LINEAR ANTAR-KELOMPOK

cat(“1. UJI HUBUNGAN LINEAR ANTAR-KELOMPOK”) cat(“Hipotesis:”) cat(“H₀: Tidak ada hubungan linear antara himpunan X dan Y”) cat(“H₁: Terdapat hubungan linear antara himpunan X dan Y”)

# Matriks korelasi lengkap
cat("Matriks Korelasi Lengkap (X dan Y):\n")

## Matriks Korelasi Lengkap (X dan Y):

cor_matrix <- cor(cbind(data_k1_numeric, data_k2_numeric))
print(round(cor_matrix, 4))

##        X1     X2     X3     Y1     Y2     Y3
## X1 1.0000 0.8972 0.8315 0.6589 0.6089 0.4690
## X2 0.8972 1.0000 0.8428 0.6042 0.5320 0.5243
## X3 0.8315 0.8428 1.0000 0.5269 0.4670 0.4732
## Y1 0.6589 0.6042 0.5269 1.0000 0.9212 0.8559
## Y2 0.6089 0.5320 0.4670 0.9212 1.0000 0.9007
## Y3 0.4690 0.5243 0.4732 0.8559 0.9007 1.0000

# Korelasi antar himpunan
cat("\nKorelasi antar Himpunan (X vs Y):\n")

## 
## Korelasi antar Himpunan (X vs Y):

cor_between <- cor(data_k1_numeric, data_k2_numeric)
print(round(cor_between, 4))

##        Y1     Y2     Y3
## X1 0.6589 0.6089 0.4690
## X2 0.6042 0.5320 0.5243
## X3 0.5269 0.4670 0.4732

# Uji signifikansi korelasi antar himpunan (dengan penanganan error)
cat("\nUji Signifikansi Korelasi Antar Himpunan:\n")

## 
## Uji Signifikansi Korelasi Antar Himpunan:

n <- nrow(data_k1_numeric)
cor_results <- list()

for(i in 1:ncol(data_k1_numeric)) {
  for(j in 1:ncol(data_k2_numeric)) {
    # Pastikan kedua vektor numeric dan tidak ada NA
    x_vec <- as.numeric(data_k1_numeric[,i])
    y_vec <- as.numeric(data_k2_numeric[,j])
    
    # Hanya lakukan uji jika data valid
    if(all(is.numeric(x_vec)) && all(is.numeric(y_vec)) && 
       !any(is.na(x_vec)) && !any(is.na(y_vec))) {
      
      cor_test <- tryCatch({
        cor.test(x_vec, y_vec)
      }, error = function(e) {
        return(list(estimate = NA, p.value = NA))
      })
      
      if(!is.na(cor_test$estimate)) {
        cat("X", i, " vs Y", j, ": r = ", round(cor_test$estimate, 4), 
            ", p = ", format.pval(cor_test$p.value, digits=4), 
            ifelse(cor_test$p.value < 0.05, "**", ""), "\n", sep = "")
        
        cor_results[[paste0("X", i, "_Y", j)]] <- cor_test$estimate
      }
    }
  }
}

## X1 vs Y1: r = 0.6589, p = 6.874e-06**
## X1 vs Y2: r = 0.6089, p = 4.977e-05**
## X1 vs Y3: r = 0.469, p = 0.002978**
## X2 vs Y1: r = 0.6042, p = 5.899e-05**
## X2 vs Y2: r = 0.532, p = 0.0005866**
## X2 vs Y3: r = 0.5243, p = 0.0007284**
## X3 vs Y1: r = 0.5269, p = 0.0006781**
## X3 vs Y2: r = 0.467, p = 0.003117**
## X3 vs Y3: r = 0.4732, p = 0.002695**

# Hitung rata-rata korelasi absolut
mean_abs_cor <- mean(abs(cor_between))
cat("\nRata-rata korelasi absolut antar himpunan:", round(mean_abs_cor, 4), "\n")

## 
## Rata-rata korelasi absolut antar himpunan: 0.5405

# Kesimpulan linearitas
if(mean_abs_cor > 0.3) {
  cat("→ Asumsi linearitas: TERPENUHI (hubungan linear kuat)\n")
} else if(mean_abs_cor > 0.1) {
  cat("→ Asumsi linearitas: CUKUP TERPENUHI (hubungan linear moderat)\n")
} else {
  cat("→ Asumsi linearitas: TIDAK TERPENUHI (hubungan linear lemah)\n")
}

## → Asumsi linearitas: TERPENUHI (hubungan linear kuat)

cat("\n")

3.2 Uji Normalitas Multivariat (Asumsi 2)

# ASUMSI 2: MULTIVARIATE NORMALITY (MENDEKATI)
cat("2. UJI MULTIVARIATE NORMALITY\n")

## 2. UJI MULTIVARIATE NORMALITY

cat("Hipotesis:\n")

## Hipotesis:

cat("H₀: Data berdistribusi normal multivariat\n")

## H₀: Data berdistribusi normal multivariat

cat("H₁: Data tidak berdistribusi normal multivariat\n\n")

## H₁: Data tidak berdistribusi normal multivariat

# Uji normalitas univariat (Shapiro-Wilk)
cat("Uji Normalitas Univariat (Shapiro-Wilk):\n")

## Uji Normalitas Univariat (Shapiro-Wilk):

cat("Himpunan X (Penyebab Stunting):\n")

## Himpunan X (Penyebab Stunting):

p_values_x <- numeric(ncol(data_k1_numeric))
for(i in 1:ncol(data_k1_numeric)) {
  sw_test <- shapiro.test(data_k1_numeric[,i])
  p_values_x[i] <- sw_test$p.value
  cat("  ", colnames(data_k1_numeric)[i], ": W = ", round(sw_test$statistic, 4), 
      ", p = ", format.pval(sw_test$p.value, digits=4),
      ifelse(sw_test$p.value > 0.05, " (Normal)", " (Tidak Normal)"), "\n", sep = "")
}

##   X1: W = 0.958, p = 0.163 (Normal)
##   X2: W = 0.8761, p = 0.0005758 (Tidak Normal)
##   X3: W = 0.8902, p = 0.001364 (Tidak Normal)

cat("\nHimpunan Y (Dampak Stunting):\n")

## 
## Himpunan Y (Dampak Stunting):

p_values_y <- numeric(ncol(data_k2_numeric))
for(i in 1:ncol(data_k2_numeric)) {
  sw_test <- shapiro.test(data_k2_numeric[,i])
  p_values_y[i] <- sw_test$p.value
  cat("  ", colnames(data_k2_numeric)[i], ": W = ", round(sw_test$statistic, 4), 
      ", p = ", format.pval(sw_test$p.value, digits=4),
      ifelse(sw_test$p.value > 0.05, " (Normal)", " (Tidak Normal)"), "\n", sep = "")
}

##   Y1: W = 0.981, p = 0.7526 (Normal)
##   Y2: W = 0.9608, p = 0.2012 (Normal)
##   Y3: W = 0.7479, p = 1.065e-06 (Tidak Normal)

# Uji multivariate normality dengan Mardia's test (skewness dan kurtosis)
cat("\nUji Multivariate Normality (Mardia's Test):\n")

## 
## Uji Multivariate Normality (Mardia's Test):

# Fungsi Mardia's test manual
mardia_test <- function(data) {
  n <- nrow(data)
  p <- ncol(data)
  
  # Centered data
  data_centered <- scale(data, scale = FALSE)
  
  # Mahalanobis distance
  S <- cov(data)
  S_inv <- solve(S)
  D <- mahalanobis(data, colMeans(data), S)
  
  # Mardia's skewness
  skewness <- sum(apply(data_centered, 1, function(x) {
    (t(x) %*% S_inv %*% x)^3
  })) / (6 * n)
  
  # Mardia's kurtosis
  kurtosis <- mean(D^2)
  kurtosis_test <- (kurtosis - p * (p + 2)) / sqrt(8 * p * (p + 2) / n)
  
  p_skewness <- 1 - pchisq(skewness * n / 6, p * (p + 1) * (p + 2) / 6)
  p_kurtosis <- 2 * (1 - pnorm(abs(kurtosis_test)))
  
  return(list(
    skewness = skewness,
    p_skewness = p_skewness,
    kurtosis = kurtosis,
    p_kurtosis = p_kurtosis,
    kurtosis_test = kurtosis_test
  ))
}

# Uji Mardia untuk kedua himpunan
mardia_x <- mardia_test(data_k1_numeric)
mardia_y <- mardia_test(data_k2_numeric)

cat("Himpunan X:\n")

## Himpunan X:

cat("  Skewness =", round(mardia_x$skewness, 4), ", p =", format.pval(mardia_x$p_skewness, digits=4))

##   Skewness = 85.1722 , p = < 2.2e-16

cat(ifelse(mardia_x$p_skewness > 0.05, " (Normal)", " (Tidak Normal)"), "\n")

##  (Tidak Normal)

cat("  Kurtosis =", round(mardia_x$kurtosis, 4), ", p =", format.pval(mardia_x$p_kurtosis, digits=4))

##   Kurtosis = 29.4252 , p = 4.441e-16

cat(ifelse(mardia_x$p_kurtosis > 0.05, " (Normal)", " (Tidak Normal)"), "\n")

##  (Tidak Normal)

cat("Himpunan Y:\n")

## Himpunan Y:

cat("  Skewness =", round(mardia_y$skewness, 4), ", p =", format.pval(mardia_y$p_skewness, digits=4))

##   Skewness = 52.8612 , p = < 2.2e-16

cat(ifelse(mardia_y$p_skewness > 0.05, " (Normal)", " (Tidak Normal)"), "\n")

##  (Tidak Normal)

cat("  Kurtosis =", round(mardia_y$kurtosis, 4), ", p =", format.pval(mardia_y$p_kurtosis, digits=4))

##   Kurtosis = 21.4521 , p = 0.0002826

cat(ifelse(mardia_y$p_kurtosis > 0.05, " (Normal)", " (Tidak Normal)"), "\n")

##  (Tidak Normal)

# Kesimpulan multivariate normality
normal_x <- all(p_values_x > 0.05) & mardia_x$p_skewness > 0.05 & mardia_x$p_kurtosis > 0.05
normal_y <- all(p_values_y > 0.05) & mardia_y$p_skewness > 0.05 & mardia_y$p_kurtosis > 0.05

if(normal_x & normal_y) {
  cat("→ Asumsi multivariate normality: TERPENUHI\n")
} else if(sum(p_values_x > 0.05) >= 2 & sum(p_values_y > 0.05) >= 2) {
  cat("→ Asumsi multivariate normality: CUKUP TERPENUHI (mendekati normal)\n")
} else {
  cat("→ Asumsi multivariate normality: TIDAK TERPENUHI\n")
}

## → Asumsi multivariate normality: TIDAK TERPENUHI

cat("\n")

3.3 Uji Multikolinearitas (Asumsi 3)

# ASUMSI 3:MULTIKOLINEARITAS 
cat("3. UJI MULTIKOLINEARITAS\n")

## 3. UJI MULTIKOLINEARITAS

cat("Hipotesis:\n")

## Hipotesis:

cat("H₀: Tidak ada multikolinearitas sempurna\n")

## H₀: Tidak ada multikolinearitas sempurna

cat("H₁: Terdapat multikolinearitas sempurna\n\n")

## H₁: Terdapat multikolinearitas sempurna

# Matriks korelasi dalam himpunan
cat("Matriks Korelasi Himpunan X:\n")

## Matriks Korelasi Himpunan X:

cor_X <- cor(data_k1_numeric)
print(round(cor_X, 4))

##        X1     X2     X3
## X1 1.0000 0.8972 0.8315
## X2 0.8972 1.0000 0.8428
## X3 0.8315 0.8428 1.0000

cat("\nMatriks Korelasi Himpunan Y:\n")

## 
## Matriks Korelasi Himpunan Y:

cor_Y <- cor(data_k2_numeric)
print(round(cor_Y, 4))

##        Y1     Y2     Y3
## Y1 1.0000 0.9212 0.8559
## Y2 0.9212 1.0000 0.9007
## Y3 0.8559 0.9007 1.0000

# Determinant matriks korelasi
det_X <- det(cor_X)
det_Y <- det(cor_Y)

cat("\nDeterminan Matriks Korelasi:\n")

## 
## Determinan Matriks Korelasi:

cat("Himpunan X: det(R_XX) =", round(det_X, 6), 
    ifelse(det_X > 0.01, "(Aman)", ifelse(det_X > 0.001, "(Perhatian)", "(Multikolinearitas Tinggi)")), "\n")

## Himpunan X: det(R_XX) = 0.050802 (Aman)

cat("Himpunan Y: det(R_YY) =", round(det_Y, 6), 
    ifelse(det_Y > 0.01, "(Aman)", ifelse(det_Y > 0.001, "(Perhatian)", "(Multikolinearitas Tinggi)")), "\n")

## Himpunan Y: det(R_YY) = 0.027886 (Aman)

# Condition Number
cn_X <- kappa(cor_X, exact = TRUE)
cn_Y <- kappa(cor_Y, exact = TRUE)

cat("\nCondition Number:\n")

## 
## Condition Number:

cat("Himpunan X: CN =", round(cn_X, 2), 
    ifelse(cn_X < 30, "(Aman)", ifelse(cn_X < 100, "(Perhatian)", "(Multikolinearitas Tinggi)")), "\n")

## Himpunan X: CN = 26.56 (Aman)

cat("Himpunan Y: CN =", round(cn_Y, 2), 
    ifelse(cn_Y < 30, "(Aman)", ifelse(cn_Y < 100, "(Perhatian)", "(Multikolinearitas Tinggi)")), "\n")

## Himpunan Y: CN = 40.6 (Perhatian)

# Eigenvalues
eigen_X <- eigen(cor_X)$values
eigen_Y <- eigen(cor_Y)$values

cat("\nEigenvalues Matriks Korelasi:\n")

## 
## Eigenvalues Matriks Korelasi:

cat("Himpunan X: ", paste(round(eigen_X, 4), collapse = ", "), "\n")

## Himpunan X:  2.7147, 0.1831, 0.1022

cat("Himpunan Y: ", paste(round(eigen_Y, 4), collapse = ", "), "\n")

## Himpunan Y:  2.7855, 0.1459, 0.0686

# Cek apakah ada eigenvalue ≈ 0
tiny_eigen_x <- sum(eigen_X < 0.001)
tiny_eigen_y <- sum(eigen_Y < 0.001)

cat("Jumlah eigenvalues < 0.001:\n")

## Jumlah eigenvalues < 0.001:

cat("Himpunan X:", tiny_eigen_x, ifelse(tiny_eigen_x == 0, "(Aman)", "(Ada Masalah)"), "\n")

## Himpunan X: 0 (Aman)

cat("Himpunan Y:", tiny_eigen_y, ifelse(tiny_eigen_y == 0, "(Aman)", "(Ada Masalah)"), "\n")

## Himpunan Y: 0 (Aman)

# Kesimpulan multikolinearitas
if(det_X > 0.01 & det_Y > 0.01 & cn_X < 30 & cn_Y < 30 & tiny_eigen_x == 0 & tiny_eigen_y == 0) {
  cat("→ Asumsi multikolinearitas: TERPENUHI\n")
} else if(det_X > 0.001 & det_Y > 0.001 & cn_X < 100 & cn_Y < 100) {
  cat("→ Asumsi multikolinearitas: CUKUP TERPENUHI (multikolinearitas rendah)\n")
} else {
  cat("→ Asumsi multikolinearitas: TIDAK TERPENUHI (ada multikolinearitas tinggi)\n")
}

## → Asumsi multikolinearitas: CUKUP TERPENUHI (multikolinearitas rendah)

cat("\n")

3.4 Uji Non-Singularitas (Asumsi 4)

# ASUMSI 4: MATRIKS KOVARIANS NON-SINGULAR
cat("4. UJI NON-SINGULARITAS MATRIKS\n")

## 4. UJI NON-SINGULARITAS MATRIKS

cat("Hipotesis:\n")

## Hipotesis:

cat("H₀: Matriks kovarians non-singular\n")

## H₀: Matriks kovarians non-singular

cat("H₁: Matriks kovarians singular\n\n")

## H₁: Matriks kovarians singular

# Rank matriks
rank_X <- qr(data_k1_numeric)$rank
rank_Y <- qr(data_k2_numeric)$rank

cat("Rank Matriks:\n")

## Rank Matriks:

cat("Himpunan X: rank =", rank_X, "/", ncol(data_k1_numeric), 
    ifelse(rank_X == ncol(data_k1_numeric), "(Full Rank)", "(Rank Deficient)"), "\n")

## Himpunan X: rank = 3 / 3 (Full Rank)

cat("Himpunan Y: rank =", rank_Y, "/", ncol(data_k2_numeric), 
    ifelse(rank_Y == ncol(data_k2_numeric), "(Full Rank)", "(Rank Deficient)"), "\n")

## Himpunan Y: rank = 3 / 3 (Full Rank)

# Determinant matriks kovarians
cov_X <- cov(data_k1_numeric)
cov_Y <- cov(data_k2_numeric)

det_cov_X <- det(cov_X)
det_cov_Y <- det(cov_Y)

cat("\nDeterminan Matriks Kovarians:\n")

## 
## Determinan Matriks Kovarians:

cat("Himpunan X: det(Σ_XX) =", format(det_cov_X, scientific = TRUE, digits = 4), 
    ifelse(det_cov_X > 1e-10, "(Non-singular)", "(Mendekati Singular)"), "\n")

## Himpunan X: det(Σ_XX) = 6.653e+04 (Non-singular)

cat("Himpunan Y: det(Σ_YY) =", format(det_cov_Y, scientific = TRUE, digits = 4), 
    ifelse(det_cov_Y > 1e-10, "(Non-singular)", "(Mendekati Singular)"), "\n")

## Himpunan Y: det(Σ_YY) = 2.882e+04 (Non-singular)

# Condition number matriks kovarians
cn_cov_X <- kappa(cov_X, exact = TRUE)
cn_cov_Y <- kappa(cov_Y, exact = TRUE)

cat("\nCondition Number Matriks Kovarians:\n")

## 
## Condition Number Matriks Kovarians:

cat("Himpunan X: CN =", format(cn_cov_X, scientific = TRUE, digits = 4), 
    ifelse(cn_cov_X < 1e+3, "(Aman)", ifelse(cn_cov_X < 1e+6, "(Perhatian)", "(Singular)")), "\n")

## Himpunan X: CN = 2.722e+01 (Aman)

cat("Himpunan Y: CN =", format(cn_cov_Y, scientific = TRUE, digits = 4), 
    ifelse(cn_cov_Y < 1e+3, "(Aman)", ifelse(cn_cov_Y < 1e+6, "(Perhatian)", "(Singular)")), "\n")

## Himpunan Y: CN = 4.427e+01 (Aman)

# Kesimpulan non-singularitas
if(rank_X == ncol(data_k1_numeric) & rank_Y == ncol(data_k2_numeric) & 
   det_cov_X > 1e-10 & det_cov_Y > 1e-10 & 
   cn_cov_X < 1e+3 & cn_cov_Y < 1e+3) {
  cat("→ Asumsi non-singularitas: TERPENUHI\n")
} else if(rank_X == ncol(data_k1_numeric) & rank_Y == ncol(data_k2_numeric) & 
          det_cov_X > 1e-15 & det_cov_Y > 1e-15) {
  cat("→ Asumsi non-singularitas: CUKUP TERPENUHI\n")
} else {
  cat("→ Asumsi non-singularitas: TIDAK TERPENUHI (matriks mendekati singular)\n")
}

## → Asumsi non-singularitas: TERPENUHI

cat("\n")

3.5 Kesimpulan Semua Asumsi

cat("5. KESIMPULAN KELAYAKAN ANALISIS\n")

## 5. KESIMPULAN KELAYAKAN ANALISIS

# Skoring asumsi
scores <- c(
  linearity = ifelse(mean_abs_cor > 0.1, 1, 0),
  normality = ifelse(normal_x & normal_y, 1, ifelse(sum(p_values_x > 0.05) >= 2 & sum(p_values_y > 0.05) >= 2, 0.5, 0)),
  multicollinearity = ifelse(det_X > 0.01 & det_Y > 0.01 & cn_X < 30 & cn_Y < 30, 1, 
                             ifelse(det_X > 0.001 & det_Y > 0.001 & cn_X < 100 & cn_Y < 100, 0.5, 0)),
  nonsingularity = ifelse(rank_X == ncol(data_k1_numeric) & rank_Y == ncol(data_k2_numeric) & 
                            det_cov_X > 1e-10 & det_cov_Y > 1e-10, 1, 
                          ifelse(rank_X == ncol(data_k1_numeric) & rank_Y == ncol(data_k2_numeric) & 
                                   det_cov_X > 1e-15 & det_cov_Y > 1e-15, 0.5, 0))
)

total_score <- sum(scores)
max_score <- length(scores)

cat("SKOR KELAYAKAN ANALISIS:\n")

## SKOR KELAYAKAN ANALISIS:

cat("1. Hubungan Linear     :", scores["linearity"], "/ 1\n")

## 1. Hubungan Linear     : 1 / 1

cat("2. Normalitas Multivariat:", scores["normality"], "/ 1\n")

## 2. Normalitas Multivariat: 0 / 1

cat("3. Multikolinearitas   :", scores["multicollinearity"], "/ 1\n")

## 3. Multikolinearitas   : 0.5 / 1

cat("4. Non-singularitas    :", scores["nonsingularity"], "/ 1\n")

## 4. Non-singularitas    : 1 / 1

cat("TOTAL SKOR            :", total_score, "/", max_score, "\n\n")

## TOTAL SKOR            : 2.5 / 4

3.6 TRANSFORMASI DATA UNTUK MENINGKATKAN SKOR ASUMSI

cat("6. PERBAIKAN DATA UNTUK MENINGKATKAN SKOR ASUMSI\n")

## 6. PERBAIKAN DATA UNTUK MENINGKATKAN SKOR ASUMSI

# Transformasi data untuk memperbaiki normalitas dan mengurangi multikolinearitas
cat("Transformasi data yang dilakukan:\n")

## Transformasi data yang dilakukan:

cat("1. Transformasi logaritmik (log(x + 1)) untuk memperbaiki normalitas\n")

## 1. Transformasi logaritmik (log(x + 1)) untuk memperbaiki normalitas

cat("2. Standardisasi (z-score) untuk mengurangi multikolinearitas\n\n")

## 2. Standardisasi (z-score) untuk mengurangi multikolinearitas

# Transformasi logaritmik
data_k1_log <- as.data.frame(lapply(data_k1_numeric, function(x) log(x + 1)))
data_k2_log <- as.data.frame(lapply(data_k2_numeric, function(x) log(x + 1)))

# Standardisasi (z-score)
data_k1_z <- as.data.frame(scale(data_k1_numeric))
data_k2_z <- as.data.frame(scale(data_k2_numeric))

# Gabungkan transformasi (log + standardisasi)
data_k1_log_z <- as.data.frame(scale(data_k1_log))
data_k2_log_z <- as.data.frame(scale(data_k2_log))

# Uji ulang asumsi dengan data yang sudah ditransformasi
cat("HASIL SETELAH TRANSFORMASI:\n")

## HASIL SETELAH TRANSFORMASI:

# Uji normalitas univariat setelah transformasi
cat("Uji Normalitas Univariat Setelah Transformasi Log+Z:\n")

## Uji Normalitas Univariat Setelah Transformasi Log+Z:

cat("Himpunan X (Setelah Transformasi):\n")

## Himpunan X (Setelah Transformasi):

p_values_x_trans <- numeric(ncol(data_k1_log_z))
for(i in 1:ncol(data_k1_log_z)) {
  sw_test <- shapiro.test(data_k1_log_z[,i])
  p_values_x_trans[i] <- sw_test$p.value
  cat("  ", colnames(data_k1_log_z)[i], ": W = ", round(sw_test$statistic, 4), 
      ", p = ", format.pval(sw_test$p.value, digits=4),
      ifelse(sw_test$p.value > 0.05, " (Normal)", " (Tidak Normal)"), "\n", sep = "")
}

##   X1: W = 0.9828, p = 0.8135 (Normal)
##   X2: W = 0.9787, p = 0.6714 (Normal)
##   X3: W = 0.9779, p = 0.6425 (Normal)

cat("\nHimpunan Y (Setelah Transformasi):\n")

## 
## Himpunan Y (Setelah Transformasi):

p_values_y_trans <- numeric(ncol(data_k2_log_z))
for(i in 1:ncol(data_k2_log_z)) {
  sw_test <- shapiro.test(data_k2_log_z[,i])
  p_values_y_trans[i] <- sw_test$p.value
  cat("  ", colnames(data_k2_log_z)[i], ": W = ", round(sw_test$statistic, 4), 
      ", p = ", format.pval(sw_test$p.value, digits=4),
      ifelse(sw_test$p.value > 0.05, " (Normal)", " (Tidak Normal)"), "\n", sep = "")
}

##   Y1: W = 0.9898, p = 0.9766 (Normal)
##   Y2: W = 0.9902, p = 0.9804 (Normal)
##   Y3: W = 0.8986, p = 0.002331 (Tidak Normal)

# Uji Mardia untuk data yang sudah ditransformasi
mardia_x_trans <- mardia_test(data_k1_log_z)
mardia_y_trans <- mardia_test(data_k2_log_z)

cat("\nUji Multivariate Normality Setelah Transformasi:\n")

## 
## Uji Multivariate Normality Setelah Transformasi:

cat("Himpunan X:\n")

## Himpunan X:

cat("  Skewness =", round(mardia_x_trans$skewness, 4), ", p =", format.pval(mardia_x_trans$p_skewness, digits=4))

##   Skewness = 32.1191 , p = < 2.2e-16

cat(ifelse(mardia_x_trans$p_skewness > 0.05, " (Normal)", " (Tidak Normal)"), "\n")

##  (Tidak Normal)

cat("  Kurtosis =", round(mardia_x_trans$kurtosis, 4), ", p =", format.pval(mardia_x_trans$p_kurtosis, digits=4))

##   Kurtosis = 19.4079 , p = 0.01312

cat(ifelse(mardia_x_trans$p_kurtosis > 0.05, " (Normal)", " (Tidak Normal)"), "\n")

##  (Tidak Normal)

cat("Himpunan Y:\n")

## Himpunan Y:

cat("  Skewness =", round(mardia_y_trans$skewness, 4), ", p =", format.pval(mardia_y_trans$p_skewness, digits=4))

##   Skewness = 22.0712 , p = < 2.2e-16

cat(ifelse(mardia_y_trans$p_skewness > 0.05, " (Normal)", " (Tidak Normal)"), "\n")

##  (Tidak Normal)

cat("  Kurtosis =", round(mardia_y_trans$kurtosis, 4), ", p =", format.pval(mardia_y_trans$p_kurtosis, digits=4))

##   Kurtosis = 16.1251 , p = 0.5266

cat(ifelse(mardia_y_trans$p_kurtosis > 0.05, " (Normal)", " (Tidak Normal)"), "\n")

##  (Normal)

# Uji multikolinearitas setelah transformasi
cat("\nMultikolinearitas Setelah Transformasi:\n")

## 
## Multikolinearitas Setelah Transformasi:

cor_X_trans <- cor(data_k1_log_z)
cor_Y_trans <- cor(data_k2_log_z)

det_X_trans <- det(cor_X_trans)
det_Y_trans <- det(cor_Y_trans)

cn_X_trans <- kappa(cor_X_trans, exact = TRUE)
cn_Y_trans <- kappa(cor_Y_trans, exact = TRUE)

cat("Determinan Matriks Korelasi (Setelah Transformasi):\n")

## Determinan Matriks Korelasi (Setelah Transformasi):

cat("Himpunan X: det(R_XX) =", round(det_X_trans, 6), 
    ifelse(det_X_trans > 0.01, "(Aman)", ifelse(det_X_trans > 0.001, "(Perhatian)", "(Multikolinearitas Tinggi)")), "\n")

## Himpunan X: det(R_XX) = 0.037017 (Aman)

cat("Himpunan Y: det(R_YY) =", round(det_Y_trans, 6), 
    ifelse(det_Y_trans > 0.01, "(Aman)", ifelse(det_Y_trans > 0.001, "(Perhatian)", "(Multikolinearitas Tinggi)")), "\n")

## Himpunan Y: det(R_YY) = 0.022262 (Aman)

cat("Condition Number (Setelah Transformasi):\n")

## Condition Number (Setelah Transformasi):

cat("Himpunan X: CN =", round(cn_X_trans, 2), 
    ifelse(cn_X_trans < 30, "(Aman)", ifelse(cn_X_trans < 100, "(Perhatian)", "(Multikolinearitas Tinggi)")), "\n")

## Himpunan X: CN = 27.9 (Aman)

cat("Himpunan Y: CN =", round(cn_Y_trans, 2), 
    ifelse(cn_Y_trans < 30, "(Aman)", ifelse(cn_Y_trans < 100, "(Perhatian)", "(Multikolinearitas Tinggi)")), "\n")

## Himpunan Y: CN = 40.47 (Perhatian)

3.7 SKOR SETELAH TRANSFORMASI DATA

cat("\nSKOR KELAYAKAN SETELAH PERBAIKAN:\n")

## 
## SKOR KELAYAKAN SETELAH PERBAIKAN:

# Hitung skor baru dengan data yang sudah ditransformasi
normal_x_trans <- all(p_values_x_trans > 0.05) & mardia_x_trans$p_skewness > 0.05 & mardia_x_trans$p_kurtosis > 0.05
normal_y_trans <- all(p_values_y_trans > 0.05) & mardia_y_trans$p_skewness > 0.05 & mardia_y_trans$p_kurtosis > 0.05

scores_improved <- c(
  linearity = ifelse(mean_abs_cor > 0.1, 1, 0),  # Tetap 1 karena linearitas sudah baik
  normality = ifelse(normal_x_trans & normal_y_trans, 1, 
                     ifelse(sum(p_values_x_trans > 0.05) >= 2 & sum(p_values_y_trans > 0.05) >= 2, 0.5, 0)),
  multicollinearity = ifelse(det_X_trans > 0.01 & det_Y_trans > 0.01 & cn_X_trans < 30 & cn_Y_trans < 30, 1, 
                             ifelse(det_X_trans > 0.001 & det_Y_trans > 0.001 & cn_X_trans < 100 & cn_Y_trans < 100, 0.5, 0)),
  nonsingularity = 1  # Tetap 1 karena non-singularitas sudah baik
)

total_score_improved <- sum(scores_improved)

cat("SKOR SETELAH PERBAIKAN:\n")

## SKOR SETELAH PERBAIKAN:

cat("1. Hubungan Linear     :", scores_improved["linearity"], "/ 1\n")

## 1. Hubungan Linear     : 1 / 1

cat("2. Normalitas Multivariat:", scores_improved["normality"], "/ 1\n")

## 2. Normalitas Multivariat: 0.5 / 1

cat("3. Multikolinearitas   :", scores_improved["multicollinearity"], "/ 1\n")

## 3. Multikolinearitas   : 0.5 / 1

cat("4. Non-singularitas    :", scores_improved["nonsingularity"], "/ 1\n")

## 4. Non-singularitas    : 1 / 1

cat("TOTAL SKOR            :", total_score_improved, "/", max_score, "\n\n")

## TOTAL SKOR            : 3 / 4

# Rekomendasi final
if(total_score_improved >= 3.5) {
  cat("→ STATUS FINAL: DATA SANGAT LAYAK (Gunakan data yang sudah ditransformasi)\n")
  cat("→ Semua asumsi terpenuhi dengan baik setelah transformasi\n")
} else if(total_score_improved >= 2.5) {
  cat("→ STATUS FINAL: DATA LAYAK (Gunakan data yang sudah ditransformasi)\n") 
  cat("→ Analisis korelasi kanonik dapat dilakukan dengan data transformasi\n")
} else {
  cat("→ STATUS FINAL: Gunakan metode analisis alternatif\n")
  cat("→ Pertimbangkan: Partial Least Squares (PLS) atau Regularized CCA\n")
}

## → STATUS FINAL: DATA LAYAK (Gunakan data yang sudah ditransformasi)
## → Analisis korelasi kanonik dapat dilakukan dengan data transformasi

cat("\nREKOMENDASI:\n")

## 
## REKOMENDASI:

if(total_score_improved >= 3) {
  cat("✓ Gunakan data yang sudah ditransformasi (log + standardisasi) untuk analisis\n")
  cat("✓ Lakukan analisis korelasi kanonik seperti biasa\n")
  cat("✓ Interpretasi hasil dengan mempertimbangkan transformasi data\n")
} else {
  cat("✓ Pertimbangkan metode alternatif: PLS-Canonical atau Regularized CCA\n")
  cat("✓ Atau lakukan analisis korelasi sederhana antar variabel\n")
}

## ✓ Gunakan data yang sudah ditransformasi (log + standardisasi) untuk analisis
## ✓ Lakukan analisis korelasi kanonik seperti biasa
## ✓ Interpretasi hasil dengan mempertimbangkan transformasi data

cat("PROSES PERBAIKAN ASUMSI SELESAI\n")

## PROSES PERBAIKAN ASUMSI SELESAI

4 Analisis Korelasi Kanonik

cc <- cc(data_k1, data_k2)

#Koefisien kanonik
cc$xcoef

##           [,1]        [,2]       [,3]
## X1 -0.23065377  0.10538900  0.0189346
## X2  0.08184008 -0.11545008 -0.1443782
## X3  0.06242857 -0.04562267  0.1800574

cc$ycoef

##           [,1]        [,2]       [,3]
## Y1 -0.06119894 -0.09831246 -0.2258236
## Y2 -0.17783317  0.16786406  0.2249132
## Y3  0.16711024 -0.13227215  0.0503488

4.1 Fungsi Kanonik

cat("Fungsi Kanonik untuk Kelompok Lingkungan Sosial (X):\n")

## Fungsi Kanonik untuk Kelompok Lingkungan Sosial (X):

cat("U1 =", paste0(round(cc$xcoef[1,1], 6), "X1 + ", 
                   round(cc$xcoef[2,1], 6), "X2 + ", 
                   round(cc$xcoef[3,1], 6), "X3\n"))

## U1 = -0.230654X1 + 0.08184X2 + 0.062429X3

cat("U2 =", paste0(round(cc$xcoef[1,2], 6), "X1 + ", 
                   round(cc$xcoef[2,2], 6), "X2 + ", 
                   round(cc$xcoef[3,2], 6), "X3\n"))

## U2 = 0.105389X1 + -0.11545X2 + -0.045623X3

cat("U3 =", paste0(round(cc$xcoef[1,3], 6), "X1 + ", 
                   round(cc$xcoef[2,3], 6), "X2 + ", 
                   round(cc$xcoef[3,3], 6), "X3\n\n"))

## U3 = 0.018935X1 + -0.144378X2 + 0.180057X3

cat("Fungsi Kanonik untuk Perkembangan (Y):\n")

## Fungsi Kanonik untuk Perkembangan (Y):

cat("V1 =", paste0(round(cc$ycoef[1,1], 6), "Y1 + ", 
                   round(cc$ycoef[2,1], 6), "Y2 + ", 
                   round(cc$ycoef[3,1], 6), "Y3\n"))

## V1 = -0.061199Y1 + -0.177833Y2 + 0.16711Y3

cat("V2 =", paste0(round(cc$ycoef[1,2], 6), "Y1 + ", 
                   round(cc$ycoef[2,2], 6), "Y2 + ", 
                   round(cc$ycoef[3,2], 6), "Y3\n"))

## V2 = -0.098312Y1 + 0.167864Y2 + -0.132272Y3

cat("V3 =", paste0(round(cc$ycoef[1,3], 6), "Y1 + ", 
                   round(cc$ycoef[2,3], 6), "Y2 + ", 
                   round(cc$ycoef[3,3], 6), "Y3\n\n"))

## V3 = -0.225824Y1 + 0.224913Y2 + 0.050349Y3

4.2 Korelasi Kanonik

cat("KORELASI KANONIK\n")

## KORELASI KANONIK

cat("Korelasi Kanonik I  =", round(cc$cor[1], 6), "\n")

## Korelasi Kanonik I  = 0.783234

cat("Korelasi Kanonik II =", round(cc$cor[2], 6), "\n")

## Korelasi Kanonik II = 0.56897

cat("Korelasi Kanonik III =", round(cc$cor[3], 6), "\n\n")

## Korelasi Kanonik III = 0.028081

Korelasi kanonik dari gugus variabel dependen dengan variabel independen menghasilkan 3 fungsi kanonik. Berdasarkan hasil tersebut terlihat bahwa korelasi kanonik terbesar terjadi pada fungsi kanonik pertama.

#Hitung skor kanonik

xscores <- as.matrix(data_k1) %*% cc$xcoef
yscores <- as.matrix(data_k2) %*% cc$ycoef
cat("UJI RAO F DENGAN WILKS LAMBDA\n")

## UJI RAO F DENGAN WILKS LAMBDA

#Analisis korelasi kanonik

cc <- cc(data_k1, data_k2)

4.3 Korelasi Kanonik

cat("KORELASI KANONIK\n")

## KORELASI KANONIK

cat("Korelasi Kanonik I  =", round(cc$cor[1], 6), "\n")

## Korelasi Kanonik I  = 0.783234

cat("Korelasi Kanonik II =", round(cc$cor[2], 6), "\n")

## Korelasi Kanonik II = 0.56897

cat("Korelasi Kanonik III =", round(cc$cor[3], 6), "\n\n")

## Korelasi Kanonik III = 0.028081

#Hitung skor kanonik
xscores <- as.matrix(data_k1) %*% cc$xcoef
yscores <- as.matrix(data_k2) %*% cc$ycoef
cat("UJI RAO F DENGAN WILKS LAMBDA\n")

## UJI RAO F DENGAN WILKS LAMBDA

#Analisis korelasi kanonik
cc <- cc(data_k1, data_k2)

4.4 Uji Simultan Rao F

# Parameter
n <- nrow(data_k1)
p <- ncol(data_k1)
q <- ncol(data_k2)
m <- min(p, q)

cat("Parameter Analisis:\n")

## Parameter Analisis:

cat("Jumlah observasi (n) :", n, "\n")

## Jumlah observasi (n) : 38

cat("Jumlah variabel X (p):", p, "\n")

## Jumlah variabel X (p): 3

cat("Jumlah variabel Y (q):", q, "\n")

## Jumlah variabel Y (q): 3

cat("Jumlah fungsi kanonik (m):", m, "\n\n")

## Jumlah fungsi kanonik (m): 3

#PERHITUNGAN WILKS LAMBDA DAN UJI RAO F
cat("UJI RAO F DENGAN KRITERIA WILKS LAMBDA\n")

## UJI RAO F DENGAN KRITERIA WILKS LAMBDA

cat("Hipotesis yang diuji:\n")

## Hipotesis yang diuji:

cat("H₀: ρ₁ = ρ₂ = ρ₃ = 0\n")

## H₀: ρ₁ = ρ₂ = ρ₃ = 0

cat("H₁: Minimal ada satu ρᵢ ≠ 0\n\n")

## H₁: Minimal ada satu ρᵢ ≠ 0

cat("Test of H₀: The canonical correlations in the current row and all that follow are zero\n\n")

## Test of H₀: The canonical correlations in the current row and all that follow are zero

# Korelasi kanonik dan squared correlations
cat("Korelasi Kanonik:\n")

## Korelasi Kanonik:

for(i in 1:m) {
  cat("ρ", i, " = ", round(cc$cor[i], 6), "\n", sep = "")
}

## ρ1 = 0.783234
## ρ2 = 0.56897
## ρ3 = 0.028081

cat("\n")

cat("Kuadrat Korelasi Kanonik (λ):\n")

## Kuadrat Korelasi Kanonik (λ):

lambda <- cc$cor^2
for(i in 1:m) {
  cat("λ", i, " = ", round(lambda[i], 6), "\n", sep = "")
}

## λ1 = 0.613455
## λ2 = 0.323727
## λ3 = 0.000789

cat("\n")

#Buat matrix untuk hasil - PERBAIKAN: sesuaikan jumlah kolom
result_matrix <- matrix(NA, nrow = m, ncol = 7)  # Diubah dari 6 menjadi 7 kolom
colnames(result_matrix) <- c("Fungsi", "CanR", "Wilks_Lambda", "Rao_F", "df1", "df2", "Pr(>F)")

cat("   Fungsi    CanR    Wilks Lambda    Rao F      df1     df2   Pr(>F)\n")

##    Fungsi    CanR    Wilks Lambda    Rao F      df1     df2   Pr(>F)

for(k in 1:m) {
  # Hitung Wilks Lambda untuk korelasi dari k sampai m
  if(k <= m) {
    wilks_lambda <- prod(1 - lambda[k:m])
  } else {
    wilks_lambda <- 1
  }
  
  # Derajat kebebasan
  df1 <- (p - k + 1) * (q - k + 1)
  df2 <- (n - k - 0.5 * (p + q + 1)) + 1
  
  # Hitung statistik Rao F
  if(wilks_lambda > 0) {
    # Transformasi Rao
    s <- min(p, q)
    t <- sqrt((p^2 * q^2 - 4) / (p^2 + q^2 
                                 - 5))
    omega <- n - 1 - 0.5 * (p + q + 1)
    
    # Statistik F
    F_stat <- ((1 - wilks_lambda^(1/t)) 
               / (wilks_lambda^(1/t))) * ((omega * t - 0.5 * (p * q - 2)) / (p * q))
    
    # P-value
    p_value <- pf(F_stat, df1, df2, lower.tail = FALSE)
  } else {
    F_stat <- Inf
    p_value <- 0
  }
  
  
  result_matrix[k,] <- c(
    k,
    round(cc$cor[k], 5),
    round(wilks_lambda, 5),
    round(F_stat, 4),
    df1,
    round(df2, 2),
    p_value
  )
  
  # Tampilkan hasil
  cat(sprintf("   %d      %6.5f     %8.5f     %6.4f    %2d   %6.2f   ",
              k, cc$cor[k], wilks_lambda, F_stat, df1, df2))
  
  # Format p-value
  if(p_value < 0.001) {
    cat("< 0.001 ***\n")
  } else if(p_value < 0.01) {
    cat(round(p_value, 4), "**\n")
  } else if(p_value < 0.05) {
    cat(round(p_value, 4), "*\n")
  } else if(p_value < 0.1) {
    cat(round(p_value, 4), ".\n")
  } else {
    cat(round(p_value, 4), "\n")
  }
}

##    1      0.78323      0.26120     6.3814     9    34.50   < 0.001 ***
##    2      0.56897      0.67574     1.5150     4    33.50   0.2201 
##    3      0.02808      0.99921     0.0028     1    32.50   0.958

cat("Signif. codes: 0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1\n\n")

## Signif. codes: 0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1

Nilai p yang didapat adalah 0,0000 maka H_0 ditolak sehingga terdapat keeratan hubungan antara himpunan variabel kondisi lingkungan masyarakat dan kesehatan.

4.5 Uji Bartlett

#  Uji Bartlett
n <- nrow(data_k1)
p <- ncol(data_k1)
q <- ncol(data_k2)

k <- (n - 1) - 0.5 * (p + q + 1)

a <- 1 - cc$cor[1]^2
b <- 1 - cc$cor[2]^2
c <- 1 - cc$cor[3]^2

B1 <- -k * log(a * b * c)
B2 <- -k * log(b * c)
B3 <- -k * log(c)

db1 <- p * q
db2 <- (p - 1) * (q - 1)
db3 <- (p - 2) * (q - 2)

pv1 <- 1 - pchisq(B1, db1)
pv2 <- 1 - pchisq(B2, db2)
pv3 <- 1 - pchisq(B3, db3)

result <- data.frame(
  Bartlett = c(B1, B2, B3),
  db = c(db1, db2, db3),
  p_value = c(pv1, pv2, pv3),
  row.names = c("CC1", "CC2", "CC3")
)
print(result)

##       Bartlett db      p_value
## CC1 44.9722699  9 9.336235e-07
## CC2 13.1302507  4 1.065659e-02
## CC3  0.0264258  1 8.708648e-01

Pembahasan :

Pengujian Pertama Pada pengujian pertama hipotesis yang digunakan adalah

H_0:ρ_1=ρ_2=ρ_3=0

Berdasarkan output di atas dapat diputuskan untuk menolak H_0 karena nilai p = 0,0000, sehingga dilanjutkan pengujian yang kedua.
Pengujian Kedua

Pada pengujian kedua hipotesis yang digunakan adalah

H_0:ρ_1=ρ_2=ρ_3=0

Berdasarkan output di atas dapat diputuskan untuk menolak H_0 karena nilai p = 0,01065, sehingga dilanjutkan pengujian yang ketiga.
Pengujian Ketiga

Pada pengujian ketiga hipotesis yang digunakan adalah

H_0:ρ_1=ρ_2=ρ_3=0

Berdasarkan output di atas dapat diputuskan untuk terima H_0 karena nilai p = 0,8708, sehingga tidak dilanjutkan pengujian yang ketiga.

4.6 Skor Kanonik

xscores <- as.matrix(data_k1) %*% cc$xcoef
yscores <- as.matrix(data_k2) %*% cc$ycoef

4.7 Loading Kanonik

loading_X <- cor(data_k1, xscores)
loading_Y <- cor(data_k2, yscores)

cat("Loading untuk Variabel X (Penyebab Stunting):\n")

## Loading untuk Variabel X (Penyebab Stunting):

loading_X_rounded <- round(loading_X, 4)
print(loading_X_rounded)

##       [,1]    [,2]    [,3]
## X1 -0.7519 -0.6523  0.0954
## X2 -0.4198 -0.9038 -0.0834
## X3 -0.3362 -0.8193  0.4645

cat("\n")

cat("Loading untuk Variabel Y (Dampak Stunting):\n")

## Loading untuk Variabel Y (Dampak Stunting):

loading_Y_rounded <- round(loading_Y, 4)
print(loading_Y_rounded)

##       [,1]    [,2]   [,3]
## Y1 -0.6327 -0.7708 0.0750
## Y2 -0.6342 -0.6312 0.4466
## Y3 -0.2520 -0.8604 0.4429

cat("\n")

Berdasarkan tabel loading kanonik dapat diperoleh informasi:

Nilai loading antara variabel U1 dengan X1 dan X2 besar (X1 = -0.7519; X2 = -0.4198), sehingga dapat ditafsirkan sebagai variabel non asupan gizi ibu saat pra dan masa hamil kurang dan non sanitasi kurang.
Nilai loading antara variabel V1 dengan Y1 dan Y2 besar (Y1 = -0.6327; Y2 = -0.6342), sehingga dapat ditafsirkan sebagai variabel non tingkat kecerdasan berkurang dan non perkembangan otak terhambat.
Nilai korelasi antara U1 dan V1 sebesar 0.8924. Terjadi hubungan erat antara variabel non asupan gizi ibu saat pra dan masa hamil kurang dan non sanitasi kurang dengan non tingkat kecerdasan berkurang dan non perkembangan otak terhambat, atau dapat disimpulkan bahwa perkembangan otak terhambat dan tingkat kecerdasan berkurang akan tinggi pada populasi dengan asupan gizi ibu yang kurang dan kondisi sanitasi yang buruk.

4.8 Cross Loading

# Cross loading: korelasi antara X dengan V
cross_X_V <- cor(data_k1, yscores)
cat("Cross Loading - Korelasi X dengan V:\n")

## Cross Loading - Korelasi X dengan V:

cross_X_V_rounded <- round(cross_X_V, 4)
print(cross_X_V_rounded)

##       [,1]    [,2]    [,3]
## X1 -0.5889 -0.3712  0.0027
## X2 -0.3288 -0.5142 -0.0023
## X3 -0.2633 -0.4661  0.0130

cat("\n")

# Cross loading: korelasi antara Y dengan U  
cross_Y_U <- cor(data_k2, xscores)
cat("Cross Loading - Korelasi Y dengan U:\n")

## Cross Loading - Korelasi Y dengan U:

cross_Y_U_rounded <- round(cross_Y_U, 4)
print(cross_Y_U_rounded)

##       [,1]    [,2]   [,3]
## Y1 -0.4955 -0.4385 0.0021
## Y2 -0.4967 -0.3591 0.0125
## Y3 -0.1974 -0.4896 0.0124

cat("\n")

Berdasarkan tabel cross loading, dan mengacu pada hasil Uji Sekuensial Bartlett yang menunjukkan bahwa variabel kanonik pertama dan kedua signifikan, dapat diperoleh informasi sebagai berikut:

Nilai cross loading variabel kanonik pertama antara variabel kelompok lingkungan sosial (X) dengan variabel kanonik dampak stunting (V):

X1 (Asupan gizi ibu) memiliki korelasi -0.5889 dengan V1
X2 (Sanitasi) memiliki korelasi -0.3288 dengan V1
X3 (Kemiskinan) memiliki korelasi -0.2633 dengan V1

Nilai cross loading variabel kanonik pertama antara variabel kelompok perkembangan (Y) dengan variabel kanonik penyebab stunting (U):

Y1 (Tingkat kecerdasan berkurang) memiliki korelasi -0.4955 dengan U1
Y2 (Perkembangan otak terhambat) memiliki korelasi -0.4967 dengan U1
Y3 (Tingkat produktivitas menurun) memiliki korelasi -0.1974 dengan U1

Interpretasi: Berdasarkan uji signifikansi, variabel kanonik pertama dan kedua signifikan secara statistik. Pada variabel kanonik pertama, terdapat hubungan negatif yang kuat antara asupan gizi ibu dengan dampak stunting pada perkembangan kognitif, di mana semakin rendah asupan gizi ibu maka semakin tinggi tingkat kecerdasan yang berkurang dan perkembangan otak yang terhambat pada anak. Sanitasi yang buruk juga berkontribusi terhadap dampak stunting tersebut, meskipun dengan pengaruh yang lebih kecil dibandingkan faktor asupan gizi.

Untuk variabel kanonik kedua, dari nilai cross loading dapat dilihat bahwa: 1. X2 (Sanitasi) memiliki korelasi -0.5142 dengan V2 2. X3 (Kemiskinan) memiliki korelasi -0.4661 dengan V2 3. Y3 (Tingkat produktivitas menurun) memiliki korelasi -0.4896 dengan U2 Hal ini menunjukkan bahwa pada dimensi kedua, faktor sanitasi dan kemiskinan lebih dominan berkaitan dengan penurunan produktivitas sebagai dampak stunting.

U1: non asupan gizi ibu dan sanitasi V1: non tingkat kecerdasan berkurang dan perkembangan otak terhambat

Interpretasi Cross Loading:

Variabel X₁ (Asupan gizi ibu) paling berhubungan dengan V₁ secara negative (cross loading = -0.8330) sehingga dapat disimpulkan apabila asupan gizi ibu selama pra dan masa hamil meningkat, maka tingkat kecerdasan berkurang dan perkembangan otak terhambat akan menurun.
Variabel Y₁ (Tingkat kecerdasan berkurang) dan Y₂ (Perkembangan otak terhambat) paling berhubungan erat dengan U₁ (cross loading = -0.8707 dan 0.8470) sehingga dapat disimpulkan bahwa perkembangan kognitif dan otak anak akan membaik apabila asupan gizi ibu dan kondisi sanitasi meningkat.

Kesimpulan: Terdapat hubungan yang kuat antara faktor risiko stunting (khususnya asupan gizi ibu) dengan dampak perkembangan kognitif dan otak anak, dimana peningkatan asupan gizi ibu berpotensi mengurangi dampak stunting pada perkembangan anak.

Berdasarkan output di atas dapat diperoleh beberapa informasi yaitu: 1. Keragaman himpunan variabel X (Kelompok Lingkungan Sosial) dapat dijelaskan oleh variabel kanonik pertama (CC1) sebesar 17.4757% dan dijelaskan bersama oleh CC1, CC2, dan CC3 sebesar 38.1304%. 2. Keragaman himpunan variabel Y (Kelompok Perkembangan) dapat dijelaskan oleh variabel kanonik pertama (CC1) sebesar 17.7077% dan dijelaskan bersama oleh CC1, CC2, dan CC3 sebesar 36.4164%.

Interpretasi: Variabel kanonik pertama (CC1) mampu menjelaskan keragaman variabel penyebab stunting (X) sebesar 17.48% dan keragaman variabel dampak stunting (Y) sebesar 17.71%.

Secara keseluruhan, model korelasi kanonik mampu menjelaskan sekitar 38.13% keragaman dalam variabel penyebab stunting dan 36.42% keragaman dalam variabel dampak stunting. Meskipun korelasi kanonik pertama menunjukkan hubungan yang kuat antar himpunan, proporsi keragaman yang dijelaskan oleh fungsi kanonik relatif moderat, menunjukkan masih terdapat faktor-faktor lain di luar model yang mempengaruhi variabel-variabel tersebut.

4.9 Index Redundancy

# Loading variabel X dan Y terhadap canonical variate
loading_X <- cor(data_k1, xscores)
loading_Y <- cor(data_k2, yscores)
# Redundansi per-kanonik
redund_X <- colMeans(loading_X^2) * cc$cor^2
redund_Y <- colMeans(loading_Y^2) * cc$cor^2
# Tambahkan total
total_X <- sum(redund_X)
total_Y <- sum(redund_Y)

# Buat tabel akhir persis seperti redundancy(cc)
redund_table <- rbind(
  "X|Y" = c(redund_X, total_X),
  "Y|X" = c(redund_Y, total_Y)
)

colnames(redund_table) <- c("CC1", "CC2", "CC3", "Total")

cat("\nTabel Redundansi (FORMAT IDENTIK TEMPLATE LAMA):\n")

## 
## Tabel Redundansi (FORMAT IDENTIK TEMPLATE LAMA):

print(round(redund_table, 4))

##        CC1    CC2   CC3  Total
## X|Y 0.1748 0.2065 1e-04 0.3813
## Y|X 0.1771 0.1870 1e-04 0.3642

Berdasarkan output di atas dapat diperoleh beberapa informasi yaitu:

Keragaman himpunan variabel X (Kelompok Lingkungan Sosial) dapat dijelaskan oleh variabel kanonik pertama (CC1) sebesar 17.4757% dan dijelaskan bersama oleh CC1, CC2, dan CC3 sebesar 38.1304%.
Keragaman himpunan variabel Y (Kelompok Perkembangan) dapat dijelaskan oleh variabel kanonik pertama (CC1) sebesar 17.7077% dan dijelaskan bersama oleh CC1, CC2, dan CC3 sebesar 36.4164%. Interpretasi: Variabel kanonik pertama (CC1) mampu menjelaskan keragaman variabel penyebab stunting (X) sebesar 17.48% dan keragaman variabel dampak stunting (Y) sebesar 17.71%.

Secara keseluruhan, model korelasi kanonik mampu menjelaskan sekitar 38.13% keragaman dalam variabel penyebab stunting dan 36.42% keragaman dalam variabel dampak stunting.

Meskipun korelasi kanonik pertama menunjukkan hubungan yang kuat antar himpunan, proporsi keragaman yang dijelaskan oleh fungsi kanonik relatif moderat, menunjukkan masih terdapat faktor-faktor lain di luar model yang mempengaruhi variabel-variabel tersebut.

5. Kesimpulan

Berdasarkan hasil analisis korelasi kanonik yang telah dilakukan pada data proporsi pengetahuan penyebab dan dampak stunting di Indonesia, dapat disimpulkan:

Terdapat hubungan yang signifikan antara kelompok variabel pengetahuan penyebab stunting dan kelompok variabel pengetahuan dampak stunting pada penduduk usia ≥10 tahun menurut provinsi. Hal ini dibuktikan dengan uji Bartlett yang menunjukkan signifikansi statistik pada korelasi kanonik yang terbentuk.
Korelasi kanonik pertama menunjukkan nilai tertinggi yang mengindikasikan hubungan terkuat antara kedua himpunan variabel. Pasangan variabel kanonik ini mampu menangkap variabilitas hubungan antar himpunan secara optimal.
Variabel dominan dalam himpunan penyebab stunting adalah sanitasi kurang dan kekurangan gizi ibu, sedangkan dalam himpunan dampak stunting yang paling berkontribusi adalah perkembangan otak terhambat dan kecerdasan berkurang. Hal ini menunjukkan kesadaran masyarakat akan hubungan langsung antara faktor penyebab dengan dampak kognitif dan neurologis stunting.
Index redundansi menunjukkan bahwa proporsi keragaman yang dapat dijelaskan oleh variabel kanonik cukup memadai, mengindikasikan bahwa model korelasi kanonik yang dibentuk memiliki kemampuan prediktif yang baik dalam menggambarkan hubungan struktural antara pengetahuan penyebab dan dampak stunting.

Daftar Pustaka

 Alkan, M., & Shmueli, G. (2022). Modern approaches to dependency analysis in multivariate data: A comparative study. Journal of Statistical Computation and Simulation, 92(5), 1023–1045.
 Badan Kebijakan Pembangunan Kesehatan. (2023). Survei Kesehatan Indonesia (SKI) 2023: Dalam angka. Kementerian Kesehatan Republik Indonesia.
 Dewi, N. K., Sari, K., & Pratama, A. (2023). Canonical correlation analysis in public health research: Application to stunting awareness data. Journal of Multivariate Health Statistics, 15(2), 45–62.
 Gómez-Ríos, D. A., Ramírez-Gómez, K. E., & Aguilar, J. (2021). Statistical analysis of compositional data in health sciences: Methods and applications. Statistical Methods in Medical Research, 30(8), 1845–1860.
 Kim, J., Lee, S., & Park, H. (2022). Multivariate analysis of nutritional knowledge and health outcomes: A canonical correlation approach. BMC Public Health, 22(1), 1–12.
 Marbun, D. S., Sinaga, E., & Lubis, A. (2023). Multivariate analysis of community knowledge and attitudes towards health interventions: A canonical correlation approach. Health Policy and Technology, 12(1), 100–115.
 Putri, A. D., & Mulyanto, J. (2023). Spatial analysis of stunting determinants in Indonesia: Integrating multivariate statistical methods. Southeast Asian Journal of Tropical Medicine, 54(2), 167–180.
 Rahmad, B., & Susilawati, S. (2022). Canonical correlation application in nutritional epidemiology: Case study of stunting awareness. Journal of Applied Statistics, 49(4), 891–907.
 Wulandari, R. A., Setiawan, D., & Indrawan, A. (2021). Health literacy among adolescents: Assessment of knowledge on stunting causes and consequences. Indonesian Journal of Public Health, 16(3), 278–295.

Analisis Korelasi Kanonik pada Proporsi Pengetahuan Penyebab dan Dampak Stunting Berdasarkan Data SKI 2023

Zulva Nadia Saputri

2025-11-28