Pendidikan dan kesejahteraan masyarakat merupakan dua aspek yang saling berhubungan, baik dalam kehidupan manusia maupun dalam pembangunan suatu negara. Aspek pendidikan memiliki peran dalam meningkatkan kualitas hidup individu, memperluas peluang sosial dan ekonomi, serta meningkatkan kualitas diri. Sedangkan, aspek kesejahteraan mencakup indikator kemiskinan struktural, kesehatan, ketimpangan sosial, serta hal lainnya menjadi keberhasilan aspek pendidikan dalam meningkatkan kualitas hidup masyarakat yang produktif dan sejahtera.
Indonesia, sebagai negara berkembang, terus menghadapi tantangan dalam meningkatkan kualitas pendidikan dan kesejahteraan masyarakat. Dalam aspek pendidikan, beberapa indikator seperti angka partisipasi sekolah, penyelesaian jenjang studi, serta indeks pembangunan literasi masyarakat menjadi tolak ukur dalam penilaiannya. Sedangkan, dalam aspek kesejahteraan masyarakat, dipilih indikator berupa angka harapan hidup, persentase penduduk miskin, serta tingkat pengangguran terbuka yang menjadi tolak ukur, dalam penilaiannya.
Meskipun aspek pendidikan dan aspek kesejahteraan masyarakat secara logika saling berhubungan, masih jarang penelitian terkait sejauh apa kedua aspek tersebut saling mempengaruhi. Sehingga, analisis ini bertujuan untuk menganalisis kedua aspek tersebut dengan menggunakan pendekatan analisis korelasi kanonik untuk mengeksplorasi hubungan antara kedua aspek tersebut.
Analisis korelasi kanonik adalah salah satu teknik analisis statistika yang digunakan untuk melihat hubungan antara segugus peubah dependen (Y1, Y2,….., Yq) dengan segugus peubah independen (X1, X2,….., Xp), (Mattjik AA, 2011). Untuk melihat hubungan tersebut, dibentuk persamaan U yang merupakan kombinasi linier dari variabel X dan V yang merupakan kombinasi linier dari variabel Y.
\(U_{(k)}=a'_{(k)}X=a_{1(k)}X_1+a_{2(k)}X_2+...+a_{p(k)}X_p\)
\(V_{(k)}=b_{(k)}'Y=b_{1(k)}Y_1+b_{2(k)}Y_2+...+b_{q(k)}Y_q\)
Data yang digunakan pada analisis ini merupakan data sekunder dari Badan Pusat Statistik (BPS) dari 34 provinsi di Indonesia pada tahun 2023. Data yang digunakan adalah:
APS TPP IPLM AHHL AHHP TPT PPM
1 83.41 74.46 66.23 68.42 72.35 6.03 14.45
2 79.25 74.43 56.10 68.06 72.00 5.89 8.15
3 84.33 68.64 77.31 68.27 72.21 5.94 5.95
4 78.15 67.79 66.88 70.28 74.29 4.23 6.68
5 72.46 66.62 62.84 69.83 73.81 4.53 7.58
6 71.71 64.81 68.64 68.74 72.68 4.11 11.78
7 79.57 63.41 59.83 67.99 71.94 3.42 14.04
8 71.74 64.54 59.25 69.31 73.28 4.23 11.11
9 69.53 68.96 77.50 69.30 73.26 4.56 4.52
10 84.97 78.97 62.52 68.99 72.94 6.80 5.69
Data tersebut dibagi ke dalam dua set variabel. Set variabel pertama adalah aspek pendidikan yang terdiri dari APS, TPP, dan IPLM. Sedangkan, set variabel kedua adalah aspek kesejahteraan masyarakat yang terdiri dari AHHL, AHHP, TPT, dan PPM. Rincian variabel yang digunakan sebagai berikut:
\(APS\) : Angka Partisipasi Sekolah pada anak berumur 16-18 tahun (2023)
\(TPP\) : Tingkat Penyelesaian Pendidikan pada jenjang SMA (2023)
\(IPLM\) : Indeks Pembangunan Literasi Masyarakat (2023)
\(AHHL\) : Angka Harapan Hidup Laki-laki (2023)
\(AHHL\) : Angka Harapan Hidup Perempuan (2023)
\(TPT\) : Tingkat Pengangguran Terbuka (2023)
\(PPM\) : Persentase Penduduk Miskin (2023)
Tujuan dari analisis ini adalah:
Mengukur keeratan hubungan antara aspek pendidikan dengan aspek kesejahteraan masyarakat secara simultan.
Menentukan variabel dominan dari masing-masing aspek yang dapat memberi pengaruh secara signifikan.
> library(candisc)
> library(readxl)
> library(dplyr)
> library(CCA)
> datak1 <- read_excel("C:/Users/Helen/Downloads/laprak_anmul.xlsx",
+ sheet <- "Pendidikan")
> datak2 <- read_excel("C:/Users/Helen/Downloads/laprak_anmul.xlsx",
+ sheet <- "Kesejahteraan")
> k1=datak1[,-1] #Menghilangkan kolom pertama (provinsi)
> k2=datak2[,-1] #Menghilangkan kolom pertama (provinsi)
> cc=cancor(k1, k2)
> cc1=cc(k1, k2)
> cc2=comput(k1, k2, cc1)
> n=34 #n = jumlah data
> p=3 #p = jumlah variabel X
> q=4 #q = jumlah variabel Y
> k=(n-1)-0.5*(p+q+1) #k = derajat bebas
> a=1-(cc$cancor[1])^2
> b=1-(cc$cancor[2])^2
> c=1-(cc$cancor[3])^2
> B1=-k*log(a*b*c)
> B2=-k*log(b*c)
> B3=-k*log(c)
> db1=p*q
> db2=(p-1)*(q-1)
> db3=(p-2)*(q-2)
> pv1=1-pchisq(B1, db1)
> pv2=1-pchisq(B2, db2)
> pv3=1-pchisq(B3, db3)
> B=rbind(B1,B2,B3)
> d=rbind(db1, db2, db3)
> p=rbind(pv1,pv2,pv3)
> result <- cbind(B , d, p)
> colnames(result) <- c("Bartlett", "db", "p-value")
> redundancy(cc)
> cc1$xcoef
[,1] [,2] [,3]
APS 0.070330135 0.04754324 -0.174698668
TPP -0.107426683 -0.04366970 0.008357397
IPLM -0.003324512 0.12733560 0.038686504
> cc1$ycoef
[,1] [,2] [,3]
AHHL -2.7013548 4.42358280 -5.3844652
AHHP 2.6414315 -4.27423240 5.2848999
TPT -0.2984371 -0.61560281 -0.3313827
PPM 0.1173378 -0.04217932 -0.1598735
Sehingga, kombinasi linier yang terbentuk untuk aspek pendidikan adalah:
\(U_1=0,07APS_1-0,11TPP_1-0,003IPLM_1\)
\(U_2=0,05APS_2-0,04TPP_2+0,13IPLM_2\)
\(U_3=-0,17APS_3+0,01TPP_3+0,04IPLM_3\)
Dan untuk kombinasi linier yang terbetuk bagi aspek kesejahteraan masyarakat adalah:
\(V_1=-2,70AHHL_1+2,64_AHHP_1-0,29TPT_1+0,12PPM_1\)
\(V_2=4,42AHHL_2-4,27AHHP_2-0,62TPT_2-0,04PPM_2\)
\(V_3=-5,38AHHL_3+5,28AHHP_3-0,33TPT_3-0,15PPM_3\)
> cc1$cor
[1] 0.7738923 0.4156709 0.1814847
Berdasakan luaran tersebut, didapatkan nilai korelasi bagi pasangan peubah kanonik pertama adalah 0,7739. Lalu, untuk nilai korelasi bagi pasangan peubah kanonik kedua adalah 0,4157. Dan, untuk nilai korelasi bagi pasangan peubah kanonik ketiga adalah 0,1815. Berdasarkan ketiga nilai korelasi tersebut, pasangan peubah kanonik dengan nilai korelasi terbesar adalah pada fungsi kanonik pertama.
> cc
Canonical correlation analysis of:
3 X variables: APS, TPP, IPLM
with 4 Y variables: AHHL, AHHP, TPT, PPM
CanR CanRSQ Eigen percent cum scree
1 0.7739 0.59891 1.49320 86.007 86.01 ******************************
2 0.4157 0.17278 0.20887 12.031 98.04 ****
3 0.1815 0.03294 0.03406 1.962 100.00 *
Test of H0: The canonical correlations in the
current row and all that follow are zero
CanR LR test stat approx F numDF denDF Pr(> F)
1 0.77389 0.32086 3.2081 12 71.727 0.001019 **
2 0.41567 0.79997 1.1018 6 56.000 0.372901
3 0.18148 0.96706 NaN 2 NaN NaN
---
Signif. codes: 0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
Dengan hipotesis:
\(H_0=\rho_1=\rho_2=\rho_3=0\)
\(H_1=\rho_i\neq0, (i=1,2,3)\)
dan nilai p 0,001 (Kurang dari tingkat signifikansi 5%), maka \(H_0\) berhasil ditolak. Maka, setidaknya terdapat satu fungsi kanonik yang memiliki nilai korelasi tidak sama dengan nol.
> result
Bartlett db p-value
B1 32.9656427 12 0.0009800396
B2 6.4721809 6 0.3724226324
B3 0.9712484 2 0.6153129959
Hipotesis:
\(H_0=\rho_1=\rho_2=\rho_3=0\)
\(H_1=\rho_i\neq0,(i=1,2,3)\)
Pada uji Bartlett, nilai p pada B1 adalah 0,00098 yang bernilai kurang dari tingkat signifikansi 5%. Sehingga, \(H_0\) berhasil ditolak dan dilanjutkan ke pengujian kedua.
\(H_0=\rho_2=\rho_3=0\)
\(H_1=\rho_i\neq0,(i=2,3)\)
Pada uji Bartlett, nilai p pada B2 adalah 0,37242 yang bernilai lebih dari tingkat signifikansi 5%. Sehingga, \(H_0\) gagal ditolak. Maka dapat disimpulkan bahwa hanya fungsi korelasi kanonik pertama saja yang signifikan.
> cc1$scores$corr.X.xscores
[,1] [,2] [,3]
APS -0.1874736 0.28105687 -0.9412017
TPP -0.9320670 0.08281875 -0.3526926
IPLM -0.3676374 0.92419072 0.1035098
> cc1$scores$corr.Y.yscores
[,1] [,2] [,3]
AHHL -0.7380858 0.3502364 -0.06835526
AHHP -0.7326782 0.3291176 -0.03714994
TPT -0.6893627 -0.6692052 -0.27102166
PPM 0.8331203 -0.1148710 -0.54046452
Karena pada uji sekuensial Bartlett hanya fungsi korelasi kanonik pertama yang signifikan, maka hanya digunakan faktor loading pertama saja. Berdasarkan pada luaran di atas, didapatkan:
Nilai loading antara variabel \(U_1\) dengan TPP sangat besar. Sehingga, variabel \(U_1\) dapat ditafsirkan sebagai variabel TPP.
Nilai loading antara variabel \(V_1\) dengan PPM sangat besar. Sehingga, variabel \(V_1\) dapat ditafsirkan sebagai variabel PPM.
Nilai korelasi \(U_1\) dengan \(V_1\) adalah 0,7739. Maka, dapat disimpulkan bahwa terdapat hubungan yang erat antara Tingkat Penyelesaian Pendidikan dengan Persentase Penduduk Miskin dengan hubungan searah.
> redundancy(cc)
Redundancies for the X variables & total X canonical redundancy
Xcan1 Xcan2 Xcan3 total X|Y
0.20743 0.05414 0.01121 0.27278
Redundancies for the Y variables & total Y canonical redundancy
Ycan1 Ycan2 Ycan3 total Y|X
0.33702 0.02989 0.00306 0.36997
Berdasarkan luaran tersebut, dapat disimpulkan:
Keragaman dari aspek pendidikan dapat dijelaskan oleh variabel \(U_1\) sebesar 20,74% dan dijelaskan secara bersama oleh \(U_1\), \(U_2\), dan \(U_3\) sebesar 27,28%.
Keragaman dari aspek kesejahteraan masyarakat dapay dijelaskan oleh \(V_1\) sebesar 33,7% dan dijelaskan secara bersama oleh \(V_1\), \(V_2\), dan \(V_3\) sebesar 36,99%.
Berdasarkan pada hasil analisis di atas, didapatkan beberapa kesimpulan sebagai berikut:
\(U_1=0,07APS_1-0,11TPP_1-0,003IPLM_1\)
\(V_1=-2,70AHHL_1+2,64_AHHP_1-0,29TPT_1+0,12PPM_1\)
Terdapat hubungan yang erat antara Tingkat Penyelesaian Pendidikan dengan Persentase Penduduk Miskin dengan hubungan searah.
Keragaman dari aspek pendidikan dapat dijelaskan oleh variabel \(U_1\) sebesar 20,74% dan dijelaskan secara bersama oleh \(U_1\), \(U_2\), dan \(U_3\) sebesar 27,28%.
Keragaman dari aspek kesejahteraan masyarakat dapay dijelaskan oleh \(V_1\) sebesar 33,7% dan dijelaskan secara bersama oleh \(V_1\), \(V_2\), dan \(V_3\) sebesar 36,99%.
Matjik AA, S. I. (2011). Sidik Peubah Ganda dengan Menggunakan SAS. Bogor (ID): IPBPress.