Latar Belakang

Kualitas lingkungan hidup merupakan salah satu indikator penting yang mencerminkan tingkat keberlanjutan dan kesehatan ekologis suatu wilayah. Variasi kondisi lingkungan antar provinsi dapat memengaruhi kualitas hidup masyarakat, keseimbangan ekosistem, serta arah pembangunan berkelanjutan. Rendahnya kualitas lingkungan dapat berdampak pada meningkatnya risiko pencemaran, penurunan kesehatan, dan menurunnya daya dukung lingkungan bagi aktivitas sosial dan ekonomi. Oleh karena itu, analisis terhadap pola variasi kualitas lingkungan antar provinsi menjadi penting untuk memahami faktor-faktor yang membentuk kondisi lingkungan tersebut.

Berkaitan dengan hal tersebut, penelitian ini menggunakan data “Komponen Penyusun Indeks Kualitas Lingkungan Hidup Menurut Provinsi” yang dipublikasikan oleh Badan Pusat Statistik (BPS). Dataset tersebut memuat informasi numerik mengenai empat komponen utama penyusun Indeks Kualitas Lingkungan Hidup (IKLH), yaitu kualitas udara, kualitas air sungai, kualitas tutupan lahan, dan kualitas lahan untuk seluruh provinsi di Indonesia. Keenam komponen ini merupakan indikator penting yang mencerminkan kondisi lingkungan fisik dan ekologis di suatu wilayah.

Dalam penelitian ini, analisis difokuskan pada keempat variabel komponen lingkungan tersebut. Tujuan penelitian adalah untuk mengidentifikasi pola variabilitas komponen lingkungan hidup antar provinsi serta menentukan faktor utama yang menjelaskan perbedaan kualitas lingkungan di Indonesia. Analisis dilakukan dengan menggunakan Principal Component Analysis (PCA) untuk mereduksi dimensi data dan memperoleh gambaran struktur variabel lingkungan yang lebih sederhana dan informatif.

Data

library(readxl)
## Warning: package 'readxl' was built under R version 4.3.3
data <- read_excel("C:/Users/HP/Downloads/Komponen Penyusun Indeks Kualitas Lingkungan Hidup Menurut Provinsi, 2023 (3).xlsx")
prediktor <- dplyr::select(data, -'38 Provinsi')
data
## # A tibble: 38 × 5
##    `38 Provinsi`        `Indeks Kualitas Udara` `Indeks Kualitas Air`
##    <chr>                                  <dbl>                 <dbl>
##  1 ACEH                                    90.9                  61.3
##  2 SUMATERA UTARA                          90.9                  60.3
##  3 SUMATERA BARAT                          90.5                  57.0
##  4 RIAU                                    90.9                  50.8
##  5 JAMBI                                   90.6                  46.1
##  6 SUMATERA SELATAN                        87.8                  58.2
##  7 BENGKULU                                92.5                  49.0
##  8 LAMPUNG                                 88.0                  55.4
##  9 KEP. BANGKA BELITUNG                    90.2                  57.4
## 10 KEP. RIAU                               90.1                  54.9
## # ℹ 28 more rows
## # ℹ 2 more variables: `Indeks Kualitas Tutupan Lahan (IKTL)` <dbl>,
## #   `Indeks Kualitas Lahan (IKL)` <dbl>

Keterangan:

X1: Indeks Kualitas Udara

X2: Indeks Kualitas Air

X3: Indeks Kualitas Tutupan Lahan

X4: Indeks Kualitas Lahan

Hasil Analisis dan Pembahasan

Library

library(dplyr)
## Warning: package 'dplyr' was built under R version 4.3.3
## 
## Attaching package: 'dplyr'
## The following objects are masked from 'package:stats':
## 
##     filter, lag
## The following objects are masked from 'package:base':
## 
##     intersect, setdiff, setequal, union
library(ggplot2)
library(factoextra)
## Warning: package 'factoextra' was built under R version 4.3.3
## Welcome! Want to learn more? See two factoextra-related books at https://goo.gl/ve3WBa

PCA

#PCA
pca_res <- prcomp(prediktor, scale. = TRUE)
summary(pca_res)
## Importance of components:
##                           PC1    PC2    PC3     PC4
## Standard deviation     1.6537 0.8168 0.6758 0.37602
## Proportion of Variance 0.6837 0.1668 0.1142 0.03535
## Cumulative Proportion  0.6837 0.8505 0.9647 1.00000

Hasil analisis PCA menunjukkan bahwa sebagian besar variasi data dapat dijelaskan oleh beberapa komponen utama, di mana PC1 merupakan komponen paling dominan dengan kontribusi sebesar 68,37% terhadap total keragaman data. PC2 menambah 16,68% sehingga dua komponen pertama telah mampu menjelaskan 85,05% variasi keseluruhan. Dengan tambahan PC3 yang menyumbang 11,42%, tiga komponen pertama secara kumulatif mencakup 96,47% informasi penting dalam data, sedangkan PC4 hanya memberi kontribusi kecil sebesar 3,53%. Secara umum, hasil ini menunjukkan bahwa struktur variabilitas kualitas lingkungan antar provinsi dapat diringkas secara efektif menggunakan dua hingga tiga komponen utama tanpa kehilangan informasi yang berarti.

Eigen Value

eigen_values <- pca_res$sdev^2
eigen_values
## [1] 2.7347116 0.6672251 0.4566728 0.1413906

Nilai eigen (eigenvalues) menunjukkan besarnya variasi yang dapat dijelaskan oleh setiap komponen utama. PC1 memiliki eigenvalue terbesar yaitu 2.7347, yang berarti komponen ini menjelaskan porsi variasi paling besar dalam data. PC2 memiliki eigenvalue 0.6672, disusul PC3 sebesar 0.4567, dan PC4 yang paling kecil sebesar 0.1414. Karena hanya PC1 yang memiliki eigenvalue lebih dari 1, komponen ini dianggap paling informatif berdasarkan kriteria Kaiser, sementara komponen lainnya menjelaskan variasi yang jauh lebih kecil. Secara keseluruhan, nilai-nilai ini menunjukkan bahwa sebagian besar informasi dalam data terkonsentrasi pada komponen pertama.

Proportion of Variance

prop_variance <- eigen_values / sum(eigen_values)
prop_variance
## [1] 0.68367790 0.16680627 0.11416819 0.03534764

Proporsi keragaman tersebut menunjukkan bahwa PC1 mampu menjelaskan sebagian besar variasi data yaitu sebesar 68,37%, diikuti PC2 yang menjelaskan 16,68%, PC3 sebesar 11,42%, dan PC4 hanya 3,53%, sehingga dapat dikatakan bahwa informasi terpenting dalam data terutama terkonsentrasi pada komponen pertama, sementara komponen kedua hingga keempat menyumbang tambahan variasi yang jauh lebih kecil.

Cumulative Proportion

cum_prop <- cumsum(prop_variance)
cum_prop
## [1] 0.6836779 0.8504842 0.9646524 1.0000000

Berdasarkan cumulative proportion tersebut menunjukkan bahwa PC1 secara kumulatif menjelaskan 68,37% variasi data, PC1–PC2 bersama-sama menjelaskan 85,05%, PC1–PC3 menjelaskan 96,47%, dan seluruh komponen (PC1–PC4) menjelaskan 100% variasi, sehingga tiga komponen pertama sudah mampu merangkum hampir seluruh informasi penting dalam data.

Loading

loading <- pca_res$rotation
print(loading)
##                                             PC1        PC2         PC3
## Indeks Kualitas Udara                -0.4867242 -0.2227580  0.83183249
## Indeks Kualitas Air                  -0.4058212  0.9057970 -0.01619012
## Indeks Kualitas Tutupan Lahan (IKTL) -0.5652819 -0.1540931 -0.23522208
## Indeks Kualitas Lahan (IKL)          -0.5280767 -0.3258313 -0.50245713
##                                             PC4
## Indeks Kualitas Udara                 0.1467417
## Indeks Kualitas Air                   0.1207428
## Indeks Kualitas Tutupan Lahan (IKTL) -0.7754884
## Indeks Kualitas Lahan (IKL)           0.6020845

Loading tersebut menunjukkan bahwa PC1 dibentuk oleh kontribusi kuat dari seluruh variabel kualitas lingkungan, sehingga komponen ini merepresentasikan dimensi umum kualitas lingkungan. PC2 didominasi oleh Indeks Kualitas Air dengan loading terbesar, sehingga menggambarkan variasi yang khusus terkait kualitas air. PC3 terutama dipengaruhi oleh Indeks Kualitas Udara dan Indeks Kualitas Lahan, yang menunjukkan adanya perbedaan pola antara kedua variabel tersebut. Sementara itu, PC4 lebih banyak dipengaruhi oleh Indeks Kualitas Tutupan Lahan (IKTL) dan Indeks Kualitas Lahan (IKL), sehingga komponen ini menangkap kontras antara kondisi tutupan lahan dan kualitas lahan.

Biplot

fviz_pca_biplot(pca_res,
                repel = TRUE,
                col.var = "navy", 
                col.ind = "red",   
                geom.ind = "point") +
  ggtitle("Biplot PCA Komponen Penyusun IKLH 2023") +
  theme_minimal()
## Warning: Using `size` aesthetic for lines was deprecated in ggplot2 3.4.0.
## ℹ Please use `linewidth` instead.
## ℹ The deprecated feature was likely used in the ggpubr package.
##   Please report the issue at <https://github.com/kassambara/ggpubr/issues>.
## This warning is displayed once every 8 hours.
## Call `lifecycle::last_lifecycle_warnings()` to see where this warning was
## generated.

Biplot PCA tersebut menunjukkan hubungan antarvariabel penyusun IKLH 2023 serta pola penyebaran wilayah berdasarkan dua komponen utama. Pada Dimensi 1 (53%), variabel Indeks Kualitas Air Laut (IKAL) memiliki vektor paling panjang dan mengarah kuat ke kanan, menunjukkan bahwa variabel ini paling dominan membentuk komponen pertama. Variabel lain seperti Indeks Kualitas Air, Udara, Tutupan Lahan (IKTL), dan Lahan (IKL) mengarah ke kiri dengan arah yang relatif berdekatan, menandakan bahwa variabel-variabel tersebut saling berkorelasi positif satu sama lain namun berkebalikan dengan IKAL. Sementara itu, Dimensi 2 (19,4%) dipengaruhi oleh Indeks Kualitas Ekosistem Gambut (IKEG) yang vektornya mengarah ke atas, sehingga komponen kedua terutama memisahkan wilayah berdasarkan kualitas ekosistem gambut. Titik-titik merah yang berdekatan mengindikasikan wilayah dengan karakteristik lingkungan serupa, sedangkan yang berjauhan menunjukkan perbedaan kondisi lingkungan yang lebih besar sesuai pengaruh variabel yang ditunjukkan arah vektor.

Kesimpulan

Berdasarkan hasil analisis Principal Component Analysis (PCA) terhadap empat komponen penyusun Indeks Kualitas Lingkungan Hidup (IKLH) pada 38 provinsi di Indonesia, diperoleh bahwa sebagian besar variasi data dapat dijelaskan oleh beberapa komponen utama. Komponen pertama (PC1) merupakan komponen paling dominan dengan kontribusi sebesar 68,37% terhadap total keragaman data, sedangkan komponen kedua (PC2) menambahkan 16,68%. Secara kumulatif, dua komponen tersebut mampu menjelaskan 85,05% variasi total, dan tiga komponen pertama menjelaskan hingga 96,47% variasi, sehingga sudah cukup merepresentasikan keseluruhan informasi penting dalam dataset.

Nilai eigen menunjukkan bahwa hanya PC1 yang memiliki eigenvalue lebih besar dari 1, sehingga menurut kriteria Kaiser, komponen ini menjadi representasi utama dari struktur data. Analisis loading mengungkapkan bahwa PC1 dibentuk oleh kontribusi kuat seluruh variabel lingkungan, sehingga dapat diinterpretasikan sebagai dimensi umum kualitas lingkungan. PC2 didominasi oleh Indeks Kualitas Air, yang mencerminkan variasi khusus terkait kondisi kualitas air antar provinsi. Hasil biplot menggambarkan pola pengelompokan beberapa provinsi berdasarkan kesamaan karakteristik lingkungan serta menunjukkan hubungan korelasi antarvariabel penyusun IKLH.

Secara umum, PCA membantu mereduksi dimensi data dan memberikan pemahaman yang lebih sederhana mengenai faktor utama pembentuk variasi kualitas lingkungan hidup antar provinsi di Indonesia. Analisis ini dapat menjadi dasar bagi pemerintah dalam merancang kebijakan peningkatan kualitas lingkungan secara lebih tepat sasaran berdasarkan komponen yang paling berpengaruh pada kondisi wilayah.

Daftar Pustaka

Gabriel, K. R. (1971). The biplot graphic display of matrices with application to principal component analysis. Biometrika, 58(3), 453–467.

Jolliffe, I. T. (2002). Principal Component Analysis (2nd ed.). Springer.