Penelitian ini bertujuan untuk menganalisis faktor-faktor yang memengaruhi Indeks Kualitas Lingkungan Hidup (IKLH) di Indonesia berdasarkan tiga komponen utama, yaitu Indeks Kualitas Udara, Indeks Kualitas Air, dan Indeks Kualitas Tutupan Lahan (IKTL). Ketiga indikator tersebut digunakan oleh Kementerian Lingkungan Hidup dan Kehutanan (KLHK) sebagai dasar dalam menilai capaian pembangunan berkelanjutan di tingkat provinsi. Kajian ini penting karena degradasi kualitas lingkungan di Indonesia terus meningkat akibat aktivitas ekonomi, urbanisasi, dan pertumbuhan penduduk yang pesat. Metode analisis yang digunakan adalah regresi linier berganda dengan pendekatan Ordinary Least Squares (OLS) untuk mengestimasi pengaruh masing-masing variabel terhadap IKLH. Namun, karena data lintas provinsi menunjukkan pelanggaran terhadap asumsi klasik, khususnya heteroskedastisitas, maka dilakukan koreksi menggunakan metode Standard Error Robust (White-HC) yang memperbaiki nilai standard error tanpa mengubah koefisien regresi. Hasil penelitian menunjukkan bahwa Indeks Kualitas Udara, Indeks Kualitas Air, dan Indeks Kualitas Tutupan Lahan berpengaruh positif terhadap kualitas lingkungan hidup di Indonesia. Setelah dilakukan koreksi dengan metode White-HC (HC3), diperoleh estimasi yang lebih stabil, akurat, dan signifikan secara statistik. Temuan ini membuktikan bahwa pendekatan robust lebih tepat digunakan untuk data yang tidak memenuhi asumsi homoskedastisitas dan memberikan hasil analisis yang lebih reliabel dalam menggambarkan kondisi lingkungan hidup di Indonesia.
Kata kunci: IKLH, Regresi Linier Berganda, Heteroskedastisitas, White-HC, Standard Error Robust.
Latar Belakang
Isu lingkungan hidup menjadi perhatian global seiring dengan meningkatnya tekanan akibat pembangunan ekonomi dan pertumbuhan penduduk. Indonesia sebagai negara berkembang menghadapi tantangan besar dalam menjaga keseimbangan antara pertumbuhan ekonomi dan kelestarian lingkungan. Untuk menilai keberhasilan pengelolaan lingkungan, pemerintah mengembangkan Indeks Kualitas Lingkungan Hidup (IKLH) yang mencerminkan kondisi lingkungan berdasarkan tiga komponen utama, yaitu Indeks Kualitas Udara, Indeks Kualitas Air, dan Indeks Kualitas Tutupan Lahan (IKTL). Indeks ini berfungsi sebagai indikator penting dalam menilai sejauh mana pembangunan nasional berjalan sesuai prinsip keberlanjutan. Oleh karena itu, analisis hubungan antar komponen penyusun IKLH menjadi hal yang penting untuk memahami dinamika kualitas lingkungan di setiap provinsi di Indonesia.
Namun, penggunaan model regresi linier berganda dengan pendekatan Ordinary Least Squares (OLS) memiliki keterbatasan, terutama ketika asumsi klasik tidak terpenuhi. Pada data lintas provinsi di Indonesia, sering dijumpai ketidaknormalan, heteroskedastisitas, dan autokorelasi, yang dapat menyebabkan hasil OLS menjadi bias dan tidak reliabel. Untuk mengatasi permasalahan tersebut, penelitian ini menerapkan metode Standard Error Robust (White-HC) yang mampu memperbaiki nilai standar error tanpa mengubah koefisien regresi. Metode ini memastikan hasil uji statistik tetap valid meskipun terjadi pelanggaran asumsi klasik. Dengan demikian, analisis menggunakan regresi robust diharapkan dapat memberikan hasil yang lebih akurat dan menggambarkan kondisi kualitas lingkungan hidup di Indonesia secara lebih objektif dan terpercaya.
bagaimana pengaruh Indeks Kualitas Udara, Indeks Kualitas Air, dan Indeks Kualitas Tutupan Lahan (IKTL) terhadap Indeks Kualitas Lingkungan Hidup (IKLH) di Indonesia menggunakan model regresi linier berganda (OLS)?
Bagaimana Hasil metode koreksi menggunakan Standard Error Robust (White-HC) untuk mengatasi permasalahan heteroskedastisitas dan ketidaknormalan?
Menganalisis pengaruh Indeks Kualitas Udara, Indeks Kualitas Air, dan Indeks Kualitas Tutupan Lahan (IKTL) terhadap Indeks Kualitas Lingkungan Hidup (IKLH) di Indonesia menggunakan model regresi linier berganda (OLS).
Menerapkan metode koreksi menggunakan Standard Error Robust (White-HC) untuk mengatasi permasalahan heteroskedastisitas dan ketidaknormalan
Data terbatas pada tingkat provinsi tahun 2019-2023. Model bersifat linier dan belum mempertimbangkan efek spasial.
Metode yang akan digunakan Regresi Model OLS dan SE Robust (White-HC)
Model umum: \[
Y = \beta_0 + \beta_1 X_1 + \beta_2 X_2 + \beta_3 X_3 + \varepsilon
\] dengan: - \(Y\): IKLH
- \(X_1\): Indeks Kualitas Udara
- \(X_2\): Indeks Kualitas Air
- \(X_3\): Indeks Kualitas Tutupan
Lahan
White (1980) memperkenalkan estimator heteroskedasticity-consistent covariance matrix (HC) yang memperbaiki standard error tanpa mengubah koefisien regresi.
Data yang digunakan merupakan data sekunder yang diperoleh dari
Badan Pusat Statistk (BPS), yaitu Data Komponen
Penyusun Indeks Kualitas Lingkungan Hidup Menurut Provinsi, Tahun
2023.
Data mencakup 38 provinsi di Indonesia dengan empat
variabel utama yang saling berkaitan terhadap kondisi lingkungan
hidup.
# Mengatur direktori kerja dan membaca data
setwd('D:/Kuliah S2 UNPAD/Analisis Regresi/dashboard')
library(readxl)
library(dplyr)
library(DT)
# Membaca data Excel
data <- read_excel("Data Komponen Penyusun Indeks Kualitas Lingkungan Hidup Menurut Provinsi, 2023 fix.xlsx")
# Melihat struktur data
str(data)
## tibble [174 × 5] (S3: tbl_df/tbl/data.frame)
## $ Provinsi : chr [1:174] "ACEH" "SUMATERA UTARA" "SUMATERA BARAT" "RIAU" ...
## $ Indeks Kualitas Udara : num [1:174] 90.9 90.9 90.5 90.9 90.6 ...
## $ Indeks Kualitas Air : num [1:174] 61.3 60.3 57 50.8 46.1 ...
## $ Indeks Kualitas Tutupan Lahan : chr [1:174] "76.5" "49.8" "67" "51.3" ...
## $ indeks Kualitas Lingkungan Hidup: num [1:174] 78.5 72.8 75.8 70.4 68.2 ...
# Konversi kolom yang masih karakter menjadi numeric (jika perlu)
data <- data %>%
mutate(`Indeks Kualitas Tutupan Lahan` = as.numeric(`Indeks Kualitas Tutupan Lahan`))
# Menampilkan beberapa baris pertama data
datatable(head(data, 10), caption = "Tabel 3.1 Contoh Data Penelitian (10 Provinsi Pertama)")
Berikut daftar dan deskripsi variabel yang digunakan dalam penelitian ini:
| Variabel | Keterangan | Jenis | Satuan / Skala |
|---|---|---|---|
| IKLH | Indeks Kualitas Lingkungan Hidup | Dependen (Y) | Skor (0–100) |
| Indeks Kualitas Udara | Menggambarkan tingkat kualitas udara di provinsi | Independen (X₁) | Skor (0–100) |
| Indeks Kualitas Air | Menggambarkan tingkat kualitas air permukaan | Independen (X₂) | Skor (0–100) |
| Indeks Kualitas Tutupan Lahan (IKTL) | Mengukur kondisi vegetasi dan tutupan lahan | Independen (X₃) | Skor (0–100) |
Model regresi yang digunakan dapat dituliskan sebagai berikut:
\[ IKLH_i = \beta_0 + \beta_1 Udara_i + \beta_2 Air_i + \beta_3 IKTL_i + \varepsilon_i \]
Tahapan penelitian dilakukan secara sistematis sebagai berikut:
Pengumpulan Data:
Mengimpor data IKLH dan komponennya dari file Excel KLHK
(2023).
Pra-pemrosesan Data:
Melakukan pembersihan dan pengecekan tipe data agar siap
dianalisis.
Pembangunan Model Regresi Linier Berganda
(OLS):
Mengestimasi hubungan antara IKLH dengan tiga komponen
utamanya.
Uji Asumsi Klasik:
Melakukan pengujian normalitas, multikolinearitas, autokorelasi, dan
heteroskedastisitas.
Koreksi Standard Error (White-HC):
Jika ditemukan heteroskedastisitas, maka digunakan estimator robust
(HC3).
Analisis dan Interpretasi Hasil:
Membandingkan hasil estimasi model OLS dengan model White-HC.
Penyajian Hasil (opsional):
Visualisasi hasil menggunakan dashboard interaktif berbasis R
Shiny.
Model yang digunakan: \[ IKLH_i = \beta_0 + \beta_1 Udara_i + \beta_2 Air_i + \beta_3 IKTL_i + \varepsilon_i \]
model_ols <- lm(`indeks Kualitas Lingkungan Hidup` ~ `Indeks Kualitas Udara`+ `Indeks Kualitas Air` + `Indeks Kualitas Tutupan Lahan` , data = data)
summary(model_ols)
##
## Call:
## lm(formula = `indeks Kualitas Lingkungan Hidup` ~ `Indeks Kualitas Udara` +
## `Indeks Kualitas Air` + `Indeks Kualitas Tutupan Lahan`,
## data = data)
##
## Residuals:
## Min 1Q Median 3Q Max
## -9.7220 -0.3205 0.7658 1.6349 4.0151
##
## Coefficients:
## Estimate Std. Error t value Pr(>|t|)
## (Intercept) 4.65839 4.01709 1.160 0.248
## `Indeks Kualitas Udara` 0.44400 0.05261 8.439 1.38e-14 ***
## `Indeks Kualitas Air` 0.29932 0.04206 7.116 3.01e-11 ***
## `Indeks Kualitas Tutupan Lahan` 0.18024 0.01422 12.676 < 2e-16 ***
## ---
## Signif. codes: 0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
##
## Residual standard error: 2.856 on 169 degrees of freedom
## (1 observation deleted due to missingness)
## Multiple R-squared: 0.8434, Adjusted R-squared: 0.8406
## F-statistic: 303.4 on 3 and 169 DF, p-value: < 2.2e-16
shapiro.test(resid(model_ols))
##
## Shapiro-Wilk normality test
##
## data: resid(model_ols)
## W = 0.79949, p-value = 3.887e-14
Interpretasi: - Residual tidak normal (p < 0.05), asumsi normalitas tidak terpenuhi.
dwtest(model_ols)
##
## Durbin-Watson test
##
## data: model_ols
## DW = 0.59866, p-value < 2.2e-16
## alternative hypothesis: true autocorrelation is greater than 0
Interpretasi: - Ada autokorelasi positif pada residual (p < 0.05).
car::vif(model_ols)
## `Indeks Kualitas Udara` `Indeks Kualitas Air`
## 1.945331 1.222109
## `Indeks Kualitas Tutupan Lahan`
## 1.774811
Interpretasi: - Tidak ada multikolinearitas serius (VIF < 10).
bptest(model_ols)
##
## studentized Breusch-Pagan test
##
## data: model_ols
## BP = 15.334, df = 3, p-value = 0.001552
Interpretasi: - Ada heteroskedastisitas (p < 0.05), gunakan SE Robust.
coeftest(model_ols, vcov = vcovHC(model_ols, type = "HC3"))
##
## t test of coefficients:
##
## Estimate Std. Error t value Pr(>|t|)
## (Intercept) 4.658391 6.187643 0.7529 0.4526
## `Indeks Kualitas Udara` 0.444003 0.069758 6.3649 1.772e-09 ***
## `Indeks Kualitas Air` 0.299323 0.067946 4.4053 1.870e-05 ***
## `Indeks Kualitas Tutupan Lahan` 0.180236 0.017205 10.4755 < 2.2e-16 ***
## ---
## Signif. codes: 0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
| Aspek | OLS | White-HC |
|---|---|---|
| Koefisien | Sama | Sama |
| Standard Error | Bias | Diperbaiki |
| Inferensi | Kurang reliabel | Lebih reliabel |
Model OLS menunjukkan bahwa kualitas udara, air, dan tutupan lahan secara positif memengaruhi kualitas lingkungan hidup (IKLH) di Indonesia. Namun karena data melanggar asumsi klasik, hasil OLS berpotensi bias. Setelah dilakukan koreksi dengan metode Standard Error Robust (White-HC), menjadi lebih akurat dan dapat dipercaya, meskipun tingkat signifikansi beberapa variabel sedikit menurun. Dengan demikian, hasil menjadi lebih reliabel, karena robust standard error sudah menyesuaikan untuk kondisi data yang tidak memenuhi asumsi homoskedastisitas dan normalitas.
LINK SHINY : https://andrewtalakua.shinyapps.io/dashboard/