Penelitian ini bertujuan untuk menganalisis faktor-faktor yang memengaruhi Indeks Kualitas Lingkungan Hidup (IKLH) di Indonesia berdasarkan tiga komponen penyusunnya, yaitu Indeks Kualitas Udara, Indeks Kualitas Air, dan Indeks Kualitas Tutupan Lahan (IKTL). Analisis dilakukan menggunakan regresi linier berganda, dan ketika ditemukan heteroskedastisitas, dilakukan koreksi dengan Standard Error Robust (White-HC).
Hasil menunjukkan bahwa meskipun model OLS menghasilkan koefisien signifikan, terdapat indikasi heteroskedastisitas sehingga model dengan SE robust memberikan estimasi yang lebih andal.
Kata Kunci: Regresi Linier Berganda, IKLH, White-HC, Heteroskedastisitas, R Shiny.
Latar Belakang
Isu lingkungan hidup menjadi perhatian global seiring dengan meningkatnya tekanan pembangunan ekonomi dan pertumbuhan penduduk. Indonesia sebagai negara berkembang menghadapi tantangan besar dalam menjaga keseimbangan antara pertumbuhan ekonomi dan kelestarian lingkungan. Upaya pemerintah untuk menilai keberhasilan pengelolaan lingkungan diwujudkan melalui Indeks Kualitas Lingkungan Hidup (IKLH), yang mengukur kondisi lingkungan berdasarkan tiga komponen utama: kualitas udara, kualitas air, dan tutupan lahan.IKLH menjadi indikator penting dalam menilai sejauh mana pembangunan nasional sejalan dengan prinsip keberlanjutan. Untuk memahami hubungan tersebut, peneliti umumnya menggunakan model regresi linier dengan pendekatan Ordinary Least Squares (OLS).
Namun, penggunaan metode OLS memiliki keterbatasan. OLS menghasilkan estimasi yang efisien hanya ketika asumsi klasik terpenuhi, khususnya asumsi homoskedastisitas (varian error yang konstan). Dalam praktiknya, data lintas provinsi di Indonesia sering menunjukkan adanya heteroskedastisitas — di mana varians error berbeda antarwilayah akibat perbedaan kondisi ekonomi, sosial, dan lingkungan. Hal ini menyebabkan nilai standar error menjadi bias, sehingga uji signifikansi statistik dapat menyesatkan. Untuk mengatasi permasalahan tersebut, metode Regresi Robust dengan koreksi heteroskedastisitas White-HC (White Heteroskedasticity-Consistent) digunakan. Pendekatan ini tidak mengubah estimasi koefisien regresi, tetapi mengoreksi varians error agar hasil uji statistik tetap valid meskipun heteroskedastisitas terjadi. Dengan demikian, regresi robust memberikan hasil yang lebih reliabel dalam analisis data empiris yang kompleks dan bervariasi, seperti data lingkungan antarwilayah di Indonesia. Melalui perbandingan antara metode OLS dan regresi robust White-HC, penelitian ini bertujuan untuk menilai keandalan hasil estimasi dan stabilitas hubungan antara faktor-faktor ekonomi dengan kualitas lingkungan. Analisis ini diharapkan dapat memberikan gambaran yang lebih akurat mengenai pengaruh pembangunan terhadap kondisi lingkungan hidup di Indonesia, sekaligus menjadi masukan bagi pemerintah dalam merumuskan kebijakan pembangunan berkelanjutan yang berbasis data empiris yang kuat.
Data terbatas pada tingkat provinsi tahun 2019-2023. Model bersifat linier dan belum mempertimbangkan efek spasial.
Model umum: \[
Y = \beta_0 + \beta_1 X_1 + \beta_2 X_2 + \beta_3 X_3 + \varepsilon
\] dengan: - \(Y\): IKLH
- \(X_1\): Indeks Kualitas Udara
- \(X_2\): Indeks Kualitas Air
- \(X_3\): Indeks Kualitas Tutupan
Lahan
White (1980) memperkenalkan estimator heteroskedasticity-consistent covariance matrix (HC) yang memperbaiki standard error tanpa mengubah koefisien regresi.
Data yang digunakan merupakan data sekunder yang diperoleh dari
Badan Pusat Statistik (BPS), yaitu Data Komponen
Penyusun Indeks Kualitas Lingkungan Hidup Menurut Provinsi, Tahun
2023.
Data mencakup 38 provinsi di Indonesia dengan empat
variabel utama yang saling berkaitan terhadap kondisi lingkungan
hidup.
# Mengatur direktori kerja dan membaca data
setwd('D:/Kuliah S2 UNPAD/Analisis Regresi/dashboard')
library(readxl)
library(dplyr)
library(DT)
# Membaca data Excel
data <- read_excel("Data Komponen Penyusun Indeks Kualitas Lingkungan Hidup Menurut Provinsi, 2023 fix.xlsx")
# Melihat struktur data
str(data)
## tibble [174 × 5] (S3: tbl_df/tbl/data.frame)
## $ Provinsi : chr [1:174] "ACEH" "SUMATERA UTARA" "SUMATERA BARAT" "RIAU" ...
## $ Indeks Kualitas Udara : num [1:174] 90.9 90.9 90.5 90.9 90.6 ...
## $ Indeks Kualitas Air : num [1:174] 61.3 60.3 57 50.8 46.1 ...
## $ Indeks Kualitas Tutupan Lahan : chr [1:174] "76.5" "49.8" "67" "51.3" ...
## $ indeks Kualitas Lingkungan Hidup: num [1:174] 78.5 72.8 75.8 70.4 68.2 ...
# Konversi kolom yang masih karakter menjadi numeric (jika perlu)
data <- data %>%
mutate(`Indeks Kualitas Tutupan Lahan` = as.numeric(`Indeks Kualitas Tutupan Lahan`))
# Menampilkan beberapa baris pertama data
datatable(head(data, 10), caption = "Tabel 3.1 Contoh Data Penelitian (10 Provinsi Pertama)")
Berikut daftar dan deskripsi variabel yang digunakan dalam penelitian ini:
| Variabel | Keterangan | Jenis | Satuan / Skala |
|---|---|---|---|
| IKLH | Indeks Kualitas Lingkungan Hidup | Dependen (Y) | Skor (0–100) |
| Indeks Kualitas Udara | Menggambarkan tingkat kualitas udara di provinsi | Independen (X₁) | Skor (0–100) |
| Indeks Kualitas Air | Menggambarkan tingkat kualitas air permukaan | Independen (X₂) | Skor (0–100) |
| Indeks Kualitas Tutupan Lahan (IKTL) | Mengukur kondisi vegetasi dan tutupan lahan | Independen (X₃) | Skor (0–100) |
Model regresi yang digunakan dapat dituliskan sebagai berikut:
\[ IKLH_i = \beta_0 + \beta_1 Udara_i + \beta_2 Air_i + \beta_3 IKTL_i + \varepsilon_i \]
Tahapan penelitian dilakukan secara sistematis sebagai berikut:
Pengumpulan Data:
Mengimpor data IKLH dan komponennya dari file Excel KLHK
(2023).
Pra-pemrosesan Data:
Melakukan pembersihan dan pengecekan tipe data agar siap
dianalisis.
Pembangunan Model Regresi Linier Berganda
(OLS):
Mengestimasi hubungan antara IKLH dengan tiga komponen
utamanya.
Uji Asumsi Klasik:
Melakukan pengujian normalitas, multikolinearitas, autokorelasi, dan
heteroskedastisitas.
Koreksi Standard Error (White-HC):
Jika ditemukan heteroskedastisitas, maka digunakan estimator robust
(HC3).
Analisis dan Interpretasi Hasil:
Membandingkan hasil estimasi model OLS dengan model White-HC.
Penyajian Hasil (opsional):
Visualisasi hasil menggunakan dashboard interaktif berbasis R
Shiny.
Model yang digunakan: \[ IKLH_i = \beta_0 + \beta_1 Udara_i + \beta_2 Air_i + \beta_3 IKTL_i + \varepsilon_i \]
model_ols <- lm(`indeks Kualitas Lingkungan Hidup` ~ `Indeks Kualitas Udara`+ `Indeks Kualitas Air` + `Indeks Kualitas Tutupan Lahan` , data = data)
summary(model_ols)
##
## Call:
## lm(formula = `indeks Kualitas Lingkungan Hidup` ~ `Indeks Kualitas Udara` +
## `Indeks Kualitas Air` + `Indeks Kualitas Tutupan Lahan`,
## data = data)
##
## Residuals:
## Min 1Q Median 3Q Max
## -9.7220 -0.3205 0.7658 1.6349 4.0151
##
## Coefficients:
## Estimate Std. Error t value Pr(>|t|)
## (Intercept) 4.65839 4.01709 1.160 0.248
## `Indeks Kualitas Udara` 0.44400 0.05261 8.439 1.38e-14 ***
## `Indeks Kualitas Air` 0.29932 0.04206 7.116 3.01e-11 ***
## `Indeks Kualitas Tutupan Lahan` 0.18024 0.01422 12.676 < 2e-16 ***
## ---
## Signif. codes: 0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
##
## Residual standard error: 2.856 on 169 degrees of freedom
## (1 observation deleted due to missingness)
## Multiple R-squared: 0.8434, Adjusted R-squared: 0.8406
## F-statistic: 303.4 on 3 and 169 DF, p-value: < 2.2e-16
shapiro.test(resid(model_ols))
##
## Shapiro-Wilk normality test
##
## data: resid(model_ols)
## W = 0.79949, p-value = 3.887e-14
dwtest(model_ols)
##
## Durbin-Watson test
##
## data: model_ols
## DW = 0.59866, p-value < 2.2e-16
## alternative hypothesis: true autocorrelation is greater than 0
car::vif(model_ols)
## `Indeks Kualitas Udara` `Indeks Kualitas Air`
## 1.945331 1.222109
## `Indeks Kualitas Tutupan Lahan`
## 1.774811
bptest(model_ols)
##
## studentized Breusch-Pagan test
##
## data: model_ols
## BP = 15.334, df = 3, p-value = 0.001552
coeftest(model_ols, vcov = vcovHC(model_ols, type = "HC3"))
##
## t test of coefficients:
##
## Estimate Std. Error t value Pr(>|t|)
## (Intercept) 4.658391 6.187643 0.7529 0.4526
## `Indeks Kualitas Udara` 0.444003 0.069758 6.3649 1.772e-09 ***
## `Indeks Kualitas Air` 0.299323 0.067946 4.4053 1.870e-05 ***
## `Indeks Kualitas Tutupan Lahan` 0.180236 0.017205 10.4755 < 2.2e-16 ***
## ---
## Signif. codes: 0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
| Aspek | OLS | White-HC |
|---|---|---|
| Asumsi homoskedastisitas | Tidak terpenuhi | Tidak disyaratkan |
| Koefisien | Sama | Sama |
| Standard Error | Bias | Diperbaiki |
| Inferensi | Kurang reliabel | Lebih reliabel |
LINK SHINY : https://andrewtalakua.shinyapps.io/dashboard/