Abstrak

Penelitian ini bertujuan untuk menganalisis faktor-faktor yang memengaruhi Indeks Kualitas Lingkungan Hidup (IKLH) di Indonesia berdasarkan tiga komponen penyusunnya, yaitu Indeks Kualitas Udara, Indeks Kualitas Air, dan Indeks Kualitas Tutupan Lahan (IKTL). Analisis dilakukan menggunakan regresi linier berganda, dan ketika ditemukan heteroskedastisitas, dilakukan koreksi dengan Standard Error Robust (White-HC).

Hasil menunjukkan bahwa meskipun model OLS menghasilkan koefisien signifikan, terdapat indikasi heteroskedastisitas sehingga model dengan SE robust memberikan estimasi yang lebih andal.

Kata Kunci: Regresi Linier Berganda, IKLH, White-HC, Heteroskedastisitas, R Shiny.


BAB 1. PENDAHULUAN

1.1 Latar Belakang

Latar Belakang

Isu lingkungan hidup menjadi perhatian global seiring dengan meningkatnya tekanan pembangunan ekonomi dan pertumbuhan penduduk. Indonesia sebagai negara berkembang menghadapi tantangan besar dalam menjaga keseimbangan antara pertumbuhan ekonomi dan kelestarian lingkungan. Upaya pemerintah untuk menilai keberhasilan pengelolaan lingkungan diwujudkan melalui Indeks Kualitas Lingkungan Hidup (IKLH), yang mengukur kondisi lingkungan berdasarkan tiga komponen utama: kualitas udara, kualitas air, dan tutupan lahan.IKLH menjadi indikator penting dalam menilai sejauh mana pembangunan nasional sejalan dengan prinsip keberlanjutan. Untuk memahami hubungan tersebut, peneliti umumnya menggunakan model regresi linier dengan pendekatan Ordinary Least Squares (OLS).

Namun, penggunaan metode OLS memiliki keterbatasan. OLS menghasilkan estimasi yang efisien hanya ketika asumsi klasik terpenuhi, khususnya asumsi homoskedastisitas (varian error yang konstan). Dalam praktiknya, data lintas provinsi di Indonesia sering menunjukkan adanya heteroskedastisitas — di mana varians error berbeda antarwilayah akibat perbedaan kondisi ekonomi, sosial, dan lingkungan. Hal ini menyebabkan nilai standar error menjadi bias, sehingga uji signifikansi statistik dapat menyesatkan. Untuk mengatasi permasalahan tersebut, metode Regresi Robust dengan koreksi heteroskedastisitas White-HC (White Heteroskedasticity-Consistent) digunakan. Pendekatan ini tidak mengubah estimasi koefisien regresi, tetapi mengoreksi varians error agar hasil uji statistik tetap valid meskipun heteroskedastisitas terjadi. Dengan demikian, regresi robust memberikan hasil yang lebih reliabel dalam analisis data empiris yang kompleks dan bervariasi, seperti data lingkungan antarwilayah di Indonesia. Melalui perbandingan antara metode OLS dan regresi robust White-HC, penelitian ini bertujuan untuk menilai keandalan hasil estimasi dan stabilitas hubungan antara faktor-faktor ekonomi dengan kualitas lingkungan. Analisis ini diharapkan dapat memberikan gambaran yang lebih akurat mengenai pengaruh pembangunan terhadap kondisi lingkungan hidup di Indonesia, sekaligus menjadi masukan bagi pemerintah dalam merumuskan kebijakan pembangunan berkelanjutan yang berbasis data empiris yang kuat.


1.2 Identifikasi Masalah

  1. Apakah model regresi linier berganda memenuhi asumsi klasik?
  2. Apakah heteroskedastisitas berpengaruh terhadap hasil OLS?
  3. Bagaimana perbandingan hasil estimasi OLS dan model dengan SE robust (White-HC)?

1.3 Tujuan Penelitian

  • Menganalisis pengaruh Indeks Kualitas Udara, Air, dan IKTL terhadap IKLH.
  • Melakukan pengujian asumsi klasik terhadap model regresi.
  • Membandingkan hasil model OLS dengan model menggunakan SE robust (White-HC).

1.4 Keterbatasan Penelitian

Data terbatas pada tingkat provinsi tahun 2019-2023. Model bersifat linier dan belum mempertimbangkan efek spasial.


BAB 2. TINJAUAN PUSTAKA

2.1 Model Regresi Linier Berganda

Model umum: \[ Y = \beta_0 + \beta_1 X_1 + \beta_2 X_2 + \beta_3 X_3 + \varepsilon \] dengan: - \(Y\): IKLH
- \(X_1\): Indeks Kualitas Udara
- \(X_2\): Indeks Kualitas Air
- \(X_3\): Indeks Kualitas Tutupan Lahan

2.2 Uji Asumsi Klasik

  • Normalitas: Shapiro–Wilk
  • Autokorelasi: Durbin–Watson
  • Multikolinearitas: Variance Inflation Factor (VIF)
  • Heteroskedastisitas: Breusch–Pagan

2.3 Pendekatan White-HC

White (1980) memperkenalkan estimator heteroskedasticity-consistent covariance matrix (HC) yang memperbaiki standard error tanpa mengubah koefisien regresi.


BAB 3. METODOLOGI PENELITIAN

3.1 Data Penelitian

Data yang digunakan merupakan data sekunder yang diperoleh dari Badan Pusat Statistik (BPS), yaitu Data Komponen Penyusun Indeks Kualitas Lingkungan Hidup Menurut Provinsi, Tahun 2023.
Data mencakup 38 provinsi di Indonesia dengan empat variabel utama yang saling berkaitan terhadap kondisi lingkungan hidup.

# Mengatur direktori kerja dan membaca data
setwd('D:/Kuliah S2 UNPAD/Analisis Regresi/dashboard')

library(readxl)
library(dplyr)
library(DT)

# Membaca data Excel
data <- read_excel("Data Komponen Penyusun Indeks Kualitas Lingkungan Hidup Menurut Provinsi, 2023 fix.xlsx")

# Melihat struktur data
str(data)
## tibble [174 × 5] (S3: tbl_df/tbl/data.frame)
##  $ Provinsi                        : chr [1:174] "ACEH" "SUMATERA UTARA" "SUMATERA BARAT" "RIAU" ...
##  $ Indeks Kualitas Udara           : num [1:174] 90.9 90.9 90.5 90.9 90.6 ...
##  $ Indeks Kualitas Air             : num [1:174] 61.3 60.3 57 50.8 46.1 ...
##  $ Indeks Kualitas Tutupan Lahan   : chr [1:174] "76.5" "49.8" "67" "51.3" ...
##  $ indeks Kualitas Lingkungan Hidup: num [1:174] 78.5 72.8 75.8 70.4 68.2 ...
# Konversi kolom yang masih karakter menjadi numeric (jika perlu)
data <- data %>%
  mutate(`Indeks Kualitas Tutupan Lahan` = as.numeric(`Indeks Kualitas Tutupan Lahan`))

# Menampilkan beberapa baris pertama data
datatable(head(data, 10), caption = "Tabel 3.1 Contoh Data Penelitian (10 Provinsi Pertama)")

3.2 Variabel Penelitian

Berikut daftar dan deskripsi variabel yang digunakan dalam penelitian ini:

Variabel Keterangan Jenis Satuan / Skala
IKLH Indeks Kualitas Lingkungan Hidup Dependen (Y) Skor (0–100)
Indeks Kualitas Udara Menggambarkan tingkat kualitas udara di provinsi Independen (X₁) Skor (0–100)
Indeks Kualitas Air Menggambarkan tingkat kualitas air permukaan Independen (X₂) Skor (0–100)
Indeks Kualitas Tutupan Lahan (IKTL) Mengukur kondisi vegetasi dan tutupan lahan Independen (X₃) Skor (0–100)

Model regresi yang digunakan dapat dituliskan sebagai berikut:

\[ IKLH_i = \beta_0 + \beta_1 Udara_i + \beta_2 Air_i + \beta_3 IKTL_i + \varepsilon_i \]

3.3 Alur Penelitian

Tahapan penelitian dilakukan secara sistematis sebagai berikut:

  1. Pengumpulan Data:
    Mengimpor data IKLH dan komponennya dari file Excel KLHK (2023).

  2. Pra-pemrosesan Data:
    Melakukan pembersihan dan pengecekan tipe data agar siap dianalisis.

  3. Pembangunan Model Regresi Linier Berganda (OLS):
    Mengestimasi hubungan antara IKLH dengan tiga komponen utamanya.

  4. Uji Asumsi Klasik:
    Melakukan pengujian normalitas, multikolinearitas, autokorelasi, dan heteroskedastisitas.

  5. Koreksi Standard Error (White-HC):
    Jika ditemukan heteroskedastisitas, maka digunakan estimator robust (HC3).

  6. Analisis dan Interpretasi Hasil:
    Membandingkan hasil estimasi model OLS dengan model White-HC.

  7. Penyajian Hasil (opsional):
    Visualisasi hasil menggunakan dashboard interaktif berbasis R Shiny.

3.4 Model Regresi

Model yang digunakan: \[ IKLH_i = \beta_0 + \beta_1 Udara_i + \beta_2 Air_i + \beta_3 IKTL_i + \varepsilon_i \]

model_ols <- lm(`indeks Kualitas Lingkungan Hidup` ~ `Indeks Kualitas Udara`+ `Indeks Kualitas Air` + `Indeks Kualitas Tutupan Lahan` , data = data)
summary(model_ols)
## 
## Call:
## lm(formula = `indeks Kualitas Lingkungan Hidup` ~ `Indeks Kualitas Udara` + 
##     `Indeks Kualitas Air` + `Indeks Kualitas Tutupan Lahan`, 
##     data = data)
## 
## Residuals:
##     Min      1Q  Median      3Q     Max 
## -9.7220 -0.3205  0.7658  1.6349  4.0151 
## 
## Coefficients:
##                                 Estimate Std. Error t value Pr(>|t|)    
## (Intercept)                      4.65839    4.01709   1.160    0.248    
## `Indeks Kualitas Udara`          0.44400    0.05261   8.439 1.38e-14 ***
## `Indeks Kualitas Air`            0.29932    0.04206   7.116 3.01e-11 ***
## `Indeks Kualitas Tutupan Lahan`  0.18024    0.01422  12.676  < 2e-16 ***
## ---
## Signif. codes:  0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
## 
## Residual standard error: 2.856 on 169 degrees of freedom
##   (1 observation deleted due to missingness)
## Multiple R-squared:  0.8434, Adjusted R-squared:  0.8406 
## F-statistic: 303.4 on 3 and 169 DF,  p-value: < 2.2e-16

BAB 4. HASIL DAN PEMBAHASAN

4.1 Uji Asumsi Klasik

Uji Normalitas

shapiro.test(resid(model_ols))
## 
##  Shapiro-Wilk normality test
## 
## data:  resid(model_ols)
## W = 0.79949, p-value = 3.887e-14

Uji Autokorelasi

dwtest(model_ols)
## 
##  Durbin-Watson test
## 
## data:  model_ols
## DW = 0.59866, p-value < 2.2e-16
## alternative hypothesis: true autocorrelation is greater than 0

Uji Multikolinearitas

car::vif(model_ols)
##         `Indeks Kualitas Udara`           `Indeks Kualitas Air` 
##                        1.945331                        1.222109 
## `Indeks Kualitas Tutupan Lahan` 
##                        1.774811

Uji Heteroskedastisitas

bptest(model_ols)
## 
##  studentized Breusch-Pagan test
## 
## data:  model_ols
## BP = 15.334, df = 3, p-value = 0.001552

4.2 Model dengan Standard Error Robust (White-HC)

coeftest(model_ols, vcov = vcovHC(model_ols, type = "HC3"))
## 
## t test of coefficients:
## 
##                                 Estimate Std. Error t value  Pr(>|t|)    
## (Intercept)                     4.658391   6.187643  0.7529    0.4526    
## `Indeks Kualitas Udara`         0.444003   0.069758  6.3649 1.772e-09 ***
## `Indeks Kualitas Air`           0.299323   0.067946  4.4053 1.870e-05 ***
## `Indeks Kualitas Tutupan Lahan` 0.180236   0.017205 10.4755 < 2.2e-16 ***
## ---
## Signif. codes:  0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1

4.3 Perbandingan Model

Aspek OLS White-HC
Asumsi homoskedastisitas Tidak terpenuhi Tidak disyaratkan
Koefisien Sama Sama
Standard Error Bias Diperbaiki
Inferensi Kurang reliabel Lebih reliabel


BAB 5. KESIMPULAN DAN SARAN

5.1 Kesimpulan

  1. Model OLS menunjukkan hubungan positif antara Udara, Air, dan IKTL terhadap IKLH.
  2. Ditemukan heteroskedastisitas pada model OLS.
  3. Model dengan Standard Error Robust (White-HC) menghasilkan inferensi yang lebih akurat.

5.2 Saran

  • Penelitian selanjutnya disarankan menambahkan efek spasial (panel data).
  • Dapat menggunakan WLS atau GLS untuk pembanding.
  • Dashboard Shiny dapat dikembangkan dengan fitur prediksi antar tahun.

LINK SHINY : https://andrewtalakua.shinyapps.io/dashboard/