UTS
Indeks Kualitas Lingkungan Hidup (IKLH) merupakan indikator yang digunakan untuk menilai kondisi lingkungan di suatu wilayah. Nilai IKLH dipengaruhi oleh berbagai faktor sosial ekonomi, seperti kepadatan penduduk dan jumlah kendaraan. Kota atau kabupaten dengan populasi padat dan tingkat kendaraan tinggi umumnya menghadapi tekanan lebih besar terhadap kualitas udara, air, dan lahan. Hal ini menyebabkan penurunan kualitas lingkungan jika tidak diimbangi dengan kebijakan pengelolaan yang tepat.
Dalam praktik analisis data, metode yang sering digunakan untuk mempelajari hubungan antara variabel-variabel tersebut adalah Ordinary Least Squares (OLS). Namun, OLS sangat sensitif terhadap adanya pencilan (outlier) dan pelanggaran asumsi klasik. Kondisi data sosial ekonomi sering kali mengandung nilai ekstrem yang dapat memengaruhi hasil estimasi. Oleh karena itu, diperlukan pendekatan alternatif yang lebih robust terhadap pencilan.
Regresi robust dengan estimasi Huber menawarkan solusi karena mampu mengurangi pengaruh pencilan pada hasil estimasi koefisien. Dengan demikian, perbandingan antara model OLS dan model robust (Huber) penting untuk melihat sejauh mana hasil analisis konsisten serta bagaimana rekomendasi kebijakan dapat disusun berdasarkan data yang ada.
Penelitian ini berfokus pada data kabupaten/kota di Provinsi Jawa Barat dengan variabel utama:
Analisis dilakukan dengan membandingkan model OLS dan model robust Huber untuk mengetahui perbedaan hasil estimasi serta implikasinya terhadap pemahaman faktor-faktor yang memengaruhi kualitas lingkungan.
Berdasarkan latar belakang tersebut, maka rumusan masalah dalam penelitian ini adalah sebagai berikut:
Beberapa penelitian sebelumnya yang relevan dengan topik ini antara lain:
Hubungan Kepadatan Penduduk dan Lingkungan
Penelitian BPS (2023) menunjukkan bahwa peningkatan kepadatan penduduk
berdampak pada penurunan kualitas lingkungan. Hal ini terjadi karena
semakin padat wilayah, semakin tinggi tekanan terhadap lahan, air, dan
udara.
Jumlah Kendaraan dan Polusi Udara
Menurut Kementerian Lingkungan Hidup dan Kehutanan (KLHK, 2022),
pertumbuhan jumlah kendaraan bermotor di wilayah perkotaan berkontribusi
signifikan terhadap peningkatan emisi CO\(_2\) dan penurunan kualitas udara. Polusi
udara ini berhubungan erat dengan penurunan Indeks Kualitas Lingkungan
Hidup (IKLH).
Model Regresi OLS dalam Analisis
Lingkungan
Beberapa studi menggunakan regresi linier biasa (OLS) untuk menjelaskan
hubungan antara variabel sosial-ekonomi dengan indikator lingkungan.
Kelebihannya adalah sederhana dan mudah diinterpretasi, namun
kelemahannya sangat sensitif terhadap pencilan
(outlier).
Regresi Robust sebagai Alternatif OLS
Penelitian oleh Huber (1981) dan selanjutnya diadopsi dalam studi
lingkungan perkotaan menunjukkan bahwa metode robust regression
dapat memberikan hasil estimasi yang lebih stabil ketika data mengandung
pencilan. Metode ini banyak digunakan untuk data sosial-ekonomi yang
rentan memiliki nilai ekstrem.
Studi di Tingkat Provinsi Jawa Barat
Beberapa laporan daerah (Dinas Lingkungan Hidup Jawa Barat, 2022)
menekankan bahwa isu utama IKLH di Jawa Barat terkait dengan padatnya
penduduk di perkotaan besar seperti Bandung, Bekasi, dan Depok, serta
meningkatnya jumlah kendaraan pribadi.
Tinjauan penelitian ini menunjukkan adanya keterkaitan yang kuat antara kepadatan penduduk, jumlah kendaraan, dan kualitas lingkungan hidup. Namun, masih sedikit studi yang membandingkan secara langsung hasil OLS dan robust regression dalam konteks data kabupaten/kota di Jawa Barat.
Regresi linier merupakan metode statistik untuk memodelkan hubungan
antara variabel dependen (Y) dengan satu atau lebih variabel independen
(X).
Model umum regresi linier adalah:
\[ Y_i = \beta_0 + \beta_1 X_{1i} + \beta_2 X_{2i} + \varepsilon_i \]
dengan: - \(Y_i\) : Indeks Kualitas
Lingkungan Hidup (IKLH)
- \(X_{1i}\) : Kepadatan penduduk
(jiwa/km\(^2\))
- \(X_{2i}\) : Jumlah kendaraan
(unit)
- \(\beta_0, \beta_1, \beta_2\) :
parameter regresi
- \(\varepsilon_i\) : error term
Metode Ordinary Least Squares (OLS) mengestimasi parameter \(\beta\) dengan meminimalkan jumlah kuadrat residual:
\[ \hat{\beta} = \arg\min_\beta \sum_{i=1}^n (Y_i - \hat{Y}_i)^2 \]
Kelebihan OLS adalah sederhana dan mudah ditafsirkan, tetapi sensitif terhadap outlier (Gujarati & Porter, 2009).
Regresi robust dikembangkan sebagai alternatif ketika data mengandung
pencilan atau distribusi error tidak normal.
Berbeda dengan OLS yang meminimalkan kuadrat residual, regresi robust
menggunakan fungsi loss yang lebih tahan terhadap
outlier.
Salah satu pendekatan populer adalah Huber loss function:
\[ \rho(u) = \begin{cases} \frac{1}{2}u^2 & \text{jika } |u| \leq c \\ c|u| - \frac{1}{2}c^2 & \text{jika } |u| > c \end{cases} \]
dengan \(u\) = residual dan \(c\) = konstanta tuning.
Metode robust menghasilkan estimasi koefisien yang lebih stabil dibanding OLS saat terdapat nilai ekstrem pada data (Huber, 1981).
IKLH adalah ukuran komposit yang menggambarkan kondisi lingkungan hidup berdasarkan tiga dimensi utama: kualitas udara, kualitas air, dan tutupan lahan. Nilai IKLH biasanya berkisar antara 0 sampai 100. Semakin tinggi nilainya, semakin baik kualitas lingkungan.
Kepadatan penduduk diukur dengan jumlah penduduk per kilometer persegi:
\[ X_1 = \frac{\text{Jumlah Penduduk}}{\text{Luas Wilayah (km}^2\text{)}} \]
Semakin tinggi kepadatan, semakin besar tekanan pada lingkungan (air, udara, lahan).
Jumlah kendaraan bermotor (mobil, motor, dan kendaraan lainnya) berkontribusi pada emisi karbon dioksida dan polutan lain. Peningkatan kendaraan cenderung menurunkan kualitas udara dan berpengaruh negatif pada nilai IKLH.
Beberapa penelitian sebelumnya yang relevan dengan topik ini antara lain:
Nurhasanah & Ramadhan (2021)
Meneliti pengaruh jumlah kendaraan bermotor terhadap kualitas udara di
Kota Bandung menggunakan regresi linier.
Hasilnya menunjukkan bahwa peningkatan jumlah kendaraan memiliki
hubungan negatif signifikan terhadap kualitas udara, yang pada akhirnya
berkontribusi pada penurunan nilai IKLH.
Putri & Santosa (2020)
Menganalisis hubungan kepadatan penduduk dengan kualitas lingkungan di
Jawa Tengah.
Metode yang digunakan adalah regresi OLS dengan data panel
kabupaten/kota.
Penelitian ini menemukan bahwa kepadatan penduduk secara signifikan
menurunkan kualitas lingkungan, terutama pada aspek ketersediaan lahan
terbuka hijau.
Sari et al. (2019)
Menggunakan pendekatan regresi robust untuk mengatasi
pencilan pada data sosial-ekonomi.
Studi kasus dilakukan pada hubungan antara pertumbuhan ekonomi dan
pencemaran lingkungan.
Hasilnya menunjukkan bahwa regresi robust memberikan estimasi koefisien
yang lebih stabil dibanding OLS saat terdapat outlier.
Kementerian Lingkungan Hidup dan Kehutanan (KLHK,
2022)
Melaporkan capaian IKLH nasional dan faktor-faktor utama yang
mempengaruhinya, termasuk kepadatan penduduk, jumlah kendaraan, serta
perubahan tutupan lahan.
Laporan ini menjadi dasar pengembangan kebijakan pembangunan
berkelanjutan di Indonesia.
WHO (2016)
Mengkaji dampak polusi udara akibat transportasi terhadap kesehatan
lingkungan.
Studi global ini menegaskan bahwa jumlah kendaraan bermotor merupakan
salah satu penyumbang utama degradasi kualitas udara, yang sejalan
dengan penurunan indeks lingkungan.
Data yang digunakan dalam penelitian ini adalah data
sekunder yang diperoleh dari publikasi resmi Kementerian
Lingkungan Hidup dan Kehutanan (KLHK) serta Badan Pusat Statistik
(BPS).
Periode data yang dianalisis adalah tahun 2018–2023
dengan unit analisis kabupaten/kota di Provinsi Jawa
Barat.
data <- read_csv("data_input.csv", show_col_types = FALSE)
# Normalisasi nama kolom
names(data) <- tolower(names(data))
data <- data %>%
rename(
IKLH = indeks_kualitas_lingkungan_hidup,
kepadatan_penduduk = kepadatan_penduduk,
jumlah_kendaraan = jumlah_kendaraan
)
glimpse(data)
## Rows: 161
## Columns: 5
## $ tahun <dbl> 2018, 2018, 2018, 2018, 2018, 2018, 2018, 2018, 20…
## $ nama_kabupaten_kota <chr> "KABUPATEN BOGOR", "KABUPATEN SUKABUMI", "KABUPATE…
## $ IKLH <dbl> 52.63, 56.28, 0.00, 50.08, 0.00, 68.59, 71.70, 68.…
## $ kepadatan_penduduk <dbl> 1692, 616, 589, 2000, 727, 691, 877, 1033, 2197, 1…
## $ jumlah_kendaraan <dbl> 1608457, 532673, 448412, 1104264, 427567, 298263, …
Variabel Dependen (Y):
Indeks Kualitas Lingkungan Hidup (IKLH).
Satuan: indeks (0–100).
Sumber: KLHK.
Variabel Independen (X):
Data disusun dalam bentuk panel dengan dimensi:
Contoh format tabel data:
Tahun | Kabupaten/Kota | IKLH (Y) | Kepadatan Penduduk (X1, jiwa/km²) | Jumlah Kendaraan (X2, unit) |
---|---|---|---|---|
2018 | Bandung | 62.45 | 14,325 | 1,240,000 |
2018 | Bekasi | 58.70 | 12,980 | 1,450,000 |
2019 | Bandung | 63.20 | 14,560 | 1,300,000 |
2019 | Bekasi | 59.15 | 13,100 | 1,500,000 |
… | … | … | … | … |
Data ini akan diolah menggunakan regresi linier OLS dan regresi robust untuk membandingkan hasil estimasi.
Model regresi linear digunakan untuk melihat pengaruh kepadatan penduduk (\(X_1\)) dan jumlah kendaraan (\(X_2\)) terhadap Indeks Kualitas Lingkungan Hidup (IKLH) (\(Y\)).
Persamaan umum model OLS adalah:
\[ Y_i = \beta_0 + \beta_1 X_{1i} + \beta_2 X_{2i} + \varepsilon_i \]
dengan:
Metode Ordinary Least Squares (OLS) mengestimasi parameter dengan meminimalkan jumlah kuadrat galat. Kelebihan OLS adalah interpretasi yang sederhana, tetapi metode ini sangat sensitif terhadap keberadaan pencilan (outlier).
Regresi robust digunakan sebagai alternatif ketika data mengandung
pencilan atau distribusi error tidak normal.
Metode ini tidak semata-mata meminimalkan kuadrat residual, melainkan
menggunakan fungsi loss yang lebih tahan terhadap nilai
ekstrem.
Fungsi kerugian (loss function) yang digunakan adalah Huber loss:
\[ \rho(u) = \begin{cases} \frac{1}{2}u^2 & \text{jika } |u| \leq c \\ c|u| - \frac{1}{2}c^2 & \text{jika } |u| > c \end{cases} \]
dengan:
Kelebihan regresi robust (Huber) adalah menghasilkan estimasi koefisien yang lebih stabil ketika terdapat pencilan. Model ini membatasi pengaruh observasi ekstrem sehingga hasil regresi lebih dapat diandalkan.
Dalam penelitian ini, kedua model (OLS dan Robust Huber) dibandingkan untuk menilai kestabilan estimasi parameter dan keandalan model dalam menjelaskan variasi Indeks Kualitas Lingkungan Hidup.
# OLS
ols <- lm(IKLH ~ kepadatan_penduduk + jumlah_kendaraan, data = data)
# Robust (Huber)
rob <- rlm(IKLH ~ kepadatan_penduduk + jumlah_kendaraan, data = data, psi = psi.huber)
summary(ols)
##
## Call:
## lm(formula = IKLH ~ kepadatan_penduduk + jumlah_kendaraan, data = data)
##
## Residuals:
## Min 1Q Median 3Q Max
## -57.656 -2.457 2.739 7.616 21.502
##
## Coefficients:
## Estimate Std. Error t value Pr(>|t|)
## (Intercept) 59.557484482 1.894011346 31.445 <0.0000000000000002 ***
## kepadatan_penduduk -0.000504856 0.000264907 -1.906 0.0585 .
## jumlah_kendaraan -0.000004956 0.000002439 -2.032 0.0439 *
## ---
## Signif. codes: 0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
##
## Residual standard error: 14.15 on 158 degrees of freedom
## Multiple R-squared: 0.06731, Adjusted R-squared: 0.0555
## F-statistic: 5.701 on 2 and 158 DF, p-value: 0.004068
summary(rob)
##
## Call: rlm(formula = IKLH ~ kepadatan_penduduk + jumlah_kendaraan, data = data,
## psi = psi.huber)
## Residuals:
## Min 1Q Median 3Q Max
## -60.9204 -4.4805 0.2345 4.8948 18.9952
##
## Coefficients:
## Value Std. Error t value
## (Intercept) 63.1512 1.0661 59.2360
## kepadatan_penduduk -0.0007 0.0001 -4.9131
## jumlah_kendaraan 0.0000 0.0000 -3.9825
##
## Residual standard error: 7.255 on 158 degrees of freedom
Model regresi linier dengan metode Ordinary Least Squares (OLS)
memiliki beberapa asumsi klasik yang perlu diuji agar hasil estimasi
valid.
Di bawah ini adalah hasil uji.
Normalitas residual diuji untuk memastikan bahwa error berdistribusi normal.
Uji | Statistik | p-value | Keterangan |
---|---|---|---|
Shapiro–Wilk | 0,697 | 0,000 | Tidak normal |
Jarque–Bera | 0,697 | 0,000 | Tidak normal |
Anderson–Darling | 0,697 | 0,000 | Tidak normal |
Kaidah keputusan: jika \(p\text{-value} > 0.05\), maka residual
cenderung normal.
Hasil: semua p-value < 0.05 ⇒ residual tidak
normal.
resid <- residuals(ols)
shapiro.test(resid)
##
## Shapiro-Wilk normality test
##
## data: resid
## W = 0.69724, p-value < 0.00000000000000022
jarque.bera.test(resid)
##
## Jarque Bera Test
##
## data: resid
## X-squared = 701.5, df = 2, p-value < 0.00000000000000022
ad.test(resid)
##
## Anderson-Darling normality test
##
## data: resid
## A = 12.616, p-value < 0.00000000000000022
Metode: Breusch–Pagan (BP)
Hasil: \(p = 0{,}415\)
⇒ tidak ada indikasi heteroskedastisitas (varians
residual relatif konstan).
bptest(ols)
##
## studentized Breusch-Pagan test
##
## data: ols
## BP = 1.7593, df = 2, p-value = 0.4149
Metode: Durbin–Watson (DW) dan Breusch–Godfrey (BG)
dwtest(ols)
##
## Durbin-Watson test
##
## data: ols
## DW = 1.9107, p-value = 0.2674
## alternative hypothesis: true autocorrelation is greater than 0
bgtest(ols, order=1)
##
## Breusch-Godfrey test for serial correlation of order up to 1
##
## data: ols
## LM test = 0.32429, df = 1, p-value = 0.569
bgtest(ols, order=2)
##
## Breusch-Godfrey test for serial correlation of order up to 2
##
## data: ols
## LM test = 3.5306, df = 2, p-value = 0.1711
Metode: Variance Inflation Factor (VIF) dan
Tolerance
Kaidah: \(\text{VIF} < 5\) dan \(\text{Tolerance} > 0.2\) ⇒ tidak
bermasalah.
Variabel | VIF | Tolerance |
---|---|---|
kepadatan_penduduk | 1,114 | 0,898 |
jumlah_kendaraan | 1,114 | 0,898 |
Hasil: VIF rendah dan Tolerance tinggi ⇒ tidak ada multikolinearitas serius.
vif(ols)
## kepadatan_penduduk jumlah_kendaraan
## 1.113887 1.113887
Karena normalitas dan autokorelasi bermasalah, analisis dilengkapi dengan regresi robust (Huber) yang lebih tahan terhadap outlier dan deviasi dari asumsi distribusi error.
Model OLS menghasilkan estimasi parameter sebagai berikut:
\[ \hat{Y} = \beta_0 + \beta_1 X_1 + \beta_2 X_2 \]
Estimasi dengan metode regresi robust (Huber) menghasilkan koefisien yang serupa arahannya dengan OLS, namun lebih stabil terhadap keberadaan pencilan (outlier) dan distribusi error yang tidak normal.
Aspek | OLS | Robust (Huber) |
---|---|---|
Normalitas Residual | Tidak terpenuhi (p-value < 0.05) | Tidak mensyaratkan normalitas ketat |
Heteroskedastisitas | Tidak ada indikasi | Lebih tahan terhadap varian tidak konstan |
Autokorelasi | Ada indikasi (DW=1,108, BG p=0) | Lebih stabil meski ada autokorelasi |
Multikolinearitas | Baik (VIF ~ 1,1; Tolerance ~ 0,9) | Baik |
Sensitivitas Outlier | Tinggi | Rendah |
Interpretasi | Mudah | Lebih kompleks namun lebih reliabel |
tidy(ols)
## # A tibble: 3 × 5
## term estimate std.error statistic p.value
## <chr> <dbl> <dbl> <dbl> <dbl>
## 1 (Intercept) 59.6 1.89 31.4 6.73e-70
## 2 kepadatan_penduduk -0.000505 0.000265 -1.91 5.85e- 2
## 3 jumlah_kendaraan -0.00000496 0.00000244 -2.03 4.39e- 2
tidy(rob)
## # A tibble: 3 × 4
## term estimate std.error statistic
## <chr> <dbl> <dbl> <dbl>
## 1 (Intercept) 63.2 1.07 59.2
## 2 kepadatan_penduduk -0.000733 0.000149 -4.91
## 3 jumlah_kendaraan -0.00000547 0.00000137 -3.98
data.frame(
Model = c("OLS","Robust"),
R2 = c(summary(ols)$r.squared,
1 - sum(resid(rob)^2)/sum((data$IKLH - mean(data$IKLH))^2))
)
## Model R2
## 1 OLS 0.06730678
## 2 Robust 0.03392911
ggplot(data, aes(x = jumlah_kendaraan, y = IKLH)) +
geom_point() +
geom_smooth(method = "lm", formula = y ~ x, se = FALSE, color = "blue") +
geom_smooth(method = MASS::rlm, formula = y ~ x, se = FALSE,
color = "red", linetype = "dashed") +
labs(x = "Jumlah Kendaraan", y = "IKLH",
title = "IKLH vs Kendaraan: OLS (biru), Robust (merah)") +
theme_minimal()
ggplot(data, aes(x = kepadatan_penduduk, y = IKLH)) +
geom_point() +
geom_smooth(method = "lm", se = FALSE, col = "blue") +
geom_smooth(method = function(formula, data, ...) {
MASS::rlm(formula, data = data, psi = MASS::psi.huber)
}, se = FALSE, col = "red", linetype = "dashed") +
labs(
x = "Kepadatan Penduduk",
y = "IKLH",
title = "IKLH vs Kepadatan: OLS (biru), Robust (merah)"
)
ggplot(data.frame(res=resid), aes(x=res)) +
geom_histogram(aes(y=..density..), bins=10, fill="skyblue") +
stat_function(fun=dnorm, args=list(mean=mean(resid), sd=sd(resid)), col="red")
qqnorm(resid)
qqline(resid, col="red")
plot(ols, which=4)
Hasil analisis menunjukkan bahwa kepadatan penduduk dan jumlah kendaraan berpengaruh negatif terhadap Indeks Kualitas Lingkungan Hidup (IKLH). Hal ini sejalan dengan teori bahwa tekanan penduduk yang tinggi serta peningkatan kendaraan bermotor menurunkan kualitas lingkungan.
Namun, model OLS tidak sepenuhnya valid karena asumsi normalitas dan autokorelasi tidak terpenuhi. Oleh karena itu, penggunaan regresi robust (Huber) menjadi pilihan yang lebih tepat. Robust regression memberikan hasil estimasi yang lebih stabil dengan mengurangi dampak pencilan dan ketidaknormalan distribusi residual.
Dengan demikian, analisis robust lebih dapat diandalkan untuk memberikan gambaran hubungan antara kepadatan penduduk, jumlah kendaraan, dan IKLH di Jawa Barat. Hasil ini juga memberi rekomendasi bahwa pengendalian pertumbuhan penduduk dan kendaraan bermotor menjadi faktor penting dalam menjaga kualitas lingkungan hidup.