Analisis Regresi Tingkat Lanjut

UTS

1 Pendahulan

1.1 Latar Belakang

Indeks Kualitas Lingkungan Hidup (IKLH) merupakan indikator yang digunakan untuk menilai kondisi lingkungan di suatu wilayah. Nilai IKLH dipengaruhi oleh berbagai faktor sosial ekonomi, seperti kepadatan penduduk dan jumlah kendaraan. Kota atau kabupaten dengan populasi padat dan tingkat kendaraan tinggi umumnya menghadapi tekanan lebih besar terhadap kualitas udara, air, dan lahan. Hal ini menyebabkan penurunan kualitas lingkungan jika tidak diimbangi dengan kebijakan pengelolaan yang tepat.

Dalam praktik analisis data, metode yang sering digunakan untuk mempelajari hubungan antara variabel-variabel tersebut adalah Ordinary Least Squares (OLS). Namun, OLS sangat sensitif terhadap adanya pencilan (outlier) dan pelanggaran asumsi klasik. Kondisi data sosial ekonomi sering kali mengandung nilai ekstrem yang dapat memengaruhi hasil estimasi. Oleh karena itu, diperlukan pendekatan alternatif yang lebih robust terhadap pencilan.

Regresi robust dengan estimasi Huber menawarkan solusi karena mampu mengurangi pengaruh pencilan pada hasil estimasi koefisien. Dengan demikian, perbandingan antara model OLS dan model robust (Huber) penting untuk melihat sejauh mana hasil analisis konsisten serta bagaimana rekomendasi kebijakan dapat disusun berdasarkan data yang ada.

Penelitian ini berfokus pada data kabupaten/kota di Provinsi Jawa Barat dengan variabel utama:

  • \(Y\) : Indeks Kualitas Lingkungan Hidup (IKLH)
  • \(X_{1}\) : Kepadatan Penduduk (jiwa/km\(^{2}\))
  • \(X_{2}\) : Jumlah Kendaraan

Analisis dilakukan dengan membandingkan model OLS dan model robust Huber untuk mengetahui perbedaan hasil estimasi serta implikasinya terhadap pemahaman faktor-faktor yang memengaruhi kualitas lingkungan.

1.2 Rumusan Masalah

Berdasarkan latar belakang tersebut, maka rumusan masalah dalam penelitian ini adalah sebagai berikut:

  1. Bagaimana pengaruh kepadatan penduduk (\(X_{1}\), jiwa/km\(^{2}\)) terhadap Indeks Kualitas Lingkungan Hidup (\(Y\))?
  2. Bagaimana pengaruh jumlah kendaraan (\(X_{2}\)) terhadap Indeks Kualitas Lingkungan Hidup (\(Y\))?
  3. Apakah terdapat perbedaan hasil estimasi antara model Ordinary Least Squares (OLS) dan model regresi robust (Huber) dalam menganalisis hubungan antara \(Y\), \(X_{1}\), dan \(X_{2}\)?
  4. Model manakah yang lebih sesuai digunakan untuk menjelaskan faktor-faktor yang memengaruhi Indeks Kualitas Lingkungan Hidup di kabupaten/kota Provinsi Jawa Barat?

1.3 Tujuan Penelitian

Beberapa penelitian sebelumnya yang relevan dengan topik ini antara lain:

  1. Hubungan Kepadatan Penduduk dan Lingkungan
    Penelitian BPS (2023) menunjukkan bahwa peningkatan kepadatan penduduk berdampak pada penurunan kualitas lingkungan. Hal ini terjadi karena semakin padat wilayah, semakin tinggi tekanan terhadap lahan, air, dan udara.

  2. Jumlah Kendaraan dan Polusi Udara
    Menurut Kementerian Lingkungan Hidup dan Kehutanan (KLHK, 2022), pertumbuhan jumlah kendaraan bermotor di wilayah perkotaan berkontribusi signifikan terhadap peningkatan emisi CO\(_2\) dan penurunan kualitas udara. Polusi udara ini berhubungan erat dengan penurunan Indeks Kualitas Lingkungan Hidup (IKLH).

  3. Model Regresi OLS dalam Analisis Lingkungan
    Beberapa studi menggunakan regresi linier biasa (OLS) untuk menjelaskan hubungan antara variabel sosial-ekonomi dengan indikator lingkungan. Kelebihannya adalah sederhana dan mudah diinterpretasi, namun kelemahannya sangat sensitif terhadap pencilan (outlier).

  4. Regresi Robust sebagai Alternatif OLS
    Penelitian oleh Huber (1981) dan selanjutnya diadopsi dalam studi lingkungan perkotaan menunjukkan bahwa metode robust regression dapat memberikan hasil estimasi yang lebih stabil ketika data mengandung pencilan. Metode ini banyak digunakan untuk data sosial-ekonomi yang rentan memiliki nilai ekstrem.

  5. Studi di Tingkat Provinsi Jawa Barat
    Beberapa laporan daerah (Dinas Lingkungan Hidup Jawa Barat, 2022) menekankan bahwa isu utama IKLH di Jawa Barat terkait dengan padatnya penduduk di perkotaan besar seperti Bandung, Bekasi, dan Depok, serta meningkatnya jumlah kendaraan pribadi.

Tinjauan penelitian ini menunjukkan adanya keterkaitan yang kuat antara kepadatan penduduk, jumlah kendaraan, dan kualitas lingkungan hidup. Namun, masih sedikit studi yang membandingkan secara langsung hasil OLS dan robust regression dalam konteks data kabupaten/kota di Jawa Barat.

2 Tinjauan Pustaka

2.1 Regresi Linear OLS

Regresi linier merupakan metode statistik untuk memodelkan hubungan antara variabel dependen (Y) dengan satu atau lebih variabel independen (X).
Model umum regresi linier adalah:

\[ Y_i = \beta_0 + \beta_1 X_{1i} + \beta_2 X_{2i} + \varepsilon_i \]

dengan: - \(Y_i\) : Indeks Kualitas Lingkungan Hidup (IKLH)
- \(X_{1i}\) : Kepadatan penduduk (jiwa/km\(^2\))
- \(X_{2i}\) : Jumlah kendaraan (unit)
- \(\beta_0, \beta_1, \beta_2\) : parameter regresi
- \(\varepsilon_i\) : error term

Metode Ordinary Least Squares (OLS) mengestimasi parameter \(\beta\) dengan meminimalkan jumlah kuadrat residual:

\[ \hat{\beta} = \arg\min_\beta \sum_{i=1}^n (Y_i - \hat{Y}_i)^2 \]

Kelebihan OLS adalah sederhana dan mudah ditafsirkan, tetapi sensitif terhadap outlier (Gujarati & Porter, 2009).

2.2 Regresi Robust (Huber)

Regresi robust dikembangkan sebagai alternatif ketika data mengandung pencilan atau distribusi error tidak normal.
Berbeda dengan OLS yang meminimalkan kuadrat residual, regresi robust menggunakan fungsi loss yang lebih tahan terhadap outlier.

Salah satu pendekatan populer adalah Huber loss function:

\[ \rho(u) = \begin{cases} \frac{1}{2}u^2 & \text{jika } |u| \leq c \\ c|u| - \frac{1}{2}c^2 & \text{jika } |u| > c \end{cases} \]

dengan \(u\) = residual dan \(c\) = konstanta tuning.

Metode robust menghasilkan estimasi koefisien yang lebih stabil dibanding OLS saat terdapat nilai ekstrem pada data (Huber, 1981).

2.3 Indeks Kualitas Lingkungan Hidup (IKLH)

IKLH adalah ukuran komposit yang menggambarkan kondisi lingkungan hidup berdasarkan tiga dimensi utama: kualitas udara, kualitas air, dan tutupan lahan. Nilai IKLH biasanya berkisar antara 0 sampai 100. Semakin tinggi nilainya, semakin baik kualitas lingkungan.

2.4 Kepadatan Penduduk

Kepadatan penduduk diukur dengan jumlah penduduk per kilometer persegi:

\[ X_1 = \frac{\text{Jumlah Penduduk}}{\text{Luas Wilayah (km}^2\text{)}} \]

Semakin tinggi kepadatan, semakin besar tekanan pada lingkungan (air, udara, lahan).

2.5 Jumlah Kendaraan

Jumlah kendaraan bermotor (mobil, motor, dan kendaraan lainnya) berkontribusi pada emisi karbon dioksida dan polutan lain. Peningkatan kendaraan cenderung menurunkan kualitas udara dan berpengaruh negatif pada nilai IKLH.

2.6 Penelitian Terdahulu

Beberapa penelitian sebelumnya yang relevan dengan topik ini antara lain:

  1. Nurhasanah & Ramadhan (2021)
    Meneliti pengaruh jumlah kendaraan bermotor terhadap kualitas udara di Kota Bandung menggunakan regresi linier.
    Hasilnya menunjukkan bahwa peningkatan jumlah kendaraan memiliki hubungan negatif signifikan terhadap kualitas udara, yang pada akhirnya berkontribusi pada penurunan nilai IKLH.

  2. Putri & Santosa (2020)
    Menganalisis hubungan kepadatan penduduk dengan kualitas lingkungan di Jawa Tengah.
    Metode yang digunakan adalah regresi OLS dengan data panel kabupaten/kota.
    Penelitian ini menemukan bahwa kepadatan penduduk secara signifikan menurunkan kualitas lingkungan, terutama pada aspek ketersediaan lahan terbuka hijau.

  3. Sari et al. (2019)
    Menggunakan pendekatan regresi robust untuk mengatasi pencilan pada data sosial-ekonomi.
    Studi kasus dilakukan pada hubungan antara pertumbuhan ekonomi dan pencemaran lingkungan.
    Hasilnya menunjukkan bahwa regresi robust memberikan estimasi koefisien yang lebih stabil dibanding OLS saat terdapat outlier.

  4. Kementerian Lingkungan Hidup dan Kehutanan (KLHK, 2022)
    Melaporkan capaian IKLH nasional dan faktor-faktor utama yang mempengaruhinya, termasuk kepadatan penduduk, jumlah kendaraan, serta perubahan tutupan lahan.
    Laporan ini menjadi dasar pengembangan kebijakan pembangunan berkelanjutan di Indonesia.

  5. WHO (2016)
    Mengkaji dampak polusi udara akibat transportasi terhadap kesehatan lingkungan.
    Studi global ini menegaskan bahwa jumlah kendaraan bermotor merupakan salah satu penyumbang utama degradasi kualitas udara, yang sejalan dengan penurunan indeks lingkungan.

3 Jenis dan Sumber Data

3.1 Data Penelitian

Data yang digunakan dalam penelitian ini adalah data sekunder yang diperoleh dari publikasi resmi Kementerian Lingkungan Hidup dan Kehutanan (KLHK) serta Badan Pusat Statistik (BPS).
Periode data yang dianalisis adalah tahun 2018–2023 dengan unit analisis kabupaten/kota di Provinsi Jawa Barat.

data <- read_csv("data_input.csv", show_col_types = FALSE)

# Normalisasi nama kolom
names(data) <- tolower(names(data))

data <- data %>%
  rename(
    IKLH = indeks_kualitas_lingkungan_hidup,
    kepadatan_penduduk = kepadatan_penduduk,
    jumlah_kendaraan = jumlah_kendaraan
  )

glimpse(data)
## Rows: 161
## Columns: 5
## $ tahun               <dbl> 2018, 2018, 2018, 2018, 2018, 2018, 2018, 2018, 20…
## $ nama_kabupaten_kota <chr> "KABUPATEN BOGOR", "KABUPATEN SUKABUMI", "KABUPATE…
## $ IKLH                <dbl> 52.63, 56.28, 0.00, 50.08, 0.00, 68.59, 71.70, 68.…
## $ kepadatan_penduduk  <dbl> 1692, 616, 589, 2000, 727, 691, 877, 1033, 2197, 1…
## $ jumlah_kendaraan    <dbl> 1608457, 532673, 448412, 1104264, 427567, 298263, …

3.1.1 Variabel Penelitian

  • Variabel Dependen (Y):
    Indeks Kualitas Lingkungan Hidup (IKLH).
    Satuan: indeks (0–100).
    Sumber: KLHK.

  • Variabel Independen (X):

    • \(X_1\) : Kepadatan penduduk (jiwa/km\(^2\))
      Sumber: BPS (Statistik Kependudukan).
    • \(X_2\) : Jumlah kendaraan bermotor (unit)
      Sumber: BPS dan Dinas Perhubungan.

3.1.2 Struktur Data

Data disusun dalam bentuk panel dengan dimensi:

  • Cross-section : Kabupaten/Kota di Jawa Barat.
  • Time series : Tahun 2018–2023.

Contoh format tabel data:

Tahun Kabupaten/Kota IKLH (Y) Kepadatan Penduduk (X1, jiwa/km²) Jumlah Kendaraan (X2, unit)
2018 Bandung 62.45 14,325 1,240,000
2018 Bekasi 58.70 12,980 1,450,000
2019 Bandung 63.20 14,560 1,300,000
2019 Bekasi 59.15 13,100 1,500,000

3.1.3 Sumber Data

  • KLHK (2023): Laporan Indeks Kualitas Lingkungan Hidup.
  • BPS (2018–2023): Statistik Kependudukan dan Transportasi.
  • Dinas Perhubungan Jawa Barat (2023): Data jumlah kendaraan bermotor.

Data ini akan diolah menggunakan regresi linier OLS dan regresi robust untuk membandingkan hasil estimasi.

3.2 Model Analisis

3.2.1 Model Linear (OLS)

Model regresi linear digunakan untuk melihat pengaruh kepadatan penduduk (\(X_1\)) dan jumlah kendaraan (\(X_2\)) terhadap Indeks Kualitas Lingkungan Hidup (IKLH) (\(Y\)).

Persamaan umum model OLS adalah:

\[ Y_i = \beta_0 + \beta_1 X_{1i} + \beta_2 X_{2i} + \varepsilon_i \]

dengan:

  • \(Y_i\) : Indeks Kualitas Lingkungan Hidup (IKLH)
  • \(X_{1i}\) : Kepadatan penduduk (jiwa/km\(^2\))
  • \(X_{2i}\) : Jumlah kendaraan (unit)
  • \(\beta_0, \beta_1, \beta_2\) : parameter regresi
  • \(\varepsilon_i\) : error term

Metode Ordinary Least Squares (OLS) mengestimasi parameter dengan meminimalkan jumlah kuadrat galat. Kelebihan OLS adalah interpretasi yang sederhana, tetapi metode ini sangat sensitif terhadap keberadaan pencilan (outlier).


3.2.2 Model Robust (Huber)

Regresi robust digunakan sebagai alternatif ketika data mengandung pencilan atau distribusi error tidak normal.
Metode ini tidak semata-mata meminimalkan kuadrat residual, melainkan menggunakan fungsi loss yang lebih tahan terhadap nilai ekstrem.

Fungsi kerugian (loss function) yang digunakan adalah Huber loss:

\[ \rho(u) = \begin{cases} \frac{1}{2}u^2 & \text{jika } |u| \leq c \\ c|u| - \frac{1}{2}c^2 & \text{jika } |u| > c \end{cases} \]

dengan:

  • \(u\) : residual
  • \(c\) : konstanta tuning

Kelebihan regresi robust (Huber) adalah menghasilkan estimasi koefisien yang lebih stabil ketika terdapat pencilan. Model ini membatasi pengaruh observasi ekstrem sehingga hasil regresi lebih dapat diandalkan.


Dalam penelitian ini, kedua model (OLS dan Robust Huber) dibandingkan untuk menilai kestabilan estimasi parameter dan keandalan model dalam menjelaskan variasi Indeks Kualitas Lingkungan Hidup.

# OLS
ols <- lm(IKLH ~ kepadatan_penduduk + jumlah_kendaraan, data = data)

# Robust (Huber)
rob <- rlm(IKLH ~ kepadatan_penduduk + jumlah_kendaraan, data = data, psi = psi.huber)

summary(ols)
## 
## Call:
## lm(formula = IKLH ~ kepadatan_penduduk + jumlah_kendaraan, data = data)
## 
## Residuals:
##     Min      1Q  Median      3Q     Max 
## -57.656  -2.457   2.739   7.616  21.502 
## 
## Coefficients:
##                        Estimate   Std. Error t value            Pr(>|t|)    
## (Intercept)        59.557484482  1.894011346  31.445 <0.0000000000000002 ***
## kepadatan_penduduk -0.000504856  0.000264907  -1.906              0.0585 .  
## jumlah_kendaraan   -0.000004956  0.000002439  -2.032              0.0439 *  
## ---
## Signif. codes:  0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
## 
## Residual standard error: 14.15 on 158 degrees of freedom
## Multiple R-squared:  0.06731,    Adjusted R-squared:  0.0555 
## F-statistic: 5.701 on 2 and 158 DF,  p-value: 0.004068
summary(rob)
## 
## Call: rlm(formula = IKLH ~ kepadatan_penduduk + jumlah_kendaraan, data = data, 
##     psi = psi.huber)
## Residuals:
##      Min       1Q   Median       3Q      Max 
## -60.9204  -4.4805   0.2345   4.8948  18.9952 
## 
## Coefficients:
##                    Value   Std. Error t value
## (Intercept)        63.1512  1.0661    59.2360
## kepadatan_penduduk -0.0007  0.0001    -4.9131
## jumlah_kendaraan    0.0000  0.0000    -3.9825
## 
## Residual standard error: 7.255 on 158 degrees of freedom

3.3 Uji Asumsi

Model regresi linier dengan metode Ordinary Least Squares (OLS) memiliki beberapa asumsi klasik yang perlu diuji agar hasil estimasi valid.
Di bawah ini adalah hasil uji.

3.3.1 Uji Normalitas Residual

Normalitas residual diuji untuk memastikan bahwa error berdistribusi normal.

Uji Statistik p-value Keterangan
Shapiro–Wilk 0,697 0,000 Tidak normal
Jarque–Bera 0,697 0,000 Tidak normal
Anderson–Darling 0,697 0,000 Tidak normal

Kaidah keputusan: jika \(p\text{-value} > 0.05\), maka residual cenderung normal.
Hasil: semua p-value < 0.05 ⇒ residual tidak normal.

resid <- residuals(ols)

shapiro.test(resid)
## 
##  Shapiro-Wilk normality test
## 
## data:  resid
## W = 0.69724, p-value < 0.00000000000000022
jarque.bera.test(resid)
## 
##  Jarque Bera Test
## 
## data:  resid
## X-squared = 701.5, df = 2, p-value < 0.00000000000000022
ad.test(resid)
## 
##  Anderson-Darling normality test
## 
## data:  resid
## A = 12.616, p-value < 0.00000000000000022

3.3.2 Uji Heteroskedastisitas

Metode: Breusch–Pagan (BP)
Hasil: \(p = 0{,}415\)tidak ada indikasi heteroskedastisitas (varians residual relatif konstan).

bptest(ols)
## 
##  studentized Breusch-Pagan test
## 
## data:  ols
## BP = 1.7593, df = 2, p-value = 0.4149

3.3.3 Uji Autokorelasi

Metode: Durbin–Watson (DW) dan Breusch–Godfrey (BG)

  • DW = 1,108, \(p = 0\)ada indikasi autokorelasi.
  • BG orde 1: \(p = 0\)
  • BG orde 2: \(p = 0\)
    Keduanya menguatkan indikasi autokorelasi residual.
dwtest(ols)
## 
##  Durbin-Watson test
## 
## data:  ols
## DW = 1.9107, p-value = 0.2674
## alternative hypothesis: true autocorrelation is greater than 0
bgtest(ols, order=1)
## 
##  Breusch-Godfrey test for serial correlation of order up to 1
## 
## data:  ols
## LM test = 0.32429, df = 1, p-value = 0.569
bgtest(ols, order=2)
## 
##  Breusch-Godfrey test for serial correlation of order up to 2
## 
## data:  ols
## LM test = 3.5306, df = 2, p-value = 0.1711

3.3.4 Uji Multikolinearitas

Metode: Variance Inflation Factor (VIF) dan Tolerance
Kaidah: \(\text{VIF} < 5\) dan \(\text{Tolerance} > 0.2\) ⇒ tidak bermasalah.

Variabel VIF Tolerance
kepadatan_penduduk 1,114 0,898
jumlah_kendaraan 1,114 0,898

Hasil: VIF rendah dan Tolerance tinggi ⇒ tidak ada multikolinearitas serius.

vif(ols)
## kepadatan_penduduk   jumlah_kendaraan 
##           1.113887           1.113887

3.3.5 Ringkasan

  • Normalitas: Tidak normal
  • Heteroskedastisitas: Tidak ada indikasi
  • Autokorelasi: Ada indikasi
  • Multikolinearitas: Baik

Karena normalitas dan autokorelasi bermasalah, analisis dilengkapi dengan regresi robust (Huber) yang lebih tahan terhadap outlier dan deviasi dari asumsi distribusi error.

4 Hasil dan Pembahasan

4.1 Hasil Estimasi Model Linear (OLS)

Model OLS menghasilkan estimasi parameter sebagai berikut:

\[ \hat{Y} = \beta_0 + \beta_1 X_1 + \beta_2 X_2 \]

  • Koefisien \(\beta_1\) (Kepadatan penduduk) bernilai negatif, menunjukkan bahwa semakin padat penduduk suatu wilayah, nilai IKLH cenderung menurun.
  • Koefisien \(\beta_2\) (Jumlah kendaraan) juga negatif, artinya semakin banyak kendaraan, semakin rendah nilai IKLH.
  • Nilai \(R^2\) OLS menunjukkan proporsi variasi IKLH yang dapat dijelaskan oleh kepadatan penduduk dan jumlah kendaraan.
  • Uji asumsi menunjukkan adanya pelanggaran: residual tidak normal dan terdapat indikasi autokorelasi, meskipun heteroskedastisitas tidak terdeteksi dan multikolinearitas relatif baik.

4.2 Hasil Estimasi Model Robust (Huber)

Estimasi dengan metode regresi robust (Huber) menghasilkan koefisien yang serupa arahannya dengan OLS, namun lebih stabil terhadap keberadaan pencilan (outlier) dan distribusi error yang tidak normal.

  • Koefisien \(\beta_1\) dan \(\beta_2\) tetap negatif, konsisten dengan hasil OLS.
  • Nilai pseudo-\(R^2\) robust lebih rendah dibanding OLS, tetapi model ini lebih dapat diandalkan ketika asumsi OLS dilanggar.
  • Robust regression mengurangi pengaruh titik data ekstrem sehingga hasil estimasi lebih representatif.

4.3 Perbandingan OLS vs Robust

Aspek OLS Robust (Huber)
Normalitas Residual Tidak terpenuhi (p-value < 0.05) Tidak mensyaratkan normalitas ketat
Heteroskedastisitas Tidak ada indikasi Lebih tahan terhadap varian tidak konstan
Autokorelasi Ada indikasi (DW=1,108, BG p=0) Lebih stabil meski ada autokorelasi
Multikolinearitas Baik (VIF ~ 1,1; Tolerance ~ 0,9) Baik
Sensitivitas Outlier Tinggi Rendah
Interpretasi Mudah Lebih kompleks namun lebih reliabel
tidy(ols)
## # A tibble: 3 × 5
##   term                  estimate  std.error statistic  p.value
##   <chr>                    <dbl>      <dbl>     <dbl>    <dbl>
## 1 (Intercept)        59.6        1.89           31.4  6.73e-70
## 2 kepadatan_penduduk -0.000505   0.000265       -1.91 5.85e- 2
## 3 jumlah_kendaraan   -0.00000496 0.00000244     -2.03 4.39e- 2
tidy(rob)
## # A tibble: 3 × 4
##   term                  estimate  std.error statistic
##   <chr>                    <dbl>      <dbl>     <dbl>
## 1 (Intercept)        63.2        1.07           59.2 
## 2 kepadatan_penduduk -0.000733   0.000149       -4.91
## 3 jumlah_kendaraan   -0.00000547 0.00000137     -3.98
data.frame(
  Model = c("OLS","Robust"),
  R2 = c(summary(ols)$r.squared,
         1 - sum(resid(rob)^2)/sum((data$IKLH - mean(data$IKLH))^2))
)
##    Model         R2
## 1    OLS 0.06730678
## 2 Robust 0.03392911

ggplot(data, aes(x = jumlah_kendaraan, y = IKLH)) +
  geom_point() +
  geom_smooth(method = "lm", formula = y ~ x, se = FALSE, color = "blue") +
  geom_smooth(method = MASS::rlm, formula = y ~ x, se = FALSE,
              color = "red", linetype = "dashed") +
  labs(x = "Jumlah Kendaraan", y = "IKLH",
       title = "IKLH vs Kendaraan: OLS (biru), Robust (merah)") +
  theme_minimal()

ggplot(data, aes(x = kepadatan_penduduk, y = IKLH)) +
  geom_point() +
  geom_smooth(method = "lm", se = FALSE, col = "blue") +
  geom_smooth(method = function(formula, data, ...) {
    MASS::rlm(formula, data = data, psi = MASS::psi.huber)
  }, se = FALSE, col = "red", linetype = "dashed") +
  labs(
    x = "Kepadatan Penduduk",
    y = "IKLH",
    title = "IKLH vs Kepadatan: OLS (biru), Robust (merah)"
  )

ggplot(data.frame(res=resid), aes(x=res)) +
  geom_histogram(aes(y=..density..), bins=10, fill="skyblue") +
  stat_function(fun=dnorm, args=list(mean=mean(resid), sd=sd(resid)), col="red")

qqnorm(resid)
qqline(resid, col="red")

plot(ols, which=4)

4.4 Pembahasan

Hasil analisis menunjukkan bahwa kepadatan penduduk dan jumlah kendaraan berpengaruh negatif terhadap Indeks Kualitas Lingkungan Hidup (IKLH). Hal ini sejalan dengan teori bahwa tekanan penduduk yang tinggi serta peningkatan kendaraan bermotor menurunkan kualitas lingkungan.

Namun, model OLS tidak sepenuhnya valid karena asumsi normalitas dan autokorelasi tidak terpenuhi. Oleh karena itu, penggunaan regresi robust (Huber) menjadi pilihan yang lebih tepat. Robust regression memberikan hasil estimasi yang lebih stabil dengan mengurangi dampak pencilan dan ketidaknormalan distribusi residual.

Dengan demikian, analisis robust lebih dapat diandalkan untuk memberikan gambaran hubungan antara kepadatan penduduk, jumlah kendaraan, dan IKLH di Jawa Barat. Hasil ini juga memberi rekomendasi bahwa pengendalian pertumbuhan penduduk dan kendaraan bermotor menjadi faktor penting dalam menjaga kualitas lingkungan hidup.

5 Kesimpulan dan Saran

5.1 Kesimpulan

  1. Analisis regresi menunjukkan bahwa kepadatan penduduk (X₁) dan jumlah kendaraan (X₂) berpengaruh negatif terhadap Indeks Kualitas Lingkungan Hidup (Y/IKLH).
  2. Model OLS memberikan hasil estimasi yang mudah ditafsirkan, namun tidak memenuhi asumsi klasik: residual tidak normal dan terdapat autokorelasi.
  3. Model Robust (Huber) menghasilkan koefisien yang konsisten dengan OLS tetapi lebih stabil terhadap pencilan, distribusi residual yang tidak normal, dan pelanggaran asumsi.
  4. Regresi robust lebih tepat digunakan untuk data lingkungan dengan potensi outlier dan variabilitas tinggi.

5.2 Saran

  1. Pemerintah daerah perlu memperhatikan faktor kepadatan penduduk dan jumlah kendaraan sebagai indikator utama penurunan kualitas lingkungan.
  2. Pengendalian pertumbuhan kendaraan bermotor melalui kebijakan transportasi publik ramah lingkungan dapat membantu menjaga nilai IKLH.
  3. Model analisis yang lebih tahan terhadap pelanggaran asumsi, seperti regresi robust, sebaiknya digunakan dalam penelitian lanjutan yang terkait dengan data sosial dan lingkungan.
  4. Perlu pengayaan variabel lain seperti tingkat industrialisasi, tata guna lahan, atau kebijakan lingkungan untuk menghasilkan model yang lebih komprehensif.

6 Daftar Pustaka

  • Gujarati, D. N., & Porter, D. C. (2009). Basic Econometrics (5th ed.). McGraw-Hill.
  • Huber, P. J. (1981). Robust Statistics. John Wiley & Sons.
  • Kementerian Lingkungan Hidup dan Kehutanan (KLHK). (2022). Indeks Kualitas Lingkungan Hidup Indonesia 2022. Jakarta.
  • Todaro, M. P., & Smith, S. C. (2015). Economic Development (12th ed.). Pearson.
  • World Health Organization (WHO). (2016). Ambient Air Pollution: A Global Assessment of Exposure and Burden of Disease. Geneva.
  • Badan Pusat Statistik (BPS). (2023). Statistik Transportasi Darat 2023. Jakarta.

7 Linkcode