Analisis Indeks Kualitas Udara di DKI Jakarta Periode Juli-Oktober 2024 Menggunakan Principal Component Analysis
PENDAHULUAN
Latar Belakang
Jakarta sebagai ibu kota Indonesia menghadapi tantangan serius dalam pengelolaan kualitas udara. Tingginya aktivitas transportasi, industri, dan pembangunan infrastruktur berkontribusi pada peningkatan konsentrasi polutan udara yang berdampak pada kesehatan masyarakat dan lingkungan.
Indeks Standar Pencemar Udara (ISPU) merupakan sistem peringatan kualitas udara yang digunakan pemerintah Indonesia untuk mengkomunikasikan kondisi udara kepada masyarakat secara sederhana dan mudah dipahami. ISPU dihitung berdasarkan konsentrasi lima parameter polutan kunci: partikulat (PM₁₀ dan PM₂.₅), sulfur dioksida (SO₂), karbon monoksida (CO), ozon (O₃), dan nitrogen dioksida (NO₂).
Penelitian ini berfokus pada periode Juli-Oktober 2024. Pada periode ini, kondisi meteorologi seperti rendahnya curah hujan, kelembapan udara yang rendah, dan kecepatan angin yang cenderung stabil dapat menyebabkan akumulasi polutan di atmosfer perkotaan.
Metode Principal Component Analysis (PCA) diterapkan dalam penelitian ini untuk menganalisis data ISPU Jakarta. PCA dipilih karena kemampuannya dalam mereduksi dimensi data multivariat dan mengidentifikasi pola dominan. Metode ini memungkinkan identifikasi hubungan antar polutan dan ekstraksi faktor-faktor utama yang menjelaskan variasi kualitas udara di Jakarta.
Sumber Data
Data yang digunakan dalam penelitian ini bersumber dari platform Kaggle, tepatnya dari dataset berjudul “Air Quality Index in Jakarta”. Dataset ini merupakan kompilasi data resmi dari Satu Data Jakarta, portal data terbuka Pemerintah Provinsi DKI Jakarta yang mengintegrasikan pengukuran dari lima Stasiun Pemantauan Kualitas Udara (SPKU).
Data yang dianalisis mencakup periode Juli hingga Oktober 2024, dengan total 124 observasi harian setelah proses pembersihan data. Dataset mencakup konsentrasi harian enam parameter polutan utama (PM₂.₅, PM₁₀, SO₂, CO, O₃, dan NO₂) serta nilai Indeks Standar Pencemar Udara (ISPU) maksimum harian.
Pemilihan dataset ini didasarkan pada kredibilitas sumber data pemerintah, kelengkapan data dalam periode panjang, dan format data yang telah terstruktur. Sebelum analisis, data telah melalui preprocessing meliputi handling missing values, standardisasi satuan, dan validasi konsistensi.
Studi Kasus
Studi kasus penelitian ini adalah analisis pola temporal kualitas udara di DKI Jakarta selama periode musim kemarau 2024. Fokus penelitian yang digunakan adalah pada periode Juli-Oktober 2024. Penelitian mengkaji hubungan antar enam parameter polutan utama ISPU: 1. PM₂.₅ (Partikulat Matter 2.5 μm) Partikel halus diameter ≤2.5 μm yang bersumber dari emisi kendaraan, industri, dan pembakaran biomassa. Dampak partikel ini pada kesehatan kesehatan diantaranya dapat terpenetrasi dalam ke paru-paru dan aliran darah. 2. PM₁₀ (Partikulat Matter 10 μm) Partikel halus diameter ≥ 10 μm yang bersumber dari debu jalanan, konstruksi, erosi tanah. Dampak partikel ini pada kesehatan kesehatan adalah gangguan pernapasan atas. 3. SO₂ (Sulfur Dioksida) Gas hasil pembakaran bahan bakar fosil mengandung sulfur yang bersumber dari industri, pembangkit listrik. 4. CO (Karbon Monoksida) Gas hasil pembakaran tidak sempurna yang bersumber dari emisi kendaraan bermotor. 5. O₃ (Ozon) Polutan sekunder hasil reaksi fotokimia yang bersumber dari NO₂ + VOC + sinar matahari. 6. NO₂ (Nitrogen Dioksida) Gas dari pembakaran suhu tinggi yang bersumber dari kendaraan, industri, pembangkit Listrik.
Data Penelitian
Data penelitian terdiri dari 124 observasi harian dari 1 Juli hingga 31 Oktober 2024.
Data yang digunakan dalam penelitian ini bersumber dari platform Kaggle dengan tautan akses: https://www.kaggle.com/datasets/senadu34/air-quality-index-in-jakarta-2010-2021
Metode
Metode Principal Component Analysis (PCA) dipilih dalam penelitian ini sebagai teknik statistik multivariat untuk mereduksi dimensi data dan mengidentifikasi pola dominan dalam data polusi udara Jakarta. PCA memungkinkan penyederhanaan enam variabel polutan (PM25, PM10, SO₂, CO, O₃, dan NO₂) menjadi sejumlah komponen utama yang lebih kecil, sambil mempertahankan sebanyak mungkin informasi asli. Pemilihan metode ini didasarkan pada kemampuannya untuk mengungkap struktur korelasi antar polutan dan mengidentifikasi faktor-faktor laten yang mendasari variasi kualitas udara.
Tinjauan Pustaka
Analisis kualitas udara di kawasan perkotaan Indonesia semakin banyak menggunakan Principal Component Analysis (PCA) untuk memahami pola pencemaran yang kompleks. Laporan Assessment Urban Air Quality Indonesia (2020) menunjukkan bahwa PCA mampu mengidentifikasi komponen utama pencemar dari parameter PM₂.₅ dan PM₁₀ di beberapa kota besar seperti Jakarta, Semarang, dan Surabaya. Hasil analisis tersebut mengungkap bahwa variabilitas konsentrasi partikulat terutama dipengaruhi oleh aktivitas transportasi, pembakaran bahan bakar fosil, dan kondisi meteorologis. PCA juga memberikan gambaran yang lebih jelas mengenai kontribusi sumber pencemaran dominan pada tiap kota, sehingga membantu dalam pemetaan spasial dan penentuan hotspot polusi.
Laporan yang sama menekankan bahwa sebagian besar lokasi pemantauan menunjukkan konsentrasi PM₂.₅ mendekati atau melampaui standar nasional Indonesia (15 µg/m³), terutama pada kawasan dengan intensitas mobilitas tinggi. Melalui PCA, pola keterkaitan antara PM₂.₅, PM₁₀, dan parameter lingkungan lain dapat diidentifikasi secara lebih komprehensif, yang kemudian menjadi dasar bagi rekomendasi kebijakan pengendalian emisi kota-kota metropolitan. Dengan demikian, hasil kajian ini menunjukkan bahwa PCA merupakan metode yang efektif dan relevan dalam menilai dinamika pencemaran udara serta mendukung perumusan kebijakan berbasis data.
Tujuan
Berdasarkan latar belakang dan data yang tersedia, penelitian ini bertujuan untuk:
Menerapkan metode Principal Component Analysis(PCA) untuk menganalisis pola polusi udara di DKI Jakarta periode Juli-Oktober 2024.
Mengidentifikasi hubungan dan pengelompokan enam polutan utama (PM₂.₅, PM₁₀, SO₂, CO, O₃, dan NO₂) berdasarkan analisis komponen utama.
Menentukan jumlah komponen optimal yang mampu menjelaskan variasi data polusi udara secara maksimal.
Menginterpretasikan makna setiap komponen utama dalam konteks karakteristik dan sumber polusi udara Jakarta.
Memberikan rekomendasi kebijakan pengelolaan kualitas udara berdasarkan hasil analisis komponen utama.
Source Code
Berikut merupakan source code beserta penjelasan mengenai coding pada RStudio.
| Source Code | Penjelasan |
|---|---|
| data <- read_xlsx(“C:/Users/HP/Downloads/ispu_dki1.xlsx”, skip = 4930, n_max = 124) | Syntax read_xlsx() membaca file Excel ispu_dki1.xlsx dengan melewati 4930 baris pertama (skip = 4930) dan hanya mengambil 124 baris berikutnya (n_max = 124). Data yang terbaca kemudian disimpan ke objek data dan ditampilkan di konsol. |
| colnames(data) <- c(“pm25”,“pm10”,“so2”,“co”,“o3”,“no2”) | Mengubah nama kolom pada dataframe data menjadi enam nama baru secara berurutan: pm25, pm10, so2, co, o3, dan no2. |
| kmo_test <- KMO(data) | Menghitung uji Kaiser-Meyer-Olkin untuk mengukur kecukupan sampling data, dengan hasil disimpan ke objek kmo_test. Pemanggilan kmo_test menampilkan nilai KMO overall dan per item. |
| bartlett <- bart_spher(x=data) | Melakukan uji Bartlett untuk sphericity pada data, dengan hasil disimpan ke objek bartlett. Pemanggilan bartlett menampilkan hasil. |
| cor_matrix <- cor(data[, c(“pm25”,“pm10”,“so2”,“co”,“o3”,“no2”)]) | Perintah cor() menghitung matriks korelasi untuk enam kolom polutan dalam data, hasilnya disimpan ke cor_matrix. |
| print(round(cor_matrix, 2)) | Fungsi print() menampilkan matriks tersebut dengan pembulatan dua desimal. |
| sdata <- scale(data) | Perintah scale() melakukan standardisasi data dengan mengubah mean menjadi 0 dan standar deviasi menjadi 1, hasilnya disimpan ke sdata. |
| print(summary(as.data.frame(sdata))) | summary() menampilkan statistik deskriptif data yang telah distandardisasi. |
| pr.out <-prcomp(x=sdata, center=TRUE) | Perintah prcomp() melakukan Principal Component Analysis (PCA) pada data terstandardisasi sdata. Parameter center=TRUE memastikan data di centering sebelum analisis. summary() menampilkan ringkasan hasil PCA. |
| Data_PCA_Cov <- cov(sdata) | cov() menghitung matriks kovarians data terstandardisasi. |
| Data_PCA_ei <- eigen(Data_PCA_Cov) | eigen() mengekstrak eigenvalue. |
| scree_data <- data.frame(eigen_value=eigen(Data_PCA_Cov)\(values, PC=1:6) </td> <td style="text-align:left;"> dibuat dataframe scree_data berisi eigenvalue dan label PC1-PC6. </td> </tr> <tr> <td style="text-align:left;"> scree_data </td> <td style="text-align:left;"> Menampilkan hasil dataframe eigen value </td> </tr> <tr> <td style="text-align:left;"> plot(x=scree_data\)PC, scree_data$eigen_value, type=‘b’, | Plot type=‘b’ menampilkan garis dan titik untuk visualisasi penurunan eigenvalue tiap komponen utama. |
| xlab=‘Komponen Utama ke-’,ylab=‘Varians (Nilai Eigen)’, main=‘Scree Plot’) | Memberi legenda |
| pr.out <- prcomp(x=sdata, center=TRUE, scale=TRUE) | prcomp() melakukan PCA ulang dengan parameter scale=TRUE yang redundan karena data sudah distandardisasi. Objek pr.out menyimpan seluruh output PCA termasuk rotation (loadings) dan x (scores). Pemanggilan pr.out menampilkan ringkasan standar deviasi dan rotasi untuk setiap komponen utama. |
Hasil dan Pembahasan
Prosedur analisis
Analisis Principal Component Analysis (PCA) dilakukan mengikuti prosedur sistematis yang terdiri dari enam tahapan utama. Pertama, data dibaca dari file Excel dengan spesifikasi skip = 4930 dan n_max = 124 untuk mengambil periode Juli-Oktober 2024. Kedua, dilakukan preprocessing data termasuk pemberian nama kolom yang sesuai (pm25, pm10, so2, co, o3, no2) dan standardisasi menggunakan fungsi scale(). Ketiga, uji kelayakan dilakukan dengan KMO test dan Bartlett’s test untuk memvalidasi asumsi PCA. Keempat, matriks korelasi dianalisis untuk memahami hubungan antar variabel. Kelima, PCA dieksekusi dengan fungsi prcomp() dengan parameter center = TRUE dan scale = TRUE. Keenam, interpretasi dilakukan berdasarkan scree plot, eigenvalues, dan loading matrix.
Hasil Eksplorasi dan Uji Asumsi
Statistik Deskriptif
Data terdiri dari 124 observasi harian dengan enam variabel polutan. Setelah standardisasi, semua variabel memiliki mean ≈ 0, menunjukkan keberhasilan proses scaling. Rentang nilai standardized menunjukkan variasi yang cukup tinggi pada semua polutan.
Uji Kelayakan PCA
Uji KMO menghasilkan overall MSA = 0.61 yang berada tepat di ambang batas minimal untuk analisis PCA. Nilai MSA per item menunjukkan variasi signifikan: NO2 (0.68) dan Pm25 (0.67) memiliki kecukupan sampling baik, Pm10 (0.64) dan SO2 (0.61) cukup, sedangkan CO (0.49) dan khususnya O3 (0.23) berada di bawah threshold yang disarankan. Bartlett’s test menunjukkan hasil sangat signifikan dengan χ² = 421.897, df = 15, p-value < 2.22e-16, mengindikasikan bahwa matriks korelasi secara statistik berbeda dari matriks identitas dan data layak untuk analisis faktor.
Matriks Korelasi
Matriks korelasi mengungkap pola hubungan yang kompleks antar polutan. Korelasi tertinggi terdapat antara Pm25 dan Pm10 (0.92), mengindikasikan sumber emisi yang sama atau proses pembentukan yang serupa. CO dan NO2 juga menunjukkan korelasi kuat (0.68), merefleksikan kontribusi bersama dari sumber transportasi. Pola lain terlihat pada SO2 yang berkorelasi positif dengan partikulat (0.53-0.54) namun negatif dengan CO (-0.16), menandakan sumber emisi yang berbeda. O3 menunjukkan korelasi sangat lemah dengan semua polutan lain (0.04-0.19)
Hasil Analisis PCA
Menentukan Jumlah Komponen
Hasil analisis komponen utama (PCA) menunjukkan bahwa dari 6 komponen utama yang terbentuk, 3 komponen pertama memiliki nilai eigen > 1, yaitu sebesar 2,0, 1,5, dan 1,2. Berdasarkan kriteria Kaiser (eigenvalue > 1), ketiga komponen tersebut dipertahankan untuk analisis lebih lanjut.
Gambar Scree Plot di bawah ini menggambarkan penurunan nilai eigen untuk setiap komponen utama. Terlihat bahwa setelah komponen ke-3, kurva mulai mendatar (elbow), yang mengindikasikan bahwa penambahan komponen berikutnya tidak memberikan kontribusi signifikan terhadap total varians yang dijelaskan.
Matriks Loading dan Rotasi
Matriks loading menunjukkan kontribusi setiap variabel terhadap komponen utama. PC1 didominasi oleh kontribusi negatif dari semua polutan kecuali O3, dengan loading tertinggi pada Pm10 (-0.561) dan Pm25 (-0.545). PC2 menunjukkan polarisasi jelas dengan loading positif tinggi pada CO (0.655) dan NO2 (0.452) versus loading negatif pada SO2 (-0.508). PC3 hampir secara eksklusif merepresentasikan O3 dengan loading 0.917.
Formula Model PCA
Berdasarkan hasil loading, tiga komponen utama dapat diformulasikan sebagai: 1. PC1 = -0.545(Pm25) - 0.561(Pm10) - 0.330(SO2) - 0.303(CO) - 0.081(O3) - 0.426(NO2) 2. PC2 = -0.204(Pm25) - 0.171(Pm10) - 0.508(SO2) + 0.655(CO) - 0.194(O3) + 0.452(NO2) 3. PC3 = 0.025(Pm25) + 0.053(Pm10) - 0.388(SO2) - 0.047(CO) + 0.917(O3) + 0.056(NO2)
Visualisasi dan Interpretasi
Visualisasi Komponen
Scree plot visual menunjukkan penurunan nilai eigen yang tajam setelah PC3, mengkonfirmasi bahwa tiga komponen cukup merepresentasikan data. Loading plot mengungkap clustering yang jelas. Semua variabel kecuali O3 berkontribusi pada PC1, sedangkan PC2 memisahkan CO dan NO2 (kuadran positif) dari SO2 (kuadran negatif).
Pembahasan Hasil
Interpretasi Lingkungan
Hasil analisis PCA menunjukkan bahwa data polusi udara Jakarta dapat disederhanakan menjadi tiga pola utama. Pola pertama, yang mencakup hampir setengah (46,2%) dari seluruh variasi data, terutama dipengaruhi oleh partikulat PM10 dan PM2,5.
Pola kedua memperlihatkan perbedaan antara dua sumber polusi: kendaraan bermotor (ditandai oleh CO dan NO2) dan industri (ditandai oleh SO2). Artinya, polusi dari lalu lintas dan pabrik memiliki karakteristik yang berbeda.
Pola ketiga khusus untuk ozon (O3), yang terbentuk dari reaksi kimia di udara dan tidak langsung berasal dari sumber tertentu seperti knalpot atau cerobong asap.
Validasi Hasil
Hasil analisis PCA sesuai dengan teori tentang sumber polusi udara di kota besar. Dominannya partikulat pada komponen pertama cocok dengan karakteristik polusi perkotaan. Pemisahan antara polusi transportasi dan industri pada komponen kedua sejalan dengan data inventarisasi emisi Jakarta. Sedangkan posisi ozon yang terpisah pada komponen ketiga sesuai dengan sifat pembentukannya melalui reaksi kimia dengan bantuan sinar matahari.
Penutup
Kesimpulan
Berdasarkan analisis Principal Component Analysis (PCA) yang diterapkan pada data Indeks Standar Pencemar Udara (ISPU) DKI Jakarta selama periode Juli-Oktober 2024, dapat disimpulkan bahwa metode PCA berhasil mereduksi kompleksitas data dari enam variabel polutan menjadi tiga komponen utama. Komponen pertama (PC1) menyumbang 46,2% variansi dan didominasi oleh partikulat PM10 dan PM2,5, komponen kedua (PC2) menyumbang 24,5% variansi yang menunjukkan kontras antara polusi transportasi (ditandai oleh CO dan NO₂) dengan polusi industri (ditandai oleh SO₂), sedangkan komponen ketiga (PC3) menyumbang 17,7% variansi yang secara khusus merepresentasikan ozon sebagai polutan sekunder.
Temuan penelitian ini tidak hanya mengonfirmasi bahwa partikulat merupakan masalah utama kualitas udara Jakarta, sebagaimana telah dilaporkan dalam berbagai studi sebelumnya, tetapi juga mengungkap struktur kompleks polusi udara yang memerlukan pendekatan berbeda berdasarkan sektor sumber pencemaran.
Saran
Implikasi untuk Kebijakan
Berdasarkan hasil PCA, berikut rekomendasi kebijakan yang dapat diterapkan: 1. pengendalian partikulat (PM10 dan PM2.5) harus menjadi prioritas utama dengan langkah konkret seperti penerapan uji emisi kendaraan bermotor yang ketat, pengaturan aktivitas konstruksi untuk mengurangi debu, serta pemantauan emisi industri secara rutin. 2. Untuk transportasi, kebijakan dapat mencakup promosi transportasi ramah lingkungan, dan pengaturan lalu lintas. Untuk industri, diperlukan penegakan mutu emisi sulfur dioksida (SO₂) yang lebih ketat. 3. Pertimbangan faktor meteorologi dalam perencanaan aktivitas yang berpotensi meningkatkan pembentukan ozon.
Saran untuk Penelitian Lanjutan
Memisahkan analisis polutan langsung (seperti PM dan SO₂) dengan polutan hasil reaksi kimia (seperti ozon), karena keduanya memiliki sifat berbeda. Menambahkan data cuaca seperti suhu, hujan, dan angin dalam analisis untuk melihat pengaruhnya terhadap polusi. Melakukan konfirmasi hasil dengan metode analisis sumber polusi lain seperti PMF untuk memastikan kebenaran interpretasi. Uji pengaruh pilihan metode analisis terhadap hasil yang didapat. Manfaatkan hasil PCA untuk membuat sistem perkiraan kualitas udara ke depannya.