Pemberdayaan gender merupakan isu strategis yang sejalan dengan tujuan kelima Sustainable Development Goals (SDGs), yakni mewujudkan kesetaraan gender dan memberdayakan perempuan di seluruh dunia [1]. Di Indonesia, tingkat pemberdayaan perempuan diukur melalui Indeks Pemberdayaan Gender (IDG) yang menggambarkan kemampuan perempuan dalam berpartisipasi di bidang ekonomi, politik, dan pengambilan keputusan publik [2]. Capaian Indeks Pemberdayaan Gender (IDG) menunjukkan tren positif, yaitu meningkat dari 75,57 pada tahun 2020 dan 77,62 pada 2024. Namun capaian nasional ini menutupi disparitas yang cukup besar antarwilayah [3]. Beberapa daerah, seperti Nusa Tenggara Barat, secara konsisten mencatat IDG terendah dalam lima tahun terakhir, jauh di bawah rata-rata nasional [2]. Kondisi ini menunjukkan pentingnya analisis pada tingkat provinsi, mengingat faktor demografi dan sosial yang spesifik sangat menentukan keberhasilan pemberdayaan perempuan.
Indeks Pemberdayaan Gender (IDG) dibentuk dari tiga komponen utama, yaitu keterlibatan perempuan di parlemen, sumbangan pendapatan perempuan, dan perempuan sebagai tenaga profesional [4]. Selain tiga dimensi utama tersebut, sejumlah penelitian juga menegaskan relevansi faktor lain. Tingkat partisipasi angkatan kerja perempuan (TPAK) penting karena menggambarkan sejauh mana perempuan dapat mengakses pasar kerja dan berkontribusi pada pembangunan [5]. Rata-rata lama sekolah perempuan (RLS) mencerminkan kualitas pendidikan, yang terbukti meningkatkan kemampuan serta peluang kerja [5].
Di sisi lain, aspek kesehatan juga memiliki keterkaitan dengan tingkat pemberdayaan perempuan. Data Badan Pusat Statistik (BPS) mencatat bahwa 27,34% penduduk Indonesia mengalami keluhan kesehatan dalam sebulan terakhir, yang dapat membatasi partisipasi perempuan dalam kegiatan ekonomi dan sosial serta berpotensi menurunkan capaian IDG di wilayah dengan tingkat keluhan kesehatan tinggi [6].
Meskipun Indeks Pemberdayaan Gender (IDG) Indonesia terus meningkat, kesenjangan antarwilayah masih besar. Hal ini menimbulkan pertanyaan mengenai faktor-faktor yang memengaruhi variasi IDG di tingkat provinsi, baik dari tingkat partisipasi angkatan kerja perempuan, rata-rata lama sekolah perempuan, dan persentase perempuan yang mempunyai keluhan kesehatan.
Dari sisi pendekatan statistik, data sosial-ekonomi antarprovinsi sering kali memiliki sebaran nilai yang tidak seragam, sehingga dapat memengaruhi ketepatan hasil estimasi apabila menggunakan metode regresi konvensional. Oleh karena itu, diperlukan pendekatan pemodelan yang mampu memberikan estimasi yang lebih stabil dan representatif terhadap kondisi sebenarnya.
Melakukan pemodelan untuk melihat bagaimana hubungan antara faktor-faktor yang diduga memengaruhi Indeks Pemberdayaan Gender (IDG) secara signifikan, yaitu tingkat partisipasi angkatan kerja perempuan, rata-rata lama sekolah perempuan, dan persentase perempuan yang mempunyai keluhan kesehatan pada tingkat provinsi di Indonesia tahun 2024.
Penelitian ini dibatasi pada tiga variabel independen utama, yaitu tingkat partisipasi angkatan kerja perempuan, rata-rata lama sekolah perempuan, dan persentase perempuan yang mengalami keluhan kesehatan, tanpa mempertimbangkan faktor lain seperti kebijakan daerah, sosiodemografis, maupun kondisi ekonomi makro.
Regresi linear merupakan pendekatan dasar dalam analisis hubungan antara variabel dependen dan sejumlah variabel independen. Bentuk umum model regresi linear adalah:
\[ Y_i = \beta_0 + \beta_1 X_{1i} + \beta_2 X_{2i} + \dots + \beta_k X_{ki} + \varepsilon_i \]
dengan \(\varepsilon_i\) adalah error yang bersifat acak. Estimasi parameter dilakukan menggunakan metode Ordinary Least Squares (OLS), yaitu:
\[ \hat{\beta}_{OLS} = (X'X)^{-1}X'Y \]
OLS memiliki sifat BLUE (Best Linear Unbiased Estimator) berdasarkan Teorema Gauss–Markov, selama asumsi klasik terpenuhi.
Agar estimasi OLS valid, terdapat beberapa asumsi klasik yang perlu diperiksa. Pertama, linearitas, yaitu hubungan antara variabel dependen dan independen harus linear. Kedua, normalitas residual, di mana error model sebaiknya berdistribusi normal. Ketiga, homoskedastisitas, yang berarti varians error harus konstan. Keempat, tidak ada autokorelasi antar residual, sehingga error tidak saling berkorelasi. Kelima, tidak ada multikolinearitas antar variabel independen.
Apabila asumsi-asumsi ini tidak terpenuhi, hasil estimasi OLS dapat menjadi bias atau tidak efisien, sehingga diperlukan model alternatif.
Dalam kondisi data yang mengandung outlier, regresi robust menjadi alternatif karena memberikan bobot lebih kecil pada observasi yang ekstrem. Estimator robust dapat dituliskan sebagai:
\[ \hat{\beta} = \arg \min_{\beta} \sum_{i=1}^n \rho \left( \frac{y_i - x_i'\beta}{\hat{\sigma}} \right) \]
Fungsi \(\rho\) mengendalikan kontribusi error. Dua fungsi populer adalah:
Dengan demikian, regresi robust dapat menghasilkan estimasi parameter yang lebih stabil dan reliabel meskipun terdapat pelanggaran asumsi klasik.
Penelitian ini menggunakan data sekunder yang diperoleh dari publikasi Badan Pusat Statistik (BPS) tahun 2024. Unit analisis yang digunakan adalah provinsi di Indonesia. Variabel dependen dalam penelitian ini adalah Indeks Pemberdayaan Gender (IDG), sedangkan variabel independen meliputi:
Sebelum melakukan analisis lebih lanjut, berikut ditampilkan seluruh dataset yang akan digunakan dalam penelitian ini. Penyajian data lengkap ini bertujuan untuk memberikan gambaran menyeluruh mengenai kondisi masing-masing provinsi.
Langkah-langkah penelitian ini dilakukan sebagai berikut:
Gambar 1. Box Plot Sebaran Indeks Pemberdayaan Gender (IDG) di Seluruh Provinsi
Gambar 1 menunjukkan adanya disparitas nilai Indeks Pemberdayaan Gender (IDG) antarprovinsi, di mana sebagian besar provinsi berada di sekitar rata-rata nasional (70,14), namun terdapat beberapa wilayah dengan nilai yang jauh lebih tinggi atau lebih rendah. Sebaran data yang cukup lebar mengindikasikan adanya disparitas antarwilayah dalam tingkat pemberdayaan gender. Hal ini berarti capaian pemberdayaan perempuan belum merata di seluruh provinsi, di mana terdapat wilayah dengan tingkat partisipasi dan keterlibatan perempuan yang relatif tinggi, sementara wilayah lainnya masih tertinggal.
Variabel | Estimasi Koefisien (β) | P-value | |
---|---|---|---|
(Intercept) | 37.4245 | 0.0361 | * |
Tingkat.Partisipasi.Angkatan.kerja.Perempuan | 0.1350 | 0.4551 | |
Rata.Rata.Lama.Sekolah.Perempuan | 2.0340 | 0.0536 | . |
Keluhan.Kesehatan | 0.2993 | 0.0601 | . |
Model Ordinary Least Squares (OLS) yang dibangun menunjukkan hasil signifikan secara keseluruhan berdasarkan uji F (p-value = 0,0288), yang berarti variabel-variabel independen secara bersama-sama berpengaruh terhadap Indeks Pemberdayaan Gender (IDG). Namun, hasil uji t menunjukkan bahwa tidak ada satu pun variabel independen yang berpengaruh signifikan secara individu pada taraf signifikansi 5%.
Meskipun demikian, sebelum menarik kesimpulan lebih lanjut mengenai pengaruh antarvariabel, perlu dipastikan terlebih dahulu bahwa model OLS yang digunakan telah memenuhi asumsi-asumsi klasik. Oleh karena itu, tahap selanjutnya dilakukan pengujian terhadap asumsi linearitas, normalitas residual, homoskedastisitas, dan multikolinearitas untuk memastikan validitas hasil estimasi.
Uji Asumsi | Statistik | P-Value / Nilai | Kesimpulan |
---|---|---|---|
Linearitas (RESET Test) | 0.5556 | 0.5792 | Asumsi Terpenuhi |
Normalitas Residual (Shapiro-Wilk) | 0.9669 | 0.3157 | Asumsi Terpenuhi |
Homoskedastisitas (Breusch-Pagan) | 3.3112 | 0.3461 | Asumsi Terpenuhi |
Multikolinearitas (VIF) | 1.6617 | 1.6617 | Tidak Ada Multikolinearitas |
Berdasarkan hasil pengujian asumsi klasik, seluruh asumsi dalam model regresi linier OLS telah terpenuhi. Uji linearitas (RESET Test) menghasilkan nilai p sebesar 0,5792 (> 0,05), sehingga hubungan antara variabel independen dan dependen dapat dianggap linear. Uji normalitas residual (Shapiro–Wilk) menunjukkan p-value sebesar 0,3157 (> 0,05), menandakan bahwa residual berdistribusi normal. Uji homoskedastisitas (Breusch–Pagan) memperoleh nilai p sebesar 0,3461 (> 0,05), sehingga varians residual dapat dianggap homogen. Selain itu, hasil uji multikolinearitas menunjukkan nilai Variance Inflation Factor (VIF) maksimal adalah 1,6617, jauh di bawah ambang batas 10, yang berarti tidak terdapat gejala multikolinearitas antarvariabel independen.
Dengan demikian, model regresi telah memenuhi asumsi dasar klasik dan layak digunakan untuk analisis lebih lanjut. Namun, untuk memastikan kestabilan hasil estimasi, langkah selanjutnya adalah melakukan pendeteksian observasi berpengaruh atau nilai ekstrem (outlier) yang mungkin memengaruhi kinerja model secara keseluruhan.
Observasi ke- | Studentized Residual | Leverage | Cook’s Distance |
---|---|---|---|
18 | NA | 0.2551 | NA |
25 | 2.0297 | NA | NA |
32 | 2.0019 | NA | NA |
37 | NA | 0.2837 | NA |
38 | NA | 0.5817 | NA |
Berdasarkan hasil pendeteksian outlier menggunakan studentized residual dan leverage, terdapat beberapa observasi yang menunjukkan nilai residual dan leverage relatif tinggi. Observasi ke-25 dan ke-32 memiliki nilai studentized residual sekitar 2,02 dan 2,00, yang mendekati ambang batas umum (2), sehingga dapat dikategorikan sebagai kandidat outlier moderat. Sementara itu, observasi ke-37 dan 38 memiliki nilai leverage tertinggi (masing-masing sebesar 0.284 dan 0,582), yang menunjukkan pengaruh cukup besar terhadap pembentukan garis regresi.
Untuk memverifikasi lebih lanjut keberadaan outlier sekaligus menilai apakah sebaran residual mengikuti distribusi normal, dilakukan analisis diagnostik melalui plot Q-Q. Plot ini berfungsi utama untuk menguji asumsi normalitas residual, namun juga dapat mengindikasikan keberadaan outlier jika terdapat titik yang menyimpang jauh dari garis diagonal.
Gambar 2. Q-Q Plot Model OLS
Gambar 2 menunjukkan bahwa sebagian besar titik residual menyebar di sekitar garis diagonal, yang menandakan bahwa asumsi normalitas residual pada model OLS umumnya terpenuhi. Namun, terdapat beberapa titik pada ujung kanan (terutama observasi ke-25 dan ke-32) serta satu titik pada ujung kiri (observasi ke-18) yang menyimpang cukup jauh dari garis teoretis. Penyimpangan tersebut mengindikasikan adanya kemungkinan outlier pada data yang berpotensi memengaruhi estimasi parameter model.
Untuk mengatasi potensi pengaruh pencilan tersebut dan memperoleh estimasi yang lebih stabil, langkah selanjutnya dilakukan analisis menggunakan regresi robust, yang dirancang agar hasil estimasi tidak terlalu sensitif terhadap keberadaan outlier.
Model | Residual Std. Error |
---|---|
Robust (Huber) | 6.3560 |
Robust (Bisquare) | 6.3909 |
Berdasarkan hasil perbandingan dua pendekatan robust, model dengan fungsi Huber menunjukkan nilai Residual Standard Error (RSE) yang lebih kecil dibandingkan fungsi Bisquare. Hal ini mengindikasikan bahwa fungsi Huber memberikan estimasi yang lebih stabil dan efisien dalam menghadapi pengaruh outlier. Oleh karena itu, regresi robust dengan fungsi Huber dipilih sebagai model yang paling sesuai untuk digunakan dalam penelitian ini.
Variabel | Estimasi | Std. Error | t-value |
---|---|---|---|
(Intercept) | 36.2348 | 19.1951 | 1.8877 |
Tingkat.Partisipasi.Angkatan.kerja.Perempuan | 0.1509 | 0.1999 | 0.7547 |
Rata.Rata.Lama.Sekolah.Perempuan | 1.8852 | 1.1387 | 1.6556 |
Keluhan.Kesehatan | 0.3519 | 0.1722 | 2.0434 |
Berdasarkan hasil estimasi menggunakan metode regresi robust Huber, diperoleh bahwa model mampu memberikan estimasi yang lebih stabil dibandingkan model OLS sebelumnya. . Secara matematis, pengaruh variabel terhadap Indeks Pemberdayaan Gender (IDG) dapat dituliskan dalam persamaan regresi berikut.
\[\widehat{IDG} = 36.2348 + 0.3519(Keluhan Kesehatan)\]
Koefisien sebesar 0,3519 dengan nilai t sebesar 2,0434 menunjukkan bahwa variabel ini berpengaruh positif dan signifikan terhadap IDG. Artinya, peningkatan proporsi perempuan yang melaporkan keluhan kesehatan cenderung diikuti oleh peningkatan nilai IDG.
Sementara itu, variabel tingkat partisipasi angkatan kerja perempuan (TPAK) dan rata-rata lama sekolah (RLS) juga menunjukkan pengaruh positif terhadap IDG, namun keduanya belum signifikan secara statistik pada taraf 5%. Hal ini mengindikasikan bahwa meskipun arah hubungan kedua variabel tersebut sejalan dengan teori (semakin tinggi TPAK dan RLS maka pemberdayaan perempuan meningkat), pengaruhnya belum cukup kuat dalam model ini.
Secara keseluruhan, penggunaan metode Huber berhasil mengurangi sensitivitas terhadap pengamatan ekstrem dan memberikan hasil estimasi yang lebih representatif dibandingkan model OLS sebelumny (akan dijelaskan lebih lanjut pada sub bab berikutnya).
Gambar 3. Perbandingan Estimasi Koefisien antara Model OLS dan Robust Huber
Gambar 3 menunjukkan bahwa outlier memiliki dampak signifikan terhadap estimasi koefisien, terutama pada variabel Rata-Rata Lama Sekolah Perempuan. Pada model OLS awal, pengaruh variabel ini terestimasi terlalu tinggi (overestimated). Setelah outlier dihapus, estimasinya turun drastis. Model Regresi Robust berhasil memberikan estimasi yang lebih stabil, yang nilainya berada di antara kedua model OLS tersebut. Hal ini mengonfirmasi bahwa Regresi Robust efektif dalam mengoreksi distorsi yang disebabkan oleh outlier tanpa harus menghilangkan data.
Penelitian ini menganalisis faktor-faktor yang memengaruhi Indeks Pemberdayaan Gender (IDG) di tingkat provinsi di Indonesia tahun 2024 menggunakan pendekatan regresi linier OLS dan regresi robust (Huber). Berdasarkan hasil analisis diperoleh beberapa kesimpulan berikut:
Secara umum, tingkat pemberdayaan gender antarprovinsi menunjukkan disparitas yang cukup besar, dengan beberapa wilayah masih berada jauh di bawah rata-rata nasional.
Model OLS menunjukkan bahwa ketiga variabel tidak memiliki pengaruh signifikan terhadap IDG secara statistik.
Regresi robust dengan fungsi Huber terbukti mampu menghasilkan estimasi yang konsisten dan tidak terdistorsi oleh outlier, sehingga lebih reliabel dibandingkan model OLS.
Variabel Keluhan Kesehatan menjadi faktor yang berpengaruh signifikan terhadap IDG pada model robust, dengan arah hubungan positif.
Dengan demikian, pendekatan regresi robust direkomendasikan dalam penelitian sosial-ekonomi yang berpotensi mengandung outlier atau pelanggaran asumsi klasik berupa normalitas residual atau heteroskedastisitas, yang dicurigai disebabkan oleh adanya outlier, karena mampu menghasilkan estimasi yang lebih representatif.
Penambahan Variabel Ekonomi dan Pembangunan Wilayah. Penelitian selanjutnya disarankan untuk memasukkan variabel yang merepresentasikan kondisi ekonomi dan pembangunan wilayah, seperti Produk Domestik Regional Bruto (PDRB) per kapita, tingkat kemiskinan, atau tingkat urbanisasi. Hal ini bertujuan untuk memperoleh pemahaman yang lebih komprehensif mengenai determinan Indeks Pemberdayaan Gender di Indonesia.
Pendekatan Spasial dan Temporal. Mengingat adanya potensi perbedaan karakteristik antarprovinsi, penelitian mendatang dapat mempertimbangkan pendekatan spasial serta analisis panel data antarwaktu untuk melihat dinamika pemberdayaan gender dari dimensi geografis dan temporal secara simultan.
Optimalisasi Struktur Data. Disarankan agar penelitian mendatang menggunakan data dengan cakupan waktu yang lebih panjang serta tingkat ketelitian yang lebih tinggi, misalnya pada level kabupaten/kota, agar hasil analisis lebih representatif dan mampu menggambarkan variasi yang lebih rinci antarwilayah.
[1] Aprilianti, S., & Setiadi, Y. (2022). Faktor-faktor Yang MemengaruhiIndeks Pembangunan Genderdi Indonesia Tahun 2020. Seminar Nasional Official Statistics, 2022(1). https://doi.org/10.34123/semnasoffstat.v2022i1.1351
[2] Raihannabil, S. D. (2025, April). Perbandingan Regresi Robust dengan M, S, dan MM-Estimator untuk Menganalisis Faktor-Faktor yang Memengaruhi Indeks Pemberdayaan Gender di Nusa Tenggara Barat Tahun 2023. Jurnal Eksponensial, 16(1). https://doi.org/10.30872/eksponensial.v16i1.1389
[3] Badan Pusat Statistik. (2025, April 25). Indeks Pemberdayaan Gender (IDG) - Tabel Statistik. Badan Pusat Statistik. Retrieved October 4, 2025, from https://www.bps.go.id/id/statistics-table/2/NDY4IzI=/indeks-pemberdayaan-gender-idg-
[4] Wisnujati, N. S. (2020). Penyusunan Indeks Pemberdayaan Gender dan Indeks Pembangunan Kabupaten Bojonegoro. Jurnal Ilmial Sosio Agribis, 20(2). http://dx.doi.org/10.30742/jisa20220201224
[5] Muryani, Watik, A., Wibowo, W., Herianingrum, S., & Widiastuti, T. (2023, February). Study of the Socio-Economic Analysis of Females Role in Eastern part of Indonesia. nternational Journal of Advances in Scientific Research and Engineering (ijasre), 9(2). https://doi.org/10.31695/IJASRE.2023.9.2.8
[6] Badan Pusat Statistik. (2024, December 11). Persentase Penduduk yang Mempunyai Keluhan Kesehatan dalam Sebulan Terakhir Menurut Provinsi - Tabel Statistik. Badan Pusat Statistik. Retrieved October 5, 2025, from https://www.bps.go.id/id/statistics-table/2/MjIyIzI%3D/persentase-penduduk-yang-mempunyai-keluhan-kesehatan-dalam-sebulan-terakhir-menurut-provinsi.html