Bab 1. Pendahuluan

1.1 Latar Belakang

Pemberdayaan gender merupakan isu strategis yang sejalan dengan tujuan kelima Sustainable Development Goals (SDGs), yakni mewujudkan kesetaraan gender dan memberdayakan perempuan di seluruh dunia [1]. Di Indonesia, tingkat pemberdayaan perempuan diukur melalui Indeks Pemberdayaan Gender (IDG) yang menggambarkan kemampuan perempuan dalam berpartisipasi di bidang ekonomi, politik, dan pengambilan keputusan publik [2]. Capaian Indeks Pemberdayaan Gender (IDG) menunjukkan tren positif, yaitu meningkat dari 75,57 pada tahun 2020 dan 77,62 pada 2024. Namun capaian nasional ini menutupi disparitas yang cukup besar antarwilayah [3]. Beberapa daerah, seperti Nusa Tenggara Barat, secara konsisten mencatat IDG terendah dalam lima tahun terakhir, jauh di bawah rata-rata nasional [2]. Kondisi ini menunjukkan pentingnya analisis pada tingkat provinsi, mengingat faktor demografi dan sosial yang spesifik sangat menentukan keberhasilan pemberdayaan perempuan.

Indeks Pemberdayaan Gender (IDG) dibentuk dari tiga komponen utama, yaitu keterlibatan perempuan di parlemen, sumbangan pendapatan perempuan, dan perempuan sebagai tenaga profesional [4]. Selain tiga dimensi utama tersebut, sejumlah penelitian juga menegaskan relevansi faktor lain. Tingkat partisipasi angkatan kerja perempuan (TPAK) penting karena menggambarkan sejauh mana perempuan dapat mengakses pasar kerja dan berkontribusi pada pembangunan [5]. Rata-rata lama sekolah perempuan (RLS) mencerminkan kualitas pendidikan, yang terbukti meningkatkan kemampuan serta peluang kerja [5].

Di sisi lain, aspek kesehatan juga memiliki keterkaitan dengan tingkat pemberdayaan perempuan. Data Badan Pusat Statistik (BPS) mencatat bahwa 27,34% penduduk Indonesia mengalami keluhan kesehatan dalam sebulan terakhir, yang dapat membatasi partisipasi perempuan dalam kegiatan ekonomi dan sosial serta berpotensi menurunkan capaian IDG di wilayah dengan tingkat keluhan kesehatan tinggi [6].

1.2 Identifikasi Masalah

Meskipun Indeks Pemberdayaan Gender (IDG) Indonesia terus meningkat, kesenjangan antarwilayah masih besar. Hal ini menimbulkan pertanyaan mengenai faktor-faktor yang memengaruhi variasi IDG di tingkat provinsi, baik dari tingkat partisipasi angkatan kerja perempuan, rata-rata lama sekolah perempuan, dan persentase perempuan yang mempunyai keluhan kesehatan.

Dari sisi pendekatan statistik, data sosial-ekonomi antarprovinsi sering kali memiliki sebaran nilai yang tidak seragam, sehingga dapat memengaruhi ketepatan hasil estimasi apabila menggunakan metode regresi konvensional. Oleh karena itu, diperlukan pendekatan pemodelan yang mampu memberikan estimasi yang lebih stabil dan representatif terhadap kondisi sebenarnya.

1.3 Tujuan Penelitian

Melakukan pemodelan untuk melihat bagaimana hubungan antara faktor-faktor yang diduga memengaruhi Indeks Pemberdayaan Gender (IDG) secara signifikan, yaitu tingkat partisipasi angkatan kerja perempuan, rata-rata lama sekolah perempuan, dan persentase perempuan yang mempunyai keluhan kesehatan pada tingkat provinsi di Indonesia tahun 2024.

1.4 Batasan Penelitian

Penelitian ini dibatasi pada tiga variabel independen utama, yaitu tingkat partisipasi angkatan kerja perempuan, rata-rata lama sekolah perempuan, dan persentase perempuan yang mengalami keluhan kesehatan, tanpa mempertimbangkan faktor lain seperti kebijakan daerah, sosiodemografis, maupun kondisi ekonomi makro.

Bab 2. Tinjauan Pustaka

2.1 Regresi Linear OLS

Regresi linear merupakan pendekatan dasar dalam analisis hubungan antara variabel dependen dan sejumlah variabel independen. Bentuk umum model regresi linear adalah:

\[ Y_i = \beta_0 + \beta_1 X_{1i} + \beta_2 X_{2i} + \dots + \beta_k X_{ki} + \varepsilon_i \]

dengan \(\varepsilon_i\) adalah error yang bersifat acak. Estimasi parameter dilakukan menggunakan metode Ordinary Least Squares (OLS), yaitu:

\[ \hat{\beta}_{OLS} = (X'X)^{-1}X'Y \]

OLS memiliki sifat BLUE (Best Linear Unbiased Estimator) berdasarkan Teorema Gauss–Markov, selama asumsi klasik terpenuhi.

2.2 Uji Asumsi Klasik

Agar estimasi OLS valid, terdapat beberapa asumsi klasik yang perlu diperiksa. Pertama, linearitas, yaitu hubungan antara variabel dependen dan independen harus linear. Kedua, normalitas residual, di mana error model sebaiknya berdistribusi normal. Ketiga, homoskedastisitas, yang berarti varians error harus konstan. Keempat, tidak ada autokorelasi antar residual, sehingga error tidak saling berkorelasi. Kelima, tidak ada multikolinearitas antar variabel independen.

Apabila asumsi-asumsi ini tidak terpenuhi, hasil estimasi OLS dapat menjadi bias atau tidak efisien, sehingga diperlukan model alternatif.

2.3 Model Alternatif

2.3.1 Regresi Robust

Dalam kondisi data yang mengandung outlier, regresi robust menjadi alternatif karena memberikan bobot lebih kecil pada observasi yang ekstrem. Estimator robust dapat dituliskan sebagai:

\[ \hat{\beta} = \arg \min_{\beta} \sum_{i=1}^n \rho \left( \frac{y_i - x_i'\beta}{\hat{\sigma}} \right) \]

Fungsi \(\rho\) mengendalikan kontribusi error. Dua fungsi populer adalah:

  • Huber: memberikan bobot linear untuk error kecil (mirip OLS) dan bobot konstan untuk error besar. Cocok bila data memiliki beberapa outlier ringan.
  • Tukey Bisquare: memberikan bobot penuh untuk error kecil, tetapi mengabaikan observasi dengan error besar (down weight ekstrem). Cocok bila data memiliki outlier yang kuat.

Dengan demikian, regresi robust dapat menghasilkan estimasi parameter yang lebih stabil dan reliabel meskipun terdapat pelanggaran asumsi klasik.

Bab 3. Metodologi Penelitian

3.1 Data Penelitian

Penelitian ini menggunakan data sekunder yang diperoleh dari publikasi Badan Pusat Statistik (BPS) tahun 2024. Unit analisis yang digunakan adalah provinsi di Indonesia. Variabel dependen dalam penelitian ini adalah Indeks Pemberdayaan Gender (IDG), sedangkan variabel independen meliputi:

  1. Tingkat Partisipasi Angkatan Kerja (TPAK) perempuan, yang menggambarkan sejauh mana perempuan berpartisipasi dalam pasar kerja.
  2. Rata-rata Lama Sekolah (RLS) perempuan, yang mencerminkan tingkat pendidikan dan kemampuan perempuan dalam meningkatkan kualitas diri serta partisipasi dalam pembangunan.
  3. Persentase Perempuan yang Memiliki Keluhan Kesehatan, yang merepresentasikan kondisi kesehatan masyarakat perempuan dan potensi hambatan dalam aktivitas ekonomi maupun sosial.

Sebelum melakukan analisis lebih lanjut, berikut ditampilkan seluruh dataset yang akan digunakan dalam penelitian ini. Penyajian data lengkap ini bertujuan untuk memberikan gambaran menyeluruh mengenai kondisi masing-masing provinsi.

3.2 Alur Penelitian

Langkah-langkah penelitian ini dilakukan sebagai berikut:

  1. Pengumpulan data Indeks Pemberdayaan Gender (IDG) dan faktor-faktor penentunya di tingkat provinsi.
  2. Analisis data eksploratif untuk mengidentifikasi adanya disparitas nilai Indeks Pemberdayaan Gender (IDG) antarprovinsi melalui visualisasi box plot.
  3. Estimasi awal dengan regresi OLS untuk melihat hubungan antara IDG dan faktor penentunya.
  4. Pengujian asumsi klasik meliputi linearitas (RESET test), normalitas residual (Shapiro-Wilk), homoskedastisitas (Breusch-Pagan), autokorelasi (Durbin-Watson), serta multikolinearitas (VIF).
  5. Mengidentifikasi outlier dari residual OLS menggunakan metode studentized residuals, leverage, dan Cook’s distance.
  6. Penerapan regresi robust untuk mengatasi keberadaan outlier pada data. Metode robust yang digunakan adalah M-estimator dengan fungsi kerugian Huber.
  7. Penarikan kesimpulan mengenai faktor-faktor yang berpengaruh signifikan terhadap Indeks Pemberdayaan Gender (IDG) di tingkat provinsi.

Bab 4. Hasil dan Pembahasan

4.1 Analisis Data Eksploratif

Gambar 1. Box Plot Sebaran Indeks Pemberdayaan Gender (IDG) di Seluruh Provinsi

Gambar 1. Box Plot Sebaran Indeks Pemberdayaan Gender (IDG) di Seluruh Provinsi

Gambar 1 menunjukkan adanya disparitas nilai Indeks Pemberdayaan Gender (IDG) antarprovinsi, di mana sebagian besar provinsi berada di sekitar rata-rata nasional (70,14), namun terdapat beberapa wilayah dengan nilai yang jauh lebih tinggi atau lebih rendah. Sebaran data yang cukup lebar mengindikasikan adanya disparitas antarwilayah dalam tingkat pemberdayaan gender. Hal ini berarti capaian pemberdayaan perempuan belum merata di seluruh provinsi, di mana terdapat wilayah dengan tingkat partisipasi dan keterlibatan perempuan yang relatif tinggi, sementara wilayah lainnya masih tertinggal.

4.2 Pemodelan Regresi Linear (OLS)

4.2.1 Hasil Estimasi Model OLS

Variabel Estimasi Koefisien (β) P-value
(Intercept) 37.4245 0.0361 *
Tingkat.Partisipasi.Angkatan.kerja.Perempuan 0.1350 0.4551
Rata.Rata.Lama.Sekolah.Perempuan 2.0340 0.0536 .
Keluhan.Kesehatan 0.2993 0.0601 .

Model Ordinary Least Squares (OLS) yang dibangun menunjukkan hasil signifikan secara keseluruhan berdasarkan uji F (p-value = 0,0288), yang berarti variabel-variabel independen secara bersama-sama berpengaruh terhadap Indeks Pemberdayaan Gender (IDG). Namun, hasil uji t menunjukkan bahwa tidak ada satu pun variabel independen yang berpengaruh signifikan secara individu pada taraf signifikansi 5%.

Meskipun demikian, sebelum menarik kesimpulan lebih lanjut mengenai pengaruh antarvariabel, perlu dipastikan terlebih dahulu bahwa model OLS yang digunakan telah memenuhi asumsi-asumsi klasik. Oleh karena itu, tahap selanjutnya dilakukan pengujian terhadap asumsi linearitas, normalitas residual, homoskedastisitas, dan multikolinearitas untuk memastikan validitas hasil estimasi.

4.2.2 Uji Asumsi Klasik

Uji Asumsi Statistik P-Value / Nilai Kesimpulan
Linearitas (RESET Test) 0.5556 0.5792 Asumsi Terpenuhi
Normalitas Residual (Shapiro-Wilk) 0.9669 0.3157 Asumsi Terpenuhi
Homoskedastisitas (Breusch-Pagan) 3.3112 0.3461 Asumsi Terpenuhi
Multikolinearitas (VIF) 1.6617 1.6617 Tidak Ada Multikolinearitas

Berdasarkan hasil pengujian asumsi klasik, seluruh asumsi dalam model regresi linier OLS telah terpenuhi. Uji linearitas (RESET Test) menghasilkan nilai p sebesar 0,5792 (> 0,05), sehingga hubungan antara variabel independen dan dependen dapat dianggap linear. Uji normalitas residual (Shapiro–Wilk) menunjukkan p-value sebesar 0,3157 (> 0,05), menandakan bahwa residual berdistribusi normal. Uji homoskedastisitas (Breusch–Pagan) memperoleh nilai p sebesar 0,3461 (> 0,05), sehingga varians residual dapat dianggap homogen. Selain itu, hasil uji multikolinearitas menunjukkan nilai Variance Inflation Factor (VIF) maksimal adalah 1,6617, jauh di bawah ambang batas 10, yang berarti tidak terdapat gejala multikolinearitas antarvariabel independen.

Dengan demikian, model regresi telah memenuhi asumsi dasar klasik dan layak digunakan untuk analisis lebih lanjut. Namun, untuk memastikan kestabilan hasil estimasi, langkah selanjutnya adalah melakukan pendeteksian observasi berpengaruh atau nilai ekstrem (outlier) yang mungkin memengaruhi kinerja model secara keseluruhan.

4.2.3 Deteksi Outlier

Observasi ke- Studentized Residual Leverage Cook’s Distance
18 NA 0.2551 NA
25 2.0297 NA NA
32 2.0019 NA NA
37 NA 0.2837 NA
38 NA 0.5817 NA

Berdasarkan hasil pendeteksian outlier menggunakan studentized residual dan leverage, terdapat beberapa observasi yang menunjukkan nilai residual dan leverage relatif tinggi. Observasi ke-25 dan ke-32 memiliki nilai studentized residual sekitar 2,02 dan 2,00, yang mendekati ambang batas umum (2), sehingga dapat dikategorikan sebagai kandidat outlier moderat. Sementara itu, observasi ke-37 dan 38 memiliki nilai leverage tertinggi (masing-masing sebesar 0.284 dan 0,582), yang menunjukkan pengaruh cukup besar terhadap pembentukan garis regresi.

Untuk memverifikasi lebih lanjut keberadaan outlier sekaligus menilai apakah sebaran residual mengikuti distribusi normal, dilakukan analisis diagnostik melalui plot Q-Q. Plot ini berfungsi utama untuk menguji asumsi normalitas residual, namun juga dapat mengindikasikan keberadaan outlier jika terdapat titik yang menyimpang jauh dari garis diagonal.

4.2.3.1 Plot Diagnostik (Normal Q-Q Plot)
Gambar 2. Q-Q Plot Model OLS

Gambar 2. Q-Q Plot Model OLS

Gambar 2 menunjukkan bahwa sebagian besar titik residual menyebar di sekitar garis diagonal, yang menandakan bahwa asumsi normalitas residual pada model OLS umumnya terpenuhi. Namun, terdapat beberapa titik pada ujung kanan (terutama observasi ke-25 dan ke-32) serta satu titik pada ujung kiri (observasi ke-18) yang menyimpang cukup jauh dari garis teoretis. Penyimpangan tersebut mengindikasikan adanya kemungkinan outlier pada data yang berpotensi memengaruhi estimasi parameter model.

Untuk mengatasi potensi pengaruh pencilan tersebut dan memperoleh estimasi yang lebih stabil, langkah selanjutnya dilakukan analisis menggunakan regresi robust, yang dirancang agar hasil estimasi tidak terlalu sensitif terhadap keberadaan outlier.

4.3 Pemodelan Regresi Robust

4.3.1 Perbandingan Model Robust

Model Residual Std. Error
Robust (Huber) 6.3560
Robust (Bisquare) 6.3909

Berdasarkan hasil perbandingan dua pendekatan robust, model dengan fungsi Huber menunjukkan nilai Residual Standard Error (RSE) yang lebih kecil dibandingkan fungsi Bisquare. Hal ini mengindikasikan bahwa fungsi Huber memberikan estimasi yang lebih stabil dan efisien dalam menghadapi pengaruh outlier. Oleh karena itu, regresi robust dengan fungsi Huber dipilih sebagai model yang paling sesuai untuk digunakan dalam penelitian ini.

4.3.2 Hasil Estimasi Model Robust Terbaik

Variabel Estimasi Std. Error t-value
(Intercept) 36.2348 19.1951 1.8877
Tingkat.Partisipasi.Angkatan.kerja.Perempuan 0.1509 0.1999 0.7547
Rata.Rata.Lama.Sekolah.Perempuan 1.8852 1.1387 1.6556
Keluhan.Kesehatan 0.3519 0.1722 2.0434

Berdasarkan hasil estimasi menggunakan metode regresi robust Huber, diperoleh bahwa model mampu memberikan estimasi yang lebih stabil dibandingkan model OLS sebelumnya. . Secara matematis, pengaruh variabel terhadap Indeks Pemberdayaan Gender (IDG) dapat dituliskan dalam persamaan regresi berikut.

\[\widehat{IDG} = 36.2348 + 0.3519(Keluhan Kesehatan)\]

Koefisien sebesar 0,3519 dengan nilai t sebesar 2,0434 menunjukkan bahwa variabel ini berpengaruh positif dan signifikan terhadap IDG. Artinya, peningkatan proporsi perempuan yang melaporkan keluhan kesehatan cenderung diikuti oleh peningkatan nilai IDG.

Sementara itu, variabel tingkat partisipasi angkatan kerja perempuan (TPAK) dan rata-rata lama sekolah (RLS) juga menunjukkan pengaruh positif terhadap IDG, namun keduanya belum signifikan secara statistik pada taraf 5%. Hal ini mengindikasikan bahwa meskipun arah hubungan kedua variabel tersebut sejalan dengan teori (semakin tinggi TPAK dan RLS maka pemberdayaan perempuan meningkat), pengaruhnya belum cukup kuat dalam model ini.

Secara keseluruhan, penggunaan metode Huber berhasil mengurangi sensitivitas terhadap pengamatan ekstrem dan memberikan hasil estimasi yang lebih representatif dibandingkan model OLS sebelumny (akan dijelaskan lebih lanjut pada sub bab berikutnya).

4.4 Dampak Outlier terhadap Hasil Estimasi Model Regresi

Gambar 3. Perbandingan Estimasi Koefisien antara Model OLS dan Robust Huber

Gambar 3. Perbandingan Estimasi Koefisien antara Model OLS dan Robust Huber

Gambar 3 menunjukkan bahwa outlier memiliki dampak signifikan terhadap estimasi koefisien, terutama pada variabel Rata-Rata Lama Sekolah Perempuan. Pada model OLS awal, pengaruh variabel ini terestimasi terlalu tinggi (overestimated). Setelah outlier dihapus, estimasinya turun drastis. Model Regresi Robust berhasil memberikan estimasi yang lebih stabil, yang nilainya berada di antara kedua model OLS tersebut. Hal ini mengonfirmasi bahwa Regresi Robust efektif dalam mengoreksi distorsi yang disebabkan oleh outlier tanpa harus menghilangkan data.

Bab 5. Kesimpulan dan Saran

5.1 Kesimpulan

Penelitian ini menganalisis faktor-faktor yang memengaruhi Indeks Pemberdayaan Gender (IDG) di tingkat provinsi di Indonesia tahun 2024 menggunakan pendekatan regresi linier OLS dan regresi robust (Huber). Berdasarkan hasil analisis diperoleh beberapa kesimpulan berikut:

  1. Secara umum, tingkat pemberdayaan gender antarprovinsi menunjukkan disparitas yang cukup besar, dengan beberapa wilayah masih berada jauh di bawah rata-rata nasional.

  2. Model OLS menunjukkan bahwa ketiga variabel tidak memiliki pengaruh signifikan terhadap IDG secara statistik.

  3. Regresi robust dengan fungsi Huber terbukti mampu menghasilkan estimasi yang konsisten dan tidak terdistorsi oleh outlier, sehingga lebih reliabel dibandingkan model OLS.

  4. Variabel Keluhan Kesehatan menjadi faktor yang berpengaruh signifikan terhadap IDG pada model robust, dengan arah hubungan positif.

Dengan demikian, pendekatan regresi robust direkomendasikan dalam penelitian sosial-ekonomi yang berpotensi mengandung outlier atau pelanggaran asumsi klasik berupa normalitas residual atau heteroskedastisitas, yang dicurigai disebabkan oleh adanya outlier, karena mampu menghasilkan estimasi yang lebih representatif.

5.2 Saran

  1. Penambahan Variabel Ekonomi dan Pembangunan Wilayah. Penelitian selanjutnya disarankan untuk memasukkan variabel yang merepresentasikan kondisi ekonomi dan pembangunan wilayah, seperti Produk Domestik Regional Bruto (PDRB) per kapita, tingkat kemiskinan, atau tingkat urbanisasi. Hal ini bertujuan untuk memperoleh pemahaman yang lebih komprehensif mengenai determinan Indeks Pemberdayaan Gender di Indonesia.

  2. Pendekatan Spasial dan Temporal. Mengingat adanya potensi perbedaan karakteristik antarprovinsi, penelitian mendatang dapat mempertimbangkan pendekatan spasial serta analisis panel data antarwaktu untuk melihat dinamika pemberdayaan gender dari dimensi geografis dan temporal secara simultan.

  3. Optimalisasi Struktur Data. Disarankan agar penelitian mendatang menggunakan data dengan cakupan waktu yang lebih panjang serta tingkat ketelitian yang lebih tinggi, misalnya pada level kabupaten/kota, agar hasil analisis lebih representatif dan mampu menggambarkan variasi yang lebih rinci antarwilayah.

Daftar Pustaka

[1] Aprilianti, S., & Setiadi, Y. (2022). Faktor-faktor Yang MemengaruhiIndeks Pembangunan Genderdi Indonesia Tahun 2020. Seminar Nasional Official Statistics, 2022(1). https://doi.org/10.34123/semnasoffstat.v2022i1.1351

[2] Raihannabil, S. D. (2025, April). Perbandingan Regresi Robust dengan M, S, dan MM-Estimator untuk Menganalisis Faktor-Faktor yang Memengaruhi Indeks Pemberdayaan Gender di Nusa Tenggara Barat Tahun 2023. Jurnal Eksponensial, 16(1). https://doi.org/10.30872/eksponensial.v16i1.1389

[3] Badan Pusat Statistik. (2025, April 25). Indeks Pemberdayaan Gender (IDG) - Tabel Statistik. Badan Pusat Statistik. Retrieved October 4, 2025, from https://www.bps.go.id/id/statistics-table/2/NDY4IzI=/indeks-pemberdayaan-gender-idg-

[4] Wisnujati, N. S. (2020). Penyusunan Indeks Pemberdayaan Gender dan Indeks Pembangunan Kabupaten Bojonegoro. Jurnal Ilmial Sosio Agribis, 20(2). http://dx.doi.org/10.30742/jisa20220201224

[5] Muryani, Watik, A., Wibowo, W., Herianingrum, S., & Widiastuti, T. (2023, February). Study of the Socio-Economic Analysis of Females Role in Eastern part of Indonesia. nternational Journal of Advances in Scientific Research and Engineering (ijasre), 9(2). https://doi.org/10.31695/IJASRE.2023.9.2.8

[6] Badan Pusat Statistik. (2024, December 11). Persentase Penduduk yang Mempunyai Keluhan Kesehatan dalam Sebulan Terakhir Menurut Provinsi - Tabel Statistik. Badan Pusat Statistik. Retrieved October 5, 2025, from https://www.bps.go.id/id/statistics-table/2/MjIyIzI%3D/persentase-penduduk-yang-mempunyai-keluhan-kesehatan-dalam-sebulan-terakhir-menurut-provinsi.html