DAFTAR ISI

  1. Pendahuluan

    1.1 Latar Belakang

    1.2 Masalah Penelitian

    1.3 Tujuan Penelitian

    1.4 Manfaat Penelitian

  2. Tinjauan Pustaka

    2.1 Pertumbuhan Ekonomi dan Kategorisasi

    2.2 Indikator Ketimpangan Gender

    2.3 Penelitian Terdahulu

  3. Metode Penelitian

    3.1 Data dan Sumber Data

    3.2 Variabel Penelitian

    3.3 Metode Analisis

    3.3.1 Analisis Diskriminan

    3.3.2 Prasyarat Analisis Diskriminan

    3.3.2.1 Bonferoni Confident Interval

    3.3.2.1.1 Varian Sama

    3.3.2.1.2 Varian Tidak Sama

    3.3.3 Asumsi Analisis Diskriminan

    3.3.3.1 Multivariate Normal

    3.3.3.1.1 Pemeriksaan Multivariate Normal

    3.3.3.1.2 Uji Henze-Zirkler

    3.3.3.2 Uji Homogenitas Varian

    3.3.4 Fungsi Diskriminan

    3.3.5 Tabel Klasifikasi dan Ketepatan Model

  4. Source Code

    4.1 Library

    4.2 Input Data

    4.2.1 Recoding Data

    4.2.2 Membuat Dataset Analisis

    4.3 Prasyarat Analisis Diskriminan

    4.3.1 Manual

    4.3.1.1 Spli Berdasarkan Kategori Pertumbuhan Ekonomi

    4.3.2 Fungsi

    4.4 Pengujian Asumsi

    4.4.1 Multivariate Normal

    4.4.1.1 Pemeriksaan Multivariate Normal

    4.4.1.2 Uji Henze-Zirkler

    4.4.2 Uji Homogenitas Varian

    4.5 Bonferoni Confident Interval

    4.6 Fungsi Diskriminan Linier

    4.6.1 Split Data

    4.6.2 Manual

    4.6.2.1 Split Berdasarkan Kategori Pertumbuhan Ekonomi

    4.6.2.2 Menghitung Nilai Varian

    4.6.2.3 Menghitung Rata-Rata Setiap Kategori Pertumbuhan Ekonomi

    4.6.2.4 Menghitung \(S_{pooled}\)

    4.6.2.5 Menghitung Nilai \(a\)

    4.6.2.6 Normalisasi Nilai \(a\)

    4.6.2.7 Hasil Persamaan Diskriminan

    4.6.3 Fungsi

    4.7 Tabel Klasifikasi dan Ketepatan Model

    4.7.1 Manual

    4.7.1.1 Prediksi

    4.7.1.2 Korelasi

    4.7.1.3 Penilaian Akurasi Hasil Prediksi

    4.7.2 Fungsi

    4.7.2.1 Prediksi

    4.7.2.2 Korelasi

    4.7.2.3 Penilaian Akurasi Hasil Prediksi

  5. Hasil dan Analisis

    5.1 Prasyarat Analisis Diskriminan

    5.1.1 Bonferoni Confident Interval

    5.2 Multivariate Normal

    5.2.1 Pengecekan Outlier

    5.2.2 Pemeriksaan Multivariate Normal

    5.2.3 Uji Henze-Zirkler

    5.3 Uji Homogenitas Varian

    5.4 Fungsi Diskriminan

    5.5 Tabel Klasifikasi dan Ketepatan Model

  6. Penutup

    6.1 Kesimpulan

    6.2 Saran

  7. Daftar Pustaka

PENDAHULUAN

Latar Belakang

Ketimpangan gender merupakan salah satu tantangan utama dalam mencapai pertumbuhan ekonomi yang inklusif dan berkelanjutan, seperti yang tercermin dalam tujuan Sustainable Development Goals (SDGs). Ketimpangan ini terlihat pada rendahnya partisipasi perempuan di sektor tenaga kerja, representasi politik, serta akses terhadap pendidikan. Menurut data Badan Pusat Statistik (BPS), Pulau Jawa dan Bali, meskipun merupakan pusat ekonomi nasional dengan kontribusi terbesar terhadap Produk Domestik Bruto (PDB), tetap menunjukkan disparitas gender yang signifikan.

Data BPS tahun 2023 menunjukkan bahwa proporsi perempuan yang terlibat dalam angkatan kerja di beberapa kabupaten/kota di Pulau Jawa dan Bali masih berada di bawah rata-rata nasional. Demikian pula, partisipasi perempuan dalam legislatif sangat terbatas. Ketimpangan ini dapat berdampak negatif terhadap pembangunan ekonomi karena potensi kontribusi perempuan tidak sepenuhnya dimanfaatkan.

Studi ini berfokus pada hubungan antara indikator ketimpangan gender dan kategori pertumbuhan ekonomi kabupaten/kota di Pulau Jawa dan Bali. Dengan menggunakan analisis diskriminan, penelitian ini bertujuan untuk mengidentifikasi faktor-faktor yang paling signifikan dalam membedakan kategori pertumbuhan ekonomi, serta memberikan rekomendasi kebijakan yang berbasis bukti.

Masalah Penelitian

  1. Bagaimana hubungan antara indikator ketimpangan gender dengan kategori pertumbuhan ekonomi kabupaten/kota di Pulau Jawa dan Bali?

  2. Indikator ketimpangan gender mana yang paling signifikan dalam membedakan kategori pertumbuhan ekonomi?

  3. Bagaimana klasifikasi kabupaten/kota di Pulau Jawa dan Bali berdasarkan kategori pertumbuhan ekonomi menggunakan analisis diskriminan?

Tujuan Penelitian

  1. Mengidentifikasi indikator ketimpangan gender yang signifikan dalam membedakan kabupaten/kota berdasarkan kategori pertumbuhan ekonomi.

  2. Mengklasifikasikan kabupaten/kota di Pulau Jawa dan Bali ke dalam kategori pertumbuhan ekonomi menggunakan analisis diskriminan.

  3. Memberikan rekomendasi kebijakan berbasis hasil analisis untuk mendukung pertumbuhan ekonomi yang lebih inklusif dan mengurangi ketimpangan gender.

Manfaat Penelitian

  1. Teoritis: Menambah literatur terkait hubungan antara ketimpangan gender dan pertumbuhan ekonomi.

  2. Praktis: Memberikan rekomendasi kebijakan berbasis data untuk meningkatkan inklusivitas dalam pembangunan ekonomi di Pulau Jawa dan Bali.

  3. Kebijakan: Mendukung pengambilan keputusan yang lebih responsif terhadap isu gender.

TINJAUAN PUSTAKA

Pertumbuhan Ekonomi dan Kategorisasi

Pertumbuhan ekonomi didefinisikan sebagai peningkatan kapasitas produksi suatu wilayah yang diukur melalui kenaikan Produk Domestik Regional Bruto (PDRB) (Todaro & Smith, 2020). Dalam penelitian ini, pertumbuhan ekonomi kabupaten/kota di Pulau Jawa dan Bali dikategorikan menjadi dua, yaitu di bawah rata-rata nasional dan di atas rata-rata nasional. Kategorisasi ini bertujuan untuk menggambarkan perbedaan kinerja ekonomi berdasarkan standar rata-rata nasional, yang telah diterapkan dalam berbagai studi sebelumnya. Firdaus et al. (2019) menggunakan pendekatan rata-rata nasional untuk mengklasifikasikan daerah berdasarkan indikator kemiskinan, sedangkan Nugroho dan Hidayat (2021) mengelompokkan wilayah berdasarkan ambang batas pertumbuhan ekonomi. Studi ini menunjukkan bahwa kategorisasi berbasis rata-rata nasional memungkinkan evaluasi komparatif terhadap performa wilayah secara komprehensif.

Indikator Ketimpangan Gender

Penelitian ini menggunakan beberapa indikator ketimpangan gender untuk memahami kontribusinya terhadap pertumbuhan ekonomi. Indikator pertama adalah proporsi perempuan berusia 15-49 tahun yang pernah kawin dan memiliki anak pertama sebelum usia 20 tahun, yang mencerminkan akses terhadap pendidikan dan kesehatan reproduksi (UNFPA, 2021). Indikator kedua adalah persentase anggota legislatif laki-laki, yang menggambarkan representasi gender dalam politik (Inter-Parliamentary Union, 2023). Selain itu, persentase partisipasi angkatan kerja perempuan terhadap penduduk perempuan usia kerja dan persentase partisipasi angkatan kerja laki-laki terhadap penduduk laki-laki usia kerja digunakan untuk mengukur kesenjangan gender dalam pasar tenaga kerja (Cuberes & Teignier, 2014).

Penelitian Terdahulu

Klasen (2002) mengungkapkan bahwa penurunan ketimpangan gender dalam pendidikan dapat meningkatkan produktivitas tenaga kerja dan pada akhirnya mendorong pertumbuhan ekonomi. Cuberes dan Teignier (2014) lebih lanjut menjelaskan bahwa ketimpangan gender dalam partisipasi tenaga kerja memiliki dampak negatif yang signifikan terhadap PDB per kapita, karena menghambat potensi kontribusi tenaga kerja perempuan. Becker (1981) menyoroti bahwa pemberdayaan perempuan, baik melalui pendidikan maupun peningkatan akses ke pasar kerja, berperan penting dalam meningkatkan kesejahteraan ekonomi rumah tangga. Firdaus et al. (2019) dan Nugroho dan Hidayat (2021) mendukung pendekatan kategorisasi berdasarkan rata-rata nasional, yang digunakan dalam penelitian ini untuk mengevaluasi disparitas regional.

METODE PENELITIAN

Data dan Sumber Data

Penelitian ini menggunakan data sekunder yang diperoleh dari Badan Pusat Statistik (BPS) di wilayah Jawa dan Bali unutk tahun 2023. Data sekunder tersebut mencakup indikator ketimpangan gender dan pertumbuhan ekonomi kabupaten/kota pada tahun terakhir yang tersedia. Indikator ketimpangan gender meliputi proporsi perempuan berusia 15-49 tahun yang pernah kawin dan saat melahirkan hidup #pertama berusia kurang dari 20 tahun, persentase anggota legislatif laki-laki, persentase angkatan kerja perempuan terhadap penduduk perempuan usia kerja, serta persentase angkatan kerja laki-laki terhadap penduduk laki-laki usia kerja.

Sampel data yang digunakan berjumlah 119 kabupaten/kota di Pulau Jawa dan Bali. Variabel independen dalam penelitian ini terdiri dari empat indikator ketimpangan gender yang bersifat kontinu. Sedangkan variabel dependen adalah kategori pertumbuhan ekonomi kabupaten/kota yang bersifat kategori dengan nilai 1 untuk kabupaten/kota yang memiliki pertumbuhan ekonomi di bawah rata-rata nasional dan 2 untuk kabupaten/kota yang memiliki pertumbuhan ekonomi di atas rata-rata nasional.

Variabel Penelitian

Variabel Dependen: Kategori pertumbuhan ekonomi kabupaten/kota (di bawah atau di atas rata-rata nasional).

Variabel Independen:

  • Proporsi perempuan berusia 15-49 tahun yang pernah kawin dan saat melahirkan hidup pertama berusia kurang dari 20 tahun.

  • Persentase anggota legislatif laki-laki.

  • Persentase angkatan kerja laki-laki terhadap penduduk laki-laki usia kerja.

  • Persentase angkatan kerja perempuan terhadap penduduk perempuan usia kerja.

Metode Analisis

Analisis Diskriminan

Analisis diskriminan merupakan salah satu teknik statistik yang termasuk dalam analisis multivariat. Tujuannya adalah untuk mengelompokkan pengamatan ke dalam kelompok berdasarkan sejumlah variabel yang memengaruhi (Johnson & Wichern, 2007). Pengelompokan dilakukan dengan membentuk sebuah fungsi diskriminan. Fungsi diskrimininan merupakan fungsi yang terdiri atas kombinasi liniear berbagai variabel prediktor. Pada nantinya akan terbentuk fungsi diskrimininan sebanyak jumlah kelas atau kategori dikurangi satu yang dapat memisahkan data. Fungsi diskriminan memiliki bentuk umum yaitu:

\[ \hat{Y}=b_0+b_1X_1+b_2X_2+b_3X_3+b_4X_4 \]

Keterangan

  • \(\hat{Y}\): Skor diskriminan

  • \(b_0\): Intersep atau koefisien persamaan fungsi diskriminan

  • \(b_1\): Bobot diskriminan untuk Proporsi perempuan berusia 15-49 tahun yang pernah kawin dan saat melahirkan hidup pertama berusia kurang dari 20 tahun

  • \(b_2\): Bobot diskriminan untuk Persentase anggota legislatif laki-laki

  • \(b_3\): Bobot diskriminan untuk Persentase angkatan kerja laki-laki terhadap penduduk laki-laki usia kerja

  • \(b_4\): Bobot diskriminan untuk Persentase angkatan kerja perempuan terhadap penduduk perempuan usia kerja

  • \(X_1\): Proporsi perempuan berusia 15-49 tahun yang pernah kawin dan saat melahirkan hidup pertama berusia kurang dari 20 tahun

  • \(X_2\):Persentase anggota legislatif laki-laki

  • \(X_3\): Persentase angkatan kerja laki-laki terhadap penduduk laki-laki usia kerja

  • \(X_4\): Persentase angkatan kerja perempuan terhadap penduduk perempuan usia kerja

Prasyarat Analisis Diskriminan

Uji \(T^2\) Hotelling adalah uji statistik yang digunakan dalam analisis multivariat untuk menguji perbedaan yang signifikan antara dua atau lebih kelompok dalam berbagai variabel dependen yang terkait. Menurut Nurhapilan dan Darwis (2023), \(T^2\) Hotelling dilakukan untuk mendeteksi perubahan rata-rata proses menggunakan vektor rata-rata sampel dan matriks kovariansi. Uji ini dinamai dari ilmuwan statistik T.W. Hotelling, yang mengembangkan metodenya pada tahun 1930-an. Pada uji ini, pengujian vektor rata rata dilakukan secara serentak pada semua variabel. Dengan kata lain, Uji \(T^2\)-Hotelling adalah Uji-T namun pada kasus multivariabel.

Hipotesis bagi Uji \(T^2\) Hotelling adalah sebagai berikut:

  • \(H_0\): \(\mu_1=\mu_2\) (tidak terdapat perbedaan rata-rata antara kategori di bawah garis nasional dan di atas garis nasional)

  • \(H_1\): \(\mu_1 \ne \mu_2\) ( terdapat perbedaan rata-rata antara kategori di bawah garis nasional dan di atas garis nasional)

Statistik Uji \[ T^2=[(\bar{X_1}-\bar{X_2})-(\mu_1-\mu_2)]'[(\frac{1}{n_1}+\frac{1}{n_2})S_{pooled}]^{-1}[(\bar{X_1}-\bar{X_2})-(\mu_1-\mu_2)]\sim\frac{(n_1+n_2-2)p}{(n_1+n_2-p-1)}F_{p,n_1+n_2-p-1} \] Keterangan: \(S_{pooled}=\frac{n_1-1}{n_1+n_2-2}S_1+\frac{n_2-1}{n_1+n_2-2}S_2\)

Keputusan hipotesis dengan nilai signifikansi: jika signifikansi p-value \(>\alpha\) maka gagal tolak \(H_0\), sedangkan jika signifikansi \(>\alpha\) tolak \(H_0\)

Bonferroni Confident Interval

Dalam analisis statistik, salah satu metode yang digunakan untuk mengakomodasi pengujian hipotesis ganda adalah metode Bonferroni. Dengan menyesuaikan tingkat signifikansi untuk setiap uji individu, Bonferroni Confidence Interval memberikan interval kepercayaan yang lebih konservatif namun tetap andal untuk setiap parameter yang diuji. Dalam penelitian ini Bonferroni Confidence Interval digunakan untuk membandingkan rata-rata indikator ketimpangan gender di tiap kategori pertumbuhan ekonomi. Rumus perhitungan interval ini dapat dinyatakan sebagai berikut:

Varian Sama

Selang kepercayaan bonferoni unutk asumsi varian sama di rumuskan: \[ (\bar{Y_1}-\bar{Y_2})\pm t_{n_1+n_2-2;(\frac{\alpha}{2p})} \sqrt{(\frac{1}{n_1}+\frac{1}{n_2})S_{pooled_{ii}}} \]

Varian Tidak Sama

Selang kepercayaan bonferoni unutk asumsi varian tidak sama di rumuskan: \[ (\bar{Y_1}-\bar{Y_2})\pm Z_{\frac{\alpha}{2p}} \sqrt{(\frac{S_1}{n_1}+\frac{S_2}{n_2})} \]

Asumsi Analisis Diskriminan

Multivariate Normal

Pemeriksaan Multivariate Normal

Untuk menguji kenormalan ganda dengan mencari nilai jarak kuadrat untuk setiap pengamatan dengan rumus:

\[ d^2_j=(X_j-\bar{X_p})'S^{-1}(X_j-\bar{X_p}) \]

Keterangan:

  • \(X_j\):Pengamatan ke-\(j\)

  • \(\bar{x_p}\): Rata-rata tiap variabel

  • \(S^{-1}\): Kebalikan (inverse) matriks ragam peragam \(S\)

  • \(d^2_j\): Jarak kuadrat

Nilai jarak tersebut dibandingkan dengan nilai chi-square \(X^2_{(p;0,5)}\), bila lebih dari 50% nilai \(d^2_j≤X^2_{(p;0,5)}\) maka dapat disimpulkan bahwa peubah ganda menyebar normal.

Uji Henze-Zirkler

Selain dengan pemeriksaan dengan mempertimbangkan tidak lebih 50% melebihi batas toleransi, uji normalitas multivariat juga dapat dilakukan menggunakan uji inferensia, salah satunya adalah Uji HenzeZirkler yang menguji normalitas data berdasarkan jarak antar dua fungsi distribusi. Pengujian normalitas multivariat dengan Uji Henze-Zirkler denganrumusan hipotesis dan statistic uji sebagai berikut (Henze dan Zirkler, 1990).

  • \(H_0\): Data berasal dari distribusi normal multivariat

  • \(H_1\): Data tidak berasal dari distribusi normal multivariat

Statistik Uji

\[ HZ=\frac{1}{n^2}\sum_{i=1}^n\sum_{j=1}^ne^{-\frac{\beta^2}{2}D_{ij}}-1(1+\beta^2)^{-\frac{p}{2}}\frac{1}{n}\sum_{i=1}^ne^{-\frac{\beta^2}{2(1+\beta^2)}D_i}+(1+\beta^2)^{-\frac{p}{2}} \] Keterangan:

  • \(\beta=\frac{1}{\sqrt2}(\frac{n(2p+1)}{4})\)

  • \(D_{ij}=(x_i-x_j)'S^{-1}(x_i-x_j)\)

  • \(D_i=(x_i-\bar{x})'S^{-1}(x_i-\bar{x})\)

  • \(p\): Jumlah variabel

  • \(S^{-1}\): Matriks varians kovarian

Jika data berdistribusi normal multivariat nilai statistic \(HZ\) akan berdistribusi log-normal. Apabila nilai p-value yang dihasilkan lebih besar dari taraf signifikansi yang ditentukan, maka dapat disimpulkan data berdistribusi normal multivariat

Uji Homogenitas Varian

Selain uji normalitas, uji homogenitas juga harus dilakukan pada data untuk memastikan bahwa setiap kelompok data memiliki variansi yang homogen sehingga dapat digunakan dalam analisis parametrik. Pengujian homogenitas variansi bertujuan untuk menunjukkan bahwa sekumpulan data yang diperoleh berasal dari populasi yang tidak jauh berbeda keragamannya. Pada analisis parametrik, model dengan simpangan estimasi yang mendekati nol menunjukkan bahwa model tersebut merupakan model yang sesuai, maka dari itu homogenitas varians pada kelompok populasi perlu dideteksi untuk mengantisipasi agar simpangan estimasi tidak terlalu besar atau menjauhi nol (Sari dkk., 2017).

Pada data multivariat, uji homogenitas matriks varian kovarian untuk menguji kesamaan matriks varian kovarian untuk masing masing kombinasi dari setiap kelompok. Uji Box’s M merupakan uji yang dapat digunakan untuk menguji homogentisa matriks varian kovarian pada data multivariat dengan hipotesis sebagai berikut

  • \(H_0: \sum_1=\sum_2\) (matriks varian kovarian homogen)

  • \(H_1: \sum_1\ne\sum_2\) (matriks varian kovarian tidak homogen)

Statistik uji yang digunakan pada uji ini menggunakan rumus sebagai berikut.

\[ M=(n-k)\log|S|-\sum_{i=1}^k(n_i-1)\log|S_i|\sim\chi^2 \]

Dimana

  • \(S\): Kovarian matriks

  • \(S_i\): Komaviran matriks terkumpul

Apabila nilai p-value yang dihasilkan lebih besar dari taraf signifikansi yang ditentukan, maka dapat disimpulkan matriks varian koravian homogen.

Fungsi Diskriminan

Membentuk fungsi diskriminan Jika pengujian asumsi-asumsi telah terpenuhi yaitu data menyebar secara normal dan nilai matriks ragam-peragamnya sama serta terdapat perbedaan vektor nilai rataannya dapat dibentuk fungsi diskriminan dengan persamaan: \[ \hat{Y}=b_0+b_1X_1+b_2X_2+b_3X_3+b_4X_4 \] Keterangan

  • \(\hat{Y}\): Skor diskriminan

  • \(b_0\): Intersep atau koefisien persamaan fungsi diskriminan

  • \(b_1\): Bobot diskriminan untuk Proporsi perempuan berusia 15-49 tahun yang pernah kawin dan saat melahirkan hidup pertama berusia kurang dari 20 tahun

  • \(b_2\): Bobot diskriminan untuk Persentase anggota legislatif laki-laki

  • \(b_3\): Bobot diskriminan untuk Persentase angkatan kerja laki-laki terhadap penduduk laki-laki usia kerja

  • \(b_4\): Bobot diskriminan untuk Persentase angkatan kerja perempuan terhadap penduduk perempuan usia kerja

  • \(X_1\): Proporsi perempuan berusia 15-49 tahun yang pernah kawin dan saat melahirkan hidup pertama berusia kurang dari 20 tahun

  • \(X_2\):Persentase anggota legislatif laki-laki

  • \(X_3\): Persentase angkatan kerja laki-laki terhadap penduduk laki-laki usia kerja

  • \(X_4\): Persentase angkatan kerja perempuan terhadap penduduk perempuan usia kerja

Tabel Klasifikasi dan Ketepatan Model

Digunakan untuk mengetahui seberapa besar keakurasian model dalam mengklasifikasi suatu objek. Ukuran yang digunakan adalah Hit Ratio atau Apparent Error Rate (APER). Hit Ratio merupakan proporsi objek yang diklasifikasikan benar oleh model, sedangkan APER kebalikannya, yaitu proporsi objek yang diklasifikan salah oleh model. Untuk memudahkan dalam pengitungannya, perlu dibuat sebuah Confusion Matrix, yaitu matriks tabulasi silang antara kategori sebenarnya dengan kategori yang diprediksi oleh model. Rumus Untuk menghitung Hit Ratio adalah sebagai berikut

\[ HitRatio=\frac{n_{c_1}+n_{c_2}}{n_{c_1}+n_{m_1}+n_{m_2}+n_{c_2}} \]

SOURCE CODE

Library

library(readxl)
library(biotools)
## Loading required package: MASS
## ---
## biotools version 4.2
library(dplyr)
## 
## Attaching package: 'dplyr'
## The following object is masked from 'package:MASS':
## 
##     select
## The following objects are masked from 'package:stats':
## 
##     filter, lag
## The following objects are masked from 'package:base':
## 
##     intersect, setdiff, setequal, union
library(MVN)
library(kableExtra)
## 
## Attaching package: 'kableExtra'
## The following object is masked from 'package:dplyr':
## 
##     group_rows
library(Hotelling)
## Loading required package: corpcor
## 
## Attaching package: 'Hotelling'
## The following object is masked from 'package:dplyr':
## 
##     summarise
library(DescTools)
library(DT)

Input Data

Keterangan variabel : \(Y\): Kategori Pertumbuhan Ekonomi Kabupaten/kota dengan pertumbuhan PDRB lebih rendah dari rata-rata nasional. Kabupaten/kota dengan pertumbuhan PDRB lebih tinggi dari rata-rata nasional.

\(X_1\): Proporsi perempuan berusia 15-49 tahun yang pernah kawin dan saat melahirkan hidup pertama berusia kurang dari 20 tahun: Mengindikasikan akses terhadap pendidikan dan kesehatan reproduksi.

\(X_2\): Persentase anggota legislatif laki-laki: Mengukur representasi gender dalam politik.

\(X_3\): Persentase angkatan kerja laki-laki terhadap penduduk laki-laki usia kerja

\(X_4\):Persentase angkatan kerja perempuan terhadap penduduk perempuan usia kerja

data<-read_excel("C:/Users/User/Downloads/Ketimpangan Gender - Pertumbuhan Ekonomi.xlsx")
datatable(data,caption="Data Indikator Ketimpangan Gender dan Pertumbuhan Ekonomi menurut Kab/Kota di Pulau Jawa dan Bali")

Recoding Data

\(Y\): Kategori Pertumbuhan Ekonomi Kabupaten/kota dengan pertumbuhan PDRB lebih rendah dari rata-rata nasional. Kabupaten/kota dengan pertumbuhan PDRB lebih tinggi dari rata-rata nasional.

Dimana diketahui menurut data BPS tahun 2023. Pertumbuhan ekonomi nasional sebesar 5,05%

# Membuat variabel baru berdasarkan garis rata-rata pertumbuhan ekonomi nasional
data$Y <- factor(ifelse(data$PE < 5.05, "1", "2"))
data$Y<-factor(ifelse(data$PE < 5.05, "1", "2"),
                         levels = c("1", "2"),
                         labels = c("Di bawah Garis Nasional", "Di atas Garis Nasional"))

# Menampilkan struktur data untuk memastikan variabel baru telah dibuat
str(data)
## tibble [128 × 7] (S3: tbl_df/tbl/data.frame)
##  $ Kab/Kota: chr [1:128] "Pacitan" "Ponorogo" "Trenggalek" "Tulungagung" ...
##  $ X1      : num [1:128] 0.288 0.146 0.235 0.167 0.233 0.183 0.286 0.383 0.424 0.261 ...
##  $ X2      : num [1:128] 82.2 86.7 93.3 82 76 ...
##  $ X3      : num [1:128] 89.4 87.7 89 86.9 88.6 ...
##  $ X4      : num [1:128] 73.9 64.2 72.5 62.6 58.3 ...
##  $ PE      : num [1:128] 4.46 5.14 4.92 4.91 4.45 4.53 5 5 4.93 5.03 ...
##  $ Y       : Factor w/ 2 levels "Di bawah Garis Nasional",..: 1 2 1 1 1 1 1 1 1 1 ...

Membuat Dataset Analisis

dataset<-data[,c("X1","X2","X3","X4","Y")]
datatable(dataset,caption = "Dataset Analisis")
summary(dataset)
##        X1               X2              X3              X4       
##  Min.   :0.0500   Min.   :60.00   Min.   :75.91   Min.   :40.28  
##  1st Qu.:0.1678   1st Qu.:76.00   1st Qu.:81.87   1st Qu.:50.86  
##  Median :0.2320   Median :82.00   Median :84.94   Median :57.87  
##  Mean   :0.2413   Mean   :81.23   Mean   :84.44   Mean   :57.73  
##  3rd Qu.:0.3123   3rd Qu.:86.67   3rd Qu.:86.78   3rd Qu.:63.97  
##  Max.   :0.4870   Max.   :96.67   Max.   :90.21   Max.   :82.52  
##                        Y     
##  Di bawah Garis Nasional:65  
##  Di atas Garis Nasional :63  
##                              
##                              
##                              
## 

Prasyarat Analisis Diskriminan

Manual

Z2.test <- function(X,Y, mu=0, asymp1=FALSE, asymp2=F){ 
X <- as.matrix(X) 
n1 <- nrow(X) 
n2<- nrow(Y)
p <- ncol(X) 
df1<-p
df2 <- n1+n2 - p -1
if(df2 < 1L) stop("Need nrow(X) > ncol(X).") 
if(length(mu) != p) mu <- rep(mu[1], p) 
xbar <- colMeans(X)
ybar <- colMeans(Y)
 
bar<- xbar-ybar
if(asymp1){ 
S <- ((((n1-1)*cov(X)+(n2-1)*cov(Y))/(n1+n2-2))*((1/n1)+(1/n2)))
} else { 
S <- (cov(X)/n1)+(cov(Y)/n2)
} 
Z2 <- t(bar - mu) %*% solve(S) %*% (bar - mu) 
Fstat <- Z2 / (df1 * (n1+n2-2) / df2) 
if(asymp2){ 
pval <- 1 - pchisq(Z2, df=p) 
} else { 
pval <- 1 - pf(Fstat, df1=p, df2=df2) 
} 
data.frame(Z2=as.numeric(Z2), Fstat=as.numeric(Fstat),df1=p, df2=df2, p.value=as.numeric(pval), 
asymp1=asymp1, asymp2=asymp2, row.names="")
} 

Split Berdasarkan Kategori Pertumbuhan Ekonomi

library(dplyr)
Y1<-dataset%>%
  filter(Y=="Di bawah Garis Nasional")%>%
  select(X1,X2,X3,X4)
Y2<-dataset%>%
  filter(Y=="Di atas Garis Nasional")%>%
  select(X1,X2,X3,X4)
HotelingM<-Z2.test(Y1,Y2,0,T,F)
HotelingM
##        Z2    Fstat df1 df2      p.value asymp1 asymp2
##  33.49474 8.174312   4 123 7.036876e-06   TRUE  FALSE

Fungsi

HotelingF<-HotellingsT2Test(cbind(X1, X2, X3, X4) ~ Y, data = dataset)
HotelingF
## 
##  Hotelling's two sample T2-test
## 
## data:  cbind(X1, X2, X3, X4) by Y
## T.2 = 8.1743, df1 = 4, df2 = 123, p-value = 7.037e-06
## alternative hypothesis: true location difference is not equal to c(0,0,0,0)

Pengujian Asumsi

Multivariate Normal

Pemeriksaan Multivariate Normal

d2<-sort(mahalanobis(dataset[,1:4],colMeans(dataset[,1:4]),cov(dataset[,1:4])))

threshold <- qchisq(p = 0.99, df = ncol(dataset[,1:4]))  #Batas untuk outlier berdasarkan distribusi chi-squared
outliers <- d2 > threshold
Joutlier<-sum(outliers)
Joutlier
## [1] 0
c<-qchisq(0.5,4)
m1<-sum(d2<c)
m2<-sum(d2>c)
Chi<-m1/(m1+m2)
normalP<-if_else(Chi<0.5,"Data Menyebar Multivariate Normal","Data Tidak Menyebar Multivariate Normal")
normalP
## [1] "Data Menyebar Multivariate Normal"

Uji Henze-Zirkler

normalT<-mvn(dataset[, -length(dataset)], 
    multivariateOutlierMethod = "adj", 
    showNewData = TRUE,mvnTest = "hz")

normalT
## $multivariateNormality
##            Test       HZ   p value MVN
## 1 Henze-Zirkler 1.007858 0.0430027  NO
## 
## $univariateNormality
##               Test  Variable Statistic   p value Normality
## 1 Anderson-Darling    X1        0.8863    0.0228    NO    
## 2 Anderson-Darling    X2        0.4594    0.2580    YES   
## 3 Anderson-Darling    X3        0.7832    0.0410    NO    
## 4 Anderson-Darling    X4        0.3700    0.4206    YES   
## 
## $Descriptives
##      n       Mean    Std.Dev Median   Min    Max     25th     75th       Skew
## X1 128  0.2412656 0.09641989  0.232  0.05  0.487  0.16775  0.31225  0.4183375
## X2 128 81.2295312 7.30835870 82.000 60.00 96.670 76.00000 86.67000 -0.1672256
## X3 128 84.4391406 3.11152671 84.940 75.91 90.210 81.87000 86.77500 -0.3356775
## X4 128 57.7348438 8.89569346 57.870 40.28 82.520 50.85750 63.96750  0.1882846
##      Kurtosis
## X1 -0.5489873
## X2 -0.3734252
## X3 -0.6255858
## X4 -0.4667749
## 
## $newData
## # A tibble: 128 × 4
##       X1    X2    X3    X4
##    <dbl> <dbl> <dbl> <dbl>
##  1 0.288  82.2  89.4  73.9
##  2 0.261  74    89.8  68.4
##  3 0.244  93.3  84.2  50.7
##  4 0.251  77.4  88.4  59.1
##  5 0.118  77.4  80.4  51.8
##  6 0.112  77.4  79.5  50.8
##  7 0.139  77.4  75.9  51.7
##  8 0.127  77.4  81.7  47.8
##  9 0.158  77.4  81.9  49.0
## 10 0.365  85.7  77.8  41.9
## # ℹ 118 more rows

Uji Homogenitas Varian

attach(dataset)
library(biotools)
library(MASS)
Var<-boxM(cbind(X1,X2,X3,X4),Y)
Var
## 
##  Box's M-test for Homogeneity of Covariance Matrices
## 
## data:  cbind(X1, X2, X3, X4)
## Chi-Sq (approx.) = 22.954, df = 10, p-value = 0.01092

Bonferoni Confident Interval

chi <- function(mu,Sigma,n,n1,n2, avec=rep(1,length(mu)),
 level=0.99){
 p <-length(mu)
 if(nrow(Sigma)!=p)stop("Needlength(mu)==nrow(Sigma).")
 if(ncol(Sigma)!=p)stop("Needlength(mu)==ncol(Sigma).")
 if(length(avec)!=p)stop("Needlength(mu)==length(avec).")
 if(level <=0 | level >= 1) stop("Need 0 < level < 1.")
 cval <- qt(1-(0.01)/(2*p), df=n-2) 
 zhat <- crossprod(avec, mu)
 zvar <- crossprod(avec, Sigma %*% avec)
 const <- cval *sqrt( zvar)
 c(lower = zhat- const, upper = zhat + const)
}
y1bar<-colMeans(Y1)
y2bar<-colMeans(Y2)
bar<-y1bar-y2bar
n1=nrow(Y1) 
n2=nrow(Y2)
S <- ((((n1-1)*cov(Y1)+(n2-1)*cov(Y2))/(n1+n2-2))*((1/n1)+(1/n2)))
 n=dim(dataset[,1:4])[1]
 p <- dim(dataset[,1:4])[2]
# Nilai untuk avec
avec_list <- list(
  c(1,0,0,0),
  c(0,1,0,0),
  c(0,0,1,0),
  c(0,0,0,1)
)
# Menyimpan hasil
p1p2 <- lapply(avec_list, function(avec) {
  chi(mu = bar, Sigma = S, n = n, n1 = n1, n2 = n2, avec = avec)
})
names(p1p2) <- c("Proporsi perempuan berusia 15-49 tahun yang pernah kawin dan saat melahirkan hidup pertama berusia kurang dari 20 tahun", "Persentase anggota legislatif laki-laki", "Persentase angkatan kerja laki-laki terhadap penduduk laki-laki usia kerja","Persentase angkatan kerja perempuan terhadap penduduk perempuan usia kerja")
p1p2
## $`Proporsi perempuan berusia 15-49 tahun yang pernah kawin dan saat melahirkan hidup pertama berusia kurang dari 20 tahun`
##      lower      upper 
## 0.03028344 0.12667578 
## 
## $`Persentase anggota legislatif laki-laki`
##     lower     upper 
## -1.913888  6.011168 
## 
## $`Persentase angkatan kerja laki-laki terhadap penduduk laki-laki usia kerja`
##     lower     upper 
## 0.6636998 3.8390157 
## 
## $`Persentase angkatan kerja perempuan terhadap penduduk perempuan usia kerja`
##     lower     upper 
## -1.879562  7.730063

Fungsi Diskriminan

Split Data

set.seed(123)
 
k <- length(levels(dataset$Y)) 
n <- nrow(dataset) 
 
# data training sebanyak 
idx <- sample(1:n, n*0.7) 
dat.tr <- dataset[idx,]  #data training 
dat.ts <- dataset[-idx,]  #data testing 
summary(dat.tr)
##        X1               X2              X3              X4       
##  Min.   :0.0500   Min.   :60.00   Min.   :75.91   Min.   :40.28  
##  1st Qu.:0.1710   1st Qu.:76.00   1st Qu.:81.90   1st Qu.:50.08  
##  Median :0.2350   Median :82.00   Median :84.83   Median :57.05  
##  Mean   :0.2455   Mean   :81.44   Mean   :84.36   Mean   :57.19  
##  3rd Qu.:0.3140   3rd Qu.:86.67   3rd Qu.:86.76   3rd Qu.:63.47  
##  Max.   :0.4870   Max.   :96.67   Max.   :90.21   Max.   :82.52  
##                        Y     
##  Di bawah Garis Nasional:44  
##  Di atas Garis Nasional :45  
##                              
##                              
##                              
## 
summary(dat.ts)
##        X1               X2              X3              X4       
##  Min.   :0.0960   Min.   :64.00   Min.   :78.45   Min.   :44.15  
##  1st Qu.:0.1455   1st Qu.:75.78   1st Qu.:82.01   1st Qu.:51.23  
##  Median :0.2110   Median :82.22   Median :85.31   Median :59.62  
##  Mean   :0.2315   Mean   :80.76   Mean   :84.63   Mean   :58.98  
##  3rd Qu.:0.2920   3rd Qu.:86.00   3rd Qu.:86.77   3rd Qu.:64.90  
##  Max.   :0.4790   Max.   :95.56   Max.   :89.83   Max.   :74.82  
##                        Y     
##  Di bawah Garis Nasional:21  
##  Di atas Garis Nasional :18  
##                              
##                              
##                              
## 

Manual

Untuk memaksimalkan fungsi diskriminan \(Z=A^tY\) maka nilai dapat dicari dengan \(A=(S_{pooled})^{−1}×(\bar{Y_1}-\bar{Y_2})\) Sedangkan S pooled dapat dihitung sebagai berikut \(S_{pooled}=\frac{1}{n_1+n_2−1}×(W_1+W_2)\) dengan \(W_1=(n_1−1)S_1\) dan \(W_2=(n_2−1)S_2\)

Split Berdasarkan Kategori Pertumbuhan Ekonomi

library(dplyr)
Y1<-dat.tr%>%
  filter(Y=="Di bawah Garis Nasional")%>%
  select(X1,X2,X3,X4)
Y2<-dat.tr%>%
  filter(Y=="Di atas Garis Nasional")%>%
  select(X1,X2,X3,X4)

Menghitung Nilai Varian

S1<-cov(Y1)
S2<-cov(Y2)

Menghitung Rata-Rata Setiap Kategori Pertumbuhan Ekonomi

ybar1<-apply(Y1,2,mean)
ybar2<-apply(Y2,2,mean)

Menghitung Spooled

# Jumlah amatan tiap lokasi
n1<-nrow(Y1)
n2<-nrow(Y2)
W <- (((n1-1)*S1) + ((n2-1)*S2)) / (n1 + n2 - 2)

Menghitung Nilai a

a<-solve(W)%*%(ybar2-ybar1)
a
##           [,1]
## X1 -7.85191011
## X2  0.02605877
## X3 -0.10314121
## X4 -0.03790072

Normalisasi Nilai a

aa <- a%*%(1/sqrt(t(a)%*%W%*%a))
aa
##           [,1]
## X1 -8.45190518
## X2  0.02805003
## X3 -0.11102263
## X4 -0.04079687

Hasil Persamaan Diskriminan

z<-as.matrix(dat.ts[,-length(dat.ts)])%*%aa
z
##             [,1]
##  [1,] -13.065264
##  [2,] -11.163280
##  [3,] -12.207256
##  [4,] -12.585661
##  [5,] -12.892690
##  [6,] -13.773493
##  [7,] -11.523293
##  [8,] -11.279313
##  [9,] -10.936456
## [10,] -11.497216
## [11,] -11.639817
## [12,] -12.192535
## [13,] -11.173526
## [14,] -10.740909
## [15,] -11.500024
## [16,] -13.376440
## [17,] -10.235092
## [18,] -12.344994
## [19,] -12.183048
## [20,] -11.648808
## [21,] -13.305428
## [22,] -12.160112
## [23,] -12.746863
## [24,]  -9.983418
## [25,] -10.720337
## [26,]  -9.593602
## [27,] -11.807669
## [28,] -10.547181
## [29,] -11.754261
## [30,] -10.692546
## [31,]  -9.783093
## [32,] -10.863605
## [33,]  -9.676032
## [34,]  -9.923900
## [35,] -10.789074
## [36,] -10.768387
## [37,] -10.567594
## [38,] -11.720660
## [39,] -12.884486

Fungsi

# Analisis Diskriminan 
fit<-lda(Y~.,data=dat.tr) 
fit
## Call:
## lda(Y ~ ., data = dat.tr)
## 
## Prior probabilities of groups:
## Di bawah Garis Nasional  Di atas Garis Nasional 
##                0.494382                0.505618 
## 
## Group means:
##                                X1       X2       X3       X4
## Di bawah Garis Nasional 0.2803636 81.66114 85.48159 58.57841
## Di atas Garis Nasional  0.2114667 81.21533 83.25489 55.83333
## 
## Coefficients of linear discriminants:
##            LD1
## X1 -8.45190518
## X2  0.02805003
## X3 -0.11102263
## X4 -0.04079687

Tabel Klasifikasi dan Ketepatan Model

Manual

Prediksi

m<-as.numeric(((ybar2%*%aa)+(ybar1%*%aa))*(n1/(n1+n2)))
pred_class <- ifelse(z < m, 1, 2)

Korelasi

kor1 <- t(cor(z,dat.ts[,-length(dat.ts)]))
tabkor<-data.frame(kor1)
tabkor
##          kor1
## X1 -0.8564891
## X2 -0.1569215
## X3 -0.7721636
## X4 -0.4511502

Penilaian Akurasi Hasil Prediksi

ct <- table(dat.ts$Y, pred_class) 
ct 
##                          pred_class
##                            1  2
##   Di bawah Garis Nasional 16  5
##   Di atas Garis Nasional   5 13
# total percent correct 
sum(diag(prop.table(ct)))
## [1] 0.7435897

Fungsi

Prediksi

pred <- predict(fit,dat.ts[,-length(dat.ts)])

Korelasi

kor1 <- t(cor(pred$x,dat.ts[,-length(dat.ts)]))
tabkor<-data.frame(kor1)
tabkor
##           LD1
## X1 -0.8564891
## X2 -0.1569215
## X3 -0.7721636
## X4 -0.4511502

Penilaian Akurasi Hasil Prediksi

ct <- table(dat.ts$Y, pred$class) 
ct 
##                          
##                           Di bawah Garis Nasional Di atas Garis Nasional
##   Di bawah Garis Nasional                      15                      6
##   Di atas Garis Nasional                        4                     14
# total percent correct 
sum(diag(prop.table(ct)))
## [1] 0.7435897

HASIL DAN ANALISIS

Prasyarat Analisis Diskriminan

HotelingM
##        Z2    Fstat df1 df2      p.value asymp1 asymp2
##  33.49474 8.174312   4 123 7.036876e-06   TRUE  FALSE

Untuk menguji perbedaan rata-rata dari indikator ketimpangan gender untuk kategorisasi pertumbuhan ekonomi digunakan uji \(T^2\) Hotelling dengan output seperti di atas.

  • \(H_0\): \(\mu_1=\mu_2\) (tidak terdapat perbedaan rata-rata antara kategori di bawah garis nasional dan di atas garis nasional)

  • \(H_1\): \(\mu_1 \ne \mu_2\) ( terdapat perbedaan rata-rata antara kategori di bawah garis nasional dan di atas garis nasional)

Keputusan: Berdasarkan Uji \(T^2\) Hotelling dapat diketahui p-value 7,036876e-06 <0,01, maka tolak H0.

Kesimpulan: Dapat disimpulkan bahwa terdapat perbedaan rata-rata dari indikator ketimpangan gender untuk kategorisasi pertumbuhan ekonomi

Bonferoni Confident Interval

(p1p2)
## $`Proporsi perempuan berusia 15-49 tahun yang pernah kawin dan saat melahirkan hidup pertama berusia kurang dari 20 tahun`
##      lower      upper 
## 0.03028344 0.12667578 
## 
## $`Persentase anggota legislatif laki-laki`
##     lower     upper 
## -1.913888  6.011168 
## 
## $`Persentase angkatan kerja laki-laki terhadap penduduk laki-laki usia kerja`
##     lower     upper 
## 0.6636998 3.8390157 
## 
## $`Persentase angkatan kerja perempuan terhadap penduduk perempuan usia kerja`
##     lower     upper 
## -1.879562  7.730063

Berdasarkan hasil perhitungan selang kepercayaan bonferoni dengan tingkat signifikansi 1% didapatkan bahwa variabel Proporsi perempuan berusia 15-49 tahun yang pernah kawin dan saat melahirkan hidup pertama berusia kurang dari 20 tahun dan Persentase angkatan kerja laki-laki terhadap penduduk laki-laki usia kerja secara signifikan memiliki perbedaan rata-rata untuk kategorisasi pertumbuhan ekonomi.

Multivariate Normal

Pengecekan Outlier

normalF<-mvn(dataset[, -length(dataset)], 
    multivariateOutlierMethod = "adj", 
    showNewData = TRUE,mvnTest = "hz")

Joutlier
## [1] 0

Plot tersebut merupakan Q-Q Plot analisis multivariat yang berguna untuk mendetekteksi adanya outlier dari data. Q-Q Plot tersebut dibentuk dengan function mvn yang memanggil packages MVN dengan data yang digunakan adalah kolom ke 1 hingga kolom ke 4 atau variabel indikator ketimpangan gender. Berdasarkan gambar di atas, dapat diketahui bahwa pada data yang digunakan sudah tidak terdapat data outlier.

Pemeriksaan Multivariate Normal

normalP
## [1] "Data Menyebar Multivariate Normal"

Berdasarakan hasil perhitungan total perbandingan jarak mahalonobis dengan kriteria 50%, di dapatkan bahwa total proporsi yang berada di bawah batas tolak multivariate normal kurang dari 50%. Sehingga data menyebar Multivariate Normal

Uji Henze-Zirkler

normalF$multivariateNormality
##            Test       HZ   p value MVN
## 1 Henze-Zirkler 1.007858 0.0430027  NO

Untuk pengujian formal di uji dengan menggunakan uji Henze-Zirkler dengan tingkat signifikansi 1% atau kepercayaan 99%. Dengan function MVN kemudian didapatkan output tersebut.

Hipotesis :

  • \(H_0\): Data berasal dari distribusi normal multivariat

  • \(H_1\): Data tidak berasal dari distribusi normal multivariat

Keputusan: Berdasarkan Uji Royston dengan p-value 0,0430027 > 0,01, maka gagal tolak H0.

Kesimpulan: Dengan tingkat signifikansi 1%, dapat disimpulkan bahwa data telah berdistribusi normal multivariat

Uji Homogenitas Varian

Var
## 
##  Box's M-test for Homogeneity of Covariance Matrices
## 
## data:  cbind(X1, X2, X3, X4)
## Chi-Sq (approx.) = 22.954, df = 10, p-value = 0.01092

Hipotesis

  • \(H_0: \sum_1=\sum_2\) (matriks varian kovarian homogen)

  • \(H_1: \sum_1\ne\sum_2\) (matriks varian kovarian tidak homogen)

Keputusan:

Berdasarkan Uji Box-M dapat diketahui p-value bernilai 0,01092 < 0,01 maka gagal tolak \(H_0\).

Kesimpulan: Dengan tingkat signifikansi 1%, dapat disimpulkan bahwa variable respon memiliki matriks ragam peragam yang tidak sama.

Fungsi Diskriminan

fit
## Call:
## lda(Y ~ ., data = dat.tr)
## 
## Prior probabilities of groups:
## Di bawah Garis Nasional  Di atas Garis Nasional 
##                0.494382                0.505618 
## 
## Group means:
##                                X1       X2       X3       X4
## Di bawah Garis Nasional 0.2803636 81.66114 85.48159 58.57841
## Di atas Garis Nasional  0.2114667 81.21533 83.25489 55.83333
## 
## Coefficients of linear discriminants:
##            LD1
## X1 -8.45190518
## X2  0.02805003
## X3 -0.11102263
## X4 -0.04079687

Output dari analisis Linear Discriminant Analysis (LDA) menunjukkan prior probabilities untuk kedua kelompok, yaitu “Di bawah Garis Nasional” dan “Di atas Garis Nasional.” Probabilitas awal untuk kelompok “Di bawah Garis Nasional” adalah 49.44%, sedangkan untuk kelompok “Di atas Garis Nasional” adalah 50.56%. Probabilitas ini menggambarkan proporsi awal pengamatan yang masuk ke masing-masing kelompok tanpa mempertimbangkan variabel prediktor.

Rata-rata (group means) dari variabel prediktor pada masing-masing kelompok memberikan gambaran karakteristik setiap kelompok. Untuk kelompok “Di bawah Garis Nasional,” rata-rata Proporsi perempuan berusia 15-49 tahun yang pernah kawin dan saat melahirkan hidup pertama berusia kurang dari 20 tahun: Mengindikasikan akses terhadap pendidikan dan kesehatan reproduksi adalah 0.2804, Persentase anggota legislatif laki-laki adalah 81.6611, Persentase angkatan kerja laki-laki terhadap penduduk laki-laki usia kerja adalah 85.4816, dan Persentase angkatan kerja perempuan terhadap penduduk perempuan usia kerja adalah 58.5784.

Sebaliknya, pada kelompok “Di atas Garis Nasional,” rata-rata Proporsi perempuan berusia 15-49 tahun yang pernah kawin dan saat melahirkan hidup pertama berusia kurang dari 20 tahun: Mengindikasikan akses terhadap pendidikan dan kesehatan reproduksi adalah 0.2115, Persentase anggota legislatif laki-laki adalah 81.2153, Persentase angkatan kerja laki-laki terhadap penduduk laki-laki usia kerja adalah 83.2549, dan Persentase angkatan kerja perempuan terhadap penduduk perempuan usia kerja adalah 55.8333. Dari hasil ini, terlihat bahwa kelompok “Di bawah Garis Nasional” cenderung memiliki nilai rata-rata yang lebih tinggi untuk variabel Proporsi perempuan berusia 15-49 tahun yang pernah kawin dan saat melahirkan hidup pertama berusia kurang dari 20 tahun: Mengindikasikan akses terhadap pendidikan dan kesehatan reproduksi, Persentase angkatan kerja laki-laki terhadap penduduk laki-laki usia kerja, dan Persentase angkatan kerja perempuan terhadap penduduk perempuan usia kerja, sementara nilai rata-rata Persentase anggota legislatif laki-laki sedikit lebih tinggi dibandingkan kelompok “Di atas Garis Nasional.”

\[ \hat{Y}=-8,45190518X_1+0,02805003_2-0,11102263X_3-0,04079687X_4 \]

Koefisien discriminant linear pada fungsi LD1 menunjukkan sejauh mana masing-masing variabel prediktor berkontribusi dalam membedakan kedua kelompok. Variabel Proporsi perempuan berusia 15-49 tahun yang pernah kawin dan saat melahirkan hidup pertama berusia kurang dari 20 tahun: Mengindikasikan akses terhadap pendidikan dan kesehatan reproduksi memiliki koefisien paling besar, yaitu -8,452, yang menunjukkan bahwa variabel ini merupakan prediktor utama dalam membedakan antara kedua kelompok. Tanda negatif pada koefisien ini menunjukkan bahwa peningkatan nilai Proporsi perempuan berusia 15-49 tahun yang pernah kawin dan saat melahirkan hidup pertama berusia kurang dari 20 tahun: Mengindikasikan akses terhadap pendidikan dan kesehatan reproduksi cenderung mengarah pada pengelompokan ke kategori “Di bawah Garis Nasional.” Variabel lainnya, seperti Persentase anggota legislatif laki-laki (0,028), Persentase angkatan kerja laki-laki terhadap penduduk laki-laki usia kerja (-0,111), dan Persentase angkatan kerja perempuan terhadap penduduk perempuan usia kerja (-0,041), memiliki kontribusi yang lebih kecil dibandingkan Proporsi perempuan berusia 15-49 tahun yang pernah kawin dan saat melahirkan hidup pertama berusia kurang dari 20 tahun: Mengindikasikan akses terhadap pendidikan dan kesehatan reproduksi, dengan Persentase anggota legislatif laki-laki menunjukkan pengaruh yang sangat kecil namun positif.

Tabel Klasifikasi dan Ketepatan Model

ct
##                          
##                           Di bawah Garis Nasional Di atas Garis Nasional
##   Di bawah Garis Nasional                      15                      6
##   Di atas Garis Nasional                        4                     14
sum(diag(prop.table(ct)))
## [1] 0.7435897

Nilai Hit Ratio yang diperoleh adalah \[ HitRatio=\frac{15+14}{15+4+6+14}=0,7435897 \]

Dengan nilai hit ratio sebesar 0,74 atau 74%, dapat diinterpretasikan bahwa model diskriminan memiliki tingkat akurasi yang cukup baik dalam mengklasifikasikan kategori pertumbuhan ekonomi. Hal ini menunjukkan bahwa model mampu memisahkan kelompok dengan tingkat keakuratan yang memadai, sehingga dapat digunakan sebagai dasar prediksi untuk data serupa di masa depan. Namun, beberapa kesalahan klasifikasi yang terjadi menunjukkan adanya kemungkinan faktor lain yang belum sepenuhnya dijelaskan dalam model ini.

PENUTUP

Kesimpulan

Berdasarkan nalisis yang telah dilakukan, dapat diperoleh hasil bahwa data terdapat perbedaan rata-rata dari kategori pertembuhan ekonomi, berdistribusi normal multivariat, memiliki matriks ragam peragam yang homogen. Kemudian karena semua syarat dan asumsi telah terpenuhi digunakan analisis diskriminan linier. Berdasarkan fungsi diskriminan tersebut dapat disimpulkan bahwa variabel Proporsi perempuan berusia 15-49 tahun yang pernah kawin dan saat melahirkan hidup pertama berusia kurang dari 20 tahun, Persentase angkatan kerja laki-laki terhadap penduduk laki-laki usia kerja, dan Persentase angkatan kerja perempuan terhadap penduduk perempuan usia kerja berpengaruh secara negatif terhadap pertumbuhan ekonomi sedangkan Persentase anggota legislatif laki-laki tidak berpengaruh secara positif terhadap pertumbuhan ekonomi.

Hasil validasi fungsi diskriminan yang terbentuk menunjukkan bahwa fungsi tersebut akurat dan stabil. Ketepatan fungsi diskriminan adalah 74,35897% atau terdapat 4 kesalahan dalam mengklasifikasikan pertumbuhan ekonmi kelompok di bawah garis nasional dan 6 kesalahan dalam mengklasifikasi pertumbuhan ekonmi kelompok di bawah garis nasional dari 39 Kabupaten/Kota yang berada di Pulau Jawa dan Bali . Oleh karena itu dapat disimpulkan bahwa Linear Discriminant dapat membantu mengklasifikasikan kategorisasi pertumbuhan eknomi dengan baik sesuai dengan tujuan.

Saran

Berdasarkan hasil penelitian, disarankan untuk meningkatkan akses pendidikan dan kesehatan reproduksi bagi perempuan guna mengurangi angka pernikahan dini. Program edukasi yang menyasar remaja perempuan serta peningkatan layanan kesehatan reproduksi yang terjangkau dapat membantu memperbaiki indikator ketimpangan gender. Selain itu, upaya untuk meningkatkan partisipasi perempuan dalam angkatan kerja juga perlu diutamakan, dengan menciptakan lapangan kerja inklusif gender dan menghapus diskriminasi di tempat kerja. Kebijakan ini dapat mendorong pertumbuhan ekonomi yang lebih inklusif.

Peningkatan keterwakilan perempuan dalam politik juga perlu menjadi prioritas untuk menciptakan kebijakan yang responsif terhadap isu-isu gender. Pemerintah diharapkan menyusun kebijakan pembangunan berbasis data untuk mengurangi ketimpangan di berbagai daerah. Selain itu, kesadaran masyarakat mengenai pentingnya peran perempuan dalam pembangunan perlu ditingkatkan melalui kampanye dan pemberdayaan komunitas lokal. Kolaborasi antara pemerintah, masyarakat, dan sektor swasta menjadi kunci dalam mengurangi ketimpangan gender dan mendukung pertumbuhan ekonomi yang berkelanjutan.

DAFTAR PUSTAKA

Badan Pusat Statistik. (2024, Mei 13). Indeks Pembangunan Manusia 2023 (Nomor Katalog: 4102002; Nomor Publikasi: 07300.24008; ISSN: 2086-2369). Jakarta, Indonesia: Badan Pusat Statistik.

Badan Pusat Statistik. (2024, Desember 23). Indeks Ketimpangan Gender 2023 (Nomor Katalog: 2104029; Nomor Publikasi: 07300.24041). Jakarta, Indonesia: Badan Pusat Statistik.

Becker, G. S. (1981). A treatise on the family. Harvard University Press.

Cuberes, D., & Teignier, M. (2014). Gender inequality and economic growth: A critical review. Journal of International Development, 26(2), 260–276. https://doi.org/10.1002/jid.2983

Firdaus, M., Darwanto, D. H., & Mawardi, M. K. (2019). Analisis pengelompokan wilayah berdasarkan tingkat kemiskinan di Indonesia. Jurnal Ekonomi Pembangunan, 20(1), 25–37. https://doi.org/10.20885/ejem.vol20.iss1.art3

Inter-Parliamentary Union. (2023). Women in national parliaments. Retrieved from https://data.ipu.org/women-in-politics

Klasen, S. (2002). Low schooling for girls, slower growth for all? Cross-country evidence on the effect of gender inequality in education on economic development. The World Bank Economic Review, 16(3), 345–373. https://doi.org/10.1093/wber/lhf004

Nugroho, A., & Hidayat, S. (2021). Pengelompokan wilayah berdasarkan threshold pertumbuhan ekonomi: Pendekatan regresi logistik. Jurnal Ekonomi dan Kebijakan Publik, 12(2), 134–150. https://doi.org/10.22212/jekp.v12i2.3096

Todaro, M. P., & Smith, S. C. (2020). Economic development (13th ed.). Pearson Education.

UNFPA. (2021). State of the world population 2021: My body is my own. United Nations Population Fund. Retrieved from https://www.unfpa.org/publications/state-world-population-2021

Wulandari, E., Setiawan, A., & Kurniawati, S. (2020). Analisis perbandingan PDRB per kapita antarwilayah di Indonesia. Jurnal Ekonomi Regional, 5(2), 67–78. https://doi.org/10.25181/jer.v5i2.1291