renv::restore()

## - The library is already synchronized with the lockfile.

BAB I Pendahuluan

1.1 Latar Belakang

Masalah ketenagakerjaan merupakan salah satu tantangan krusial dalam pembangunan ekonomi di Indonesia. Fokus perhatian sering kali tertuju pada angka pengangguran terbuka, namun terdapat aspek lain yang tidak kalah penting untuk diperhatikan, yaitu fenomena setengah pengangguran. Setengah pengangguran merujuk pada kondisi di mana seseorang bekerja di bawah jam kerja normal (kurang dari 35 jam seminggu), tetapi masih aktif mencari atau bersedia menerima pekerjaan tambahan. Tingginya angka setengah pengangguran mencerminkan adanya ketidakefisienan dalam penyerapan tenaga kerja dan potensi produktivitas yang belum teroptimalkan secara maksimal.

Secara teoretis, tingkat setengah pengangguran dipengaruhi oleh berbagai faktor, mulai dari kualitas sumber daya manusia hingga kondisi ekonomi makro. Salah satu faktor utama adalah aspek pendidikan, yang dalam penelitian ini diproksikan melalui Rata-Rata Lama Sekolah (RLS). Semakin tinggi durasi pendidikan formal, diharapkan individu memiliki keterampilan yang lebih spesifik sehingga dapat terserap pada sektor pekerjaan dengan jam kerja yang lebih stabil. Selain itu, Indeks Pembangunan Manusia (IPM) juga berperan sebagai indikator kualitas hidup dan akses terhadap sumber daya yang secara tidak langsung memengaruhi posisi tawar penduduk di pasar kerja.

Faktor lain yang turut menentukan adalah kondisi pertumbuhan ekonomi yang tercermin dari kebijakan upah, dalam hal ini menggunakan data Rata-Rata Upah Minimum. Perbedaan standar upah minimum antarwilayah diduga memiliki keterkaitan dengan keputusan pekerja untuk tetap berada dalam kondisi setengah pengangguran atau mencari alternatif pekerjaan lain yang lebih layak. Berdasarkan dinamika tersebut,dilakukan analisis lebih mendalam mengenai pola hubungan antara variabel-variabel tersebut. Dengan menggunakan metode Analisis Regresi Linier Berganda, analisis ini akan mengetahui seberapa besar pengaruh Rata-Rata Lama Sekolah (RLS), Indeks Pembangunan Manusia (IPM), dan Rata-Rata Upah Minimum terhadap Persentase Tingkat Setengah Pengangguran di Indonesia pada tahun 2022. Analisis ini diharapkan dapat memberikan landasan empiris bagi pembuat kebijakan dalam menangani isu ketenagakerjaan di tingkat regional.

1.2 Rumusan Masalah

Berdasarkan latar belakang tersebut, maka rumusan masalah dalam penelitian ini adalah:

Bagaimana pengaruh Rata-Rata Lama Sekolah (RLS), Indeks Pembangunan Manusia (IPM), dan Rata-Rata Upah Minimum terhadap Persentase Tingkat Setengah Pengangguran di Indonesia tahun 2022 secara simultan?
Bagaimana pengaruh masing-masing variabel secara parsial terhadap Persentase Tingkat Setengah Pengangguran?
Variabel manakah yang memberikan pengaruh paling dominan terhadap Persentase Tingkat Setengah Pengangguran?
Sejauh mana model regresi yang dihasilkan mampu menjelaskan dan memprediksi variasi nilai Persentase Tingkat Setengah Pengangguran secara akurat?
Apakah data penelitian ini telah memenuhi seluruh asumsi klasik sehingga model regresi yang dihasilkan bersifat Best Linear Unbiased Estimator (BLUE)?

1.3 Tujuan Penelitian

Tujuan yang ingin dicapai melalui penelitian ini adalah sebagai berikut:

Menganalisis dan membuktikan pengaruh Rata-Rata Lama Sekolah (RLS), Indeks Pembangunan Manusia (IPM), dan Rata-Rata Upah Minimum secara simultan (bersama-sama) terhadap Persentase Tingkat Setengah Pengangguran di Indonesia tahun 2022.
Mengetahui besarnya pengaruh masing-masing variabel independen (RLS, IPM, dan Upah Minimum) secara parsial terhadap naik-turunnya angka Setengah Pengangguran.
Mengidentifikasi variabel yang memberikan kontribusi paling dominan dalam memengaruhi kondisi setengah pengangguran di tingkat provinsi.
Mengevaluasi kemampuan dan akurasi model regresi yang dibentuk dalam menjelaskan serta memprediksi variasi nilai Persentase Tingkat Setengah Pengangguran.
Memastikan validitas hasil analisis melalui pengujian seluruh asumsi klasik guna menghasilkan estimasi parameter yang bersifat Best Linear Unbiased Estimator (BLUE).

BAB II Tinjauan Pustaka

2.1 Regresi Linear Berganda

Analisis regresi digunakan untuk mengukur seberapa besar pengaruh antara variabel bebas dan variabel terikat. Regresi linier berganda menyatakan hubungan antara dua atau lebih variabel bebas/predictor dengan satu variabel tak bebas/respon \((Y)\). Tujuan dari uji regresi linier berganda adalah untuk memprediksi nilai variabel tak bebas/respon \((Y)\) apabila nilai-nilai variabel bebas/predictor \((X_1, X_2, …,X_n)\) diketahui. Selain itu, regresi linier berganda juga digunakan untuk mengetahui bagaimanakah hubungan antara variabel tak bebas dengan variabel-variabel bebasnya. Secara matematis, persamaan umum regresi linier berganda dapat dinyatakan sebagai berikut: \[Y=β_0+β_1 X_1+β_2 X_2+⋯+β_n X_n+ε\]dimana \(Y\) merupakan variabel dependen, \(\beta_0\) adalah konstanta (intersep), \(\beta_1, \beta_2, \ldots, \beta_n\) adalah koefisien regresi untuk masing-masing variabel independen \(X_1, X_2, \ldots, X_n\), dan \(\varepsilon\) adalah komponen galat yang mencerminkan pengaruh variabel lain di luar model. Untuk mendapatkan estimasi yang akurat, parameter tersebut dihitung menggunakan metode Ordinary Least Squares (OLS) yang bekerja dengan meminimalkan jumlah kuadrat residual. Namun, sebelum hasil tersebut dapat diinterpretasikan secara valid, model harus memenuhi berbagai asumsi klasik seperti linearitas, normalitas residual, homoskedastisitas, serta bebas dari multikolinearitas dan autokorelasi.

Setelah model terbentuk dan asumsi terpenuhi, langkah selanjutnya adalah melakukan pengujian kesesuaian model. Hal ini mencakup pengujian secara parsial melalui uji t untuk melihat pengaruh individu setiap variabel, serta pengujian secara simultan melalui uji F untuk menilai apakah seluruh variabel independen secara bersama-sama memengaruhi variabel dependen. Kualitas model juga dievaluasi menggunakan koefisien determinasi (\(R^2\)) yang menunjukkan seberapa besar variasi variabel dependen mampu dijelaskan oleh variabel independen di dalam model. Secara substansial, regresi linier berganda memiliki kegunaan utama untuk prediksi dan peramalan yang aplikasinya sering kali bersinggungan dengan bidang machine learning serta untuk menyimpulkan hubungan kausalitas jika didukung oleh landasan teori dan desain penelitian yang kuat. Pada intinya, metode ini bertujuan untuk mengungkapkan pola hubungan yang kompleks dalam kumpulan data tetap guna memberikan gambaran analitis yang mendalam.

2.2 Uji Asumsi Klasik

Pengujian asumsi klasik merupakan tahapan krusial dalam analisis regresi linier berganda untuk memastikan bahwa model yang dibentuk layak digunakan dalam penarikan kesimpulan. Tujuan utama dari pengujian ini adalah untuk mengevaluasi apakah model telah memenuhi asumsi dasar yang mendasari metode estimasi, sehingga hasil parameter dan pengujian hipotesis dapat dipercaya serta memenuhi kriteria BLUE (Best Linear Unbiased Estimator). Jika asumsi-asumsi ini dilanggar, maka estimasi parameter regresi dapat menjadi tidak efisien, bias, atau menghasilkan kesimpulan yang menyesatkan bagi peneliti.

Dalam model yang telah dibuat, residual merupakan selisih antara harga observasi dengan harga yang diprediksi oleh model \(ε_i = y_i-y ̂_i\). Dalam analisis regresi, error yang sebenarnya diasumsikan dengan variabel random berdistribusi normal independen dengan mean 0 dan varian \(σ^2\) (konstan). Secara umum, agar model regresi linier berganda dikatakan valid dan reliabel, terdapat beberapa asumsi klasik mengenai sifat residual yang harus dipenuhi, antara lain:

2.2.1 Linieritas

Uji linieritas bertujuan untuk mengetahui apakah dua variabel mempunyai hubungan yang linier atau signifikan. Uji ini digunakan sebagai prasyarat dalam analisis korelasi atau regresi linier. Uji linieritas dipenuhi jika plot-plot pada Grafik ZRESID by ZPRED Scatterplot tersebar acak dan tidak membentuk pola di sekitar garis regresi. Linearitas dalam konteks ini tidak selalu berarti hubungan harus berupa garis lurus secara absolut, melainkan model harus linear dalam parameter \(\beta\). Pelanggaran terhadap asumsi ini dapat menyebabkan kesalahan spesifikasi model (model misspecification), sehingga estimasi menjadi bias. Uji linearitas dapat dilakukan melalui pendekatan grafik seperti Residual vs Fitted Plot maupun melalui uji statistik seperti Ramsey RESET test.

2.2.2 Normalitas

Uji normalitas adalah uji yang digunakan dalam model regresi untuk menguji apakah nilai residual yang dihasilkan terdistribusi secara normal atau tidak. Model regresi yang baik adalah model regresi yang memiliki residual berdistribusi normal.

Secara Visual

Model dikatakan linier jika plot antara residual terstandardisasi dengan nilai prediksi perstandardisasi pada grafik Normal Q-Q Plot of Unstandardized Residual tidak tersebar secara acak, membentuk pola tertentu, dan mengikuti garis linier.
Secara formal
- Hipotesis
  
  \(H_0\) : residual data berdistribusi normal
  
  \(H_1\) : residual data tidak berdistribusi normal
- Taraf Signifikansi : \(α\)
- Statistik Uji : Menggunakan nilai Sig. pada Kolmogorov-Smirnov jika jumlah data \(> 50\) dan menggunakan nilai Sig. pada Shapiro-Wilk jika jumlah data \(≤ 50\). Pada perhitungan SPSS dan R dapat dilihat pada nilai Sig. di tabel Test of Normality.
- Daerah Kritis : \(H_0\) ditolak jika nilai sig. < \(α\).

2.2.3 Homoskedastisitas

Uji homoskedastisitas bertujuan untuk melihat apakah residual dari model yang terbentuk memiliki varians yang konstan atau tidak. Prasyarat yang harus terpenuhi dalam model regresi adalah tidak adanya gejala heteroskedastisitas agar uji t dan uji F tetap akurat. Sifat homoskedastisitas yaitu ragam dari nilai residual bersifat konstan/identik. Uji ini terpenuhi secara visual ketika plot-plot pada Grafik SRESID by ZPRED Scatterplot tersebar secara acak dan tidak membentuk pola tertentu.

2.2.4 Non-Autokorelasi

Uji Non Autokorelasi digunakan untuk mengetahui ada atau tidaknya penyimpangan asumsi klasik autokorelasi, yaitu korelasi yang terjadi antara residual pada satu pengamatan dengan pengamatan yang lain. Prasyarat yang harus dipenuhi adalah tidak adanya autokorelasi dalam model regresi. Metode pengujian yang sering digunakan adalah dengan uji Durbin-Watson (uji D-W).

Hipotesis

\(H_0\) : tidak ada autokorelasi

\(H_1\) : ada autokorelasi
Taraf Signifikansi : α
Statistik Uji \[d = \frac{\sum_{i=1}^{n} (e_i - e_{i-1})^2}{\sum_{i=1}^{n} e_i^2}\]
Daerah Kritis

Tolak \(H_0\) jika nilai p-value < α

\(0 < DW < dL\) : Menolak H0, autokorelasi positif

\(dL < DW < dU\) : Ragu-ragu

\(dU < DW < 4-dU\) : Menerima H0, tidak ada autokorelasi

\(4-dU < DW < 4-dL\) : Ragu-ragu

\(4-dL < DW < 4\) : Menolak H0, autokorelasi negatif

2.2.5 Non-Multikolinearitas

Uji Non Multikolinieritas bertujuan untuk menguji apakah pada model regresi ditemukan adanya hubungan yang linier antar variabel bebas (independen). Model regresi yang baik seharusnya tidak terjadi hubungan yang linier antar variabel independen. Ada beberapa cara untuk mengetahui ada atau tidaknya multikolinieritas, salah satunya dengan memakai harga faktor inflasi varian (VIF).\[VIF_i = 1/(1-R^2_i); i = 1, 2, …, n\]. Nilai VIF yang semakin besar akan menunjukkan multikolinieritas yang kompleks. Apabila nilai VIF < 10 maka dapat disimpulkan bahwa Asumsi Non-Multikolinieritas terpenuhi dan apabila nilai VIF > 10 maka Asumsi Non-Multikolinieritas tidak terpenuhi.

2.3 Uji Signifikansi

Uji signifikansi/hipotesis digunakan untuk menguji signifikansi koefisien regresi yang diperoleh. Pengambilan keputusan hipotesis dilakukan dengan membandingkan t statistik terhadap t tabel atau nilai probabilitas terhadap taraf signifikansi yang ditetapkan.

2.3.1 Uji F

Uji F diperuntukkan guna melakukan uji hipotesis koefisien (slope) regresi secara bersamaan dan memastikan bahwa model yang dipilih layak atau tidak untuk menginterpretasikan pengaruh variabel bebas terhadap variabel terikat. Uji ini sangat penting karena apabila tidak lolos uji F, maka hasil uji t tidak relevan. Model yang baik adalah model yang cocok/layak untuk menginterpretasikan pengaruh variabel bebas terhadap variabel terikat.

Hipotesis

\(H_0 : β_0 = β_1 =…= β_k = 0\) (model tidak cocok)

\(H_1 : β_i ≠ 0\) (untuk paling sedikit satu i atau model regresi sesuai)
Taraf Signifikansi : α
Statistik Uji \[F_0 = \frac{\frac{JKR}{k}}{\frac{JKS}{n - k - 1}}\]
Daerah Kritis

\(H_0\) ditolak jika \(F_0 > F_(α,k,n-k-1)\) atau \(sig.< α\)

2.3.2 Uji t

Uji t dilakukan untuk mengetahui pengaruh dari masing-masing koefisien parameter, apakah memiliki pengaruh yang signifikan terhadap variabel dependen atau modelnya.

Hipotesis

\(H_0 : β_j= 0; j = 1, 2, …, k\) (Koefisien parameter tidak sesuai

\(H_1 : β_j ≠ 0; j = 1, 2, …, k\) (Koefisien parameter sesuai)
Taraf Signifikansi : α
Statistik Uji \[t_{hitung} = \frac{\hat{\beta}_j}{se(\hat{\beta}_j)} ; \quad se(\hat{\beta}_j) = \sqrt{var(\hat{\beta}_j)}\]
Daerah Kritis

\(H_0\) ditolak jika \(|t_hitung | > t_(α/2,n-k-1)\) atau \(sig. < α\)

2.4 Koefisien Determinasi

Nilai koefisien determinasi menggambarkan seberapa besar variasi dari variabel terikat Y dapat diterangkan oleh variabel bebas X. Model dikatakan baik jika nilai \(R^2\) mendekati 1. Nilai ini dapat dilihat pada output summary(model) pada bagian Multiple R-squared dan Adjusted R-squared. Nilai R-squared menunjukkan proporsi variasi variabel dependen yang dapat dijelaskan oleh seluruh variabel independen dalam model. Semakin besar nilainya, maka semakin baik kemampuan model dalam menjelaskan data. Sedangkan Adjusted R-squared merupakan versi yang telah disesuaikan dengan jumlah variabel dalam model.

2.5 Model Akhir

Model akhir merupakan model fit yang hanya mencakup koefisien-koefisien variabel bebas signifikan berdasarkan uji yang sudah dilakukan sebelumnya.

BAB III Metodologi

3.1 Sumber Data dan Variabel Penelitian

Data yang digunakan dalam penelitian ini merupakan data sekunder yang bersumber dari publikasi resmi Badan Pusat Statistik (BPS) Republik Indonesia untuk periode tahun 2022. Pemilihan periode ini bertujuan untuk menganalisis kondisi ketenagakerjaan dan kualitas sumber daya manusia pada tahun tersebut secara komprehensif. Objek penelitian mencakup wilayah nasional yang terdiri dari 34 provinsi di Indonesia. Penggunaan data dari BPS dilakukan atas dasar pertimbangan validitas dan reliabilitas data yang telah teruji, sehingga representatif untuk digunakan dalam pemodelan statistik. Penelitian ini melibatkan dua kategori variabel, yaitu variabel dependen dan variabel independen. Variabel dependen (\(Y\)) yang dianalisis adalah Persentase Tingkat Setengah Pengangguran, yang mencerminkan kondisi pekerja dengan jam kerja di bawah normal namun masih bersedia menerima pekerjaan tambahan. Sementara itu, variabel independen terdiri dari tiga indikator utama, yaitu Rata-Rata Lama Sekolah (RLS) sebagai \(X_1\), Indeks Pembangunan Manusia (IPM) sebagai \(X_2\), dan Rata-Rata Upah Minimum sebagai \(X_3\). Seluruh variabel tersebut diukur dalam skala rasio untuk memungkinkan analisis pengaruh dimensi pendidikan, kualitas hidup, dan upah minimum terhadap dinamika setengah pengangguran di tingkat regional secara mendalam.

3.2 Metode Analisis Data

Metode analisis utama yang digunakan dalam penelitian ini adalah Analisis Regresi Linier Berganda. Pemilihan metode ini didasarkan pada tujuan penelitian untuk menjelaskan pola hubungan dan mengukur pengaruh antara lebih dari satu variabel independen terhadap satu variabel dependen secara simultan. Dalam konteks ini, model digunakan untuk melihat sejauh mana Rata-Rata Lama Sekolah (RLS) sebagai (\(X_1\)), Indeks Pembangunan Manusia (IPM) sebagai \(X_2\), dan Rata-Rata Upah Minimum sebagai \(X_3\) mampu menjelaskan variasi pada Tingkat Setengah Pengangguran (\(Y\)). Model regresi linier berganda yang dibangun dalam penelitian ini dapat dinyatakan dalam persamaan matematis sebagai berikut: \[Y = \beta_0 + \beta_1 X_1 + \beta_2 X_2 + \beta_3 X_3+\varepsilon\]Keterangan:

\(Y\) : Tingkat Setengah Pengangguran

\(\beta_0\) : Konstanta (Intersep)

\(\beta_1,\beta_2,\beta_3\) : Koefisien regresi untuk variabel RLS, IPM dan Rata-Rata Upah Minimum

\(X_1\) : Rata-Rata Lama Sekolah (RLS)

\(X_2\) : Indeks Pembangunan Manusia (IPM)

\(X_3\) : Rata-Rata Upah Minimum

\(\varepsilon\) : Komponen galat (error)

Estimasi parameter dalam model ini menggunakan metode Ordinary Least Squares (OLS), yang bekerja dengan meminimalkan jumlah kuadrat residual untuk menghasilkan garis regresi yang paling akurat. Agar model yang dihasilkan bersifat Best Linear Unbiased Estimator (BLUE), analisis dilanjutkan dengan pengujian asumsi klasik serta uji signifikansi parameter melalui uji t (parsial) dan uji F (simultan). Selain itu, dilakukan evaluasi ketepatan model menggunakan koefisien determinasi (\(R^2\)) untuk melihat seberapa besar variabel independen menjelaskan variasi variabel dependen. Seluruh proses perhitungan dilakukan dengan bantuan perangkat lunak statistik untuk memastikan akurasi hasil analisis.

3.3 Prosedur Analisis Data

Uji Asumsi Klasik

Sebelum melakukan interpretasi model, dilakukan serangkaian pengujian untuk memastikan model memenuhi kriteria Best Linear Unbiased Estimator (BLUE). Pengujian ini mencakup:
- Uji Linieritas: Menguji apakah hubungan antara variabel independen dan dependen bersifat linier.
- Uji Normalitas: Memastikan residual berdistribusi normal menggunakan uji Kolmogorov-Smirnov.
- Uji Homoskedastisitas: Memeriksa kesamaan varians residual guna memastikan stabilitas model.
- Uji Multikolinearitas: Mendeteksi hubungan antar variabel independen melalui nilai Variance Inflation Factor (VIF).
- Uji Non Autokorelasi: Memastikan tidak ada korelasi antar residual pada observasi yang berbeda, yang biasanya diuji menggunakan statistik Durbin-Watson .
Pengujian Signifikansi Model

Setelah model dinyatakan memenuhi asumsi, dilakukan pengujian statistik untuk membuktikan hipotesis:
- Uji F (Simultan): Menilai pengaruh AHH dan RLS secara bersama-sama terhadap IPM.
- Uji t (Parsial): Menilai pengaruh masing-masing variabel secara individu untuk menentukan variabel mana yang paling dominan.
- Koefisien Determinasi \((R^2)\): Mengukur sejauh mana variasi IPM mampu dijelaskan oleh model regresi yang dibentuk.
Interpretasi Hasil

Langkah terakhir adalah melakukan interpretasi terhadap koefisien regresi untuk memahami arah dan besaran pengaruh tiap variabel, yang kemudian diikuti dengan penarikan kesimpulan sesuai dengan tujuan penelitian.

BAB IV Hasil dan Pembahasan

4.1 Model Awal

library(readxl)
datakomlan<- read_excel("D://STATISTIKA/SEMESTER 6/Komputasi Statistika Lanjut/DATA TUGAS KOMLAN_INDIVIDU.xlsx")

head(datakomlan)

## # A tibble: 6 × 4
##       Y    X1    X2      X3
##   <dbl> <dbl> <dbl>   <dbl>
## 1 10.5   9.44  72.8 3166460
## 2  6.83  9.71  72.7 2522610
## 3  8.68  9.18  73.3 2512539
## 4  7.42  9.22  73.5 2938564
## 5  7.46  8.68  72.1 2698941
## 6  7.08  8.37  70.9 3144446

str(datakomlan)

## tibble [34 × 4] (S3: tbl_df/tbl/data.frame)
##  $ Y : num [1:34] 10.46 6.83 8.68 7.42 7.46 ...
##  $ X1: num [1:34] 9.44 9.71 9.18 9.22 8.68 ...
##  $ X2: num [1:34] 72.8 72.7 73.3 73.5 72.1 ...
##  $ X3: num [1:34] 3166460 2522610 2512539 2938564 2698941 ...

summary(datakomlan)

##        Y                X1               X2              X3         
##  Min.   : 2.710   Min.   : 7.020   Min.   :61.39   Min.   :1812935  
##  1st Qu.: 5.447   1st Qu.: 8.088   1st Qu.:70.23   1st Qu.:2435868  
##  Median : 6.795   Median : 8.835   Median :72.19   Median :2704768  
##  Mean   : 7.256   Mean   : 8.839   Mean   :71.97   Mean   :2729463  
##  3rd Qu.: 8.110   3rd Qu.: 9.360   3rd Qu.:73.22   3rd Qu.:3041814  
##  Max.   :13.300   Max.   :11.310   Max.   :81.65   Max.   :4641854

model <- lm(Y ~ X1 + X2 + X3, data = datakomlan)
summary(model)

## 
## Call:
## lm(formula = Y ~ X1 + X2 + X3, data = datakomlan)
## 
## Residuals:
##    Min     1Q Median     3Q    Max 
## -4.571 -1.349 -0.118  0.782  5.603 
## 
## Coefficients:
##               Estimate Std. Error t value Pr(>|t|)    
## (Intercept)  4.837e+01  7.508e+00   6.442 4.08e-07 ***
## X1           1.806e+00  6.774e-01   2.666   0.0122 *  
## X2          -7.334e-01  1.516e-01  -4.839 3.67e-05 ***
## X3          -1.572e-06  6.863e-07  -2.291   0.0292 *  
## ---
## Signif. codes:  0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
## 
## Residual standard error: 2.043 on 30 degrees of freedom
## Multiple R-squared:  0.5031, Adjusted R-squared:  0.4535 
## F-statistic: 10.13 on 3 and 30 DF,  p-value: 9.085e-05

Berdasarkan output R, diperoleh nilai:

\(\beta_0\) = 4.837e+01 \(\beta_1\) = 1.806e+00 \(\beta_2\) = -7.334e-01 \(\beta_3\) = -1.572e-06.

Dengan demikian, dapat dibangun model regresi awal yaitu \[\hat{Y} = (4.837e+01)+(1.806e+00)X_1-(7.334e-01)X_2-(1.572e-06)X_3\]

4.2 Uji Asumsi Klasik

4.2.1 Linieritas

Hipotesis

\(H_0\) : Terdapat hubungan yang linear

\(H_1\) : Tidak terdapat hubungan yang linear
Taraf Signifikansi α = 5%
Statistik uji

lmtest::resettest(model)

## 
##  RESET test
## 
## data:  model
## RESET = 0.32813, df1 = 2, df2 = 28, p-value = 0.723

Berdasarkan uji menggunakan Ramsey RESET (Regression Specification Reset Test), didapat nilai p-value sebesar 0.723

Daerah Kritis

Tolak \(H_0\) jika nilai sig < α
Keputusan

\(H_0\) gagal ditolak karena nilai sig (0.723) > α (0.05)
Kesimpulan

Pada taraf signifikansi α = 5%, \(H_0\) gagal ditolak karena nilai sig (0.723) > α (0.5) sehingga dapat disimpulkan bahwa terdapat hubungan yang linear antara variable \(X_1, X_2\) dan \(X_3\) dengan variabel Y.

4.2.2 Normalitas

Hipotesis

\(H_0\) : residual data berdistribusi normal

\(H_1\) : residual data tidak berdistribusi normal
Taraf Signifikansi α = 5%
Statistik uji

residuals <- resid(model)
shapiro.test(residuals)

## 
##  Shapiro-Wilk normality test
## 
## data:  residuals
## W = 0.95171, p-value = 0.1382

Berdasarkan output pada Shapiro-Wilk normality test menggunakan R Studio didapatkan nilai Shapiro-Wilk sebesar 0.95171 dengan nilai p-value sebesar 0.1382

Daerah Kritis

Tolak \(H_0\) jika nilai sig < α
Keputusan

\(H_0\) gagal ditolak karena nilai sig (0.1382) > α (0.05)
Kesimpulan

Pada taraf signifikansi α = 5%, \(H_0\) gagal ditolak karena nilai sig (0.1382) > α (0.5) sehingga residual data berdistribusi normal.

qqnorm(residuals)
qqline(residuals)

Berdasarkan Output R, dapat dilihat bahwa Normal Q-Q Plot of Unstandardized Residual mengikuti garis lurus, sehingga dapat dikatakan bahwa residual berdistribusi normal. Sehingga, dapat disimpulkan bahwa asumsi normalitas terpenuhi secara visual.

4.2.3 Homoskedastisitas

Hipotesis

\(H_0\) : Tidak terjadi gejala heteroskedastisitas (varians residual konstan)

\(H_1\) : Terdapat gejala heteroskedastisitas (varians residual tidak konstan)
Taraf Signifikansi α = 5%
Statistik Uji

glejser_test <- lm(abs(residuals(model))~X1 + X2 + X3, data = datakomlan)
summary(glejser_test)

## 
## Call:
## lm(formula = abs(residuals(model)) ~ X1 + X2 + X3, data = datakomlan)
## 
## Residuals:
##     Min      1Q  Median      3Q     Max 
## -1.3373 -0.8924 -0.2648  0.6895  3.7169 
## 
## Coefficients:
##               Estimate Std. Error t value Pr(>|t|)  
## (Intercept)  1.035e+01  4.351e+00   2.378    0.024 *
## X1          -2.712e-01  3.926e-01  -0.691    0.495  
## X2          -1.012e-01  8.783e-02  -1.152    0.258  
## X3           2.866e-07  3.977e-07   0.720    0.477  
## ---
## Signif. codes:  0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
## 
## Residual standard error: 1.184 on 30 degrees of freedom
## Multiple R-squared:  0.2197, Adjusted R-squared:  0.1416 
## F-statistic: 2.815 on 3 and 30 DF,  p-value: 0.05602

Berdasarkan output diatas, didapatkan nilai signifikansi untuk variabel \(X_1= 0.495, X_2 = 0.258\) dan \(X_3 = 0.477\)

Daerah Kritis Tolak

\(H_0\) jika nilai thitung > ttabel atau Sig. < α
Keputusan

\(H_0\) gagal ditolak karena Sig. \(X_1, X_2\), dan \(X_3 > α (0.05)\)
Kesimpulan

Pada taraf signifikansi α = 5%, \(H_0\) gagal ditolak karena Sig. \(X_1, X_2\), dan \(X_3 > α (0.05)\), sehingga dapat disimpulkan bahwa tidak terjadi gejala heteroskedastisitas atau dengan kata lain asumsi homoskedastisitas terpenuhi.

plot(model, which = 1)

Berdasarkan grafik pada output R, dapat dilihat bahwa asumsi homoskedastisitas terpenuhi secara visual karena residual menyebar secara acak dan tidak membentuk pola.

4.2.4 Non-Autokorelasi

Hipotesis

\(H_0\) : tidak ada autokorelasi

\(H_1\) : ada autokorelasi
Taraf Signifikansi α = 5%
Statistik Uji

library(lmtest)

## Loading required package: zoo

## 
## Attaching package: 'zoo'

## The following objects are masked from 'package:base':
## 
##     as.Date, as.Date.numeric

dwtest(model)

## 
##  Durbin-Watson test
## 
## data:  model
## DW = 2.0204, p-value = 0.4466
## alternative hypothesis: true autocorrelation is greater than 0

Berdasarkan ouput R, dapat dilihat bahwa nilai p-value sebesar 0.4466

Daerah Kritis

Tolak \(H_0\) jika nilai p-value < α
Keputusan

\(H_0\) gagal ditolak karena nilai p-value > α
Kesimpulan

Pada taraf signifikansi α=5%, nilai durbin watson berada pada daerah penerimaan \(H_0\) sehingga dapat disimpulkan bahwa tidak terjadi gejala autokorelasi sehingga asumsi non autokorelasi terpenuhi.

4.2.5 Non-Multiolineritas

library(car)

## Loading required package: carData

vif(model)

##       X1       X2       X3 
## 3.091546 2.764249 1.224068

Berdasarkan output R, diperoleh nilai VIF = 3.091546 < 10 untuk \(X_1\), VIF = 2.764249 < 10 untuk \(X_2\), dan VIF = 1.224068 < 10 untuk \(X_3\), sehingga asumsi non- multikolinieritas terpenuhi, maka tidak ada hubungan yang linier antara variabel \(X_1, X_2\), dan \(X_3.\)

4.3 Uji F

Hipotesis

\(H_0 :β_0 = β_1 =…= β_k = 0\) (model tidak cocok)

\(H_1 : β_i ≠ 0\) (untuk paling sedikit satu atau model regresi sesuai)
Taraf Signifikansi α = 5%
Statistik Uji

summary(model)

## 
## Call:
## lm(formula = Y ~ X1 + X2 + X3, data = datakomlan)
## 
## Residuals:
##    Min     1Q Median     3Q    Max 
## -4.571 -1.349 -0.118  0.782  5.603 
## 
## Coefficients:
##               Estimate Std. Error t value Pr(>|t|)    
## (Intercept)  4.837e+01  7.508e+00   6.442 4.08e-07 ***
## X1           1.806e+00  6.774e-01   2.666   0.0122 *  
## X2          -7.334e-01  1.516e-01  -4.839 3.67e-05 ***
## X3          -1.572e-06  6.863e-07  -2.291   0.0292 *  
## ---
## Signif. codes:  0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
## 
## Residual standard error: 2.043 on 30 degrees of freedom
## Multiple R-squared:  0.5031, Adjusted R-squared:  0.4535 
## F-statistic: 10.13 on 3 and 30 DF,  p-value: 9.085e-05

Berdasarkan ouput R, dapat dilihat bahwa nilai F sebesar 10.13 dan p-value sebesar 9.085e-05

Daerah Kritis

Tolak \(H_0\) jika nilai p-value < α
Keputusan

\(H_0\) ditolak karena nilai p-value < α
Kesimpulan

Pada taraf signifikansi α = 5%, \(H_0\) ditolak sehingga model cocok atau setidaknya paling sedikit satu model cocok sehingga model regresi dapat digunakan untuk memprediksi Y.

4.4 Uji t

Hipotesis

\(H_0 :β_j = 0\) (koefisien parameter tidak sesuai)

\(H_1 : β_i ≠ 0\) (koefisien parameter sesuai)
Taraf Signifikansi α = 5%
Statistik Uji

summary(model)

## 
## Call:
## lm(formula = Y ~ X1 + X2 + X3, data = datakomlan)
## 
## Residuals:
##    Min     1Q Median     3Q    Max 
## -4.571 -1.349 -0.118  0.782  5.603 
## 
## Coefficients:
##               Estimate Std. Error t value Pr(>|t|)    
## (Intercept)  4.837e+01  7.508e+00   6.442 4.08e-07 ***
## X1           1.806e+00  6.774e-01   2.666   0.0122 *  
## X2          -7.334e-01  1.516e-01  -4.839 3.67e-05 ***
## X3          -1.572e-06  6.863e-07  -2.291   0.0292 *  
## ---
## Signif. codes:  0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
## 
## Residual standard error: 2.043 on 30 degrees of freedom
## Multiple R-squared:  0.5031, Adjusted R-squared:  0.4535 
## F-statistic: 10.13 on 3 and 30 DF,  p-value: 9.085e-05

Berdasarkan hasil uji t, diperoleh: \(t_1\) = 2.666 dengan p-value = 0.0122 \(t_2\) = -4.839 dengan p-value = 3.67e-05 \(t_3\) = -2.291 dengan p-value = 0.0292

Daerah Kritis

Tolak \(H_0\) jika p-value \(< \alpha\)
Keputusan

\(H_0\) ditolak dan semua nilai p-value < α (0,05)
Kesimpulan

Pada taraf signifikansi \(\alpha\) = 5%, \(H_0\) ditolak dan semua nilai p-value < α (0,05) sehingga dapat disimpulkan bahwa koefisien parameter \(X_1, X_2\), dan \(X_3\) sesuai atau dapat dikatakan bahwa semua variabel X berpengaruh terhadap variabel

4.5 Koefisien Determinasi

summary(model)

## 
## Call:
## lm(formula = Y ~ X1 + X2 + X3, data = datakomlan)
## 
## Residuals:
##    Min     1Q Median     3Q    Max 
## -4.571 -1.349 -0.118  0.782  5.603 
## 
## Coefficients:
##               Estimate Std. Error t value Pr(>|t|)    
## (Intercept)  4.837e+01  7.508e+00   6.442 4.08e-07 ***
## X1           1.806e+00  6.774e-01   2.666   0.0122 *  
## X2          -7.334e-01  1.516e-01  -4.839 3.67e-05 ***
## X3          -1.572e-06  6.863e-07  -2.291   0.0292 *  
## ---
## Signif. codes:  0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
## 
## Residual standard error: 2.043 on 30 degrees of freedom
## Multiple R-squared:  0.5031, Adjusted R-squared:  0.4535 
## F-statistic: 10.13 on 3 and 30 DF,  p-value: 9.085e-05

Berdasarkan output tersebut, diperoleh nilai Multiple R-Squared sebesar 0.5031. Hal tersebut menunjukkan bahwa sebesar 50.31% variasi variabel dependen (\(Y\)) dapat dijelaskan oleh variabel independen (\(X_1\), \(X_2\), dan \(X_3\)) dalam model regresi. Sementara itu, sebesar 49.69% variasi variabel dependen (\(Y\)) dijelaskan oleh faktor lain di luar model penelitian.

4.6 Model Akhir

model <- lm(Y ~ X1 + X2 + X3, data = datakomlan)
summary(model)

## 
## Call:
## lm(formula = Y ~ X1 + X2 + X3, data = datakomlan)
## 
## Residuals:
##    Min     1Q Median     3Q    Max 
## -4.571 -1.349 -0.118  0.782  5.603 
## 
## Coefficients:
##               Estimate Std. Error t value Pr(>|t|)    
## (Intercept)  4.837e+01  7.508e+00   6.442 4.08e-07 ***
## X1           1.806e+00  6.774e-01   2.666   0.0122 *  
## X2          -7.334e-01  1.516e-01  -4.839 3.67e-05 ***
## X3          -1.572e-06  6.863e-07  -2.291   0.0292 *  
## ---
## Signif. codes:  0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
## 
## Residual standard error: 2.043 on 30 degrees of freedom
## Multiple R-squared:  0.5031, Adjusted R-squared:  0.4535 
## F-statistic: 10.13 on 3 and 30 DF,  p-value: 9.085e-05

Berdasarkan uji F, model regresi yang dibuat cocok digunakan untuk analisis lebih lanjut, kemudian dilanjutkan dengan uji t yang menyatakan bahwa model akhir tetap karena koefisien parameter signifikan terhadap Y. Sehingga model akhir sama dengan model awal yang telah dibuat yaitu \[\hat{Y} = (4.837e+01)+(1.806e+00)X_1-(7.334e-01)X_2-(1.572e-06)X_3\]

BAB V Penutup

5.1 Kesimpulan

Berdasarkan hasil analisis regresi linier berganda mengenai pengaruh Rata-Rata Lama Sekolah (\(X_1\)), Indeks Pembangunan Manusia (\(X_2\)), dan Rata-Rata Upah Minimum (\(X_3\)) terhadap Persentase Tingkat Setengah Pengangguran (\(Y\)) di Indonesia tahun 2022, dapat ditarik kesimpulan sebagai berikut:

Variabel Rata-Rata Lama Sekolah, IPM, dan Rata-Rata Upah Minimum secara bersama-sama memiliki pengaruh yang signifikan terhadap Tingkat Setengah Pengangguran di Indonesia. Hal ini dibuktikan melalui uji F dengan nilai signifikansi sebesar 0.000 atau \(9,085 \times 10^{-5}\) yang lebih kecil dari \(\alpha = 0.05\).
Ketiga variabel independen secara individu terbukti memiliki pengaruh signifikan terhadap variabel dependen karena masing-masing memiliki nilai signifikansi di bawah 0.05.
- Rata-Rata Lama Sekolah (\(X_1\)) memiliki pengaruh positif terhadap tingkat setengah pengangguran (koefisien 1.806).
- Indeks Pembangunan Manusia (\(X_2\)) memiliki pengaruh negatif terhadap tingkat setengah pengangguran (koefisien -0.733).
- Rata-Rata Upah Minimum (\(X_3\)) memiliki pengaruh negatif terhadap tingkat setengah pengangguran (koefisien -0.000001572).
Dilihat dari besaran koefisien regresi, variabel Rata-Rata Lama Sekolah(\(X_1\)) merupakan faktor yang paling kuat dalam memengaruhi variasi angka setengah pengangguran di tingkat provinsi.
Model regresi \(\hat{Y} = 48,370 + 1,806X_1 - 0,733X_2 - 0,000001572X_3\) dinyatakan cocok (fit) untuk memprediksi tingkat setengah pengangguran. Nilai koefisien determinasi (\(R^2\)) sebesar 0.503 menunjukkan bahwa model mampu menjelaskan 50.3% variasi variabel dependen, sementara 49.7% sisanya dijelaskan oleh faktor lain di luar model.
Model ini telah memenuhi seluruh kriteria Best Linear Unbiased Estimator (BLUE), yang dibuktikan dengan lolosnya uji normalitas, linearitas, homoskedastisitas, non-multikolinearitas, serta non-autokorelasi.

5.2 Saran

Pemerintah diharapkan dapat lebih fokus pada kebijakan pendidikan yang tidak hanya meningkatkan durasi sekolah, tetapi juga relevansi keterampilan lulusan dengan kebutuhan lapangan kerja agar produktivitas tenaga kerja lebih optimal. Selain itu, bagi peneliti selanjutnya, disarankan untuk menambah variabel independen lain yang lebih spesifik seperti tingkat investasi atau pertumbuhan ekonomi daerah. Penggunaan metode analisis lain, seperti regresi spasial, juga patut dipertimbangkan untuk melihat adanya keterkaitan antar-wilayah yang mungkin memengaruhi fenomena setengah pengangguran ini.

DAFTAR PUSTAKA

BPS. (2022). [Metode Baru] Indeks Pembangunan Manusia menurut Provinsi 2020-2022. Dipetik Maret 5, 2026, dari Badan Pusat Statistik: https://www.bps.go.id/indicator/26/494/1/-metode-baru-indeks- pembangunan-manusia-menurut-provinsi.html

BPS. (2022). [Metode Baru] Rata-rata Lama Sekolah (Tahun), 2021-2022. Dipetik Maret 5, 2026, dari Badan Pusat Statistik: https://www.bps.go.id/indicator/26/415/1/-metode-baru-rata-rata-lama- sekolah.html

BPS. (2022). Tingkat Setengah Pengangguran Menurut Provinsi (Persen), 2020- 2022. Dipetik Maret 5, 2026, dari Badan Pusat Statistik: https://www.bps.go.id/indicator/6/1181/1/tingkat-setengah-pengangguran- menurut-provinsi.html

KataData. (2022). Daftar Upah Minimum Provinsi Seluruh Indonesia Tahun 2022. Dipetik Maret 5, 2026, dari Databoks KataData.

Analisis Regresi Berganda Pengaruh antara Rata-Rata Lama Sekolah, Indeks Pembangunan Manusia, dan Rata-Rata Upah Minimum terhadap Tingkat Setengah Pengangguran di Indonesia Tahun 2022.

Tsuraya Safa Zerlina_24050123120012

2026-03-08