A. Pendahuluan

Kemiskinan masih menjadi permasalahan struktural utama dalam pembangunan ekonomi Indonesia. Meskipun pertumbuhan ekonomi nasional menunjukkan tren positif, ketimpangan pembangunan antarwilayah serta perbedaan kualitas sumber daya manusia (SDM) menyebabkan penurunan kemiskinan tidak terjadi secara merata. Dalam konteks ekonomi modern, digitalisasi juga menjadi faktor baru yang berpotensi mempercepat inklusi ekonomi melalui peningkatan akses informasi, efisiensi pasar, dan perluasan kesempatan kerja.

Indeks Pembangunan Teknologi Informasi dan Komunikasi (IP-TIK) mencerminkan tingkat kesiapan digital suatu wilayah. Wilayah dengan tingkat digitalisasi yang lebih baik cenderung memiliki akses ekonomi yang lebih luas. Selain itu, kualitas SDM yang direpresentasikan oleh Rata-rata Lama Sekolah (RLS) berperan penting dalam meningkatkan produktivitas dan daya saing tenaga kerja. Namun, manfaat pertumbuhan dan digitalisasi dapat tereduksi apabila ketimpangan pendapatan yang diukur melalui Indeks Gini masih tinggi.

Berdasarkan kondisi tersebut, penelitian ini bertujuan untuk menganalisis pengaruh digitalisasi, kualitas SDM, dan ketimpangan pendapatan terhadap tingkat kemiskinan di Indonesia menggunakan pendekatan regresi linear berganda. http://rmarkdown.rstudio.com.

B. Data dan Variabel Penelitian

Sumber Data

Data yang digunakan merupakan data sekunder resmi Badan Pusat Statistik (BPS) dalam bentuk cross-section provinsi di Indonesia tahun 2023, yang bisa di akses di link berikut :

  1. Tingkat Kemiskinan : https://www.bps.go.id/subject/23/kemiskinan.html

  2. Indeks Pembangunan TIK (IP-TIK) : https://www.bps.go.id/subject/27/teknologi-informasi-dan-komunikasi.html

  3. Rata-rata Lama Sekolah (RLS) : https://www.bps.go.id/subject/28/pendidikan.html

  4. Indeks Gini : https://www.bps.go.id/subject/23/kemiskinan-dan-ketimpangan.html

Definisi Variabel

Variabel Keterangan Skala
Y Tingkat Kemiskinan (%) Rasio
X₁ Indeks Pembangunan TIK Rasio
X₂ Rata-rata Lama Sekolah Rasio
X₃ Indeks Gini Rasio

Model Regresi

Y = β₀ + β₁X₁ + β₂X₂ + β₃X₃ + ε

dengan:

Y = Tingkat Kemiskinan (%)
X₁ = Indeks Pembangunan TIKK
X₂ = Rata-rata Lama Sekolah)
X₃ = Indeks Gini

C. Exploratory Data Analysis (EDA)

Persiapan Data

Tahap persiapan data merupakan langkah awal dalam Exploratory Data Analysis (EDA) yang bertujuan untuk memastikan bahwa data siap digunakan dalam proses analisis statistik lanjutan. Pada tahap ini, dilakukan pemanggilan beberapa library pendukung yang diperlukan untuk membaca data, melakukan visualisasi, membangun model regresi, serta melakukan pengujian asumsi klasik.

# Memanggil library yang dibutuhkan
library(readxl)
library(ggplot2)
library(car)
library(lmtest)
library(dplyr)

Tahap persiapan data ini penting untuk meminimalkan kesalahan analisis serta memastikan bahwa metode regresi linear berganda yang digunakan memenuhi asumsi-asumsi statistik yang diperlukan. Dengan memanggil seluruh library tersebut, proses eksplorasi data, analisis regresi linear berganda, serta pengujian asumsi klasik dapat dilakukan secara sistematis dan terintegrasi.

Import Data

# Membaca data Excel
data <- read_excel("DataPenelitian.xlsx")

Kode diatas digunakan untuk membaca data Excel ke dalam R pada dokumen R Markdown. File DataPenelitian.xlsx dibaca dengan fungsi read_excel() dan disimpan ke objek data, sementara pengaturan chunk memastikan kode dijalankan dan ditampilkan tanpa menampilkan pesan atau peringatan.

# Melihat struktur data
str(data)
## tibble [34 × 5] (S3: tbl_df/tbl/data.frame)
##  $ Provinsi              : chr [1:34] "Aceh" "Sumatera Utara" "Sumatera Barat" "Riau" ...
##  $ Tingkat Kemiskinan (%): num [1:34] 14.45 8.15 5.95 6.68 7.58 ...
##  $ Indeks Pembangunan TIK: num [1:34] 5.88 6.04 6.12 6.07 5.92 5.88 6.04 5.78 5.95 6.66 ...
##  $ Rata-rata Lama Sekolah: num [1:34] 9.55 9.82 9.28 9.32 8.81 ...
##  $ Indeks Gini           : num [1:34] 0.296 0.309 0.28 0.324 0.343 0.338 0.333 0.324 0.245 0.34 ...
summary(data)
##    Provinsi         Tingkat Kemiskinan (%) Indeks Pembangunan TIK
##  Length:34          Min.   : 4.250         Min.   :3.440         
##  Class :character   1st Qu.: 6.240         1st Qu.:5.765         
##  Mode  :character   Median : 8.425         Median :5.945         
##                     Mean   :10.089         Mean   :5.985         
##                     3rd Qu.:12.252         3rd Qu.:6.107         
##                     Max.   :26.030         Max.   :7.730         
##  Rata-rata Lama Sekolah  Indeks Gini   
##  Min.   : 7.150         Min.   :0.245  
##  1st Qu.: 8.160         1st Qu.:0.314  
##  Median : 8.895         Median :0.339  
##  Mean   : 8.928         Mean   :0.343  
##  3rd Qu.: 9.422         3rd Qu.:0.370  
##  Max.   :11.450         Max.   :0.449

Kode ini digunakan untuk melihat struktur dan ringkasan data. Fungsi str(data) menampilkan struktur data seperti jenis variabel dan jumlah observasi, sedangkan summary(data) menampilkan ringkasan statistik setiap variabel.

Hasil ringkasan data menunjukkan bahwa terdapat 34 provinsi sebagai unit pengamatan. Tingkat Kemiskinan (%) memiliki rata-rata sebesar 10,09% dengan nilai minimum 4,25% dan maksimum 26,03%, yang menunjukkan adanya kesenjangan tingkat kemiskinan antarprovinsi. Indeks Pembangunan TIK memiliki rata-rata 5,99, dengan nilai terendah 3,44 dan tertinggi 7,73, menandakan perbedaan tingkat pembangunan TIK yang cukup nyata. Rata-rata Lama Sekolah berada pada rata-rata 8,93 tahun, dengan rentang dari 7,15 hingga 11,45 tahun, yang mencerminkan variasi capaian pendidikan antarprovinsi. Sementara itu, Indeks Gini memiliki nilai rata-rata 0,343, dengan kisaran 0,245–0,449, yang menunjukkan tingkat ketimpangan pendapatan berada pada kategori sedang namun bervariasi antarprovinsi.

Merapikan nama variabel

data <- data %>%
  rename(
    Kemiskinan = `Tingkat Kemiskinan (%)`,
    IPTIK      = `Indeks Pembangunan TIK`,
    RLS        = `Rata-rata Lama Sekolah`,
    Gini       = `Indeks Gini`
  )

Kode tersebut digunakan untuk merapikan dan mengganti nama variabel (kolom) pada data agar lebih jelas dan deskriptif. Dengan operator pipe %>%, objek data diteruskan ke fungsi rename() untuk mengubah nama kolom, misalnya Kemiskinan menjadi Tingkat Kemiskinan (%), IPTIK menjadi Indeks Pembangunan TIK, RLS menjadi Rata-rata Lama Sekolah, dan Gini menjadi Indeks Gini, sehingga nama variabel lebih mudah dipahami dalam analisis dan pelaporan.

Statistik Deskriptif

summary(data)
##    Provinsi           Kemiskinan         IPTIK            RLS        
##  Length:34          Min.   : 4.250   Min.   :3.440   Min.   : 7.150  
##  Class :character   1st Qu.: 6.240   1st Qu.:5.765   1st Qu.: 8.160  
##  Mode  :character   Median : 8.425   Median :5.945   Median : 8.895  
##                     Mean   :10.089   Mean   :5.985   Mean   : 8.928  
##                     3rd Qu.:12.252   3rd Qu.:6.107   3rd Qu.: 9.422  
##                     Max.   :26.030   Max.   :7.730   Max.   :11.450  
##       Gini      
##  Min.   :0.245  
##  1st Qu.:0.314  
##  Median :0.339  
##  Mean   :0.343  
##  3rd Qu.:0.370  
##  Max.   :0.449

Berdasarkan hasil summary(data), data terdiri dari 34 provinsi. Variabel Kemiskinan memiliki rata-rata 10,09% dengan rentang 4,25%–26,03%, menunjukkan perbedaan tingkat kemiskinan yang cukup besar antarprovinsi. IPTIK memiliki nilai rata-rata 5,99 (min 3,44, maks 7,73), yang menandakan adanya kesenjangan pembangunan TIK. Rata-rata Lama Sekolah (RLS) rata-rata sebesar 8,93 tahun, dengan kisaran 7,15–11,45 tahun, mencerminkan variasi capaian pendidikan. Sementara itu, Indeks Gini rata-rata 0,343 dengan rentang 0,245–0,449, yang menunjukkan tingkat ketimpangan pendapatan berada pada kategori sedang dan bervariasi antarprovinsi.

library(dplyr)
data %>%
  summarise(
    Kemiskinan_min = min(Kemiskinan, na.rm = TRUE),
    Kemiskinan_max = max(Kemiskinan, na.rm = TRUE),
    Kemiskinan_mean = mean(Kemiskinan, na.rm = TRUE),
    IPTIK_mean = mean(IPTIK, na.rm = TRUE),
    RLS_mean = mean(RLS, na.rm = TRUE),
    Gini_mean = mean(Gini, na.rm = TRUE)
  )
## # A tibble: 1 × 6
##   Kemiskinan_min Kemiskinan_max Kemiskinan_mean IPTIK_mean RLS_mean Gini_mean
##            <dbl>          <dbl>           <dbl>      <dbl>    <dbl>     <dbl>
## 1           4.25           26.0            10.1       5.99     8.93     0.343
  1. Varibel Kemiskinan Variabel Kemiskinan (biasanya dalam persentase) memiliki rentang data sebagai berikut: Nilai Minimum (4.25): Terdapat wilayah dengan tingkat kemiskinan terendah sebesar 4,25%. Nilai Maksimum (26.0): Terdapat wilayah dengan tingkat kemiskinan tertinggi mencapai 26,0%. Rata-rata (10.1): Secara keseluruhan, rata-rata tingkat kemiskinan dari seluruh data yang diolah adalah 10,1%.

  2. Indikator Pembangunan Lainnya (Rata-rata) Selain kemiskinan, terdapat tiga indikator lain yang dihitung nilai rata-ratanya: IPTIK_mean (5.99): Rata-rata Indeks Pembangunan Teknologi Informasi dan Komunikasi adalah 5,99. RLS_mean (8.93): Rata-rata Rata-rata Lama Sekolah (RLS) adalah 8,93 tahun. Ini menunjukkan bahwa secara rata-rata, penduduk di wilayah tersebut menempuh pendidikan hingga kelas 2 atau 3 SMP. Gini_mean (0.343): Rata-rata Rasio Gini adalah 0,343. Berdasarkan standar BPS, angka ini menunjukkan tingkat ketimpangan pengeluaran penduduk yang berada pada kategori ketimpangan rendah hingga sedang (biasanya kategori rendah adalah di bawah 0,3 dan sedang antara 0,3–0,5).

Bar Chart

library(ggplot2)

ggplot(data, aes(x = reorder(Provinsi, Kemiskinan), y = Kemiskinan)) +
  geom_bar(stat = "identity") +
  coord_flip() +
  labs(
    title = "Tingkat Kemiskinan Provinsi di Indonesia Tahun 2023",
    x = "Provinsi",
    y = "Tingkat Kemiskinan (%)"
  ) +
  theme_minimal()

Berdasarkan analisis statistik terhadap visualisasi dan ringkasan data tersebut, distribusi tingkat kemiskinan antarprovinsi di Indonesia pada tahun 2023 menunjukkan ketimpangan regional yang substansial dengan rentang nilai yang sangat lebar, yaitu dari 4,25% di wilayah dengan performa ekonomi terbaik (seperti Bali) hingga mencapai angka ekstrem 26,0% di wilayah Indonesia Timur (Papua). Secara agregat, meskipun rata-rata nasional berada pada level 10,1%, distribusi data ini cenderung menceng kanan (positive skewness) yang mengindikasikan bahwa sebagian besar provinsi sudah berhasil menekan angka kemiskinan di bawah rata-rata, namun masih terdapat beberapa wilayah “outlier” yang memerlukan perhatian khusus karena angka kemiskinannya jauh melampaui median. Fenomena ini secara statistik beriringan dengan tingkat ketimpangan pengeluaran yang berada pada kategori sedang (Gini Ratio 0,343) serta capaian kualitas sumber daya manusia yang tercermin dari Rata-rata Lama Sekolah (RLS) sebesar 8,93 tahun, yang memberikan sinyal kuat bahwa strategi pengentasan kemiskinan harus diintegrasikan dengan peningkatan akses pendidikan dan pemerataan infrastruktur digital (IPTIK) untuk memperkecil gap pembangunan antarwilayah tersebut.

Scatter Plot IP-TIK vs Kemiskinan

ggplot(data, aes(x = IPTIK, y = Kemiskinan)) +
  geom_point(color = "steelblue", size = 2) +
  geom_smooth(method = "lm", se = FALSE, color = "black") +
  labs(
    title = "Scatter Plot IP-TIK terhadap Tingkat Kemiskinan",
    x = "Indeks Pembangunan TIK",
    y = "Tingkat Kemiskinan (%)"
  ) +
  theme_minimal()

Scatter plot tersebut menunjukkan adanya korelasi negatif antara Indeks Pembangunan TIK (IP-TIK) dan Tingkat Kemiskinan, yang terlihat dari garis regresi hitam yang melandai ke bawah seiring meningkatnya nilai pada sumbu X. Hal ini mengindikasikan bahwa daerah dengan pembangunan teknologi informasi dan komunikasi yang lebih maju cenderung memiliki tingkat kemiskinan yang lebih rendah, yang mungkin disebabkan oleh kemudahan akses informasi dan efisiensi ekonomi digital. Meskipun sebaran data menunjukkan variabilitas yang cukup tinggi pada rentang IP-TIK 5,5 hingga 6,5—termasuk adanya satu pencilan signifikan di sisi kiri dengan IP-TIK rendah namun tingkat kemiskinan sangat tinggi—secara keseluruhan grafik ini mengesankan bahwa penguatan infrastruktur TIK dapat menjadi salah satu pendorong dalam upaya pengentasan kemiskinan.

Scatter Plot RLS vs Kemiskinan

ggplot(data, aes(x = RLS, y = Kemiskinan)) +
  geom_point(size = 2) +
  geom_smooth(method = "lm", se = FALSE) +
  labs(
    title = "Scatter Plot Rata-rata Lama Sekolah terhadap Tingkat Kemiskinan",
    x = "Rata-rata Lama Sekolah (Tahun)",
    y = "Tingkat Kemiskinan (%)"
  ) +
  theme_minimal()

terdapat hubungan korelasi negatif antara Rata-rata Lama Sekolah (RLS) dan Tingkat Kemiskinan, yang ditunjukkan oleh garis regresi yang menurun ke arah kanan. Hal ini mengindikasikan bahwa semakin tinggi tingkat pendidikan masyarakat di suatu daerah, maka tingkat kemiskinannya cenderung semakin rendah. Meskipun terdapat beberapa titik data yang menyimpang dari garis (seperti pencilan dengan tingkat kemiskinan sangat tinggi di angka pendidikan rendah), tren umum menunjukkan bahwa peningkatan durasi pendidikan berkontribusi secara signifikan terhadap upaya pengurangan angka kemiskinan.

Scatter Plot Indeks Gini vs Tingkat Kemiskinan

ggplot(data, aes(x = Gini, y = Kemiskinan)) +
  geom_point(size = 2) +
  geom_smooth(method = "lm", se = FALSE) +
  labs(
    title = "Scatter Plot Indeks Gini terhadap Tingkat Kemiskinan",
    x = "Indeks Gini",
    y = "Tingkat Kemiskinan (%)"
  ) +
  theme_minimal()

Interpretasi untuk Scatter Plot Indeks Gini terhadap Tingkat Kemiskinan menunjukkan adanya korelasi positif yang sangat lemah atau hampir tidak signifikan, yang ditandai dengan garis regresi berwarna biru yang cenderung mendatar. Hal ini mengindikasikan bahwa variasi dalam ketimpangan pengeluaran (Indeks Gini) tidak secara langsung atau kuat menjelaskan perubahan pada tingkat kemiskinan di daerah-daerah tersebut. Sebaran titik data yang sangat acak dan jauh dari garis regresi mencerminkan adanya variabilitas yang tinggi, di mana terdapat daerah dengan Indeks Gini rendah namun memiliki tingkat kemiskinan tinggi, serta sebaliknya, sehingga faktor ketimpangan ekonomi dalam data ini bukan merupakan prediktor utama bagi tingkat kemiskinan.

D. Metode Analisis

Regresi Linear Berganda

Metode analisis yang digunakan dalam penelitian ini adalah regresi linear berganda, yaitu suatu pendekatan statistik yang bertujuan untuk menganalisis pengaruh lebih dari satu variabel independen terhadap satu variabel dependen secara simultan. Metode ini dipilih karena penelitian ini melibatkan tiga variabel bebas, yaitu Indeks Pembangunan Teknologi Informasi dan Komunikasi (IP-TIK), Rata-rata Lama Sekolah (RLS), dan Indeks Gini, yang diduga secara bersama-sama memengaruhi Tingkat Kemiskinan (%) sebagai variabel terikat.

Estimasi parameter model dilakukan menggunakan metode Ordinary Least Squares (OLS), yaitu metode yang meminimalkan jumlah kuadrat galat (residual) antara nilai aktual dan nilai prediksi variabel dependen. Metode OLS dipilih karena bersifat efisien dan menghasilkan estimator yang tidak bias selama asumsi-asumsi klasik regresi terpenuhi.

Uji Asumsi Klasik

Agar hasil estimasi regresi linear berganda bersifat BLUE (Best Linear Unbiased Estimator), diperlukan pengujian terhadap asumsi-asumsi klasik regresi. Uji asumsi klasik yang dilakukan dalam penelitian ini meliputi uji normalitas, uji multikolinearitas, uji heteroskedastisitas, dan uji autokorelasi.

  1. Uji Normalitas

Uji normalitas dilakukan untuk mengetahui apakah residual dari model regresi berdistribusi normal. Normalitas residual penting karena memengaruhi validitas pengujian statistik, khususnya uji t dan uji F. Dalam penelitian ini, uji normalitas dilakukan menggunakan uji Shapiro–Wilk. Kriteria pengambilan keputusan adalah sebagai berikut: Jika nilai p-value > 0,05, maka residual berdistribusi normal. Jika nilai p-value ≤ 0,05, maka residual tidak berdistribusi normal. Apabila residual berdistribusi normal, maka model regresi dapat digunakan untuk pengujian inferensial secara valid.

  1. Uji Multikolinearitas

Uji multikolinearitas bertujuan untuk mengetahui apakah terdapat korelasi yang tinggi antarvariabel independen dalam model regresi. Multikolinearitas yang tinggi dapat menyebabkan koefisien regresi menjadi tidak stabil dan sulit diinterpretasikan. Pengujian multikolinearitas dalam penelitian ini dilakukan menggunakan Variance Inflation Factor (VIF). Kriteria pengambilan keputusan adalah: Jika nilai VIF < 10, maka tidak terjadi multikolinearitas. Jika nilai VIF ≥ 10, maka terdapat indikasi multikolinearitas. Apabila tidak ditemukan multikolinearitas, maka masing-masing variabel independen dapat menjelaskan pengaruhnya terhadap variabel dependen secara lebih akurat.

  1. Uji Heteroskedastisitas

Uji heteroskedastisitas dilakukan untuk mengetahui apakah varians residual bersifat konstan pada seluruh pengamatan. Model regresi yang baik mensyaratkan tidak terjadinya heteroskedastisitas atau dengan kata lain residual bersifat homoskedastik. Dalam penelitian ini, uji heteroskedastisitas dilakukan menggunakan uji Breusch–Pagan. Kriteria pengambilan keputusan: Jika nilai p-value > 0,05, maka tidak terjadi heteroskedastisitas. Jika nilai p-value ≤ 0,05, maka terjadi heteroskedastisitas. Apabila tidak terdapat heteroskedastisitas, maka model regresi memenuhi salah satu asumsi penting OLS.

  1. Uji Autokorelasi Uji autokorelasi bertujuan untuk menguji apakah terdapat korelasi antara residual pada satu observasi dengan observasi lainnya. Meskipun data yang digunakan dalam penelitian ini bersifat cross-section, pengujian autokorelasi tetap dilakukan sebagai langkah kehati-hatian. Uji autokorelasi dilakukan menggunakan Durbin–Watson test. Kriteria pengambilan keputusan: Nilai statistik Durbin–Watson mendekati 2 menunjukkan tidak adanya autokorelasi. Nilai Durbin–Watson jauh di bawah 2 menunjukkan autokorelasi positif. Nilai Durbin–Watson jauh di atas 2 menunjukkan autokorelasi negatif. Hasil uji yang menunjukkan tidak adanya autokorelasi menandakan bahwa residual bersifat independen.

E. Hasil dan Pembahasan

REGRESI LINEAR BERGANDA

# Membentuk model regresi linear berganda
model <- lm(Kemiskinan ~ IPTIK + RLS + Gini, data = data)

# Ringkasan hasil regresi
summary(model)
## 
## Call:
## lm(formula = Kemiskinan ~ IPTIK + RLS + Gini, data = data)
## 
## Residuals:
##     Min      1Q  Median      3Q     Max 
## -5.1580 -2.4295 -0.7748  1.4406  8.0952 
## 
## Coefficients:
##             Estimate Std. Error t value Pr(>|t|)    
## (Intercept)  30.5637     7.7141   3.962 0.000424 ***
## IPTIK        -6.9983     1.6209  -4.318 0.000158 ***
## RLS           0.8514     1.1014   0.773 0.445546    
## Gini         40.2707    15.1506   2.658 0.012480 *  
## ---
## Signif. codes:  0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
## 
## Residual standard error: 3.694 on 30 degrees of freedom
## Multiple R-squared:  0.5384, Adjusted R-squared:  0.4922 
## F-statistic: 11.66 on 3 and 30 DF,  p-value: 3.104e-05

Berdasarkan hasil analisis regresi linear berganda dan visualisasi data yang Anda berikan, berikut adalah interpretasi komprehensif mengenai faktor-faktor yang memengaruhi tingkat kemiskinan:

  1. Analisis Model Regresi (Goodness of Fit) Secara keseluruhan, model ini memiliki nilai Adjusted R-squared sebesar 0,4922. Hal ini berarti variabel IP-TIK, RLS, dan Indeks Gini secara bersama-sama mampu menjelaskan sekitar 49,2% variasi dari Tingkat Kemiskinan, sedangkan sisanya dipengaruhi oleh faktor lain di luar model. Nilai p-value uji F sebesar \(3,104 \times 10^{-5}\) (jauh di bawah 0,05) menunjukkan bahwa model ini signifikan secara statistik untuk digunakan.

  2. Interpretasi Variabel Secara Parsial Berdasarkan koefisien regresi, kita dapat melihat pengaruh masing-masing variabel:Indeks Pembangunan TIK (IP-TIK): Merupakan faktor paling dominan dan signifikan secara statistik (p-value = 0,000158). Koefisien negatif sebesar -6,9983 menunjukkan bahwa setiap kenaikan satu poin IP-TIK akan menurunkan tingkat kemiskinan sebesar 6,99%. Hal ini didukung oleh scatter plot yang menunjukkan tren penurunan yang sangat tajam dan konsisten.Indeks Gini: Memiliki pengaruh positif yang signifikan secara statistik (p-value = 0,012480). Koefisien sebesar 40,2707 berarti peningkatan ketimpangan (Gini) akan meningkatkan tingkat kemiskinan secara drastis. Meskipun pada scatter plot hubungannya terlihat lemah secara visual, dalam model berganda variabel ini terbukti menjadi pendorong kemiskinan yang nyata.Rata-rata Lama Sekolah (RLS): Secara mengejutkan, dalam model berganda ini RLS memiliki p-value sebesar 0,445546 yang berarti tidak signifikan secara statistik dalam memengaruhi kemiskinan jika variabel IP-TIK dan Gini sudah diperhitungkan.

Uji Normalitas Residual (Shapiro–Wilk)

# Mengambil residual
residual_model <- residuals(model)

# Uji normalitas
shapiro.test(residual_model)
## 
##  Shapiro-Wilk normality test
## 
## data:  residual_model
## W = 0.93741, p-value = 0.05165

Uji normalitas residual dilakukan untuk mengetahui apakah residual pada model regresi linear berganda berdistribusi normal. Normalitas residual merupakan salah satu asumsi penting dalam analisis regresi linear berganda agar hasil estimasi parameter dan pengujian hipotesis bersifat valid.

Berdasarkan hasil uji Shapiro–Wilk terhadap residual model regresi diperoleh nilai statistik W sebesar 0,93741 dengan nilai signifikansi (p-value) sebesar 0,05165. Nilai p-value tersebut lebih besar dari taraf signifikansi 0,05, sehingga H₀ tidak ditolak. Dengan demikian, dapat disimpulkan bahwa residual model regresi berdistribusi normal.

Oleh karena itu, asumsi normalitas residual dalam model regresi linear berganda telah terpenuhi, sehingga model regresi yang digunakan layak untuk dianalisis lebih lanjut dalam menguji pengaruh digitalisasi, kualitas sumber daya manusia, dan ketimpangan terhadap tingkat kemiskinan di Indonesia tahun 2023.

Uji Multikolinearitas (VIF)

library(car)

vif(model)
##    IPTIK      RLS     Gini 
## 2.680980 2.439841 1.188562

Berdasarkan hasil uji multikolinearitas menggunakan metode Variance Inflation Factor (VIF) pada model regresi dengan judul “Pengaruh Digitalisasi, Kualitas SDM, dan Ketimpangan terhadap Tingkat Kemiskinan di Indonesia Tahun 2023”, diperoleh nilai VIF masing-masing variabel sebagai berikut:

  1. Variabel Digitalisasi (IPTIK) memiliki nilai VIF sebesar 2,680980
  2. Variabel Kualitas Sumber Daya Manusia (RLS) memiliki nilai VIF sebesar 2,439841
  3. Variabel Ketimpangan (Gini) memiliki nilai VIF sebesar 1,188562

Seluruh nilai VIF tersebut kurang dari 10 dan juga kurang dari batas konservatif 5, sehingga dapat disimpulkan bahwa tidak terdapat masalah multikolinearitas antar variabel independen dalam model regresi.

Dengan demikian, variabel digitalisasi, kualitas sumber daya manusia, dan ketimpangan dapat digunakan secara simultan dalam model regresi linear berganda tanpa menimbulkan bias akibat hubungan linear yang kuat antar variabel bebas. Model regresi yang digunakan memenuhi asumsi multikolinearitas dan layak untuk analisis lebih lanjut.

Uji Heteroskedastisitas (Breusch–Pagan)

library(lmtest)

bptest(model)
## 
##  studentized Breusch-Pagan test
## 
## data:  model
## BP = 0.44848, df = 3, p-value = 0.9301

Berdasarkan hasil uji heteroskedastisitas menggunakan Breusch–Pagan test pada model regresi dengan judul “Pengaruh Digitalisasi, Kualitas SDM, dan Ketimpangan terhadap Tingkat Kemiskinan di Indonesia Tahun 2023”, diperoleh nilai statistik BP sebesar 0,44848 dengan derajat kebebasan (df) sebesar 3, serta nilai signifikansi (p-value) sebesar 0,9301.

Nilai p-value tersebut lebih besar dari taraf signifikansi 0,05, sehingga H₀ tidak ditolak. Hal ini menunjukkan bahwa tidak terdapat gejala heteroskedastisitas dalam model regresi yang digunakan.

Dengan demikian, dapat disimpulkan bahwa varians residual bersifat konstan (homoskedastis), sehingga model regresi linear berganda yang digunakan telah memenuhi asumsi heteroskedastisitas dan layak digunakan untuk analisis lanjutan dalam mengkaji pengaruh digitalisasi, kualitas sumber daya manusia, dan ketimpangan terhadap tingkat kemiskinan di Indonesia tahun 2023.

Uji Autokorelasi (Durbin–Watson)

dwtest(model)
## 
##  Durbin-Watson test
## 
## data:  model
## DW = 2.3317, p-value = 0.7794
## alternative hypothesis: true autocorrelation is greater than 0

Berdasarkan hasil uji autokorelasi menggunakan Durbin–Watson test pada model regresi dengan judul “Pengaruh Digitalisasi, Kualitas SDM, dan Ketimpangan terhadap Tingkat Kemiskinan di Indonesia Tahun 2023”, diperoleh nilai statistik Durbin–Watson (DW) sebesar 2,3317 dengan nilai signifikansi (p-value) sebesar 0,7794.

Nilai p-value tersebut lebih besar dari taraf signifikansi 0,05, sehingga H₀ tidak ditolak. Hal ini menunjukkan bahwa tidak terdapat autokorelasi positif pada residual model regresi.

Selain itu, nilai DW yang berada di sekitar angka 2 mengindikasikan bahwa residual bersifat acak dan saling independen. Dengan demikian, dapat disimpulkan bahwa model regresi linear berganda yang digunakan telah memenuhi asumsi autokorelasi dan layak digunakan untuk analisis lebih lanjut.

Uji Diagnostic Plot Model Regresi

par(mfrow = c(2, 2))
plot(model)

par(mfrow = c(1, 1))

Uji diagnostik model regresi dilakukan untuk memastikan bahwa model regresi linear berganda yang digunakan telah memenuhi asumsi-asumsi klasik dan tidak mengandung permasalahan yang dapat mengganggu keandalan hasil estimasi. Uji ini dilakukan melalui empat grafik diagnostik, yaitu Residuals vs Fitted, Normal Q–Q, Scale–Location, dan Residuals vs Leverage.

  1. Residuals vs Fitted Berdasarkan grafik, titik-titik residual tersebar secara acak di sekitar garis nol dan tidak membentuk pola tertentu. Garis loess (garis merah) cenderung mendatar dan tidak menunjukkan pola sistematis yang kuat. Hal ini menunjukkan bahwa hubungan antara variabel independen dan variabel dependen bersifat linear, serta tidak terdapat indikasi heteroskedastisitas yang serius pada model.

  2. Normal Q–Q Plot Berdasarkan grafik, sebagian besar titik residual mengikuti dan berada di sekitar garis diagonal, meskipun terdapat sedikit penyimpangan pada bagian ekor. Penyimpangan tersebut masih berada dalam batas yang wajar, sehingga dapat disimpulkan bahwa residual model berdistribusi mendekati normal. Hasil ini sejalan dengan uji normalitas Shapiro–Wilk yang menunjukkan bahwa asumsi normalitas telah terpenuhi.

  3. Scale–Location Berdasarkan grafik, sebaran nilai akar residual terstandarisasi relatif merata dan tidak membentuk pola kipas (funnel shape). Garis tren juga tidak menunjukkan peningkatan atau penurunan yang tajam. Hal ini mengindikasikan bahwa varians residual bersifat konstan, sehingga model regresi memenuhi asumsi homoskedastisitas. Temuan ini konsisten dengan hasil uji Breusch–Pagan yang menunjukkan tidak adanya heteroskedastisitas.

  4. Residuals vs Leverage Berdasarkan grafik, sebagian besar titik pengamatan berada di dalam batas Cook’s Distance, dan tidak terdapat titik yang melewati batas nilai 1. Meskipun terdapat beberapa observasi dengan nilai leverage relatif lebih tinggi, pengamatan tersebut masih berada dalam batas yang dapat diterima dan tidak memberikan pengaruh ekstrem terhadap model.

Kesimpulan

Berdasarkan hasil analisis regresi linear berganda, dapat disimpulkan bahwa digitalisasi, kualitas sumber daya manusia, dan ketimpangan secara simultan berpengaruh signifikan terhadap tingkat kemiskinan di Indonesia tahun 2023, yang ditunjukkan oleh nilai F-statistic sebesar 11,66 dengan p-value = 3,104 × 10⁻⁵ (< 0,05). Secara parsial, digitalisasi yang diukur melalui Indeks Pembangunan Teknologi Informasi dan Komunikasi (IPTIK) berpengaruh negatif dan signifikan terhadap tingkat kemiskinan dengan nilai koefisien regresi sebesar –6,9983 dan p-value = 0,000158, yang mengindikasikan bahwa setiap peningkatan satu satuan indeks digitalisasi mampu menurunkan tingkat kemiskinan sebesar 6,99 poin, ceteris paribus. Kualitas sumber daya manusia yang diproksikan dengan Rata-rata Lama Sekolah (RLS) memiliki koefisien regresi sebesar 0,8514, namun tidak signifikan secara statistik (p-value = 0,4455 > 0,05), sehingga peningkatan pendidikan formal pada tahun pengamatan belum berdampak langsung terhadap penurunan kemiskinan. Sementara itu, ketimpangan pendapatan yang diukur menggunakan Gini Ratio berpengaruh positif dan signifikan terhadap tingkat kemiskinan dengan koefisien regresi sebesar 40,2707 dan p-value = 0,01248, yang menunjukkan bahwa peningkatan ketimpangan secara nyata mendorong peningkatan kemiskinan. Nilai Adjusted R-squared sebesar 0,4922 menunjukkan bahwa 49,22% variasi tingkat kemiskinan di Indonesia dapat dijelaskan oleh ketiga variabel tersebut, sedangkan sisanya 50,78% dipengaruhi oleh faktor lain di luar model. Selain itu, hasil uji asumsi klasik dan uji diagnostik menunjukkan bahwa model regresi telah memenuhi asumsi normalitas, multikolinearitas, heteroskedastisitas, dan autokorelasi, sehingga hasil estimasi dapat dinyatakan valid, konsisten, dan layak dijadikan dasar dalam perumusan kebijakan pengentasan kemiskinan berbasis digitalisasi dan pengurangan ketimpangan ekonomi.

Referensi

Badan Pusat Statistik. (2023). Indeks pembangunan teknologi informasi dan komunikasi (IP-TIK) Indonesia 2023. Badan Pusat Statistik. https://www.bps.go.id

Badan Pusat Statistik. (2023). Indikator kesejahteraan rakyat Indonesia 2023. Badan Pusat Statistik. https://www.bps.go.id

Badan Pusat Statistik. (2023). Profil kemiskinan di Indonesia September 2023. Badan Pusat Statistik. https://www.bps.go.id

Gujarati, D. N., & Porter, D. C. (2009). Basic econometrics (5th ed.). McGraw-Hill Education.

Ghozali, I. (2021). Aplikasi analisis multivariate dengan program IBM SPSS 26 (10th ed.). Badan Penerbit Universitas Diponegoro.

Kutner, M. H., Nachtsheim, C. J., Neter, J., & Li, W. (2005). Applied linear statistical models (5th ed.). McGraw-Hill Irwin.

Montgomery, D. C., Peck, E. A., & Vining, G. G. (2012). Introduction to linear regression analysis (5th ed.). Wiley.