Analisis ini bertujuan untuk mengevaluasi hubungan antara Produk Domestik Regional Bruto Atas Dasar Harga Konstan Menurut Lapangan Usaha dan Jumlah Penduduk Miskin di Kabupaten Lahat pada tahun 2010-2022. Metode regresi linear digunakan untuk menentukan hubungan antara kedua variabel tersebut.
# Memanggil library yang akan digunakan
library(tidyverse)
## Warning: package 'tidyverse' was built under R version 4.2.3
## Warning: package 'tibble' was built under R version 4.2.3
## Warning: package 'readr' was built under R version 4.2.3
## Warning: package 'forcats' was built under R version 4.2.3
## ── Attaching core tidyverse packages ──────────────────────── tidyverse 2.0.0 ──
## ✔ dplyr 1.1.0 ✔ readr 2.1.4
## ✔ forcats 1.0.0 ✔ stringr 1.5.0
## ✔ ggplot2 3.4.1 ✔ tibble 3.2.1
## ✔ lubridate 1.9.2 ✔ tidyr 1.3.0
## ✔ purrr 1.0.1
## ── Conflicts ────────────────────────────────────────── tidyverse_conflicts() ──
## ✖ dplyr::filter() masks stats::filter()
## ✖ dplyr::lag() masks stats::lag()
## ℹ Use the ]8;;http://conflicted.r-lib.org/conflicted package]8;; to force all conflicts to become errors
library(broom)
## Warning: package 'broom' was built under R version 4.2.3
library(MASS)
## Warning: package 'MASS' was built under R version 4.2.3
##
## Attaching package: 'MASS'
##
## The following object is masked from 'package:dplyr':
##
## select
library(dgof)
##
## Attaching package: 'dgof'
##
## The following object is masked from 'package:stats':
##
## ks.test
library(car)
## Loading required package: carData
##
## Attaching package: 'car'
##
## The following object is masked from 'package:dplyr':
##
## recode
##
## The following object is masked from 'package:purrr':
##
## some
library(lmtest)
## Warning: package 'lmtest' was built under R version 4.2.3
## Loading required package: zoo
##
## Attaching package: 'zoo'
##
## The following objects are masked from 'package:base':
##
## as.Date, as.Date.numeric
library(caret)
## Warning: package 'caret' was built under R version 4.2.3
## Loading required package: lattice
##
## Attaching package: 'caret'
##
## The following object is masked from 'package:purrr':
##
## lift
library(mctest)
library(readxl)
## Warning: package 'readxl' was built under R version 4.2.3
# Membaca file Excel
data <- read_excel("pdrb1604 vs kemiskinan.xlsx", sheet = "Sheet2")
# Menampilkan 6 baris pertama data
head(data)
Statistik deskriptif memberikan gambaran awal tentang distribusi data.
# Ringkasan statistik deskriptif
summary(data)
## Pdrb Lapus ADHK (dalam jutaan rupiah) Jumlah Penduduk Miskin (jiwa)
## Min. : 8514045 Min. :65030
## 1st Qu.: 9937386 1st Qu.:65750
## Median :10786005 Median :67700
## Mean :11024613 Mean :67893
## 3rd Qu.:12382331 3rd Qu.:70300
## Max. :13920583 Max. :71800
# Standar deviasi masing-masing variabel
sd(data$`Pdrb Lapus ADHK (dalam jutaan rupiah)`)
## [1] 1619758
sd(data$`Jumlah Penduduk Miskin (jiwa)`)
## [1] 2301.805
# Mendefinisikan variabel
x <- data$`Pdrb Lapus ADHK (dalam jutaan rupiah)`
y <- data$`Jumlah Penduduk Miskin (jiwa)`
# Membuat boxplot
par(mfrow = c(1, 2))
boxplot(x, main = "Boxplot PDRB",
sub = paste("Outlier rows: ", boxplot.stats(x)$out),
col = "darkseagreen1")
boxplot(y, main = "Boxplot Jumlah Penduduk Miskin",
sub = paste("Outlier rows: ", boxplot.stats(y)$out),
col = "darksalmon")
Berdasarkan hasil visualisasi dalam boxplot pada gambar, terlihat bahwa data PDRB dan jumlah penduduk miskin tidak memiliki pencilan (outlier). Selain itu, dapat dilihat bahwa data tersebut memiliki kecenderungan untuk menjulur ke kanan.
# Scatter plot dengan garis regresi
ggplot(data, aes(x = x, y = y)) +
geom_point() +
geom_smooth(method = "lm", se = FALSE) +
labs(
x = "PDRB",
y = "Jumlah Penduduk Miskin",
title = "Diagram Pencar PDRB dan Jumlah Penduduk Miskin"
)
## `geom_smooth()` using formula = 'y ~ x'
Berdasarkan gambar, terlihat bahwa titik-titik data membentuk pola garis yang bergerak dari sudut kanan bawah menuju ke sudut kiri atas. Hal ini mengindikasikan adanya hubungan yang linear dan negatif antara PDRB dengan jumlah penduduk miskin. Jadi, dalam konteks ini, gambar tersebut menggambarkan bahwa semakin tinggi PDRB suatu wilayah, semakin rendah kemungkinan terjadinya kemiskinan di wilayah tersebut, dan sebaliknya.
# Membuat model regresi
model <- lm(y ~ x, data = data)
# Ringkasan model
summary(model)
##
## Call:
## lm(formula = y ~ x, data = data)
##
## Residuals:
## Min 1Q Median 3Q Max
## -2594 -1720 -264 1813 2992
##
## Coefficients:
## Estimate Std. Error t value Pr(>|t|)
## (Intercept) 7.718e+04 3.843e+03 20.082 5.12e-10 ***
## x -8.420e-04 3.452e-04 -2.439 0.0329 *
## ---
## Signif. codes: 0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
##
## Residual standard error: 1937 on 11 degrees of freedom
## Multiple R-squared: 0.351, Adjusted R-squared: 0.292
## F-statistic: 5.95 on 1 and 11 DF, p-value: 0.03287
Berdasarkan pada output maka diperolehlah model persamaan regresi linear sederhananya yaitu :
𝑌=𝛽0+𝛽1𝑋
𝑌=77.175−0,0008𝑋
Model tersebut adalah suatu persamaan yang digunakan untuk memprediksi nilai Y berdasarkan nilai X. Dalam konteks ini, dapat diartikan bahwa setiap peningkatan satu unit dalam variabel X akan diikuti oleh penurunan sekitar 0.0008 unit dalam nilai Y. Sebaliknya, jika nilai X menurun satu unit, maka nilai Y kemungkinan akan naik sekitar 0.0008 unit. Koefisien intercept (77.175) mengindikasikan bahwa jika nilai X adalah nol, maka nilai Y diperkirakan akan sekitar 77.175. Ini adalah nilai Y ketika tidak ada pengaruh dari variabel X.
Nilai koefisien determinasi atau R Square sebesar 0,351 yang menunjukkan bahwa variabel PDRB memiliki pengaruh kontribusi sebesar 35,1% terhadap variabel jumlah penduduk miskin. Sedangkan sisanya, sebesar 64,9% dipengaruhi oleh variabel lain di luar model yang digunakan dalam penelitian ini.
Uji ini bertujuan untuk memverifikasi bahwa kesalahan atau residual dari model regresi memiliki distribusi yang mendekati distribusi normal. Ini merupakan salah satu asumsi fundamental dalam analisis regresi linear.
# Plot normalitas residual
plot(model, 2)
Uji Shapiro-Wilk merupakan metode untuk menguji normalitas untuk data berukuran kecil (kurang dari 30 atau kurang dari 50).
# Uji Shapiro-Wilk
shapiro.test(model$residuals)
##
## Shapiro-Wilk normality test
##
## data: model$residuals
## W = 0.93385, p-value = 0.3824
Dari hasil tersebut diperoleh p-value = 0.3824 > 0.05. Dengan demikian, dapat disimpulkan bahwa residual berdistribusi normal.
Uji homoskedastisitas digunakan untuk mengevaluasi apakah varians atau ketidakseragaman dari kesalahan atau residual dalam model statistik tetap konstan atau homogen, sehingga memastikan bahwa asumsi klasik homoskedastisitas terpenuhi. Dalam konteks analisis regresi, uji homoskedastisitas dilakukan untuk memverifikasi bahwa varians residual atau kesalahan pada setiap nilai prediksi berfluktuasi dan tetap konsisten.
# Breusch-Pagan test
bptest(model)
##
## studentized Breusch-Pagan test
##
## data: model
## BP = 0.99147, df = 1, p-value = 0.3194
Dari hasil tersebut, diperoleh p = 0.3194 > 0.05, menunjukkan bahwa data dalam kondisi homoskedastisitas. Dengan demikian, asumsi homoskedastisitas terpenuhi.
Hipotesis untuk uji signifikansi variabel adalah sebagai berikut.
H0 : Tidak ada pengaruh antara PDRB terhadap jumlah penduduk miskin di Kabupaten Lahat pada tahun 2010-2022
H1 : Ada pengaruh antara PDRB terhadap jumlah penduduk miskin di Kabupaten Lahat pada tahun 2010-2022
summary(model)$coefficients
## Estimate Std. Error t value Pr(>|t|)
## (Intercept) 7.717539e+04 3.84309e+03 20.08160 5.115889e-10
## x -8.419626e-04 3.45170e-04 -2.43927 3.286525e-02
Dari persamaan regresi linear sederhana di atas, p-value diperoleh sebesar 0,0329. Nilai ini lebih rendah dari alpha (α) yang ditetapkan sebesar 0,05. Dengan demikian, tolak hipotesis nol (H0) dan terima hipotesis alternatif pertama (H1). Ini dapat diartikan bahwa variabel PDRB (X) memiliki pengaruh yang signifikan terhadap tingkat Kemiskinan (Y). Dengan demikian, dapat disimpulkan bahwa “PDRB memiliki pengaruh yang signifikan pada tingkat kemiskinan di Kabupaten Lahat.”
Hasil penelitian menunjukkan bahwa variabel PDRB memiliki pengaruh yang signifikan terhadap variabel jumlah penduduk miskin dengan nilai koefisien determinasi sebesar 0,351, yang berarti bahwa sekitar 35,1% dari variasi dalam tingkat kemiskinan dapat dijelaskan oleh variasi dalam PDRB. Sisanya, sebesar 64,9%, dipengaruhi oleh variabel lain yang tidak dimasukkan dalam model penelitian ini.
Selain itu, setelah dilakukan uji signifikansi variabel, dapat disimpulkan bahwa Produk Domestik Bruto (PDRB) memiliki pengaruh yang signifikan terhadap tingkat kemiskinan di Kabupaten Lahat selama periode tahun 2010-2022. Dengan kata lain, ketika PDRB mengalami peningkatan, kemungkinan besar akan terjadi penurunan tingkat kemiskinan di Kabupaten Lahat, dan sebaliknya.