Pembangunan manusia merupakan aspek penting dalam mengevaluasi kualitas hidup dan kesejahteraan masyarakat. Indeks Pembangunan Manusia (IPM) digunakan sebagai indikator komprehensif untuk menggambarkan keberhasilan pembangunan suatu daerah melalui tiga dimensi utama: kesehatan, pendidikan, dan standar hidup layak. Di Provinsi Jawa Tengah, tingkat IPM antar kabupaten/kota menunjukkan variasi yang cukup signifikan, yang mengindikasikan adanya perbedaan tingkat kesejahteraan dan kualitas pembangunan antarwilayah.Penelitian ini menggunakan data kuantitatif yang bersumber dari Badan Pusat Statistik (BPS) Provinsi Jawa Tengah tahun 2024. Variabel yang dianalisis terdiri dari satu variabel dependen, yaitu Indeks Pembangunan Manusia (IPM), serta empat variabel independen: Angka Harapan Hidup (X₁), Harapan Lama Sekolah (X₂), Rata-rata Lama Sekolah (X₃), dan Pengeluaran per Kapita (X₄). Sesuai batasan masalah, penelitian ini difokuskan pada penerapan analisis regresi linier dengan menggunakan program R Markdown, yang mencakup enam tahapan utama: (1) mengumpulkan data, (2) eksplorasi data, (3) uji asumsi regresi, (4) estimasi model, (5) pengujian hipotesis, dan (6) evaluasi model. Seluruh tahapan disajikan dalam bentuk tab terpisah untuk memudahkan pemahaman alur analisis secara sistematis. Melalui penelitian ini, diharapkan diperoleh gambaran empiris mengenai kontribusi masing-masing variabel yang memengaruhi IPM, sehingga dapat menjadi bahan pertimbangan dalam perumusan kebijakan pembangunan manusia di Jawa Tengah.
Pada tahap ini seluruh variabel yang dianalisis dikumpulkan dan
dimasukkan ke dalam format yang sesuai untuk dianalisis di R.
Variabel yang dianalisis terdiri dari satu variabel dependen, yaitu
Indeks Pembangunan Manusia (IPM), dan empat variabel independen, yaitu
Angka Harapan Hidup (x1), Harapan Lama Sekolah (x2), Rata-rata Lama
Sekolah (x3), serta Pengeluaran per Kapita (x4).
Data berikut dimasukkan ke dalam R menggunakan
data.frame() agar mudah diolah pada langkah
selanjutnya.
# Input nama kab/kota
Kab_Kota <- c(
"Kabupaten Cilacap","Kabupaten Banyumas","Kabupaten Purbalingga","Kabupaten Banjarnegara",
"Kabupaten Kebumen","Kabupaten Purworejo","Kabupaten Wonosobo","Kabupaten Magelang",
"Kabupaten Boyolali","Kabupaten Klaten","Kabupaten Sukoharjo","Kabupaten Wonogiri",
"Kabupaten Karanganyar","Kabupaten Sragen","Kabupaten Grobogan","Kabupaten Blora",
"Kabupaten Rembang","Kabupaten Pati","Kabupaten Kudus","Kabupaten Jepara",
"Kabupaten Demak","Kabupaten Semarang","Kabupaten Temanggung","Kabupaten Kendal",
"Kabupaten Batang","Kabupaten Pekalongan","Kabupaten Pemalang","Kabupaten Tegal",
"Kabupaten Brebes","Kota Magelang","Kota Surakarta","Kota Salatiga","Kota Semarang",
"Kota Pekalongan","Kota Tegal"
)
# Input variabel
y = c(72.55,74.52,70.97,69.62,72.48,75.16,70.63,72.10,75.96,78.16,
79.30,72.54,78.11,75.53,72.02,71.42,72.53,74.10,77.21,74.32,
74.57,75.67,71.86,74.34,70.73,71.95,68.65,71.70,70.18,82.15,
84.41,85.72,85.24,77.21,77.50)
x1 = c(74.97,74.34,74.19,74.70,75.22,75.64,74.25,74.68,76.44,77.31,
78.01,76.82,77.91,76.18,75.25,74.92,74.98,76.56,77.07,76.21,
75.79,76.15,75.94,74.73,75.01,74.25,74.23,74.25,74.18,77.54,
77.91,78.27,78.23,74.79,75.01)
x2 = c(12.69,13.34,12.03,11.83,13.39,13.55,11.81,12.62,12.67,13.43,
13.92,12.61,13.73,12.93,12.48,12.60,12.30,12.98,13.28,12.86,
13.36,13.06,12.62,13.00,12.17,12.46,12.02,12.96,12.45,14.62,
15.07,15.46,15.57,12.89,13.25)
x3 = c(7.40,7.91,7.36,6.87,7.87,8.65,6.90,7.83,8.17,9.29,
10.01,7.68,9.26,7.88,7.29,7.26,7.73,7.82,9.35,8.27,
8.28,8.16,7.53,7.74,7.08,7.48,6.56,7.36,6.41,11.43,
11.25,11.48,11.05,9.34,9.28)
x4 = c(11868,12960,11343,10595,10176,11584,11980,10926,14195,13513,
12758,10634,12732,13890,11548,10926,11830,11829,12533,11729,
11591,13377,10519,13277,10919,11701,10017,10972,11389,13619,
16291,17096,16990,14547,14358)
# Membuat data frame lengkap
data <- data.frame(
Kab_Kota,
y, x1, x2, x3, x4
)
data## Kab_Kota y x1 x2 x3 x4
## 1 Kabupaten Cilacap 72.55 74.97 12.69 7.40 11868
## 2 Kabupaten Banyumas 74.52 74.34 13.34 7.91 12960
## 3 Kabupaten Purbalingga 70.97 74.19 12.03 7.36 11343
## 4 Kabupaten Banjarnegara 69.62 74.70 11.83 6.87 10595
## 5 Kabupaten Kebumen 72.48 75.22 13.39 7.87 10176
## 6 Kabupaten Purworejo 75.16 75.64 13.55 8.65 11584
## 7 Kabupaten Wonosobo 70.63 74.25 11.81 6.90 11980
## 8 Kabupaten Magelang 72.10 74.68 12.62 7.83 10926
## 9 Kabupaten Boyolali 75.96 76.44 12.67 8.17 14195
## 10 Kabupaten Klaten 78.16 77.31 13.43 9.29 13513
## 11 Kabupaten Sukoharjo 79.30 78.01 13.92 10.01 12758
## 12 Kabupaten Wonogiri 72.54 76.82 12.61 7.68 10634
## 13 Kabupaten Karanganyar 78.11 77.91 13.73 9.26 12732
## 14 Kabupaten Sragen 75.53 76.18 12.93 7.88 13890
## 15 Kabupaten Grobogan 72.02 75.25 12.48 7.29 11548
## 16 Kabupaten Blora 71.42 74.92 12.60 7.26 10926
## 17 Kabupaten Rembang 72.53 74.98 12.30 7.73 11830
## 18 Kabupaten Pati 74.10 76.56 12.98 7.82 11829
## 19 Kabupaten Kudus 77.21 77.07 13.28 9.35 12533
## 20 Kabupaten Jepara 74.32 76.21 12.86 8.27 11729
## 21 Kabupaten Demak 74.57 75.79 13.36 8.28 11591
## 22 Kabupaten Semarang 75.67 76.15 13.06 8.16 13377
## 23 Kabupaten Temanggung 71.86 75.94 12.62 7.53 10519
## 24 Kabupaten Kendal 74.34 74.73 13.00 7.74 13277
## 25 Kabupaten Batang 70.73 75.01 12.17 7.08 10919
## 26 Kabupaten Pekalongan 71.95 74.25 12.46 7.48 11701
## 27 Kabupaten Pemalang 68.65 74.23 12.02 6.56 10017
## 28 Kabupaten Tegal 71.70 74.25 12.96 7.36 10972
## 29 Kabupaten Brebes 70.18 74.18 12.45 6.41 11389
## 30 Kota Magelang 82.15 77.54 14.62 11.43 13619
## 31 Kota Surakarta 84.41 77.91 15.07 11.25 16291
## 32 Kota Salatiga 85.72 78.27 15.46 11.48 17096
## 33 Kota Semarang 85.24 78.23 15.57 11.05 16990
## 34 Kota Pekalongan 77.21 74.79 12.89 9.34 14547
## 35 Kota Tegal 77.50 75.01 13.25 9.28 14358
Eksplorasi data awal dilakukan untuk memahami karakteristik dasar dari setiap variabel sebelum masuk ke tahap pemodelan regresi. Tahapan ini mencakup pemeriksaan statistik deskriptif, pola hubungan antara variabel dependen dan variabel independen melalui scatterplot, serta analisis korelasi untuk melihat tingkat keeratan hubungan antar-variabel. Melalui eksplorasi ini dapat diketahui apakah data menunjukkan kecenderungan linear, adanya outlier, serta potensi multikolinearitas yang dapat memengaruhi hasil analisis regresi pada tahap berikutnya.
## Kab_Kota y x1 x2
## Length:35 Min. :68.65 Min. :74.18 Min. :11.81
## Class :character 1st Qu.:71.91 1st Qu.:74.72 1st Qu.:12.54
## Mode :character Median :74.32 Median :75.25 Median :12.93
## Mean :74.89 Mean :75.77 Mean :13.09
## 3rd Qu.:77.21 3rd Qu.:76.69 3rd Qu.:13.38
## Max. :85.72 Max. :78.27 Max. :15.57
## x3 x4
## Min. : 6.410 Min. :10017
## 1st Qu.: 7.380 1st Qu.:11158
## Median : 7.870 Median :11830
## Mean : 8.321 Mean :12463
## 3rd Qu.: 9.270 3rd Qu.:13445
## Max. :11.480 Max. :17096
par(mfrow=c(2,2))
# y vs x1
plot(data$x1, data$y,
main="Scatterplot Y vs X1",
xlab="Angka Harapan Hidup (x1)", ylab="IPM (y)",
pch=19, col="steelblue")
abline(lm(y ~ x1, data=data), col="red", lwd=2)
# y vs x2
plot(data$x2, data$y,
main="Scatterplot Y vs X2",
xlab="Harapan Lama Sekolah (x2)", ylab="IPM (y)",
pch=19, col="steelblue")
abline(lm(y ~ x2, data=data), col="red", lwd=2)
# y vs x3
plot(data$x3, data$y,
main="Scatterplot Y vs X3",
xlab="Rata-rata Lama Sekolah (x3)", ylab="IPM(y)",
pch=19, col="steelblue")
abline(lm(y ~ x3, data=data), col="red", lwd=2)
# y vs x4
plot(data$x4, data$y,
main="Scatterplot Y vs X4",
xlab="Pengeluaran per Kapita (x4)", ylab="IPM (y)",
pch=19, col="steelblue")
abline(lm(y ~ x4, data=data), col="red", lwd=2)par(mfrow=c(1,1))
# Matriks korelasi (Pearson)
cor_matrix <- cor(data[, c("y", "x1", "x2", "x3", "x4")])
cor_matrix## y x1 x2 x3 x4
## y 1.0000000 0.8321931 0.9408006 0.9747332 0.8973010
## x1 0.8321931 1.0000000 0.7841912 0.8142769 0.6075231
## x2 0.9408006 0.7841912 1.0000000 0.9195952 0.7727014
## x3 0.9747332 0.8142769 0.9195952 1.0000000 0.8090262
## x4 0.8973010 0.6075231 0.7727014 0.8090262 1.0000000
Uji asumsi regresi dilakukan untuk memastikan bahwa model regresi yang dibangun memenuhi kriteria statistik sehingga hasil analisis dapat diinterpretasikan dengan benar. Asumsi yang diperiksa meliputi: normalitas residual, homoskedastisitas (tidak terjadi heteroskedastisitas), tidak adanya multikolinearitas antarsesama variabel independen, serta tidak adanya autokorelasi pada residual. Jika seluruh asumsi terpenuhi, maka model regresi dinyatakan layak digunakan untuk analisis lebih lanjut.
##
## Call:
## lm(formula = y ~ x1 + x2 + x3 + x4, data = data)
##
## Coefficients:
## (Intercept) x1 x2 x3 x4
## 7.0150185 0.4640759 0.9210179 1.3338315 0.0007671
## x1 x2 x3 x4
## 3.134733 6.794232 9.264007 3.030677
##
## studentized Breusch-Pagan test
##
## data: model
## BP = 2.9885, df = 4, p-value = 0.5598
##
## Durbin-Watson test
##
## data: model
## DW = 1.8183, p-value = 0.2177
## alternative hypothesis: true autocorrelation is greater than 0
# 4) Normalitas residual: Shapiro-Wilk dan QQ-plot
shapiro <- shapiro.test(residuals(model))
shapiro##
## Shapiro-Wilk normality test
##
## data: residuals(model)
## W = 0.95594, p-value = 0.1723
Hasil uji asumsi menunjukkan bahwa model regresi memenuhi seluruh asumsi klasik dengan baik. Uji Shapiro–Wilk menghasilkan p-value 0.1723 yang mengindikasikan bahwa residual berdistribusi normal. Uji Durbin–Watson memperoleh p-value 0.2177 sehingga tidak terdapat autokorelasi. Nilai VIF untuk seluruh variabel berada di bawah 10 (rentang 3.03–9.26), sehingga multikolinearitas tidak menjadi masalah serius dalam model. Selain itu, uji Breusch–Pagan memberikan p-value 0.5598, menunjukkan bahwa tidak terdapat heteroskedastisitas. Dengan terpenuhinya asumsi-asumsi tersebut, model regresi dapat dinilai stabil dan layak untuk digunakan dalam analisis lebih lanjut.
Estimasi model adalah tahap untuk menghitung nilai koefisien regresi agar model dapat digunakan memprediksi variabel dependen. Estimasi ini umumnya dilakukan dengan metode Ordinary Least Squares (OLS), yaitu teknik yang paling banyak digunakan dalam analisis regresi karena sederhana dan efisien. Dalam praktiknya, estimasi dapat dilakukan langsung menggunakan fungsi lm() di R, yang secara otomatis menghitung nilai koefisien, residual, dan statistik penting lainnya. Hasil estimasi inilah yang kemudian menjadi dasar untuk uji hipotesis dan evaluasi performa model.
##
## Call:
## lm(formula = y ~ x1 + x2 + x3 + x4, data = data)
##
## Residuals:
## Min 1Q Median 3Q Max
## -0.31757 -0.09538 0.00734 0.10454 0.22751
##
## Coefficients:
## Estimate Std. Error t value Pr(>|t|)
## (Intercept) 7.0150185 2.2717799 3.088 0.00432 **
## x1 0.4640759 0.0330224 14.053 9.79e-15 ***
## x2 0.9210179 0.0700805 13.142 5.57e-14 ***
## x3 1.3338315 0.0552241 24.153 < 2e-16 ***
## x4 0.0007671 0.0000239 32.101 < 2e-16 ***
## ---
## Signif. codes: 0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
##
## Residual standard error: 0.1455 on 30 degrees of freedom
## Multiple R-squared: 0.999, Adjusted R-squared: 0.9989
## F-statistic: 7641 on 4 and 30 DF, p-value: < 2.2e-16
Hasil estimasi menunjukkan bahwa seluruh variabel independen (X1, X2, X3, dan X4) berpengaruh signifikan terhadap IPM dengan nilai p-value < 0.001. Koefisien regresi bernilai positif, menandakan bahwa peningkatan pada masing-masing variabel akan meningkatkan nilai IPM. Model regresi memiliki kemampuan prediksi yang sangat tinggi, ditunjukkan oleh nilai Adjusted R² sebesar 0.9989, yang berarti 99.89% variasi IPM dapat dijelaskan oleh keempat variabel tersebut. Uji F juga signifikan (p-value < 2.2e−16), sehingga model secara keseluruhan layak digunakan. Residual yang kecil (RSE = 0.1455) menunjukkan bahwa selisih antara nilai aktual dan nilai prediksi sangat minimal, sehingga model dapat dikatakan sangat baik.
Pengujian hipotesis dilakukan untuk memastikan apakah variabel-variabel independen dalam model memiliki pengaruh yang signifikan terhadap variabel dependen. Pengujian ini mencakup uji F, yang menilai apakah semua variabel independen secara simultan memengaruhi variabel dependen, serta uji t, yang mengevaluasi pengaruh setiap variabel secara individual. Jika nilai p-value dari uji F atau uji t lebih kecil dari tingkat signifikansi (misalnya 0.05), maka dapat disimpulkan bahwa model atau variabel tersebut berpengaruh signifikan. Pengujian ini penting untuk menentukan kelayakan model regresi serta variabel mana yang benar-benar memberikan kontribusi pada perubahan variabel dependen.
## Analysis of Variance Table
##
## Response: y
## Df Sum Sq Mean Sq F value Pr(>F)
## x1 1 448.57 448.57 21186.7 < 2.2e-16 ***
## x2 1 139.72 139.72 6599.3 < 2.2e-16 ***
## x3 1 36.97 36.97 1746.1 < 2.2e-16 ***
## x4 1 21.82 21.82 1030.4 < 2.2e-16 ***
## Residuals 30 0.64 0.02
## ---
## Signif. codes: 0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
## value numdf dendf
## 7640.643 4.000 30.000
Berdasarkan hasil uji F, model regresi berganda terbukti signifikan secara simultan dengan nilai F sebesar 7640.643 dan p-value < 2.2e-16, sehingga variabel X₁, X₂, X₃, dan X₄ secara bersama-sama berpengaruh terhadap IPM. Secara parsial, tabel estimasi koefisien menunjukkan bahwa seluruh variabel independen memiliki t-value yang besar dan p-value jauh di bawah 0,05 (X₁: t = 14.053, p = 9.79e-15; X₂: t = 13.142, p = 5.57e-14; X₃: t = 24.153, p < 2e-16; X₄: t = 32.101, p < 2e-16). Dengan p-value masing-masing variabel yang sangat kecil, H₀ ditolak untuk seluruh parameter, sehingga setiap variabel bebas terbukti berpengaruh signifikan secara parsial terhadap IPM. Dengan demikian, baik secara simultan maupun parsial, seluruh variabel X₁, X₂, X₃, dan X₄ memberikan kontribusi penting dalam menjelaskan variasi IPM di Jawa Tengah tahun 2024.
Evaluasi model dilakukan untuk menilai seberapa baik model regresi yang dibangun mampu menjelaskan variasi pada variabel dependen. Tahapan ini biasanya meliputi pemeriksaan koefisien determinasi (R² dan Adjusted R²) untuk melihat proporsi keragaman data yang dapat dijelaskan oleh model, serta Root Mean Square Error (RMSE) atau ukuran kesalahan lainnya untuk menilai ketepatan prediksi model. Selain itu, residual plot dan grafik diagnostik lainnya digunakan untuk memastikan tidak ada pola tertentu yang tertinggal pada residual. Evaluasi model sangat penting agar model yang digunakan tidak hanya signifikan secara statistik, tetapi juga akurat dan reliabel dalam menggambarkan hubungan antar-variabel.
## [1] 0.9990194
## [1] 0.9988886
## [1] 0.1347133
Berdasarkan hasil evaluasi model, nilai R-squared sebesar 0,9990 dan Adjusted R-squared sebesar 0,9989 menunjukkan bahwa model mampu menjelaskan hampir seluruh variasi IPM, sehingga kekuatan model sangat tinggi. Nilai RMSE sebesar 0,1347 menandakan bahwa kesalahan prediksi rata-rata sangat kecil. Plot diagnostik juga mendukung kelayakan mode, Residuals vs Fitted tidak menunjukkan pola khusus (linearitas terpenuhi), Scale-Location cukup datar (varians residual relatif homogen), Q-Q plot hanya menunjukkan sedikit penyimpangan pada ekor (normalitas hampir terpenuhi), dan Residuals vs Leverage tidak menunjukkan titik berpengaruh yang ekstrem. Secara keseluruhan, model bekerja sangat baik tanpa pelanggaran asumsi yang berarti.
Hasil analisis menunjukkan bahwa keempat variabel independen, yaitu Angka Harapan Hidup, Harapan Lama Sekolah, Rata-Rata Lama Sekolah, dan Pengeluaran per Kapita, memiliki hubungan positif dan signifikan terhadap Indeks Pembangunan Manusia (IPM) kabupaten/kota di Jawa Tengah tahun 2024. Model regresi yang diperoleh memiliki kemampuan prediksi yang sangat kuat, dengan nilai Adjusted R² sebesar 0,9989, yang menandakan bahwa hampir seluruh variasi IPM dapat dijelaskan oleh keempat variabel tersebut. Evaluasi diagnostik juga menunjukkan bahwa model memenuhi sebagian besar asumsi klasik regresi, sehingga hasil estimasi dapat dianggap stabil dan reliabel. Secara parsial, seluruh variabel signifikan berdasarkan uji t, dengan variabel Pengeluaran per Kapita dan Rata-Rata Lama Sekolah memberikan nilai t-value terbesar, menunjukkan kontribusi yang sangat kuat terhadap IPM, diikuti oleh Angka Harapan Hidup dan Harapan Lama Sekolah. Hasil uji F memperkuat temuan tersebut, di mana model terbukti signifikan secara simultan. Temuan ini mengindikasikan bahwa peningkatan kualitas pendidikan, kesehatan, dan kesejahteraan ekonomi merupakan faktor utama yang mendorong peningkatan IPM di Jawa Tengah. Dengan demikian, strategi pembangunan daerah perlu memprioritaskan perbaikan di ketiga sektor tersebut untuk mencapai pembangunan manusia yang lebih optimal dan berkelanjutan.