IPM menjelaskan bagaimana penduduk dapat mengakses hasil pembangunan dalam memperoleh pendapatan, kesehatan, pendidikan, dan sebagainya. IPM diperkenalkan oleh UNDP pada tahun 1990 dan dipublikasikan secara berkala dalam laporan tahunan Human Development Report (HDR).
1. Umur panjang dan hidup sehat (a long and healthy life).
2. Pengetahuan (knowledge).
3. Standar hidup layak (decent standard of living).
1. IPM merupakan indikator penting untuk mengukur keberhasilan dalam upaya membangun kualitas hidup manusia (masyarakat/penduduk).
2. IPM dapat menentukan peringkat atau level pembangunan suatu wilayah/negara.
3. Bagi Indonesia, IPM merupakan data strategis karena selain sebagai ukuran kinerja Pemerintah, IPM juga digunakan sebagai salah satu alokator penentuan Dana Alokasi Umum (DAU).
Data yang digunakan adalah IPM tahun 2017. Variabel IPM menjadi variabel respon dan sisanya adalah variabel prediktor. Terdapat 34 observasi yang merupakan data setiap provinsi yang ada di Indonesia. Berikut variabel yang digunakan.
| No | Variabel | Keterangan |
|---|---|---|
| 1 | AHH | Angka Harapan Hidup |
| 2 | EYS | Harapan Lama Sekolah |
| 3 | MYS | Rata-rata Lama Sekolah |
| 4 | Pengeluaran | Pengeluaran Perkapita |
| 5 | IPM | Indeks Pembangun Manusia |
Menampilkan data
setwd("D:/Shindy")
data <- read.csv("data.csv", sep = ";", header = TRUE)
head(data)
## AHH EYS MYS Pengeluaran IPM
## 1 69.52 14.13 8.98 8957 70.60
## 2 68.37 13.10 9.25 10036 70.57
## 3 68.78 13.94 8.72 10306 71.24
## 4 70.99 13.03 8.76 10677 71.79
## 5 70.76 12.87 8.15 9880 69.99
## 6 69.18 12.35 7.99 10220 68.86
Sumber: Badan Pusat Statistik
summary(data)
## AHH EYS MYS Pengeluaran
## Min. :64.34 Min. :10.54 Min. : 6.270 Min. : 6996
## 1st Qu.:67.66 1st Qu.:12.48 1st Qu.: 7.450 1st Qu.: 8991
## Median :69.56 Median :12.94 Median : 8.290 Median :10128
## Mean :69.41 Mean :12.97 Mean : 8.262 Mean :10275
## 3rd Qu.:70.94 3rd Qu.:13.34 3rd Qu.: 8.750 3rd Qu.:10899
## Max. :74.74 Max. :15.42 Max. :11.020 Max. :17707
## IPM
## Min. :59.09
## 1st Qu.:68.13
## Median :69.97
## Mean :69.75
## 3rd Qu.:71.10
## Max. :80.06
Didapatkan informasi bahwa rata-rata IPM 34 provinsi yang ada di Indonesia adalah 69.75 artinnya masuk dalam kategori sedang. Provinsi DKI Jakarta menjadi provinsi dengan IPM tertinggi yaitu 80.06, hal ini disebabkan karena Jakarta menjadi ibu kota negara Indonesia. Provinsi dengan IPM terndah adalah Papua, hal ini dipengaruhi oleh infrastruktur yang kurang menunjang mobilitas perekonomian dan sektor yang lain. Angka Harapan Hidup rata-rata masyarakat Indonesia 67 tahun dan untuk Harapan Lama Sekolah adalah 12 tahun yang berarti sampai SMP sederajat.
Box Plot merupakan metode grafik yang mudah digunakan dan diintepretasikan untuk memperoleh informasi dari sebuah sample. Box Plot dapat menyediakan informasi mengenai range, mean, median, kenormalan dari sebaran, dan kemiringan/kemencengan (skewness) dari sebaran.
library(RColorBrewer)
par(mfrow=c(2,3))
boxplot(data$IPM, col="pink", main="Boxplot of IPM", boxwex=0.8)
boxplot(data$AHH, col="pink", main="Boxplot of AHH", boxwex=0.8)
boxplot(data$EYS, col="pink", main="Boxplot of EYS", boxwex=0.8)
boxplot(data$MYS, col="pink", main="Boxplot of MYS", boxwex=0.8)
boxplot(data$Pengeluaran, col="pink", main="Boxplot of Pengeluaran", boxwex=0.8)
> #####Hasil visualisasi boxplot diatas menunjukkan data Indeks Pembangunan Manusia di 34 provinsi di Indonesia terdapat provinsi yang outlier artinya berbeda jauh dengan data yang lain. Empat provinsi tersebut adalah DKI Jakarta, Yogjakarta, Papua Barat dan Papua. Papua Barat dan Papua harus menjadi perhatian khusus pemerintah agar provinsi tersebut lebih sejahtera.
Kegunaan dari Histogram adalah untuk mengetahui distribusi / penyebaran data sehingga dengan demikian didapatkan informasi yang lebih banyak dari data tersebut dan akan memudahkan untuk mendapatkan kesimpulan dari data tersebut.
library(RColorBrewer)
par(mfrow=c(2,3))
hist(data$IPM, breaks=9, col="pink", main="Histogram of IPM")
hist(data$AHH, breaks=9, col="pink", main="Histogram of AHH")
hist(data$EYS, breaks=9, col="pink", main="Histogram of EYS")
hist(data$MYS, breaks=9, col="pink", main="Histogram of MYS")
hist(data$Pengeluaran, breaks=9, col="pink", main="Histogram of Pengeluaran")
Melalui histogram dapat diketahui penyebaran data masing-masing variabel. Variabel menarik untuk dibahas karena dapat dilihat sebagian besar masyarakat Indonesia pengeluaran yang dikeluarkan masih dibawah 11000.
Scatter plot aadalah alat untuk menganalisis hubungan antara dua variabel. Satu variabel diplot pada sumbu horizontal dan yang lainnya diplot pada sumbu vertikal. Scatter plot sangat berguna untuk mendeteksi korelasi (hubungan) antara dua variable, sekaligus juga memperlihatkan tingkat hubungan tersebut (kuat atau lemah). Berikut hasil Scatter plot antar variabel.
library(RColorBrewer)
library(ggplot2)
plot(data, col=brewer.pal(3,"Set1"))
Diketahui hubungan antar variabel melalui visualisasi scatter plot. Rata-rata hubungan yang terbentuk adalah positif, artinya setiap variabel yang satu mengalami kenaikan maka variabel yang lain juga mengalami kenaikan.
Korelasi antar variabel dapat diketahui melalui
\(\text{H}_0\) : Tidak ada korelasi
\(\text{H}_1\) : Ada korelasi
\(\alpha =5\%\)
library(boot)
P <- data
korelasi <- P[,c(1:5)]
cor.mat <- cor(cbind(korelasi))
cor.mat
## AHH EYS MYS Pengeluaran IPM
## AHH 1.0000000 0.2543129 0.4474504 0.5807331 0.7798437
## EYS 0.2543129 1.0000000 0.4720591 0.1958231 0.5189355
## MYS 0.4474504 0.4720591 1.0000000 0.6365602 0.8112886
## Pengeluaran 0.5807331 0.1958231 0.6365602 1.0000000 0.8716515
## IPM 0.7798437 0.5189355 0.8112886 0.8716515 1.0000000
cor.test(data$IPM, data$AHH, method="pearson")
##
## Pearson's product-moment correlation
##
## data: data$IPM and data$AHH
## t = 7.0474, df = 32, p-value = 5.444e-08
## alternative hypothesis: true correlation is not equal to 0
## 95 percent confidence interval:
## 0.5998748 0.8846996
## sample estimates:
## cor
## 0.7798437
Nilai P-value < \(\alpha =5\%\) dapat disimpulkan bahwa terdapat hubungan antara IPM dengan Angka Harapan hidup.
cor.test(data$IPM, data$EYS, method="pearson")
##
## Pearson's product-moment correlation
##
## data: data$IPM and data$EYS
## t = 3.4341, df = 32, p-value = 0.001663
## alternative hypothesis: true correlation is not equal to 0
## 95 percent confidence interval:
## 0.2192441 0.7291461
## sample estimates:
## cor
## 0.5189355
Nilai P-value < \(\alpha =5\%\) dapat disimpulkan bahwa terdapat hubungan antara IPM dengan Harapan Lama Sekolah.
cor.test(data$IPM, data$MYS, method="pearson")
##
## Pearson's product-moment correlation
##
## data: data$IPM and data$MYS
## t = 7.8498, df = 32, p-value = 5.901e-09
## alternative hypothesis: true correlation is not equal to 0
## 95 percent confidence interval:
## 0.6519988 0.9019926
## sample estimates:
## cor
## 0.8112886
Nilai P-value < \(\alpha =5\%\) dapat disimpulkan bahwa terdapat hubungan antara IPM dengan Rata-rata Lama Sekolah.
cor.test(data$IPM,data$Pengeluaran, method="pearson")
##
## Pearson's product-moment correlation
##
## data: data$IPM and data$Pengeluaran
## t = 10.06, df = 32, p-value = 1.957e-11
## alternative hypothesis: true correlation is not equal to 0
## 95 percent confidence interval:
## 0.7564628 0.9343930
## sample estimates:
## cor
## 0.8716515
Nilai P-value < \(\alpha =5\%\) dapat disimpulkan bahwa terdapat hubungan antara IPM dengan Pengeluaran Perkapita.
\(\text{H}_0\) : \(\beta_0 , \beta_1 , \beta_2 , \beta_3 , \beta_4 , \beta_5 = 0\)
\(\text{H}_1\) : \(\beta_0 , \beta_1 , \beta_2 , \beta_3 , \beta_4 , \beta_5 \neq 0\)
\(\alpha =5\%\)
model1 <- lm(IPM ~ AHH+EYS+MYS+Pengeluaran, data=data)
summary(model1)
##
## Call:
## lm(formula = IPM ~ AHH + EYS + MYS + Pengeluaran, data = data)
##
## Residuals:
## Min 1Q Median 3Q Max
## -0.9095 -0.1736 0.1219 0.1938 0.3423
##
## Coefficients:
## Estimate Std. Error t value Pr(>|t|)
## (Intercept) 9.416e-01 1.737e+00 0.542 0.592
## AHH 5.156e-01 2.629e-02 19.612 < 2e-16 ***
## EYS 1.134e+00 8.208e-02 13.814 2.76e-14 ***
## MYS 1.095e+00 8.468e-02 12.926 1.46e-13 ***
## Pengeluaran 9.022e-04 3.864e-05 23.350 < 2e-16 ***
## ---
## Signif. codes: 0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
##
## Residual standard error: 0.3208 on 29 degrees of freedom
## Multiple R-squared: 0.9945, Adjusted R-squared: 0.9938
## F-statistic: 1323 on 4 and 29 DF, p-value: < 2.2e-16
Berdasarkan output yang dihasilkan dari pengolahan data memberikan informasi bahwa nilai signifikansi (Sig.) sebesar 0.000 < \(\alpha =5\%\), artinya variabel Angka Harapan Hidup, Harapan Lama Sekolah, Rata-rata Lama Sekolah, Pengeluaran Perkapita berpengaruh signifikan terhadap Indeks Pembangunan Manusia. Nilai R Square sebesar 99,45%, artinya bahwa variabel prediktor dapat menjelaskan variabel respon secara serentak sebesar 99,45% sedangkan 0,55% dijelaskan oleh variabel lain yang tidak masuk kedalam model. Sehingga model regresi linier yang didapatkan adalah sebagai berikut.
y = 0,94 + 0,51 AHH + 0,11 EYS + 0,1 MYS + 0,0009 Pengeluaran