Library:
> # install.packages("knitr")
> # install.packages("rmarkdown")
> # install.packages("prettydoc")
> # install.packages("equatiomatic")
> library(knitr)
> library(rmarkdown)
> library(prettydoc)
> library(equatiomatic)Indeks Pembangunan Manusia (IPM) merupakan indikator komposit tunggal yang mengukur tiga dimensi pokok pembangunan manusia yang dinilai mampu mencerminkan kemampuan dasar (basic capabilities) penduduk (Setiawan & Hakim, 2013). Ketiga kemampuan dasar itu adalah umur panjang dan sehat, berpengetahuan dan berketerampilan, serta akses terhadap sumber daya yang dibutuhkan untuk mencapai standar hidup layak. Ketiga dimensi tersebut memiliki pengertian sangat luas karena terkait banyak faktor. Setiap indikator komponen penghitungan IPM dapat dimanfaatkan untuk mengukur capaian pembangunan kualitas hidup manusia (BPS, 2021).
Dimensi umur panjang dan hidup sehat diukur dengan indikator umur harapan hidup saat lahir. Dimensi pengetahuan diukur dengan gabungan indikator harapan lama sekolah dan rata-rata lama sekolah. Adapun untuk mengukur dimensi standar hidup layak digunakan indikator kemampuan daya beli. Kemampuan daya beli masyarakat terhadap sejumlah kebutuhan pokok yang dilihat dari rata-rata besarnya pengeluaran rill per kapita sebagai pendekatan pendapatan yang mewakili capaian pembangunan untuk standar hidup layak.
Semakin tinggi angka IPM, semakin baik kualitas hidup masyarakat di wilayah tersebut. Namun, terdapat disparitas IPM antarwilayah yang menunjukkan adanya ketimpangan pembangunan. Untuk mengatasi hal ini, diperlukan analisis yang mendalam guna mengidentifikasi faktor-faktor utama yang memengaruhi IPM dan menentukan prioritas perbaikan bagi wilayah yang tertinggal.
Indeks Pembangunan Manusia (IPM) merupakan indikator penting dalam pengukuran tingkat keberhasilan pembangunan kualitas hidup manusia (Sikana & Wijayanto, 2021). Dalam pengukuran Indeks Pembangunan Manusia (IPM), terdapat keterkaitan erat antar indikator, seperti Angka Harapan Hidup (AHH), Harapan Lama Sekolah (HLS), Rata-rata Lama Sekolah (RLS), Pengeluaran per Kapita (PK) serta Pertumbuhan. Hubungan yang kompleks ini sering kali menyebabkan tantangan dalam analisis data, terutama ketika indikator saling berkorelasi atau memiliki dimensi yang tinggi. Oleh karena itu, diperlukan metode statistik yang mampu menyederhanakan data dan menggali informasi mendalam dari struktur variabel yang ada.
Analisis Komponen Utama (Principal Component Analysis) dan Analisis Faktor (Factor Analysis) adalah dua metode yang dapat digunakan untuk mengatasi permasalahan tersebut. PCA bertujuan untuk mereduksi dimensi data dengan mengubah variabel yang saling berkorelasi menjadi sejumlah kecil komponen utama yang independen. Sementara itu, FA digunakan untuk menemukan struktur laten dalam data, dengan mengelompokkan variabel ke dalam faktor-faktor tersembunyi yang mendasari hubungan antarindikator.
Dengan menggunakan PCA dan FA, dimensi data IPM yang kompleks dapat disederhanakan, sehingga faktor-faktor utama yang berpengaruh terhadap kualitas pembangunan manusia dapat diidentifikasi. Penerapan metode ini tidak hanya membantu memahami pola dalam data, tetapi juga memungkinkan perumusan kebijakan pembangunan yang lebih efektif dan efisien.
Analisis Komponen Utama (Principal Component Analysis) adalah analisis multivariate yang mentransformasi variabelvariabel asal yang saling berkorelasi menjadi variabel-variabel baru yang tidak saling berkorelasi dengan mereduksi sejumlah variabel tersebut sehingga mempunyai dimensi yang lebih kecil namun dapat menerangkan sebagian besar keragaman variable aslinya (Rufaidah & Effindi, 2017).
Banyaknya komponen utama yang terbentuk sama dengan banyaknya variabel asli. Pereduksian (penyederhanaan) dimensi dilakukan dengan kriteria persentase keragaman data yang diterangkan oleh beberapa komponen utama pertama. Apabila beberapa komponen utama pertama telah menerangkan lebih dari 75% keragaman data asli, maka analisis cukup dilakukan sampai dengan komponen utama tersebut.
Analisis faktor yaitu suatu metode reduksi data untuk menemukan variabel baru yang disebut faktor yang jumlahnya lebih sedikit dibandingkan dengan jumlah aslinya, yang tidak berkorelasi satu sama lainnya, variabel baru tersebut memuat sebanyak mungkin informasi yang terkandung di dalam variabel asli (Puspitasari dkk., 2011)
Rumusan masalah dalam penelitian ini adalah sebagai berikut.
Bagaimana menentukan komponen utama yang dapat menjelaskan keragaman terbesar dari indikator-indikator pembangunan manusia menggunakan analisis komponen utama?
Faktor apa saja yang dapat direpresentasikan dari hubungan antarindikator pembangunan manusia menggunakan analisis Faktor (FA)?
Berdasarkan masalah yang telah dirumuskan, tujuan penelitian ini antara lain:
Menentukan jumlah faktor yang bermakna berdasarkan nilai eigen ≥ 1.
Mengidentifikasi komponen utama yang dapat menjelaskan keragaman terbesar dari indikator-indikator pembangunan manusia menggunakan PCA.
Menginterpretasikan faktor-faktor yang terbentuk berdasarkan hubungan antarindikator pembangunan manusia melalui analisis faktor.
Batasan masalah yang digunakan pada penelitian ini adalah sebagai berikut.
Data yang digunakan berasal dari data 38 Kabupaten/Kota di Jawa Timur pada tahun 2021 yang diperoleh dari situs resmi Badan Pusat Statistik (BPS) Jawa Timur yang meliputi sejumlah indikator Indeks Pembangunan Manusia (IPM), yakni Angka Harapan Hidup (AHH), Harapan Lama Sekolah (HLS), Pengeluaran per Kapita (PK), Rata-rata Lama Sekolah (RLS) dan Pembangunan.
Adapun data tersebut dapat dilihat pada tabel berikut:
Indikator Indeks Pembangunan Manusia (IPM) terdiri dari 5 indikator, yaitu:
\(X_1\) : Angka Harapan Hidup (Tahun)
\(X_2\) : Harapan Lama Sekolah (Tahun)
\(X_3\) : Pengeluaran per Kapita (Rupiah)
\(X_4\) : Rata-rata Lama Sekolah (Tahun)
\(X_5\) : Pembangunan (%)
Mengimpor data dari file excel dengan cara membaca file Excel menggunakan fungsi read_excel(), lalu menyimpannya dalam “data”
> data <- read_excel("D:/LAPRAK NAZWA/Data IPM Jawa Timur 2021.xlsx")
> data
# A tibble: 38 × 6
`Kabupaten/Kota` AHH HLS PK RLS Pertumbuhan
<chr> <dbl> <dbl> <dbl> <dbl> <dbl>
1 Kabupaten Pacitan 72.1 12.6 8887 7.61 0.26
2 Kabupaten Ponorogo 72.8 13.7 9851 7.55 0.35
3 Kabupaten Trenggalek 73.9 12.5 9743 7.56 0.46
4 Kabupaten Tulungagung 74.2 13.3 10807 8.34 0.21
5 Kabupaten Blitar 73.6 12.6 10757 7.5 0.67
6 Kabupaten Kediri 72.6 13.4 11127 8.08 0.71
7 Kabupaten Malang 72.6 13.2 10163 7.43 0.34
8 Kabupaten Lumajang 70.2 11.9 9203 6.67 0.93
9 Kabupaten Jember 69.3 13.4 9410 6.49 0.31
10 Kabupaten Banyuwangi 70.7 13.1 12217 7.42 1.08
# ℹ 28 more rows
> View(data)Digunakan untuk menampilkan struktur objek data seperti tipe data objek, jumlah elemen dalam objek, dan informasi lainnya. Struktur data digunakan untuk memastikan tipe data yang akan dianalisis sudah benar.
str(data[,2:6])
Digunakan untuk memberikan pemahaman awal mengenai data yang akan diuji. Menampilkan statistik deskriptif (informasi seperti mean, median, maksimum, minimum, dan kuartil) dari tiap variabel yang ada.
summary(data[,2:6])
Uji KMO dihitung dengan fungsi KMOS(). Menghitung kecukupan sampel keseluruhan (KMO-Criteration) dengan KMOS > 0.5 dan kecukupan sampel tiap indikator MSA > 0.5 yang menyatakan bahwa data cocok untuk dilakukan ekstraksi PCA dan PFA.
KMOS(data)
Uji Bartlett digunakan untuk memeriksa apakah terdapat korelasi antar indikator. Apabila p-value ≤ 0.05 data cocok untuk analisis faktor.
bart_spher(data_baru)
Fungsi corrplot() digunakan untuk visualisasi matriks korelasi. Fungsi ini membantu menganalisis hubungan antar indikator IPM dengan menampilkan korelasi dalam bentuk visual yang informatif.
korelasi<-cor(data_baru)
corrplot(korelasi, method="number", type="lower")
Diambil eigen yang bernilai > 1 untuk dilakukan analisis PCA dan FA.
nilaieigen <- eigen(korelasi)$values
nilaieigen
Digunakan untuk menentukan jumlah komponen utama atau faktor dalam analisis.
Plot ini membantu memvisualisasikan kontribusi relatif dari setiap komponen atau faktor dalam menjelaskan variansi data.
Menambahkan garis horizontal pada nilai eigen 1, yang menunjukkan batas umum untuk menentukan faktor, dimana apabila nilai eigen merupakan banyaknya faktor bermakna yang akan diesktrak.
scrplot <- plot(nilaieigen, main = "Scree Plot", xlab = "Factors", ylab="Eigen Values", pch = 20, col = "blue", type = "o")
axis(1, at = seq(1,28))
abline(h = 1, col = "red", lty = 2, lwd = 1.5)
Digunakan untuk melakukan analisis PCA dengan mereduksi dimensi data multidimensi.
analisis_pca <- prcomp(data_baru, center = TRUE, scale. = TRUE)
analisis_pca
Digunakan untuk memberikan ringkasan hasil analisis PCA yang mencakup informasi mengenai proporsi variansi, kumulatif proporsi, standar deviasi.
summary(analisis_pca)
Melakukan Analisis Faktor dengan menggunakan fungsi fa() dan rotasi varimax.
PFA = fa(r = korelasi, nfactors = 1, rotate = "varimax")
PFA
Digunakan untuk membuat diagram agar visualiasi dari hubungan antar-variabel dengan masing-masing faktor yang dihasilkan dari analisis faktor.
loads=PFA$loadings
fa.diagram(PFA)
> str(data[,2:6])
tibble [38 × 5] (S3: tbl_df/tbl/data.frame)
$ AHH : num [1:38] 72.1 72.8 73.9 74.2 73.6 ...
$ HLS : num [1:38] 12.6 13.7 12.5 13.3 12.6 ...
$ PK : num [1:38] 8887 9851 9743 10807 10757 ...
$ RLS : num [1:38] 7.61 7.55 7.56 8.34 7.5 8.08 7.43 6.67 6.49 7.42 ...
$ Pertumbuhan: num [1:38] 0.26 0.35 0.46 0.21 0.67 0.71 0.34 0.93 0.31 1.08 ...Interpretasi: Berdasarkan output diatas, dapat dilihat bahwa tipe data pada variabel AHH sampai dengan Pertumbuhan adalah numerik.
> summary(data[,2:6])
AHH HLS PK RLS
Min. :66.89 Min. :11.73 Min. : 8673 Min. : 4.860
1st Qu.:70.44 1st Qu.:12.72 1st Qu.:10038 1st Qu.: 7.200
Median :72.45 Median :13.32 Median :11260 Median : 7.695
Mean :71.72 Mean :13.40 Mean :11569 Mean : 8.061
3rd Qu.:72.84 3rd Qu.:13.77 3rd Qu.:12723 3rd Qu.: 9.220
Max. :74.18 Max. :15.75 Max. :17862 Max. :11.370
Pertumbuhan
Min. :0.1000
1st Qu.:0.3175
Median :0.4750
Mean :0.4937
3rd Qu.:0.6675
Max. :1.0800 Interpretasi: Berdasarkan statistika deskriptif di atas, didapatkan informasi:
Kabupaten/Kota yang memiliki angka harapan hidup tertinggi adalah Kota Surabaya sebesar 74.18 tahun dan terendah adalah Kabupaten Bondowoso sebesar 66.89 tahun. Sebagian besar Kabupaten/Kota di Jawa Timur tahun 2021 memiliki angka harapan hidup sebesar 71.72 tahun.
Kabupaten/Kota yang memiliki harapan lama sekolah tertinggi adalah Kota Malang sebesar 15.75 tahun dan terendah adalah Kabupaten Bangkalan sebesar 11.73 tahun. Sebagian besar Kabupaten/Kota di Jawa Timur tahun 2021 memiliki harapan lama sekolah sebesar 13.40 tahun.
Kabupaten/Kota yang memiliki pengeluaran per kapita tertinggi adalah Kota Surabaya sebesar Rp 17.862 dan terendah adalah Kabupaten Bangkalan sebesar Rp 8.673. Sebagian besar Kabupaten/Kota di Jawa Timur tahun 2021 memiliki pengeluaran per kapita sebesar Rp 11.569.
Kabupaten/Kota yang memiliki rata-rata lama sekolah tertinggi adalah Kota Madiun sebesar 11.37 tahun dan terendah adalah Kabupaten Sampang sebesar 4.86 tahun. Sebagian besar Kabupaten/Kota di Jawa Timur tahun 2021 memiliki rata-rata lama sekolah sebesar 8.06 tahun.
Kabupaten/Kota yang memiliki pertumbuhan tertinggi adalah Kabupaten Banyuwangi sebesar 1.08 persen dan terendah adalah Kota Surabaya sebesar 0.1 persen. Sebagian besar Kabupaten/Kota di Jawa Timur tahun 2021 memiliki pertumbuhan sebesar 0.4937 persen.
> KMOS(data[,2:6])
Kaiser-Meyer-Olkin Statistics
Call: KMOS(x = data[, 2:6])
Measures of Sampling Adequacy (MSA):
AHH HLS PK RLS Pertumbuhan
0.6521186 0.8756855 0.7254774 0.6441153 0.3413266
KMO-Criterion: 0.7076663Interpretasi: Dari hasil diatas diperoleh nilai KMO-Criterion sebesar 0.7076663 menunjukkan sampel secara keseluruhan sudah cukup baik sehingga analisis faktor dan analisis komponen utama dapat diterapkan. Nilai MSA pada indikator Pertumbuhan bernilai < 0,5 sehingga harus dihilangkan.
> data_baru = data[,2:5]
> data_baru
# A tibble: 38 × 4
AHH HLS PK RLS
<dbl> <dbl> <dbl> <dbl>
1 72.1 12.6 8887 7.61
2 72.8 13.7 9851 7.55
3 73.9 12.5 9743 7.56
4 74.2 13.3 10807 8.34
5 73.6 12.6 10757 7.5
6 72.6 13.4 11127 8.08
7 72.6 13.2 10163 7.43
8 70.2 11.9 9203 6.67
9 69.3 13.4 9410 6.49
10 70.7 13.1 12217 7.42
# ℹ 28 more rows> KMOS(data_baru)
Kaiser-Meyer-Olkin Statistics
Call: KMOS(x = data_baru)
Measures of Sampling Adequacy (MSA):
AHH HLS PK RLS
0.6638541 0.8733258 0.7274289 0.6435159
KMO-Criterion: 0.714109Interpretasi: Dari hasil diatas diperoleh nilai KMO-Criterion sebesar 0.714109 menunjukkan sampel secara keseluruhan sudah cukup baik sehingga analisis faktor dan analisis komponen utama dapat diterapkan. Nilai MSA pada setiap indikator bernilai > 0,5 sehingga semua indikator tersebut (AHH, HLS, PK dan RLS) dapat digunakan.
> bart_spher(data_baru)
Bartlett's Test of Sphericity
Call: bart_spher(x = data_baru)
X2 = 114.357
df = 6
p-value < 2.22e-16Keputusan:
Diperoleh p-value (2,22e-16) < alpha (0,05), maka tolak \(H_{0}\).
Interpretasi:
Dengan taraf nyata 5% dapat dibuktikan bahwa terdapat korelasi yang signifikan antar variabel, sehingga data layak digunakan untuk analisis faktor.
Interpretasi: Berdasarkan plot korelasi di atas, semakin mendekati 1 atau -1 maka mengindikasikan adanya korelasi yang kuat antar Indikator. Dapat dilihat bahwa semua korelasi berawarna biru yang menandakan korelasi positif.
Interpretasi: Banyaknya faktor yang dapat diambil untuk analisis PCA dan FA apabila memiliki nilai eigen ≥ 1. Dari output diatas, dapat dilihat pada bahwa terdapat satu nilai eigen yang lebih besar sama dengan satu, sehingga terdapat 1 faktor bermakna yang akan diekstrak.
> scrplot <- plot(nilaieigen, main = "Scree Plot", xlab = "Factors", ylab="Eigen Values", pch = 20, col = "blue", type = "o")
> axis(1, at = seq(1,28))
> abline(h = 1, col = "red", lty = 2, lwd = 1.5)Interpretasi: Berdasarkan scree plot di atas, terdapat 1 faktor yang memiliki nilai eigen lebih dari sama dengan satu, dimana dapat diketahui dari titik yang berada diatas garis merah, sehingga terdapat 1 faktor bermakna yang akan diekstrak.
> analisis_pca <- prcomp(data_baru, center = TRUE, scale. = TRUE)
> analisis_pca
Standard deviations (1, .., p=4):
[1] 1.7555507 0.7595448 0.5098700 0.2848964
Rotation (n x k) = (4 x 4):
PC1 PC2 PC3 PC4
AHH -0.4335482 -0.84148370 0.1450180 -0.2879425
HLS -0.4926598 0.43022165 0.7431361 -0.1412246
PK -0.5152932 0.32569619 -0.6232558 -0.4898440
RLS -0.5511761 -0.02713866 -0.1956292 0.8106772Interpretasi:
Persamaan yang terbentuk:
\[ PC_1 = -0.4335482X_1 - 0.4926598X_2 - 0.5152932X_3 - 0.55117X_4 \]
> summary(analisis_pca)
Importance of components:
PC1 PC2 PC3 PC4
Standard deviation 1.7556 0.7595 0.50987 0.28490
Proportion of Variance 0.7705 0.1442 0.06499 0.02029
Cumulative Proportion 0.7705 0.9147 0.97971 1.00000Interpretasi: Berdasarkan output di atas, komponen utama pertama (PC1) dapat menjelaskan keragaman dari 4 indikator sebesar 77,05%.
> PFA = fa(r = korelasi, nfactors = 1, rotate = "varimax")
> PFA
Factor Analysis using method = minres
Call: fa(r = korelasi, nfactors = 1, rotate = "varimax")
Standardized loadings (pattern matrix) based upon correlation matrix
MR1 h2 u2 com
AHH 0.65 0.42 0.580 1
HLS 0.80 0.64 0.363 1
PK 0.87 0.76 0.237 1
RLS 1.01 1.01 -0.015 1
MR1
SS loadings 2.83
Proportion Var 0.71
Mean item complexity = 1
Test of the hypothesis that 1 factor is sufficient.
df null model = 6 with the objective function = 3.28
df of the model are 2 and the objective function was 0.21
The root mean square of the residuals (RMSR) is 0.04
The df corrected root mean square of the residuals is 0.08
Fit based upon off diagonal values = 1Interpretasi: Berdasarkan hasil analisis PFA, persamaan yang terbentuk:
\[ \begin{align*} X_1 (\text{AHH}) &= 0,65 MR_1 + \epsilon_1 \\ X_2 (\text{HLS}) &= 0,80 MR_1 + \epsilon_2 \\ X_3 (\text{PK}) &= 0,87 MR_1 + \epsilon_3 \\ X_4 (\text{RLS}) &= 1,01 MR_1 + \epsilon_4 \\ \end{align*} \]
Interpretasi:
RLS (Rata-rata Lama Sekolah) memiliki nilai loading sebesar 1, menunjukkan hubungan yang paling kuat terhadap faktor MR1.
PK (Pengeluaran per Kapita) memiliki nilai loading sebesar 0.9, menunjukkan hubungan yang kuat dengan MR1.
HLS (Harapan Lama Sekolah) memiliki nilai loading sebesar 0.8, menunjukkan hubungan yang kuat dengan MR1.
AHH (Angka Harapan Hidup) memiliki nilai loading sebesar 0.6, memiliki hubungan lebih rendah dibandingkan indikator lainnya tetapi tetap memiliki hubungan yang kuat dengan MR1.
Dari hasil analisis faktor, MR1 dapat diinterpretasikan sebagai faktor yang merepresentasikan indeks pembangunan manusia, karena indikator-indikatornya terkait dengan pendidikan, ekonomi, dan kesehatan, yang merupakan komponen utama dalam pengukuran pembangunan manusia. Faktor ini menggambarkan tingkat kesejahteraan dan kualitas hidup masyarakat berdasarkan indikator-indikator yang dianalisis. Semua indikator mempunyai hubungan yang positif dengan MR1, dengan indikator dominan adalah RLS (Rata-rata Lama Sekolah)
Berdasarkan hasil analisis, dapat ditarik kesimpulan:
Terdapat 1 faktor bermakna yang dapat diekstrak dari 4 indikator.
Analisis komponen utama menghasilkan 1 komponen utama dengan persamaan sebagai berikut:
\[ PC_1 = -0.4335482X_1 - 0.4926598X_2 - 0.5152932X_3 - 0.55117X_4 \]
Berdasarkan analisis yang sudah dilakukan, dapat dilakukan analisis lanjutan dengan memperbanyak indikator-indikator lain terkait faktor indeks pembangunan manusia.
BPS. (2021). Indeks Pembangunan Manusia 2021. Jakarta: Badan Pusat Statistik.
Puspitasari, N. B., Suliantoro, H., Erlianna V. (2021). ANALISIS FAKTOR YANG MEMPENGARUHI KONSUMEN DALAM PEMAKAIAN PRODUK LAYANAN SELULER DENGAN MEMPERTIMBANGKAN ASPEK 7P’S OF MARKETING (STUDI KASUS : PT. TELKOM AREA BLORA). J@TI Undip. 6(2), hal 95-96.
Rufaidah, A. & Effendi, M. A. (2017). ANALISIS KOMPONEN UTAMA PADA PENERAPAN APLIKASI PEMBELAJARAN METODE GLENN DOMAN. Jurnal Ilmiah Edutic. 3(2), hal 108.
Setiawan, M. B. & Hakim, A. (2013). INDEKS PEMBANGUNAN MANUSIA INDONESIA. Jurnal Economica. 9(1), hal 20.
Sikana, A. M. & Wijayanto, A. W. (2021). Analisis Perbandingan Pengelompokan Indeks Pembangunan Manusia Indonesia Tahun 2019 dengan Metode Partitioning dan Hierarchical Clustering . Jurnal Ilmu Computer. 14(2), hal 67.