Analisis Cluster Hierarki Tingkat Pengangguran Terbuka (TPT) dan Tingkat Partisipasi Angkatan Kerja (TPAK) Berdasarkan Provinsi di Indonesia Tahun 2023

Asha Aruni Mawardani

2024-11-25


Library :
# install.packages('psych')
# install.packages('GPArotation')
# install.packages('clValid')
# install.packages('ggplot2')
# install.packages('cluster')
# install.packages('factoextra')
# install.packages('tidyverse')
# install.packages('car')
# install.packages('readxl')
# install.packages("knitr")
# install.packages("rmarkdown")
# install.packages("prettydoc")
# install.packages("equatiomatic")

1 PENDAHULUAN

1.1 Latar Belakang

Tingkat Pengangguran Terbuka (TPT) dan Tingkat Partisipasi Angkatan Kerja (TPAK) adalah dua indikator penting yang digunakan untuk mengukur kondisi pasar tenaga kerja di Indonesia. Tingkat Pengangguran Terbuka (TPT) mengacu pada persentase angkatan kerja yang tidak memiliki pekerjaan tetapi sedang aktif mencari pekerjaan. Sedangkan Tingkat Partisipasi Angkatan Kerja (TPAK) adalah persentase dari jumlah penduduk usia kerja yang terlibat dalam kegiatan ekonomi (baik yang bekerja maupun yang mencari pekerjaan). Data mengenai TPAK biasanya mencerminkan seberapa banyak penduduk yang aktif dalam angkatan kerja.

TPT dan TPAK adalah indikator kunci untuk memahami dinamika pasar tenaga kerja di Indonesia. Meskipun ada penurunan dalam TPT dan peningkatan dalam TPAK, tantangan tetap ada terutama terkait disparitas antara wilayah perkotaan dan pedesaan serta perbedaan berdasarkan jenis kelamin. Data ini menegaskan perlunya kebijakan yang lebih efektif untuk meningkatkan lapangan kerja dan mengurangi pengangguran di seluruh provinsi di Indonesia.

Kedua indikator ini penting untuk mengidentifikasi tantangan dalam penciptaan lapangan kerja, membantu pemerintah dan pembuat kebijakan dalam merumuskan strategi untuk meningkatkan partisipasi angkatan kerja dan mengurangi pengangguran, dan memantau perkembangan ekonomi dan sosial di berbagai provinsi di Indonesia. Secara keseluruhan, analisis terhadap TPT dan TPAK memberikan wawasan yang berharga mengenai dinamika pasar tenaga kerja di Indonesia dan membantu dalam pengambilan keputusan untuk perbaikan kebijakan ketenagakerjaan.

1.2 Statistika Deskriptif

Statistika deskriptif adalah metode statistik yang digunakan untuk menganalisis data dengan cara mendeskripsikan atau menggambarkan data yang telah terkumpul sebagaimana adanya tanpa bermaksud membuat kesimpulan yang berlaku umum atau generalisasi.

Statistika deskriptif berfungsi untuk menggambarkan karakteristik suatu sampel data, seperti ukuran pemusatan data, ukuran penyebaran data, serta kecenderungan suatu gugus data. Penyajian data statistik pada dasarnya ada dua bentuk: bentuk penyajian dengan tabel-tabel dan bentuk penyajian dengan grafik-grafik.

Jenis statistika deskriptif umumnya dibagi menjadi tiga, yaitu:

  1. Penyajian Data: Penyajian data meliputi cara menampilkan data dalam bentuk tabel, grafik, atau histogram untuk memudahkan analisis dan interpretasi.

  2. Pemusatan Data: Pemusatan data meliputi ukuran pemusatan data seperti rata-rata, median, dan modus yang digunakan untuk menggambarkan posisi data pusat.

  3. Penyebaran Data: Penyebaran data meliputi ukuran penyebaran data seperti standar deviasi dan range yang digunakan untuk menggambarkan seberapa jauh data berbeda dari data pusat.

1.3 Analisis Cluster

Analisis cluster adalah teknik multivariat yang bertujuan untuk mengelompokkan objek-objek berdasarkan karakteristik yang dimilikinya. Dalam analisis ini, objek yang memiliki sifat mirip akan dikelompokkan ke dalam satu cluster, sedangkan objek yang berbeda akan dimasukkan ke dalam cluster lain. Cluster yang baik ditandai dengan homogenitas internal (kesamaan antar anggota dalam satu cluster) dan heterogenitas eksternal (perbedaan antara cluster yang satu dengan lainnya).

Tujuan utama dari analisis cluster meliputi:

  1. Mengidentifikasi Pola: Mencari pola atau struktur dalam data yang tidak terstruktur.

  2. Segmentasi Data: Membantu dalam segmentasi pasar atau kelompok berdasarkan karakteristik tertentu.

  3. Pengambilan Keputusan: Memberikan wawasan bagi pembuat keputusan untuk merumuskan strategi yang lebih baik.

  • Ada beberapa metode yang umum digunakan dalam analisis cluster:

    1. Hierarchical Clustering: Metode ini membangun hierarki cluster dengan menggabungkan atau membagi cluster berdasarkan kesamaan. Metode ini dapat dibagi menjadi: Aglomeratif: Memulai dengan setiap objek sebagai cluster terpisah dan secara bertahap menggabungkannya. Divisif: Memulai dengan satu cluster besar dan membaginya menjadi sub-kluster.

    2. K-Means Clustering: Metode ini mengelompokkan data ke dalam K cluster berdasarkan jarak ke centroid (titik rata-rata) dari setiap cluster. Proses ini melibatkan penentuan jumlah cluster K terlebih dahulu.

    3. DBSCAN (Density-Based Spatial Clustering of Applications with Noise): Metode ini mendefinisikan cluster berdasarkan kepadatan titik data, memungkinkan untuk menemukan bentuk cluster yang tidak teratur dan mengidentifikasi outlier.

1.4 Jarak Analisis Cluster

Dalam analisis cluster, pengukuran jarak adalah komponen penting yang menentukan seberapa dekat atau mirip objek satu dengan yang lain dalam proses pengelompokan. Ada beberapa jenis jarak yang umum digunakan dalam analisis cluster, di antaranya adalah jarak Euclidean dan jarak Manhattan.

  1. Jarak Euclidean Jarak Euclidean adalah ukuran jarak paling umum yang digunakan dalam analisis kluster. Ini mengukur jarak antara dua titik dalam ruang multidimensi berdasarkan rumus Pythagoras. Jarak ini didefinisikan sebagai:

\[ d_{i,j}= \sqrt{\sum (y_{ik}-y_{jk})^2} \]

  1. Jarak Manhattan Jarak Manhattan, juga dikenal sebagai jarak “taxicab”, mengukur jarak antara dua titik dengan menjumlahkan perbedaan absolut dari setiap dimensi. Rumusnya adalah:

\[ d_{i,j} = \sum |y_{ik} - y_{jk}| \]

1.5 Analisis Cluster Hierarki

Cluster hierarki adalah metode analisis cluster yang mengelompokkan objek secara hierarkis berdasarkan kemiripan sifatnya. Metode ini memulai dengan setiap objek sebagai cluster terpisah dan secara bertahap menggabungkannya menjadi kluster yang lebih besar. Terdapat dua pendekatan dasar dalam metode hierarki: agglomerative (pemusatan) dan divisive (penyebaran)1.

  • Metode Agglomerative
    1. Single Linkage Metode ini didasarkan pada jarak terdekat antara dua objek. Pada awalnya, pengelompokan single linkage memilih jarak terkecil dan menggabungkan objek yang sesuai.

    2. Complete Linkage Metode ini menggunakan jarak maksimum antara anggota dua cluster untuk menentukan seberapa jauh kedua cluster tersebut. Ini cenderung menghasilkan cluster yang lebih kompak karena semua titik harus memiliki jarak maksimal untuk bergabung menjadi satu cluster.

    3. Average Linkage Metode average linkage menghitung rata-rata jarak antara semua pasangan anggota dua cluster. Ini mirip dengan single linkage tetapi menggunakan rata-rata jarak seluruh individu dalam cluster dengan jarak seluruh individu dalam cluster lain13.

    4. Ward’s Method Metode ward meminimumkan koefisien sum of squares error (SSQ) tiap cluster saat menggabungkan dua cluster. Metode ini cocok digunakan karena memaksimumkan homogenitas internal dalam setiap cluster.

1.6 Data

Data yang digunakan dalam analisis cluster ini merupakan Tingkat Pengangguran Terbuka (TPT) dan Tingkat Partisipasi Angkatan Kerja (TPAK) berdasarkan provinsi di Indonesia pada tahun 2023. Analisis ini bertujuan untuk mengelompokkan provinsi-provinsi berdasarkan pola serupa dalam TPT dan TPAK guna mengidentifikasi kesamaan dan perbedaan karakteristik pasar tenaga kerja di berbagai wilayah. Cluster yang dihasilkan diharapkan dapat membantu dalam perumusan kebijakan ketenagakerjaan yang lebih tepat sasaran. Berikut data yang digunakan.

library(readxl)
## Warning: package 'readxl' was built under R version 4.3.3
data <- read_excel("C:/Users/User/Downloads/Tingkat Pengangguran Terbuka (TPT) dan Tingkat Partisipasi Angkatan Kerja (TPAK) Menurut Provinsi, 2023.xlsx")
data <- data.frame(data)
head(data)
##           Provinsi TPT...Februari TPT...Agustus TPAK...Februari TPAK...Agustus
## 1             Aceh           5.75          6.03           65.12          64.77
## 2   Sumatera Utara           5.24          5.89           70.60          71.06
## 3   Sumatera Barat           5.90          5.94           69.96          69.61
## 4             Riau           4.25          4.23           65.18          64.45
## 5            Jambi           4.50          4.53           67.88          68.75
## 6 Sumatera Selatan           4.53          4.11           69.73          70.72

2 SOURCE CODE

2.1 Library yang Dibutuhkan

# Library
library(psych)
## Warning: package 'psych' was built under R version 4.3.3
library(GPArotation)
## Warning: package 'GPArotation' was built under R version 4.3.3
## 
## Attaching package: 'GPArotation'
## The following objects are masked from 'package:psych':
## 
##     equamax, varimin
library(clValid)
## Warning: package 'clValid' was built under R version 4.3.3
## Loading required package: cluster
library(ggplot2)
## Warning: package 'ggplot2' was built under R version 4.3.3
## 
## Attaching package: 'ggplot2'
## The following objects are masked from 'package:psych':
## 
##     %+%, alpha
library(cluster)
library(factoextra)
## Warning: package 'factoextra' was built under R version 4.3.3
## Welcome! Want to learn more? See two factoextra-related books at https://goo.gl/ve3WBa
library(tidyverse)
## Warning: package 'tidyverse' was built under R version 4.3.3
## Warning: package 'tibble' was built under R version 4.3.3
## Warning: package 'tidyr' was built under R version 4.3.3
## Warning: package 'readr' was built under R version 4.3.3
## Warning: package 'purrr' was built under R version 4.3.3
## Warning: package 'stringr' was built under R version 4.3.3
## Warning: package 'forcats' was built under R version 4.3.3
## Warning: package 'lubridate' was built under R version 4.3.3
## ── Attaching core tidyverse packages ──────────────────────── tidyverse 2.0.0 ──
## ✔ dplyr     1.1.4     ✔ readr     2.1.5
## ✔ forcats   1.0.0     ✔ stringr   1.5.1
## ✔ lubridate 1.9.3     ✔ tibble    3.2.1
## ✔ purrr     1.0.2     ✔ tidyr     1.3.1
## ── Conflicts ────────────────────────────────────────── tidyverse_conflicts() ──
## ✖ ggplot2::%+%()   masks psych::%+%()
## ✖ ggplot2::alpha() masks psych::alpha()
## ✖ dplyr::filter()  masks stats::filter()
## ✖ dplyr::lag()     masks stats::lag()
## ℹ Use the conflicted package (<http://conflicted.r-lib.org/>) to force all conflicts to become errors
library(car)
## Warning: package 'car' was built under R version 4.3.3
## Loading required package: carData
## Warning: package 'carData' was built under R version 4.3.3
## 
## Attaching package: 'car'
## 
## The following object is masked from 'package:dplyr':
## 
##     recode
## 
## The following object is masked from 'package:purrr':
## 
##     some
## 
## The following object is masked from 'package:psych':
## 
##     logit
library(readxl)
library(knitr)
## Warning: package 'knitr' was built under R version 4.3.3

2.2 Input Data

data <- read_excel("C:/Users/User/Downloads/Tingkat Pengangguran Terbuka (TPT) dan Tingkat Partisipasi Angkatan Kerja (TPAK) Menurut Provinsi, 2023.xlsx")
data <- data.frame(data)
View(data)

2.3 Statistik Deskriptif

statdes <- summary(data)
statdes
##    Provinsi         TPT...Februari  TPT...Agustus   TPAK...Februari
##  Length:34          Min.   :3.040   Min.   :2.270   Min.   :63.07  
##  Class :character   1st Qu.:3.730   1st Qu.:3.487   1st Qu.:66.58  
##  Mode  :character   Median :4.415   Median :4.320   Median :69.06  
##                     Mean   :4.806   Mean   :4.614   Mean   :69.01  
##                     3rd Qu.:5.695   3rd Qu.:5.763   3rd Qu.:71.02  
##                     Max.   :7.970   Max.   :7.520   Max.   :77.19  
##  TPAK...Agustus 
##  Min.   :63.60  
##  1st Qu.:66.66  
##  Median :69.69  
##  Mean   :69.34  
##  3rd Qu.:71.02  
##  Max.   :77.20

2.4 Uji Asumsi

2.4.1 Uji Sampel Representatif(KMO)

kmo <- KMO(data[, 2:5])
kmo
## Kaiser-Meyer-Olkin factor adequacy
## Call: KMO(r = data[, 2:5])
## Overall MSA =  0.6
## MSA for each item = 
##  TPT...Februari   TPT...Agustus TPAK...Februari  TPAK...Agustus 
##            0.62            0.59            0.59            0.61

2.4.2 Uji Non-Multikolinearitas

korelasi <- cor(data[, 2:5], method = 'pearson')
korelasi
##                 TPT...Februari TPT...Agustus TPAK...Februari TPAK...Agustus
## TPT...Februari       1.0000000     0.9349503      -0.6014111     -0.6418142
## TPT...Agustus        0.9349503     1.0000000      -0.5792073     -0.6737696
## TPAK...Februari     -0.6014111    -0.5792073       1.0000000      0.9193467
## TPAK...Agustus      -0.6418142    -0.6737696       0.9193467      1.0000000

2.5 Menghitung Jarak Euclidean

jarak <- dist(data[, 2:5], method = "euclidean")
jarak
##             1          2          3          4          5          6          7
## 2   8.3590789                                                                  
## 3   6.8470286  1.7176146                                                       
## 4   2.3655866  8.7638005  7.4243249                                            
## 5   5.2221164  3.8899486  3.0023491  5.0923963                                 
## 6   7.8631673  2.1319006  2.5516269  7.7529478  2.7350868                      
## 7  10.4270466  3.8391015  4.7847779 10.0160321  5.5666327  3.3458482           
## 8   9.0432461  2.6609209  3.2433779  8.8727166  4.4059732  2.4647312  1.6662533
## 9   6.7460729  3.3260637  2.7738601  6.4724879  2.5580461  2.5761405  3.7521994
## 10  4.9040290  4.8026555  3.4143081  6.3434612  3.8958953  5.1805116  8.0772644
## 11  2.8210814  9.8367627  8.3647534  4.6197511  7.0066112  9.4770090 12.4215216
## 12  3.4904154  6.7180652  5.1233388  5.4936509  5.1327088  7.0108345  9.6560913
## 13 10.0676065  2.0015244  3.3407634 10.2842355  5.4342433  3.0503279  2.8023562
## 14 12.8808657  4.9724139  6.5166479 12.7098348  7.7950882  5.1047527  3.2806707
## 15 10.2336406  2.2154458  3.8291775 10.3025919  5.2699051  2.6742102  2.7562474
## 16  2.8159901  8.6976893  7.0477372  5.0239626  6.5818462  8.7900057 11.2825928
## 17 17.6764533  9.6014895 11.1060884 17.5042566 12.6508300  9.9376858  7.6715774
## 18 11.1322280  4.1478066  5.4496330 10.7970042  5.9277146  3.3330317  2.9746260
## 19 14.9482173  7.0104066  8.5857207 14.7163990  9.8198727  7.1298107  5.1410797
## 20  5.9316692  2.9216605  2.2389060  6.0115805  1.0220567  2.0523401  4.9825696
## 21  5.1410797  4.8584051  3.8696382  4.5226430  1.9646374  3.7347958  5.5184962
## 22  7.1096132  2.6448818  2.5820147  6.8713172  2.0232400  1.1567195  3.5830574
## 23  1.3544002  7.4937974  5.9522601  2.6731255  4.3756257  6.9219217  9.5873302
## 24  6.4488294  4.2524111  4.0121565  6.1889741  1.9268887  2.7607608  5.8163477
## 25  1.9841875 10.1326995  8.6488496  3.2995454  6.9225357  9.5858750 12.2932217
## 26  8.1305166  3.6521637  3.8546984  7.5150582  3.1721601  1.8427425  2.7971056
## 27  2.1177110  8.3908820  7.0606161  1.7749084  4.7419194  7.4104318 10.1151174
## 28  6.8306222  4.5040648  4.3383637  6.2222022  2.1121790  2.6178999  5.2640194
## 29  9.0644691  3.5764228  4.2535397  8.4985293  3.9637735  1.9946428  2.1680637
## 30  8.1957367  5.1792760  5.4034896  7.4040057  3.5491971  3.1885263  5.2326857
## 31  1.8017214 10.1243271  8.6016859  3.2011560  6.9764533  9.6366488 12.2161819
## 32  3.9039595  5.5114880  4.4233585  3.5981801  1.6936351  4.3648024  7.1430946
## 33  4.9547351  4.0588422  2.5352317  5.3120053  2.5007799  3.8548930  5.8294511
## 34 17.5240121  9.4576213 10.9889945 17.3310646 12.4607504  9.7462403  7.5345803
##             8          9         10         11         12         13         14
## 2                                                                              
## 3                                                                              
## 4                                                                              
## 5                                                                              
## 6                                                                              
## 7                                                                              
## 8                                                                              
## 9   2.4719628                                                                  
## 10  6.5626062  5.3116099                                                       
## 11 11.0050443  8.9402349  5.4702651                                            
## 12  8.0605893  6.3665768  2.3612920  4.0138884                                 
## 13  2.1962696  4.1918731  6.5611737 11.6411597  8.4171195                      
## 14  4.3385251  6.5886721  9.6318534 14.4911076 11.6133156  3.4071689           
## 15  2.6683890  4.4128562  6.8719211 11.7604209  8.8676152  1.5116547  2.8308833
## 16  9.7018091  7.7388694  4.5219575  3.1575148  2.2071248 10.3438629 13.5266663
## 17  8.8515592 11.2680832 14.1603849 19.2292096 16.1557977  7.7835018  4.9152925
## 18  3.7105795  5.3397565  8.2139028 12.6379033 10.2369771  3.4067580  2.5613278
## 19  6.3694976  8.6358150 11.6372548 16.5168611 13.6691112  5.4122177  2.0949702
## 20  3.7784653  2.3103679  3.8083855  7.6263622  5.3426492  4.5682820  7.0177774
## 21  4.3895558  2.0061406  5.0905599  7.4883109  5.6634177  6.0313680  8.3459331
## 22  2.5669632  1.6500000  5.0773714  8.9703344  6.6137584  3.7440753  5.8646142
## 23  8.1872767  6.0162031  4.0108229  3.1250760  2.9802349  9.1444355 11.9666829
## 24  5.0549481  3.9085419  4.7917325  7.7776925  6.4114741  5.7027099  7.4327451
## 25 10.9397029  8.6605138  6.2781287  1.8442614  4.7200847 11.8920436 14.6572405
## 26  2.3843238  2.2476210  6.4479299 10.0839873  7.9147520  3.9864019  5.3801673
## 27  8.9247297  6.6808532  5.4101941  3.4739891  4.7898121 10.0362144 12.4984799
## 28  4.6763340  3.5724361  5.5609981  8.3906198  7.0536090  5.6557670  7.1381020
## 29  2.3138496  2.9987497  7.0669159 10.9534333  8.6978388  3.5897493  4.4211650
## 30  5.0954686  4.5447552  6.8652458  9.6683297  8.4736002  5.9709798  6.7264404
## 31 10.8384731  8.5267989  6.3583253  2.3287550  4.6357308 11.8512658 14.6729990
## 32  6.0115056  3.9252516  4.0842625  5.6749802  4.7235897  7.1021546  9.4333981
## 33  4.2812498  2.3479566  3.5638883  7.0120682  4.1458172  5.3886826  8.3671441
## 34  8.7437806 11.1338807 14.0310976 19.0668429 16.0505015  7.6834953  4.6981379
##            15         16         17         18         19         20         21
## 2                                                                              
## 3                                                                              
## 4                                                                              
## 5                                                                              
## 6                                                                              
## 7                                                                              
## 8                                                                              
## 9                                                                              
## 10                                                                             
## 11                                                                             
## 12                                                                             
## 13                                                                             
## 14                                                                             
## 15                                                                             
## 16 10.8197597                                                                  
## 17  7.6133173 18.1007900                                                       
## 18  2.3161390 12.0905459  7.1123765                                            
## 19  4.8565626 15.6071971  3.1034497  4.1884484                                 
## 20  4.3848717  7.0074175 11.8851546  5.3068635  9.0596965                      
## 21  6.1074135  6.6493082 13.0795680  6.7111102 10.3664507  2.5453094           
## 22  3.4914467  8.2252660 10.7205783  4.1937930  7.9002152  1.4678215  2.7028688
## 23  9.3440997  2.9663783 16.7109246 10.1699213 14.0266461  5.1084929  4.4796317
## 24  5.0670307  7.9632405 12.2636781  5.2363632  9.3029135  2.0345270  3.6218089
## 25 11.9902043  3.4963123 19.4698279 12.7895465 16.7034907  7.6628911  6.9837741
## 26  3.6729688  9.3960577 10.0696624  3.6045249  7.3011985  2.9467609  3.2586500
## 27  9.9806964  4.6339508 17.3147134 10.4550658 14.4949957  5.6435804  4.8633116
## 28  5.0243806  8.4830419 11.9283779  4.8638565  8.9820822  2.3626468  3.2788870
## 29  2.9767432 10.2881777  9.1485846  2.6792723  6.2990952  3.5382340  4.2491764
## 30  5.0804232  9.9187650 11.3401190  4.2890792  8.3690800  3.6420599  4.5017108
## 31 12.0154650  3.1994062 19.4703415 12.8841880 16.7361824  7.7026294  6.8645247
## 32  6.9384652  5.7520692 14.2795763  7.4335859 11.4307261  2.6460159  2.4469164
## 33  5.8797959  5.4835755 12.9850144  7.0697454 10.4573132  2.5902703  2.2041098
## 34  7.4231664 18.0036941  0.4820788  6.8486130  2.7860007 11.6965508 12.9247321
##            22         23         24         25         26         27         28
## 2                                                                              
## 3                                                                              
## 4                                                                              
## 5                                                                              
## 6                                                                              
## 7                                                                              
## 8                                                                              
## 9                                                                              
## 10                                                                             
## 11                                                                             
## 12                                                                             
## 13                                                                             
## 14                                                                             
## 15                                                                             
## 16                                                                             
## 17                                                                             
## 18                                                                             
## 19                                                                             
## 20                                                                             
## 21                                                                             
## 22                                                                             
## 23  6.2760975                                                                  
## 24  2.5904826  5.6185585                                                       
## 25  8.8915128  2.8929915  7.8588931                                            
## 26  1.5826876  7.2597039  3.4250985  9.8855703                                 
## 27  6.7195312  1.9658840  5.5244638  2.7543239  7.5143729                      
## 28  2.3337095  5.9859669  1.1322544  8.2970718  2.6621232  5.7890327           
## 29  2.1263584  8.2161913  3.8510518 10.8103839  1.1100000  8.4506982  3.1805974
## 30  3.2096573  7.3622347  2.2336741  9.5712643  2.9512370  6.9847405  1.4574292
## 31  8.8930647  2.8897405  8.0670317  0.7459222  9.8811487  3.0230614  8.4626119
## 32  3.6664288  3.1164884  2.6937892  5.4386303  4.5691356  3.0839261  2.9291808
## 33  3.1655331  4.1460101  4.3615135  6.8905007  4.1913602  5.3452689  4.4446372
## 34 10.5338692 16.5649570 12.0144829 19.3038183  9.8823530 17.1264853 11.6822001
##            29         30         31         32         33
## 2                                                        
## 3                                                        
## 4                                                        
## 5                                                        
## 6                                                        
## 7                                                        
## 8                                                        
## 9                                                        
## 10                                                       
## 11                                                       
## 12                                                       
## 13                                                       
## 14                                                       
## 15                                                       
## 16                                                       
## 17                                                       
## 18                                                       
## 19                                                       
## 20                                                       
## 21                                                       
## 22                                                       
## 23                                                       
## 24                                                       
## 25                                                       
## 26                                                       
## 27                                                       
## 28                                                       
## 29                                                       
## 30  3.0843962                                            
## 31 10.8236593  9.7727018                                 
## 32  5.4395496  4.3085496  5.5560148                      
## 33  5.0546414  5.7806488  6.7162936  3.2181206           
## 34  8.9362520 11.0577529 19.3167958 14.0825956 12.8806910

2.6 Koefisien Korelasi Cophenetic

2.6.1 Single Linkage

hiers <- hclust(jarak, method = "single")
d1 <- cophenetic(hiers)
single <- cor(jarak, d1)

2.6.2 Average Linkage

hierave <- hclust(jarak, method = "average")
d2 <- cophenetic(hierave)
average <- cor(jarak, d2)

2.6.3 Complete Linkage

hiercomp <- hclust(jarak, method = "complete")
d3 <- cophenetic(hiercomp)
complete <- cor(jarak, d3)

2.6.4 Centroid Linkage

hiercen <- hclust(jarak, method = "centroid")
d4 <- cophenetic(hiercen)
centroid <- cor(jarak, d4)

2.6.5 Ward’s Method

hierward <- hclust(jarak, method = "ward.D")
d5 <- cophenetic(hierward)
ward <- cor(jarak, d5)

2.6.6 Membandingkan Koefisien Korelasi Cophenetic

KorCop <- data.frame(single, average, complete, centroid, ward)
KorCop
##      single   average  complete  centroid      ward
## 1 0.6656924 0.7695622 0.7601545 0.7447153 0.6646885

2.7 Indeks Validitas

inval <- clValid(data[, 2:5], 2:4, clMethods = "hierarchical", 
                 validation = "internal", metric = "euclidean", method = "average")
## Warning in clValid(data[, 2:5], 2:4, clMethods = "hierarchical", validation =
## "internal", : rownames for data not specified, using 1:nrow(data)
summary(inval)
## 
## Clustering Methods:
##  hierarchical 
## 
## Cluster sizes:
##  2 3 4 
## 
## Validation Measures:
##                                  2       3       4
##                                                   
## hierarchical Connectivity   5.9905  9.8968 15.2516
##              Dunn           0.1988  0.3446  0.3446
##              Silhouette     0.4690  0.4791  0.4148
## 
## Optimal Scores:
## 
##              Score  Method       Clusters
## Connectivity 5.9905 hierarchical 2       
## Dunn         0.3446 hierarchical 3       
## Silhouette   0.4791 hierarchical 3
optimalScores(inval)
##                  Score       Method Clusters
## Connectivity 5.9904762 hierarchical        2
## Dunn         0.3445615 hierarchical        3
## Silhouette   0.4790844 hierarchical        3
plot(inval)

2.8 Dendrogram dengan Average Linkage

hierave <- hclust(dist(data[, 2:5]), method = "average")
plot(hierave, labels = data$Provinsi, hang = 1, col = "blue", main = "Cluster Dendrogram Average Linkage", sub = " ", xlab = "Provinsi", ylab = "Jarak")

2.9 Visualisasi Dendrogram dengan Rectangle

clus_hier <- eclust(data[, -1], FUNcluster = "hclust", k = 3, hc_method = "average", dist = "manhattan", graph = TRUE)
## Warning: The `<scale>` argument of `guides()` cannot be `FALSE`. Use "none" instead as
## of ggplot2 3.3.4.
## ℹ The deprecated feature was likely used in the factoextra package.
##   Please report the issue at <https://github.com/kassambara/factoextra/issues>.
## This warning is displayed once every 8 hours.
## Call `lifecycle::last_lifecycle_warnings()` to see where this warning was
## generated.
fviz_dend(clus_hier, rect = TRUE, cex = 0.5)

2.10 Membagi Data ke Dalam Kluster

anggotaave <- data.frame(Provinsi = data$Provinsi, cluster = cutree(hierave, k = 3))
anggotaave
##                     Provinsi cluster
## 1                       Aceh       1
## 2             Sumatera Utara       2
## 3             Sumatera Barat       2
## 4                       Riau       1
## 5                      Jambi       2
## 6           Sumatera Selatan       2
## 7                   Bengkulu       2
## 8                    Lampung       2
## 9  Kepulauan Bangka Belitung       2
## 10            Kepulauan Riau       1
## 11               DKI Jakarta       1
## 12                Jawa Barat       1
## 13               Jawa Tengah       2
## 14             DI Yogyakarta       3
## 15                Jawa Timur       2
## 16                    Banten       1
## 17                      Bali       3
## 18       Nusa Tenggara Barat       2
## 19       Nusa Tenggara Timur       3
## 20          Kalimantan Barat       2
## 21         Kalimantan Tengah       2
## 22        Kalimantan Selatan       2
## 23          Kalimantan Timur       1
## 24          Kalimantan Utara       2
## 25            Sulawesi Utara       1
## 26           Sulawesi Tengah       2
## 27          Sulawesi Selatan       1
## 28         Sulawesi Tenggara       2
## 29                 Gorontalo       2
## 30            Sulawesi Barat       2
## 31                    Maluku       1
## 32              Maluku Utara       2
## 33               Papua Barat       2
## 34                     Papua       3

2.11 Karakteristik Setiap Kluster

idclus <- cutree(hierave, k = 3)
karakteristik <- aggregate(data[, 2:5], by = list(Cluster = idclus), FUN = mean)

3 HASIL DAN PEMBAHASAN

3.1 Statistika Deskriptif

Tabel1 <- kable(statdes, caption = "Tabel 1. Statistik Deskriptif")
Tabel1
Tabel 1. Statistik Deskriptif
Provinsi TPT…Februari TPT…Agustus TPAK…Februari TPAK…Agustus
Length:34 Min. :3.040 Min. :2.270 Min. :63.07 Min. :63.60
Class :character 1st Qu.:3.730 1st Qu.:3.487 1st Qu.:66.58 1st Qu.:66.66
Mode :character Median :4.415 Median :4.320 Median :69.06 Median :69.69
NA Mean :4.806 Mean :4.614 Mean :69.01 Mean :69.34
NA 3rd Qu.:5.695 3rd Qu.:5.763 3rd Qu.:71.02 3rd Qu.:71.02
NA Max. :7.970 Max. :7.520 Max. :77.19 Max. :77.20

Statistik deskriptif pada penelitian ini digunakan untuk memberikan gambaran umum dan menyajikan data TPT dan TPAK pada Bulan Februari dan Bulan Agustus.

  • 34 Provinsi di Indonesia pada tahun 2023, Provinsi Sulawesi Barat memiliki Tingkat Pengangguran Terbuka (TPT) terendah pada Bulan Februari sebesar 3.04. Sedangkan Provinsi Banten memiliki Tingkat Pengangguran Terbuka (TPT) tertinggi pada Bulan Februari sebesar 7.97.

  • 34 Provinsi di Indonesia pada tahun 2023, Provinsi Sulawesi Barat memiliki Tingkat Pengangguran Terbuka (TPT) terendah pada Bulan Agustus sebesar 2.27. Sedangkan Provinsi Banten memiliki Tingkat Pengangguran Terbuka (TPT) tertinggi pada Bulan Agustus sebesar 7.52. TPT pada Bulan Agustus ini masih sama seperti TPT pada Bulan Februari dimana terendah ialah Sulawesi Barat dan tertinggi ialah Banten.

  • 34 Provinsi di Indonesia pada tahun 2023, Provinsi DKI Jakarta memiliki Tingkat Partisipasi Angkatan Kerja (TPAK) terendah pada Bulan Februari sebesar 63.07. Sedangkan Provinsi Bali memiliki Tingkat Partisipasi Angkatan Kerja (TPAK) tertinggi pada Bulan Februari sebesar 77.19.

  • 34 Provinsi di Indonesia pada tahun 2023, Provinsi Maluku memiliki Tingkat Partisipasi Angkatan Kerja (TPAK) terendah pada Bulan Agustus sebesar 63.60. Sedangkan Provinsi Papua memiliki Tingkat Partisipasi Angkatan Kerja (TPAK) tertinggi pada Bulan Agustus sebesar 77.20.

3.2 Uji Asumsi

3.2.1 Uji Sampel Representatif(KMO)

kmo <- as.data.frame(kmo$MSAi)
colnames(kmo) <- "MSA Index"
Tabel2 <- kable(kmo, caption = "Tabel 2. Hasil Uji KMO")
Tabel2
Tabel 2. Hasil Uji KMO
MSA Index
TPT…Februari 0.6175766
TPT…Agustus 0.5914189
TPAK…Februari 0.5946127
TPAK…Agustus 0.6142615

Hasil uji KMO seluruhnya memiliki nilai MSA>0.5. Sehingga dapat disimpulkan bahwa sampel telah representatif.

3.2.2 Uji Non-Multikolinearitas

Tabel3 <- kable(korelasi, caption = "Tabel 3. Matriks Korelasi Pearson")
Tabel3
Tabel 3. Matriks Korelasi Pearson
TPT…Februari TPT…Agustus TPAK…Februari TPAK…Agustus
TPT…Februari 1.0000000 0.9349503 -0.6014111 -0.6418142
TPT…Agustus 0.9349503 1.0000000 -0.5792073 -0.6737696
TPAK…Februari -0.6014111 -0.5792073 1.0000000 0.9193467
TPAK…Agustus -0.6418142 -0.6737696 0.9193467 1.0000000

3.3 Koefisien Korelasi Cophenetic

Tabel4 <- kable(KorCop, caption = "Tabel 4. Koefisien Korelasi Cophenetic")
Tabel4
Tabel 4. Koefisien Korelasi Cophenetic
single average complete centroid ward
0.6656924 0.7695622 0.7601545 0.7447153 0.6646885

Dari hasil koefisein korelasi cophenetic terlihat bahwa Average Linkage memiliki nilai koefisien korelasi tertinggi dibandingkan metode lain, yaitu sebesar 0.7695622. Oleh karena itu metode cluster yang terbaik yang akan digunakan adalah metode Average Linkage.

3.4 Indeks Validitas

optimalScores(inval)
##                  Score       Method Clusters
## Connectivity 5.9904762 hierarchical        2
## Dunn         0.3445615 hierarchical        3
## Silhouette   0.4790844 hierarchical        3

Hasil analisis validitas menunjukkan bahwa dua dari tiga indeks validitas memberikan jumlah cluster optimal sebanyak 3, yang mengindikasikan bahwa pembagian data menjadi 3 cluster lebih sesuai berdasarkan Tingkat Pengangguran Terbuka (TPT) dan Tingkat Partisipasi Angkatan Kerja (TPAK) berdasarkan provinsi di Indonesia pada tahun 2023.

3.5 Hasil Analisis Cluster dengan Metode Average Linkage

Tabel5 <- kable(anggotaave, caption = "Tabel 5. Anggota Cluster dengan Average Linkage")
Tabel5
Tabel 5. Anggota Cluster dengan Average Linkage
Provinsi cluster
Aceh 1
Sumatera Utara 2
Sumatera Barat 2
Riau 1
Jambi 2
Sumatera Selatan 2
Bengkulu 2
Lampung 2
Kepulauan Bangka Belitung 2
Kepulauan Riau 1
DKI Jakarta 1
Jawa Barat 1
Jawa Tengah 2
DI Yogyakarta 3
Jawa Timur 2
Banten 1
Bali 3
Nusa Tenggara Barat 2
Nusa Tenggara Timur 3
Kalimantan Barat 2
Kalimantan Tengah 2
Kalimantan Selatan 2
Kalimantan Timur 1
Kalimantan Utara 2
Sulawesi Utara 1
Sulawesi Tengah 2
Sulawesi Selatan 1
Sulawesi Tenggara 2
Gorontalo 2
Sulawesi Barat 2
Maluku 1
Maluku Utara 2
Papua Barat 2
Papua 3

Hasil klasterisasi membagi provinsi-provinsi di Indonesia menjadi tiga cluster berdasarkan kesamaan dalam variabel yang diukur, seperti TPT dan TPAK.

  • Cluster 1: Terdiri dari provinsi-provinsi yang lebih terpusat di wilayah barat Indonesia dan beberapa provinsi besar dengan karakteristik yang mirip dalam hal variabel yang diukur. Cluster 1 terdiri dari 12 provinsi, yaitu Aceh, Riau, Kepulauan Riau, DKI Jakarta, Jawa Barat, Jawa Timur, Banten, Sulawesi Utara, Sulawesi Selatan, Kalimantan Timur, Sulawesi Tenggara, dan Maluku.

  • Cluster 2: Merupakan cluster yang lebih besar, dengan provinsi-provinsi yang tersebar di banyak wilayah, terutama di bagian tengah dan selatan Indonesia. Cluster 2 adalah cluster terbesar dengan 20 provinsi, termasuk Sumatera Utara, Sumatera Barat, Jambi, Sumatera Selatan, Bengkulu, Lampung, Kepulauan Bangka Belitung, Jawa Tengah, Nusa Tenggara Barat, Kalimantan Barat, Kalimantan Tengah, Kalimantan Selatan, Kalimantan Utara, Sulawesi Tengah, Sulawesi Tenggara, Gorontalo, Sulawesi Barat, Maluku Utara, Papua Barat, dan Papua.

  • Cluster 3: Cluster ini lebih sedikit anggotanya dan terdiri dari provinsi-provinsi yang terletak di wilayah timur Indonesia. Cluster 3 terdiri dari 3 provinsi, yaitu DI Yogyakarta, Bali, dan Nusa Tenggara Timur.

3.6 Karakteristik Setiap Cluster

Tabel6 <- kable(karakteristik, caption = "Tabel 6. Karakteristik Setiap Klaster")
Tabel6
Tabel 6. Karakteristik Setiap Klaster
Cluster TPT…Februari TPT…Agustus TPAK…Februari TPAK…Agustus
1 6.4940 6.0600 65.051 65.296
2 4.2275 4.2040 69.694 70.025
3 3.4750 3.0475 75.480 76.020

Tabel 6 menggambarkan karakteristik tiap cluster yang terbentuk berdasarkan analisis klasterisasi, dengan fokus pada dua variabel utama, yaitu Tingkat Pengangguran Terbuka (TPT) dan Tingkat Partisipasi Angkatan Kerja (TPAK) untuk dua periode, Februari dan Agustus. Berdasarkan data yang ada, tiga cluster terbentuk dengan perbedaan mencolok dalam hal TPT dan TPAK.

  • Cluster 1 : Merupakan kelompok dengan TPT yang lebih tinggi, baik pada Februari (6.4940) maupun Agustus (6.0600). Meskipun ada penurunan, angka TPT tetap lebih besar dibandingkan dengan cluster lainnya. TPAK pada Cluster 1 juga lebih rendah, yang menunjukkan bahwa tingkat partisipasi angkatan kerja di provinsi-provinsi dalam cluster ini lebih sedikit dibandingkan dengan dua klaster lainnya.

  • Cluster 2: TPT di Cluster 2 lebih rendah dibandingkan Cluster 1 (4.2275 pada Februari dan 4.2040 pada Agustus), dengan penurunan yang relatif kecil. TPAK di Cluster 2 lebih tinggi dibandingkan Cluster 1, yang mengindikasikan tingkat partisipasi angkatan kerja yang lebih besar dan lebih stabil di kelompok ini.

  • Cluster 3: Cluster 3 memiliki TPT terendah di antara ketiga cluster (3.4750 pada Februari dan 3.0475 pada Agustus), dengan penurunan yang signifikan antara Februari dan Agustus. TPAK di Cluster 3 juga tertinggi, yang mengindikasikan provinsi-provinsi dalam cluster ini memiliki tingkat partisipasi angkatan kerja yang sangat tinggi.

4 KESIMPULAN

Analisis Cluster Hierarki menggunakan Jarak Euclidean dan Metode Average Linkage membagi provinsi-provinsi di Indonesia menjadi tiga Cluster berdasarkan kesamaan dalam Tingkat Pengangguran Terbuka (TPT) dan Tingkat Partisipasi Angkatan Kerja (TPAK). Cluster 1 terdiri dari provinsi-provinsi dengan TPT tinggi dan TPAK rendah, yang menunjukkan tantangan besar dalam mengurangi pengangguran dan meningkatkan partisipasi angkatan kerja, terutama di wilayah barat Indonesia dan provinsi besar. Cluster 2, yang merupakan Cluster terbesar dengan 20 provinsi, memiliki TPT yang lebih rendah dan TPAK yang lebih tinggi, menunjukkan kondisi ekonomi yang lebih stabil, terutama di wilayah tengah dan selatan Indonesia. Sementara itu, Cluster 3, yang terdiri dari 3 provinsi di wilayah timur Indonesia, memiliki TPT terendah dan TPAK tertinggi, mencerminkan kondisi terbaik dalam hal pengangguran dan partisipasi angkatan kerja. Secara keseluruhan, klasterisasi ini menggambarkan variasi kondisi ekonomi dan sosial antar provinsi, di mana Cluster 3 menunjukkan kinerja terbaik, sedangkan Cluster 1 menghadapi tantangan lebih besar.

5 DAFTAR PUSTAKA

Apriliana, T., & Widodo, E. (2023). Analisis Cluster Hierarki untuk Pengelompokan Provinsi di Indonesia berdasarkan Jumlah Base Transceiver Station dan Kekuatan Sinyal. Konvergensi: Konvergensi Teknologi dan Sistem Informasi, 3(2), 286. Badan Pusat Statistik (BPS). (2023). Tingkat Pengangguran Terbuka (TPT) dan Tingkat Partisipasi Angkatan Kerja (TPAK) Menurut Provinsi, 2023. Survei Angkatan Kerja Nasional (Sakernas) Agustus/BPS-Statistics Indonesia, August National Labor Force Survey. Paramadina, M., Sudarmin, & Aidid, M. K. (2019). Perbandingan Analisis Cluster Metode Average Linkage dan Metode Ward (Kasus: IPM Provinsi Sulawesi Selatan). VARIANSI: Journal of Statistics and Its Application on Teaching and Research, 1(2), 22-31. Wahyuni, M. (n.d.). Statistik deskriptif untuk penelitian olah data manual dan SPSS versi 25. Bintang Pustaka Madani.