Analisis Cluster Hierarki: Ketimpangan Sosial-Ekonomi

Library:

> # install.packages("knitr")
> # install.packages("rmarkdown")
> # install.packages("prettydoc")
> # install.packages("equatiomatic")
> # install.packages("DT")

Pendahuluan

Latar Belakang

Ketimpangan sosial-ekonomi merupakan salah satu permasalahan yang sering dihadapi oleh negara berkembang, termasuk Indonesia. Masalah ini terlihat nyata dalam berbagai indikator, seperti tingkat pengangguran, kemiskinan, distribusi pendapatan, dan standar gaji di berbagai wilayah. Meskipun Indonesia telah menunjukkan kemajuan ekonomi dalam beberapa dekade terakhir, perbedaan signifikan antar provinsi masih menjadi tantangan yang perlu diselesaikan.

Tingkat pengangguran terbuka di provinsi-provinsi di Pulau Kalimantan dan Sulawesi mencerminkan ketidakseimbangan antara ketersediaan lapangan kerja dan jumlah angkatan kerja. Tingginya angka pengangguran tidak hanya berdampak pada produktivitas regional tetapi juga berkontribusi terhadap meningkatnya jumlah penduduk miskin. Sementara itu, persentase penduduk miskin di berbagai provinsi di kedua pulau ini masih menunjukkan ketimpangan yang tajam, dengan daerah-daerah tertentu memiliki persentase yang jauh lebih tinggi dibandingkan daerah lainnya. Hal ini menunjukkan adanya keterbatasan akses terhadap peluang ekonomi, pendidikan, dan layanan dasar di beberapa wilayah.

Selain itu, perbedaan dalam rata-rata gaji dan upah minimum regional (UMR) di setiap provinsi semakin memperjelas ketimpangan ekonomi di Kalimantan dan Sulawesi. Rata-rata gaji yang rendah di beberapa daerah sering kali tidak sejalan dengan standar hidup yang layak, sedangkan UMR yang ditetapkan pemerintah belum mampu menjawab kebutuhan dasar masyarakat secara memadai. Ketimpangan ini menciptakan tantangan dalam mewujudkan kesejahteraan ekonomi yang merata di kedua wilayah tersebut.

Pemilihan fokus pada provinsi di Pulau Kalimantan dan Sulawesi juga didasarkan pada perannya yang strategis dalam perekonomian nasional. Kalimantan merupakan pusat produksi sumber daya energi dan tambang, sementara Sulawesi memiliki kontribusi penting dalam sektor agribisnis dan perikanan. Ketimpangan sosial-ekonomi di kedua wilayah ini tidak hanya berdampak lokal tetapi juga memiliki implikasi signifikan terhadap ekonomi nasional. Oleh karena itu, memahami pola distribusi sosial-ekonomi di kedua pulau ini penting untuk mendukung pengembangan wilayah dan menyusun kebijakan yang lebih tepat sasaran.

Dalam hal ini, penting untuk memahami bagaimana pola distribusi sosial-ekonomi antar provinsi di Kalimantan dan Sulawesi. Salah satu cara yang efektif untuk mengetahui pola distribusi sosial-ekonomi antar provinsi adalah melalui analisis klaster hierarki. Metode ini memungkinkan kita untuk mengelompokkan provinsi berdasarkan kesamaan dalam berbagai aspek sosial-ekonomi, seperti tingkat pengangguran, persentase penduduk miskin, rata-rata gaji, dan UMR. Dengan pemahaman yang lebih mendalam tentang karakteristik wilayah-wilayah tersebut, diharapkan pemerintah dapat menyusun kebijakan yang lebih tepat sasaran serta lebih efektif dalam menangani ketimpangan ekonomi dan meningkatkan kesejahteraan masyarakat.

Penelitian ini bertujuan untuk mengidentifikasi pola-pola karakteristik sosial-ekonomi antar provinsi di Kalimantan dan Sulawesi dengan menggunakan metode analisis klaster hierarki. Hasil dari penelitian ini diharapkan dapat menangkap pola distribusi sosial-ekonomi antar provinsi di kedua pulau tersebut sebagai faktor dari ketimpangan sosial-ekonomi regional yang menjadi dasar bagi perencanaan kebijakan yang lebih efektif dalam mengatasi masalah pengangguran, kemiskinan, dan ketimpangan pendapatan.

Rumusan Masalah

Berdasarkan latar belakang yang telah diuraikan, maka rumusan permasalahan penelitian ini adalah sebagai berikut:

Bagaimana mengelompokkan provinsi-provinsi di pulau Kalimantan dan Sulawesi berdasarkan indikator sosial-ekonomi seperti tingkat pengangguran, persentase penduduk miskin, rata-rata gaji, dan UMR?
Bagaimana mengetahui kelompok provinsi yang menunjukkan ketimpangan sosial-ekonomi yang lebih tinggi atau lebih rendah berdasarkan indikator tersebut?

Tujuan Penelitian

Adapun tujuan penelitian yang ingin dicapai dalam penelitian ini adalah sebagai berikut:

Untuk mengetahui pengelompokan provinsi-provinsi di pulau Kalimantan dan Sulawesi berdasarkan indikator sosial-ekonomi seperti tingkat pengangguran, persentase penduduk miskin, rata-rata gaji, dan UMR.
Untuk mengetahui kelompok provinsi yang memiliki ketimpangan sosial-ekonomi yang lebih tinggi atau lebih rendah berdasarkan analisis klaster yang dilakukan.

Data

Data yang digunakan dalam penelitian ini berasal dari dataset yang tersedia website BPS(Bada Pusat Statistik). Dataset ini merupakan gabungan dari berbaga data yang memiliki amatan dan periode waktu yang sama, yakni pada 11 provinsi di pulau Kalimantan dan Sulawesi pada tahun 2024. Adapun data tersebut tersaji dalam tabel berikut:

Tinjauan Pustaka

Ketimpangan Sosial-Ekonomi

Ketimpangan sosial adalah sebuah ketidakadilan dalam status dan kedudukan yang dirasakan oleh masyarakat (Nuraini, 2011). Ketimpangan ini seringkali dipicu oleh faktor-faktor struktural yang menghambat sebagian kelompok dalam masyarakat untuk mengakses peluang dan sumber daya yang dapat meningkatkan kualitas hidup mereka.

Tingkat Penggangguran Terbuka

Tingkat pengangguran terbuka adalah indikator penting dalam mengukur ketidakseimbangan antara angkatan kerja yang tersedia dan jumlah lapangan kerja yang ada. Pengangguran terbuka menggambarkan proporsi angkatan kerja yang aktif mencari pekerjaan namun belum mendapatkan pekerjaan.

Persentase Penduduk Miskin

Kemiskinan merupakan salah satu bentuk ketimpangan sosial-ekonomi yang menggambarkan kondisi di mana seseorang atau keluarga tidak dapat memenuhi kebutuhan dasar hidupnya. Kemiskinan dapat diukur dengan berbagai cara, salah satunya adalah melalui persentase penduduk miskin, yang menggambarkan proporsi jumlah penduduk yang hidup di bawah garis kemiskinan.

Upah Minimum Regional

Upah Minimum Regional (UMR) adalah standar minimum gaji yang harus diterima pekerja di suatu wilayah, yang ditetapkan oleh pemerintah daerah.

Statistika Deskriptif

Statistika deskriptif yaitu salah satu metode statistika yang berkaitan untuk pengumpulan dan penyajian sehingga dapat memberikan informasi yang berguna (Martias, 2021). Statistika deskriptif digunakan untuk menggambarkan atau merangkum data dengan cara yang mudah dipahami, tanpa menarik kesimpulan atau inferensi yang lebih luas. Dalam analisis sosial-ekonomi, statistika deskriptif dapat digunakan untuk menggambarkan pola distribusi pendapatan, pengangguran, kemiskinan, dan lainnya. Penggunaan statistik deskriptif sangat berguna dalam memvisualisasikan data melalui ukuran-ukuran statistik yang sederhana seperti rata-rata, median, dan standar deviasi.

Analisis Cluster: Hierarki

Analisis Cluster merupakan metode multivariat yang bertujuan untuk mengelompokkan objek atau kasus berdasarkan karakteristik yang dimilikinya. Teknik ini mengklasifikasikan objek sedemikian rupa sehingga objek-objek dengan karakteristik serupa (memiliki tingkat kemiripan tertinggi) dikelompokkan ke dalam satu cluster atau kelompok yang sama. Analisis cluster memiliki berbagai jenis metode yang dapat digunakan sesuai dengan kebutuhan dan karakteristik data. Secara umum, jenis-jenis analisis cluster terbagi menjadi dua yakni, hierarki dan non-hierarki. Analisis klaster hierarki adalah metode analisis statistik yang digunakan untuk mengelompokkan objek berdasarkan kemiripan karakteristiknya. Dalam konteks ketimpangan sosial-ekonomi, analisis klaster hierarki memungkinkan pengelompokan provinsi atau wilayah berdasarkan variabel seperti pengangguran, kemiskinan, rata-rata gaji, dan UMR.

Asumsi Analisis Cluster Hierarki

UJI KECUKUPAN SAMPEL

Sampel yang representatif adalah kondisi di mana sampel yang dipilih mampu menggambarkan atau mewakili populasi secara keseluruhan. Untuk memastikan sampel tersebut representatif, dapat dilakukan uji Kaiser Meyer Olkin (KMO). Jika hasil uji KMO berada dalam rentang 0,5 hingga 1, maka sampel dianggap cukup representatif untuk mewakili populasi.

UJI NON MULTIKOLINEARITAS

Variabel yang berkorelasi tinggi bisa memengaruhi pembentukan klaster dengan cara yang tidak diinginkan, mengurangi akurasi dan interpretabilitas hasil klasterisasi. Oleh karena itu, mengidentifikasi dan mengatasi multikolinearitas sebelum melakukan analisis klaster dapat meningkatkan kualitas hasil yang diperoleh. Menurut Gujarati (1995), masalah multikolinearitas terjadi apabila nilai absolut koefisien korelasi antar variabel independen lebih besar dari 0,8. Sebaliknya, jika nilai koefisien korelasi kurang dari 0,8, maka model dianggap bebas dari multikolinearitas dan memenuhi asumsi non-multikolinearitas.

Source Code

Library

> library(psych)
> library(GPArotation)
> library(clValid)
> library(ggplot2)
> library(cluster)
> library(factoextra)
> library(tidyverse)
> library(car)
> library(readxl)
> library(REdaS)
> library(fpc)  
> library(DT)
> library(MVN)

Import Data

> data <- read_excel("C:/Users/AJENG/Downloads/Data.xlsx")
> data <-data.frame(data)
> head(data)
            Provinsi Tingkat_Pengangguran Penduduk_Miskin Rata_Gaji     UMR
1   KALIMANTAN BARAT                 4.86            6.32   2815188 2399699
2  KALIMANTAN TENGAH                 4.01            5.17   3088199 2903145
3 KALIMANTAN SELATAN                 4.20            4.11   3233740 2877449
4   KALIMANTAN TIMUR                 5.14            5.78   4234455 2981379
5   KALIMANTAN UTARA                 3.90            6.32   3625922 3000804
6     SULAWESI UTARA                 5.85            7.25   3222825 3310723

Statistika Deskriptif

> statdes <- summary(data)
> statdes
   Provinsi         Tingkat_Pengangguran Penduduk_Miskin    Rata_Gaji      
 Length:11          Min.   :2.680        Min.   : 4.110   Min.   :2283344  
 Class :character   1st Qu.:3.110        1st Qu.: 6.050   1st Qu.:2719159  
 Mode  :character   Median :4.010        Median : 7.250   Median :2968534  
                    Mean   :3.999        Mean   : 8.343   Mean   :3047896  
                    3rd Qu.:4.530        3rd Qu.:11.210   3rd Qu.:3228282  
                    Max.   :5.850        Max.   :14.570   Max.   :4234455  
      UMR         
 Min.   :2303711  
 1st Qu.:2615439  
 Median :2877449  
 Mean   :2809129  
 3rd Qu.:2991092  
 Max.   :3310723

Asumsi Analisis Cluster

Uji Kecukupan Sampel

> kmo <- KMO(data[,2:5])
> kmo
Kaiser-Meyer-Olkin factor adequacy
Call: KMO(r = data[, 2:5])
Overall MSA =  0.77
MSA for each item = 
Tingkat_Pengangguran      Penduduk_Miskin            Rata_Gaji 
                0.74                 0.74                 0.82 
                 UMR 
                0.79

Uji Non-Multikolinearitas

> korelasi <- cor(data[,2:5], method = 'pearson')
> korelasi
                     Tingkat_Pengangguran Penduduk_Miskin  Rata_Gaji        UMR
Tingkat_Pengangguran            1.0000000      -0.6861700  0.6234543  0.5862937
Penduduk_Miskin                -0.6861700       1.0000000 -0.6375348 -0.4134960
Rata_Gaji                       0.6234543      -0.6375348  1.0000000  0.4964258
UMR                             0.5862937      -0.4134960  0.4964258  1.0000000

Standarisasi Data

> datastand <- scale(data[,2:5])
> datastand
      Tingkat_Pengangguran Penduduk_Miskin   Rata_Gaji        UMR
 [1,]            0.8609568     -0.60719234 -0.43328225 -1.3462595
 [2,]            0.0109097     -0.95240506  0.07504023  0.3091388
 [3,]            0.2009202     -1.27060114  0.34602494  0.2246469
 [4,]            1.1409724     -0.76929223  2.20926638  0.5663827
 [5,]           -0.0990964     -0.60719234  1.07623317  0.6302547
 [6,]            1.8510117     -0.32802031  0.32570121  1.6493101
 [7,]           -1.0591496      1.02881578 -0.84542869 -1.6618809
 [8,]            0.1909197     -0.08487048 -0.39138519  0.9689194
 [9,]           -0.9091413      0.86071220 -0.14776502 -0.8454239
[10,]           -0.8691391      1.86933372 -0.79087635 -0.0667575
[11,]           -1.3191641      0.86071220 -1.42352843 -0.4283306
attr(,"scaled:center")
Tingkat_Pengangguran      Penduduk_Miskin            Rata_Gaji 
        3.999091e+00         8.342727e+00         3.047896e+06 
                 UMR 
        2.809129e+06 
attr(,"scaled:scale")
Tingkat_Pengangguran      Penduduk_Miskin            Rata_Gaji 
        9.999445e-01         3.331279e+00         5.370826e+05 
                 UMR 
        3.041238e+05 
> rownames(datastand) <- 1:nrow(datastand)
> hasildata<-mvn(data[,2:5], multivariateOutlierMethod = "adj", showNewData = TRUE)

Menghitung Jarak

> jarak <- dist(datastand, method = "euclidean")
> jarak
           1         2         3         4         5         6         7
2  1.9597160                                                            
3  1.9876685 0.4668237                                                  
4  3.2781013 2.4355015 2.1733524                                        
5  2.6658858 1.1121043 1.1080808 1.6887542                              
6  3.2569370 2.3737569 2.3751503 2.3279661 2.3415019                    
7  2.5754248 3.1308856 3.4429120 4.7296987 3.5418773 4.7587367          
8  2.4664911 1.1991176 1.5823314 2.8803572 1.6203478 1.9473500 3.1512277
9  2.3707272 2.3487327 2.6764927 3.7958761 2.5469031 3.9343866 1.0973139
10 3.3002139 3.1028705 3.5187610 4.5171471 3.2707906 4.0520635 1.8138272
11 2.9548015 2.8010819 3.2265851 4.7849596 3.3185418 4.3404487 1.3970368
           8         9        10
2                               
3                               
4                               
5                               
6                               
7                               
8                               
9  2.3356912                    
10 2.4849263 1.4278765          
11 2.4883944 1.4034450 1.3231869

Koefisien Korelasi Cophenetic

> #Single Linkage
> hiers <- hclust(dist(data[,2:5]), method = "single")
> #korelasi cophenetic
> d1 <- dist(data[,2:5])
> hc1 <- hclust(d1, "single")
> d2 <- cophenetic(hc1)
> cors <- cor(d1,d2)
> cors
[1] 0.7486702
> 
> #Average Linkage
> hierave <- hclust(dist(data[,2:5]), method = "ave")
> #korelasi cophenetic
> hc2 <- hclust(d1, "ave")
> d3 <- cophenetic(hc2)
> corave <- cor(d1,d3)
> corave
[1] 0.7929993
> 
> #Complete Linkage
> hiercomp <- hclust(dist(data[,2:5]), method = "complete")
> #korelasi cophenetic
> hc3 <- hclust(d1, "complete")
> d4 <- cophenetic(hc3)
> corcomp <- cor(d1,d4)
> corcomp
[1] 0.7197275
> 
> #Centorid Linkage
> hiercen <- hclust(dist(data[,2:5]), method = "centroid")
> #korelasi cophenetic
> hc4 <- hclust(d1, "centroid")
> d5 <- cophenetic(hc4)
> corcen <- cor(d1,d5)
> corcen
[1] 0.7537638
> 
> #Ward
> hierward <- hclust(dist(data[,2:5]), method = "ward.D")
> #korelasi cophenetic
> hc5 <- hclust(d1,"ward.D")
> d6 <- cophenetic(hc5)
> corward <- cor(d1,d6)
> corward
[1] 0.5586403
> 
> #Menampilkan Hasil Koefisien Korelasi Cophenetic Dari Beberapa Metode
> KorCop<-data.frame(cors,corave,corcomp,corcen,corward)
> KorCop
       cors    corave   corcomp    corcen   corward
1 0.7486702 0.7929993 0.7197275 0.7537638 0.5586403

Analisis Cluster Metode Centroid Linkage

Dendogram

> hirave <- hclust(dist(scale(data[,2:5])), method = "centroid")
> hirave

Call:
hclust(d = dist(scale(data[, 2:5])), method = "centroid")

Cluster method   : centroid 
Distance         : euclidean 
Number of objects: 11 
> plot(hirave, labels(data$Provinsi), hang = 0.5, col = "black", main = "Cluster Dendogram", sub = " ", xlab = "PROVINSI", ylab = "Jarak")

Penentuan Jumlah Cluster

> plot <- fviz_nbclust(data[,2:4], FUN = hcut, method = "silhouette")
> print(plot)

> plot(hirave, hang = -1, main = "Cluster Dendogram With Centroid Linkage Method", sub = " ", xlab = "Kelurahan", ylab = "Jarak")
> cut_level<-2 #Menentukan jumlah cluster yaitu sebanyak 2
> clusters<-cutree(hirave,k=cut_level) #Menggabungkan menjadi 2 Cluster 
> print(clusters)
 [1] 1 1 1 1 1 1 2 1 2 2 2
> anggotaave <- data.frame(id = data$Provinsi, cutree(hirave, k = cut_level))
> anggotaave
                   id cutree.hirave..k...cut_level.
1    KALIMANTAN BARAT                             1
2   KALIMANTAN TENGAH                             1
3  KALIMANTAN SELATAN                             1
4    KALIMANTAN TIMUR                             1
5    KALIMANTAN UTARA                             1
6      SULAWESI UTARA                             1
7     SULAWESI TENGAH                             2
8    SULAWESI SELATAN                             1
9   SULAWESI TENGGARA                             2
10          GORONTALO                             2
11     SULAWESI BARAT                             2
> rect.hclust(hirave,k=cut_level,border="red")

Karakteristik Setiap Cluster

> library(cluster)
> clusters<-cutree(hirave,k=cut_level)
> clusters
 [1] 1 1 1 1 1 1 2 1 2 2 2
> result<-aggregate(datastand, list(clusters), mean)
> result
  Group.1 Tingkat_Pengangguran Penduduk_Miskin  Rata_Gaji        UMR
1       1            0.5937992      -0.6599391  0.4582284  0.4289133
2       2           -1.0391485       1.1548935 -0.8018996 -0.7505983

Hasil dan Pembahasan

Statistika Deskriptif

> statdes <- summary(data)
> statdes
   Provinsi         Tingkat_Pengangguran Penduduk_Miskin    Rata_Gaji      
 Length:11          Min.   :2.680        Min.   : 4.110   Min.   :2283344  
 Class :character   1st Qu.:3.110        1st Qu.: 6.050   1st Qu.:2719159  
 Mode  :character   Median :4.010        Median : 7.250   Median :2968534  
                    Mean   :3.999        Mean   : 8.343   Mean   :3047896  
                    3rd Qu.:4.530        3rd Qu.:11.210   3rd Qu.:3228282  
                    Max.   :5.850        Max.   :14.570   Max.   :4234455  
      UMR         
 Min.   :2303711  
 1st Qu.:2615439  
 Median :2877449  
 Mean   :2809129  
 3rd Qu.:2991092  
 Max.   :3310723

Berdasarkan hasil statistik deskriptif yang diberikan untuk variabel-variabel dalam dataset, secara umum terdapat variasi yang cukup besar dalam tingkat pengangguran, kemiskinan, rata-gaji, dan UMR di berbagai daerah. Tingkat pengangguran dan kemiskinan cenderung lebih tinggi di beberapa daerah dibandingkan dengan daerah lain. Sementara itu, gaji rata-rata dan UMR menunjukkan adanya disparitas besar, dengan beberapa daerah memiliki gaji dan UMR yang lebih tinggi daripada yang lain.

Asumsi Analisis Cluster

Uji Kecukupan Sampel

Tabel 4.1. Nilai Uji KMO
	Variabel	Nilai Uji KMO
Tingkat_Pengangguran	Tingkat_Pengangguran	0.74
Penduduk_Miskin	Penduduk_Miskin	0.74
Rata_Gaji	Rata_Gaji	0.82
UMR	UMR	0.79

Uji KMO pada masing masing variabel tersebut bernilai lebih dari 0.5 maka sampel dianggap cukup representatif untuk mewakili populasi. Sehingga sampel telah cukup untuk bisa dilanjutkan analisis cluster.

Uji Non-Multikolinearitas

Tabel 4.2. Nilai Korelasi Antar Variabel
	Tingkat_Pengangguran	Penduduk_Miskin	Rata_Gaji	UMR
Tingkat_Pengangguran	1.0000000	-0.6861700	0.6234543	0.5862937
Penduduk_Miskin	-0.6861700	1.0000000	-0.6375348	-0.4134960
Rata_Gaji	0.6234543	-0.6375348	1.0000000	0.4964258
UMR	0.5862937	-0.4134960	0.4964258	1.0000000

Berdasarkan output, dilihat bahwa nilai korelasi antar variabel kurang dari 0.8, sehingga dapat disimpulkan bahwa tidak terjadi multikolinearitas antar variabel.

Standarisasi Data

Setelah seluruh asumsi analisis kluster terpenuhi maka selanjutnya adalah melakukan standarisasi variabel ke bentuk Z-score sebagai data baru yang akan dipakai dalam analisis cluster. Berikut adalah hasil standarisasi data:

Tabel 4.3 Standarisasi Data
Tingkat_Pengangguran	Penduduk_Miskin	Rata_Gaji	UMR
0.8609568	-0.6071923	-0.4332823	-1.3462595
0.0109097	-0.9524051	0.0750402	0.3091388
0.2009202	-1.2706011	0.3460249	0.2246469
1.1409724	-0.7692922	2.2092664	0.5663827
-0.0990964	-0.6071923	1.0762332	0.6302547
1.8510117	-0.3280203	0.3257012	1.6493101
-1.0591496	1.0288158	-0.8454287	-1.6618809
0.1909197	-0.0848705	-0.3913852	0.9689194
-0.9091413	0.8607122	-0.1477650	-0.8454239
-0.8691391	1.8693337	-0.7908764	-0.0667575
-1.3191641	0.8607122	-1.4235284	-0.4283306

Menghitung Jarak

Setelah data distandarisasi, tahap berikutnya adalah menghitung jarak antara nilai tengah objek untuk setiap variabel dalam satu kelompok dengan menggunakan jarak Euclidean. Hasil perhitungan jarak Euclidean tersebut dapat ditemukan pada pembahasan sebelumnya.

Koefisien Korelasi Cophenetic

Tabel 4.4. Koefisien Korelasi Cophenetic dari Berbagai Metode Klastering
cors	corave	corcomp	corcen	corward
0.7486702	0.7929993	0.7197275	0.7537638	0.5586403

Koefisien korelasi cophenetic digunakan sebagai dasar dalam penentuan metode terbaik yang akan digunakan dalam analisis cluster. Metode dengan nilai korelasi mendekati 1 yang akan dipilih sebagai metode terbaik dalam penelitian ini. Nilai korelasi yang paling mendekati 1 ialah corcern, sehingga berdasarkan output metode terbaik yang terpilih adalah metode centroid linkage dipilih sebagai metode terbaik.

Analisis Cluster Hierarki Metode Centroid

Berdasarkan metode silhoutte didapatkan nilai optimum untuk kluster sebesar 2, pada gambar dibawah dapat dilihat bahwa pada titik 2 terjadi penurunan jangka panjang mak adari itu kluster optimum bernilai 2.

Dihasilkan dendogram dari analisis hierarki centroid dengan kelompok terbagi menajdi 2 sebagai berikut. Berdasarkan hasil dendogram tersebut dapat diketahui bahwa cluster 1 terdiri dari 7 provinsi dan 4 lainnya berada di cluster 2.

Karakteristik Setiap Cluster

Setelah menentukan jumlah cluster beserta anggota yang terbentuk, maka selanjutnya ialah memberikan ciri spesifik untuk menggambarkan isi cluster tersebut.

Tabel 4.5 Karakteristik Cluster
Group.1	Tingkat_Pengangguran	Penduduk_Miskin	Rata_Gaji	UMR
1	0.5937992	-0.6599391	0.4582284	0.4289133
2	-1.0391485	1.1548935	-0.8018996	-0.7505983

Hasil analisis cluster pada tabel di atas dapat diinterpretasikan sebagai berikut: 1. Cluster 1 = Wilayah ini memiliki ekonomi relatif lebih baik dengan tingkat pengangguran yang sedikit lebih tinggi, namun dengan lebih sedikit penduduk miskin, gaji rata-rata yang lebih tinggi, dan UMR yang lebih baik. 2. Cluster 2 = Wilayah ini memiliki tantangan ekonomi yang lebih besar, dengan tingkat pengangguran rendah tetapi jumlah penduduk miskin lebih tinggi, serta gaji rata-rata dan UMR yang lebih rendah dibandingkan rata-rata.

Kesimpulan

Tabel 5.1. Anggota Cluster
Cluster	Provinsi
1	Kalimantan Barat, Kalimantan Tengah, Kalimantan Selatan, Kalimantan Timur, Kalimantan Utara, Sulawesi Utara, Sulawesi Selatan.
2	Sulawesi Tengah, Sulawesi Tenggara, Gorontalo, Sulawesi Barat

Berdasarkan 4 faktor kesenjangan sosial-ekonomi di pulau kalimantan dan sulawesi yang terdiri dari 11 provinsi didapatkan bahwa provinsi Kalimantan Barat, Kalimantan Tengah, Kalimantan Selatan, Kalimantan Timur, Kalimantan Utara, Sulawesi Utara, Sulawesi Selatan cenderung memiliki kondisi ekonomi yang lebih baik, sedangkan provinsi Sulawesi Tengah, Sulawesi Tenggara, Gorontalo, Sulawesi Bara menunjukkan adanya tantangan ekonomi dengan lebih banyak penduduk miskin dan tingkat gaji serta UMR yang lebih rendah.

Daftar Pustaka

Gujarati, D. N. 1995. Ekonometrika Dasar. Jakarta: Erlangga.

Martias, L. D.(2021).Statistika Deskriptif Sebagai Kumpulan Informasi. FIHRIS: Jurnal Ilmu Perpustakaan dan Informasi, 16(1), 40-59.

Nuraini, dkk. (2018) Ketimpangan Sosial sebagai Dampak Perubahan Sosial di Tengah Globalisasi. Kemendikbud. Diakses pada: http://repositori.kemdikbud.go.id/19432/ (30 November 2024)