PENDAHULUAN

Latar Belakang

Indonesia merupakan negara demokrasi yang memberikan hak partisipasi politik kepada seluruh warga negaranya. Pemilihan Umum (Pemilu) menjadi salah satu sarana untuk mempererat relasi demokratis antara rakyat dengan pemerintahan. Dalam demokrasi, Komisi Pemilihan Umum (KPU) memiliki peran penting sebagai lembaga independen yang bertanggung jawab dalam penyelenggaraan Pemilu.

Salah satu aspek yang menjadi fokus perhatian dalam setiap Pemilu adalah tingkat partisipasi pemilih. Tingkat partisipasi yang tinggi menandakan keterlibatan aktif masyarakat dalam proses demokrasi, sementara tingkat partisipasi yang rendah dapat mencerminkan terjadinya berbagai tantangan atau hambatan dalam partisipasi politik oleh rakyat. Dalam menjalankan tugasnya, KPU tidak hanya berkutat pada aspek administratif penyelenggaraan Pemilu, tetapi juga memperhatikan analisis data terkait partisipasi pemilih. Salah satu cara untuk memahami pola partisipasi pemilih dengan metode Cluster.

Cluster dilakukan untuk membantu KPU dan pihak terkait dalam memahami dinamika politik. Dengan pemahaman yang lebih mendalam tentang karakteristik masyarakat di setiap Cluster, KPU dapat merancang strategi yang lebih tepat untuk meningkatkan partisipasi pemilih, baik melalui sosialisasi, edukasi, maupun penyuluhan. Cluster juga membantu dalam pengambilan keputusan terkait alokasi sumber daya dan pengaturan logistik untuk Pemilu. Dengan mengetahui pola partisipasi pemilih di setiap Cluster, KPU dapat menyesuaikan strategi dan alokasi sumber daya secara lebih efisien dan efektif.

Tujuan Penelitian

Tujuan dari penelitian adalah untuk mengetahui masyarakat Kota Malang melalui pengelompokkan kelurahan berdasarkan jumlah pemilih dan jumlah pemilih abstain pada pemilihan calon presiden 2024, yang selanjutnya dapat ditindaklanjuti sebagai informasi untuk perbaikan penyusunan kebijakan oleh Komisi Pemilihan Umum Kota Malang serta diadakannya penyuluhan yang lebih efektif tentang pentingnya penggunaan hak suara.

Tinjauan Pustaka

Statistika Deskriptif

Statistik deskriptif merupakan salah satu cabang ilmu statistika yang merangkum, menyajikan, dan mendeskripsikan data penelitian dalam format yang mudah dibaca untuk memberikan informasi yang lebih akurat. Statistik deskriptif hanya berkaitan dengan penjelasan atau deskripsi data, memberikan gambaran umum tentang situasi atau fenomena yang dianalisis.

Uji Sampel Representatif

Uji Kaiser-Meyer Olkin (KMO) digunakan untuk menilai sejauh mana data indikator homogen atau cocok untuk analisis faktor. Uji KMO juga membantu dalam menghitung koefisien korelasi untuk menentukan relevansi indikator tertentu dalam analisis faktor. Nilai KMO sama dengan atau melebihi 0,5 dapat menunjukkan bahwa sampel yang diuji cukup.

H0: Sampel mewakili populasi

H1: Sampel tidak mewakili populasi

Dengan rumus skewness: \[ KMO = \frac{\sum_{k=1}^{p} \sum_{l=1, l \neq k}^{p} r_{x_k x_l}^2}{\sum_{k=1}^{p} \sum_{l=1, l \neq k}^{p} r_{x_k x_l}^2 + \sum_{k=1}^{p} \sum_{l=1, l \neq k}^{p} \rho_{x_k x_l}^2} \]

dengan : \[ r_{x_k x_l} = \frac{\frac{1}{n} \sum_{i=1}^{n} (x_{ik} - \bar{x}_k)(x_{il} - \bar{x}_l)}{\sqrt{\frac{\sum_{i=1}^{n} (x_{ik} - \bar{x}_k)^2}{n}} \sqrt{\frac{\sum_{i=1}^{n} (x_{il} - \bar{x}_l)^2}{n}}} \] \[ \rho_{x_k x_{l,m}} = \frac{r_{x_k x_l} - r_{x_k x_m} r_{x_l x_m}}{\sqrt{(1 - r_{x_k x_m}^2)(1 - r_{x_l x_m}^2)}} \] dimana : \[ \begin{align*} p & \quad = \text{ Banyaknya variabel pengamatan } \\ n & \quad = \text{ Banyaknya objek pengamatan } \\ r_{x_k x_l} & \quad = \text{ Korelasi antara variabel \(x_k\) dan \(x_l\)} \\ \bar{x}_k & \quad = \text{ Rata-rata dari variabel \(x_k\)} \\ \bar{x}_l & \quad = \text{ Rata-rata dari variabel \(x_l\)} \\ \rho_{x_k x_{l,m}} & \quad = \text{ Korelasi parsial antara variabel \(x_k\) dan \(x_l\), dengan \(x_m\) sebagai konstan} \end{align*} \]

Uji Asumsi Non Multikolinearitas

Multikolinearitas merupakan suatu kondisi adanya hubungan linier atau korelasi yang tinggi diantara masing-masing variabel independen. Multikolinearitas biasanya terjadi karena sebagian besar variabel yang digunakan saling terkait. Menurut salah satu cara mengidentifikasi adanya multikolinearitas adalah dengan menghitung nilai Variance Inflation Factor (VIF).

H0: Tidak Terdapat multikolinearitas pada data

H1: Terdapat multikolinearitas pada data

\[ {VIF}_j = \frac{1}{1 - R_j^2} \] dimana: \[ \begin{align*} R_j^2 = \text{Koefisien determinasi yang diperoleh jika variabel ke-}j \text{ diregresikan dengan variabel lainnya, dengan } j = 1, 2, \dots, p. \end{align*} \] Jika nilai VIF ≤ 10, maka dapat disimpulkan bahwa multikolinieritas tidak terlalu tinggi dan masih dapat diterima. Salah satu metode untuk mengatasi multikolinieritas adalah dengan mengeluarkan variabel yang berkorelasi dari model. Selain itu, multikolinieritas juga bisa diatasi melalui Analisis Komponen Utama atau PCA (Principal Components Analysis).

Analisis Cluster

Analisis Cluster merupakan metode mengelompokkan objek pengamatan menjadi beberapa kelompok yang memiliki karakteristik yang sama, sehingga objek yang paling mirip akan berada dalam kelompok yang sama. Data mengenai ukuran kesamaan dianalisis menggunakan analisis Cluster untuk menentukan keanggotaan tiap objek dalam Cluster. Proses bertujuan untuk menciptakan Cluster yang homogen dalam satu Cluster dan heterogen dengan Cluster yang lain.

Analisis Cluster terdiri dari Cluster hirarki dan Cluster non hirarki. Cluster hirarki merupakan metode dalam mengelompokkan objek serupa dengan kemiripan dengan lebih dari 100 objek pengamatan. Cluster hirarki dilakukan dengan cara mengukur jarak kedekatan pada setiap objek yang kemudian membentuk sebuah degdogram. Sedangkan, Cluster non hirarki merupakan metode mengelompokkan objek ke dalam Cluster yang sudah ditentukan jumlahnya kurang dari 100 objek pengamatan.

Jarak Euclidean

Jarak euclidean adalah perhitungan untuk mengukur jarak dua titik yang mempelajari hubungan antara sudut dan jarak (Derisma, Firdaus, & Yusya, 2016). Jarak ini menghitung akar kuadrat dari penjumlahan kuadrat selisih dari masing-masing nilai peubah. Rumus dari jarak euclidean yaitu : \[ d_{i,j} = \sqrt{\sum_{k=1}^p (x_{ik} - x_{jk})^2} \] dimana : \[ \begin{align} d_{i,j} & = \text{Jarak antara objek \(i\) dengan objek \(j\)} \\ x_{ik} & = \text{Nilai objek \(i\) pada peubah ke-\(k\)} \\ x_{jk} & = \text{Nilai objek \(j\) pada peubah ke-\(k\)} \\ p & = \text{Banyaknya peubah yang diamati} \end{align} \]

Metode Analisis Cluster Hierarki

Menurut (Qonitatin & Novita, 2017) metode Cluster hirarki adalah teknik pengelompokan di mana jumlah Cluster yang akan dibentuk belum ditentukan sebelumnya. Dilakukan metode penggabungan (Agglomerative). Metode agglomerative dimulai dengan mencari dua objek terdekat kemudian digabungkan, proses ini berlanjut hingga terbentuk satu cluster yang mencakup semua objek. Metode terdapat beberapa macam, yaitu :

Single Linkage

Metode single linkage menentukan jarak antar cluster berdasarkan jarak terdekat antara dua titik atau dikenal dengan aturan tetangga terdekat. Rumus dari single linkage, yaitu \[ d_{(ij)k} = \min(d_{ik}, d_{jk}) \] dalam hal ini d_ik dan d_jk masing-masing merupakan jarak terdekat antar Cluster i dan k, dan Cluster j dan k.

Average Linkage

Metode average linkage dihitung jarak antara dua Cluster sebagai jarak rata-rata semua objek dalam satu Cluster terharap semua objek dalam Cluster lain. Metode ini menggunakan rumus, yaitu \[ d_{(ij)k} = \frac{1}{n_i \cdot n_j} \sum_{i=1}^{n_i} \sum_{j=1}^{n_j} \sqrt{\sum_{k=1}^p (d_{ik} - d_{jk})^2} \] dimana : \[ \begin{align*} n_i & = \text{jumlah item pada Cluster \(i\)} \\ n_j & = \text{jumlah item pada Cluster \(j\)} \\ d_{ik} & = \text{jarak terdekat antara Cluster \(i\) dan \(k\)} \\ d_{jk} & = \text{jarak terdekat antara Cluster \(j\) dan \(k\)} \end{align*} \]

Complete Linkage

Metode complete Linkage Method adalah metode Cluster yang didasarkan jarak terjauh antar objek. Rumus dari complete Linkage, yaitu \[ d_{(ij)k} = \max(d_{ik}, d_{jk}) \] dalam hal ini d(ik) dan d(jk) masing-masing merupakan jarak terdekat antar Cluster i dan k, dan Cluster j dan k.

Ward Linkage

Pada metode ward, jarak antara dua cluster dihitung menggunakan jumlah kuadrat (sum of squares) dari perbedaan antara cluster tersebut dengan fungsi objektifnya adalah Error Sum of Squares (SSE). Metode ward menggunakan rumus, yaitu \[ ESS = \sum_{j=1}^K \left( \sum_{i=1}^{n_j} d_{ij}^2 - \frac{1}{n_j} \left(\sum_{i=1}^{n_j} d_{ij} \right)^2 \right) \] dimana : \[ \begin{align*} n_j & = \text{jumlah item pada Cluster \(j\)} \\ d_{ij}^2 & = \text{nilai objek ke \(i\) pada kelompok ke \(j\)} \\ K & = \text{jumlah kelompok} \end{align*} \]

Koefisien Korelasi Cophenetic

Koefisien korelasi cophenetic merupakan koefisien korelasi antara elemen-elemen asli matriks ketidakmiripan (dissimilarity distance) dan elemen-elemen yang dihasilkan oleh dendogram (matriks cophenetic). Nilai koefisien korelasi cophenetic berikisar antara -1 sampai 1. Dengan persamaan korelasi cophenetic, yaitu \[ r_\text{coph} = \frac{\sum_{i < k} (d_{ik} - \bar{d})(d_{Cik} - \bar{d}_C)} {\sqrt{\left[\sum_{i < k} (d_{ik} - \bar{d})^2 \right] \left[\sum_{i < k} (d_{Cik} - \bar{d}_C)^2 \right]}} \] dimana : \[ \begin{align*} d_{ik} & = \text{jarak Euclidean antara objek ke-\(i\) dan ke-\(j\)} \\ d_{Cik} & = \text{jarak cophenetic antara objek ke-\(i\) dan ke-\(j\)} \\ \bar{d} & = \text{rata-rata jarak Euclidean antara objek ke-\(i\) dan ke-\(j\)} \\ \bar{d}_C & = \text{rata-rata jarak cophenetic antara objek ke-\(i\) dan ke-\(j\)} \end{align*} \] Nilai korelasi Cophenetic yang semakin mendekati 1 berarti solusi yang dihasilkan dari proses gerombol semakin baik.

Koefisien Silhouette

Koefisien silhouette adalah ukuran yang digunakan untuk menilai efektivitas pengelompokan dalam analisis data. Nilai koefisien mendekati 1 pengelompokan dianggap berkualitas baik. Dengan persamaan koefisien silhouette, yaitu \[ \text{sil}(c) = \text{sil}(k) = \frac{1}{|k|} \sum_{i=1}^k \text{sil}(c_i) \] dimana: \[ \begin{align*} \text{sil}(k) & = \text{nilai silhouette semua cluster} \\ |k| & = \text{banyaknya cluster} \\ \text{sil}(c_i) & = \text{nilai silhouette untuk cluster ke-\(i\)} \end{align*} \]

Indeks Validitas

Indeks validitas cluster adalah metode yang mengevaluasi hasil Cluster untuk menentukan jumlah Cluster optimal suatu data. Terdapat tiga indeks validitas Cluster yang digunakan untuk menentukan jumlah Cluster optimal, yaitu :

Connectivity : indeks validitas Cluster yang mengukur seberapa baik objek-objek dalam dataset terhubung satu sama lain di dalam Cluster yang sama. Nilai yang lebih kecil menunjukkan Cluster yang lebih kompak dan baik.
Indeks Dunn : indeks yang digunakan untuk menilai kualitas Cluster dengan mempertimbangkan dua faktor utama: jarak antara Cluster yang berbeda (separation) dan kekompakan (compactness) di dalam Cluster. Nilai yang lebih tinggi menunjukkan Cluster yang lebih terpisah dengan baik dan lebih kompak.
Indeks Silhouette : Indeks ini memperhitungkan jarak rata-rata antara objek dan semua objek lain dalam Cluster yang sama (cohesion), serta jarak rata-rata antara objek dan objek di Cluster terdekat yang berbeda (separation).

Data

Data yang digunakan pada penelitian ini adalah data jumlah pemilih yang dikriteriakan dengan jumlah pengguna dalam Daftar Pemilih Tetap (DPT), jumlah pengguna hak pilih dalam daftar Pemilih Tambahan (DPTb), jumlah pengguna hak pilih dalam Daftar Pemilih Khusus (DPK), jumlah pengguna hak pilih disabilitas, dan jumlah pemilih abstain/golput.

SOURCE CODE

Library yang Dibutuhkan

> library(readxl)
> library(psych)
> library(car)
> library(stats)
> library(factoextra)
> library(knitr)
> library(dplyr)
> library(cluster)   
> library(factoextra)
> library(ggplot2)
> library(clValid)

Import Data

> data2 <- read_excel("C:/Users/Salma/Documents/'brawijaya!/internship/Data PKL/data2.xlsx")
> data2 <- data.frame(data2)
> head(data2)
  No       Kelurahan   DPT DPTb DPK Disabilitas Golput
1  1      Ciptomulyo  8199   25 118          11   1478
2  2          Gadang 12184    9 254          11   2627
3  3       Kebonsari  6555   29 110          23   1461
4  4 Bandungrejosari 19595  109 284          27   3669
5  5           Sukun 11791   30 195          30   2386
6  6     Tanjungrejo 17505   45 252          43   3841

> datastand2 <- data2[, c("DPT", "DPTb", "DPK", "Disabilitas", "Golput")]
> describe(data2[, -1])
            vars  n    mean      sd median trimmed     mad  min   max range
Kelurahan*     1 57   29.00   16.60     29   29.00   20.76    1    57    56
DPT            2 57 9272.40 4366.11   8807 8880.26 4544.17 3237 19999 16762
DPTb           3 57   43.33   38.86     30   37.38   25.20    3   185   182
DPK            4 57  144.79   75.00    132  138.17   74.13   29   358   329
Disabilitas    5 57   27.33   17.01     26   25.30   16.31    6    88    82
Golput         6 57 1967.46 1017.87   1747 1859.45  939.97  599  5507  4908
            skew kurtosis     se
Kelurahan*  0.00    -1.26   2.20
DPT         0.71    -0.33 578.31
DPTb        1.62     2.49   5.15
DPK         0.82     0.10   9.93
Disabilitas 1.50     2.90   2.25
Golput      1.13     1.18 134.82

Uji Sampel Representatif

> kmo <- KMO(datastand2)
> kmo
Kaiser-Meyer-Olkin factor adequacy
Call: KMO(r = datastand2)
Overall MSA =  0.79
MSA for each item = 
        DPT        DPTb         DPK Disabilitas      Golput 
       0.73        0.94        0.83        0.84        0.76

Uji Asumsi Non Multikolinearitas

> model <- lm(data2$Golput ~ data2$DPT + data2$DPTb + data2$DPK + data2$Disabilitas, data = data2)
> vif(model)
        data2$DPT        data2$DPTb         data2$DPK data2$Disabilitas 
         4.762425          1.401343          3.627687          1.493506

Analisis Cluster

Korelasi cophenetic

> cov_matrix <- cov(datastand2)
> jarak <- dist(datastand2, method = "euclidean")
> head(jarak)
[1]  4149.5997  1644.1560 11606.2123  3705.8390  9602.3323   902.3021

> d1 <- dist(jarak)
> 
> #Single Linkage
> hiers <- hclust(dist(jarak), method = "single")
> hc1 <- hclust(d1, "single")
> d2 <- cophenetic(hc1)
> cors <- cor(d1,d2)
> cors
[1] 0.8006389

> 
> #Average Linkage
> hierave <- hclust(dist(jarak), method = "average")
> hc2 <- hclust(d1, "ave")
> d3 <- cophenetic(hc2)
> corave <- cor(d1,d3)
> corave
[1] 0.8877889

> 
> #Complete Linkage
> hiercomp <- hclust(dist(jarak), method = "complete")
> hc3 <- hclust(d1, "complete")
> d4 <- cophenetic(hc3)
> corcomp <- cor(d1,d4)
> corcomp
[1] 0.8796501

> 
> #Ward
> hierward <- hclust(dist(jarak), method = "ward.D")
> hc4 <- hclust(d1,"ward.D")
> d5 <- cophenetic(hc4)
> corward <- cor(d1,d5)
> corward
[1] 0.7025977

> 
> KorCop<-data.frame(cors,corave,corcomp,corward)
> KorCop
       cors    corave   corcomp   corward
1 0.8006389 0.8877889 0.8796501 0.7025977

Koefisien Silhouette

> silhouette_widths <- function(datastand2, max_k) {
+   sil_scores <- numeric(max_k - 1)
+   
+   for (k in 2:max_k) {
+     hclust_result <- hclust(dist(datastand2), method = "average")
+         cluster_cut <- cutree(hclust_result, k = k)
+         sil <- silhouette(cluster_cut, dist(datastand2))
+     sil_scores[k - 1] <- mean(sil[, 3])
+   }
+   
+   return(sil_scores)
+ }
> sil_scores <- silhouette_widths(datastand2, 8)
> for (k in 2:8) {
+   cat("Silhouette for k =", k, ":", sil_scores[k-1], "\n")
+ }
Silhouette for k = 2 : 0.6099696 
Silhouette for k = 3 : 0.6063302 
Silhouette for k = 4 : 0.5615026 
Silhouette for k = 5 : 0.5151271 
Silhouette for k = 6 : 0.5344935 
Silhouette for k = 7 : 0.5113327 
Silhouette for k = 8 : 0.4973201

> sil_data <- data.frame(
+   k = 2:8,
+   silhouette = sil_scores
+ )
> ggplot(sil_data, aes(x = k, y = silhouette)) +
+   geom_line() +
+   geom_point() +
+   labs(title = "Silhouette Width for Different Number of Clusters",
+        x = "Number of Clusters (k)",
+        y = "Silhouette Width") +
+   theme_minimal()

Indeks Validitas

> inval <- clValid(
+   datastand2,           
+   2:3,                 
+   clMethods = "hierarchical", 
+   validation = "internal",    
+   metric = "euclidean",       
+   method = "average"          
+ )
> summary(inval)

Clustering Methods:
 hierarchical 

Cluster sizes:
 2 3 

Validation Measures:
                                2      3
                                        
hierarchical Connectivity  3.5071 7.9944
             Dunn          0.2948 0.0882
             Silhouette    0.6100 0.6063

Optimal Scores:

             Score  Method       Clusters
Connectivity 3.5071 hierarchical 2       
Dunn         0.2948 hierarchical 2       
Silhouette   0.6100 hierarchical 2

Dendogram

> #Metode Average Linkage
> hirave <- hclust(dist(scale(datastand2)), method = "average")
> hirave

Call:
hclust(d = dist(scale(datastand2)), method = "average")

Cluster method   : average 
Distance         : euclidean 
Number of objects: 57

> plot(hirave, labels = data2$Kelurahan, hang = 3, col = "blue", 
+      main = "Cluster Dendogram", sub = " ", xlab = "Kelurahan", ylab = "Jarak")

Hasil Aggregate Cluster

> average.cut <- cutree(hirave, 2)
> datastand2$Cluster <- average.cut
> result <- aggregate(datastand2[, -ncol(datastand2)], by = list(Cluster = datastand2$Cluster), FUN = mean)
> print(result)
  Cluster      DPT     DPTb      DPK Disabilitas   Golput
1       1  8065.18 36.44000 127.8800          25 1673.440
2       2 17895.43 92.57143 265.5714          44 4067.571

HASIL DAN PEMBAHASAN

Statistika Deskriptif

> summary(datastand2)
      DPT             DPTb             DPK         Disabilitas   
 Min.   : 3237   Min.   :  3.00   Min.   : 29.0   Min.   : 6.00  
 1st Qu.: 5742   1st Qu.: 17.00   1st Qu.: 87.0   1st Qu.:15.00  
 Median : 8807   Median : 30.00   Median :132.0   Median :26.00  
 Mean   : 9272   Mean   : 43.33   Mean   :144.8   Mean   :27.33  
 3rd Qu.:11791   3rd Qu.: 55.00   3rd Qu.:185.0   3rd Qu.:35.00  
 Max.   :19999   Max.   :185.00   Max.   :358.0   Max.   :88.00  
     Golput        Cluster     
 Min.   : 599   Min.   :1.000  
 1st Qu.:1215   1st Qu.:1.000  
 Median :1747   Median :1.000  
 Mean   :1967   Mean   :1.123  
 3rd Qu.:2484   3rd Qu.:1.000  
 Max.   :5507   Max.   :2.000

Hasil Uji

Uji Sampel Representatif

H0: Sampel mewakili populasi H1: Sampel tidak mewakili populasi

Overall MSA: 0.79
Nilai ini menunjukkan bahwa data memiliki tingkat kecukupan sampel yang baik dan cocok untuk dilanjutkan dengan analisis faktor.

MSA untuk setiap variabel: - DPT: 0.73
- DPTb: 0.94
- DPK: 0.83
- Disabilitas: 0.84
- Golput: 0.76

Seluruh variabel memiliki nilai MSA di atas 0.5, yang berarti setiap variabel dalam dataset ini layak untuk dimasukkan dalam analisis lanjutan.

Uji Asumsi Non Multikolinearitas

H0: Tidak Terdapat multikolinearitas pada data H1: Terdapat multikolinearitas pada data

Variabel	VIF
DPT	4.76
DPTb	1.40
DPK	3.63
Disabilitas	1.49

Dari hasil analisis:

Variabel DPT memiliki nilai VIF sebesar 4.76, mendekati batas indikasi multikolinearitas tetapi masih dalam rentang toleransi.
Variabel lainnya (DPTb, DPK, dan Disabilitas) memiliki nilai VIF di bawah 5, yang menunjukkan bahwa multikolinearitas antar variabel independen relatif rendah. Semua variabel independen dapat digunakan dalam analisis.

Korelasi Cophenetic

Korelasi Cophenetic pada Berbagai Metode Linkage

Berikut hasil analisis korelasi cophenetic menggunakan empat metode linkage:

Metode Linkage	Korelasi Cophenetic
Single Linkage	0.801
Average Linkage	0.888
Complete Linkage	0.880
Ward	0.703

Berdasarkan hasil korelasi cophenetic, metode Average Linkage adalah yang paling optimal dalam mencerminkan jarak asli antar objek. Metode ini direkomendasikan untuk analisis lebih lanjut dalam pengelompokan data.

Koefisien Silhouette

Hasil analisis untuk \(k = 2\) dari 2 hingga 8 adalah sebagai berikut:

Jumlah Klaster k	Nilai Silhouette
2	0.610
3	0.606
4	0.562
5	0.515
6	0.534
7	0.511
8	0.497

Nilai silhouette tertinggi diperoleh ketika \(k = 2\) = 2, yaitu sebesar 0.610, menunjukkan bahwa dua klaster memberikan hasil pengelompokan yang paling baik. Oleh karena itu, jumlah klaster yang optimal untuk analisis ini adalah 2 klaster.

Indeks Validitas

Metrik Validasi	\(k = 2\)	\(k = 3\)
Connectivity	3.5071	7.9944
Dunn Index	0.2948	0.0882
Silhouette	0.6100	0.6063

Connectivity: Nilai connectivity yang lebih rendah menunjukkan kualitas klasterisasi yang lebih baik. Nilai connectivity paling baik.
Dunn Index: Nilai Dunn Index yang lebih tinggi menunjukkan bahwa klaster lebih terpisah dan kompak. Nilai tertinggi pada \(k = 2\).
Silhouette Score: Nilai silhouette yang lebih mendekati 1 menunjukkan bahwa objek berada dalam klaster yang tepat. Pada \(k = 2\), nilai silhouette mlebih tinggi.

Anggota Cluster

Data Cluster dan Anggota

Berdasarkan ketiga metrik validasi konfigurasi klaster dengan \(k = 2\) memberikan hasil terbaik. Oleh karena itu, jumlah klaster optimal yang disarankan adalah 2 klaster.

Cluster	Anggota
1	Ciptomulyo, Gadang, Kebonsari, Sukun, Pisang Candi, Bandulan, Karangbesuki, Mulyorejo, Bakalankrajan, Balearjosari, Arjosari, Polowijen, Purwodadi, Blimbing, Kesatrian, Polehan, Jodipan, Tunggulwulung, Merjosari, Tlogomas, Dinoyo, Sumbersari, Ketawanggede, Jatimulyo, Tunjungsekar, Mojolangu, Tulusrejo, Lowokwaru, Tasikmadu, Klojen, Rampal Celaket, Samaan, Kidul Dalem, Sukoharjo, Kasin, Kauman, Oro-Oro Dowo, Bareng, Gading Kasri, Penanggungan, Mergosono, Bumiayu, Wonokoyo, Buring, Kedungkandang, Lesanpuro, Masyopuro, Cemorokandang, Arjowinangun, Tlogowaru
2	Bandungrejosari, Tanjungrejo, Pandanwangi, Purwantoro, Bunulrejo, Kotalama, Sawojajar

Ciptomulyo, Gadang, Kebonsari, Sukun, Pisang Candi, Bandulan, Karangbesuki, Mulyorejo, Bakalankrajan, Balearjosari, Arjosari, Polowijen, Purwodadi, Blimbing, Kesatrian, Polehan, Jodipan, Tunggulwulung, Merjosari, Tlogomas, Dinoyo, Sumbersari, Ketawanggede, Jatimulyo, Tunjungsekar, Mojolangu, Tulusrejo, Lowokwaru, Tasikmadu, Klojen, Rampal Celaket, Samaan, Kidul Dalem, Sukoharjo, Kasin, Kauman, Oro-Oro Dowo, Bareng, Gading Kasri, Penanggungan, Mergosono, Bumiayu, Wonokoyo, Buring, Kedungkandang, Lesanpuro, Masyopuro, Cemorokandang, Arjowinangun, Tlogowaru

Bandungrejosari, Tanjungrejo, Pandanwangi, Purwantoro, Bunulrejo, Kotalama, Sawojajar

Hasil Aggregat

Cluster	DPT	DPTb	DPK	Disabilitas	Golput
1	8065.18	36.44	127.88	25	1673.44
2	17895.43	92.57	225.57	44	4067.57

Pada variabel DPT, Rata-rata DPT pada Cluster sebesar 17895,43. Cluster 2 memiliki jumlah pemilih tetap yang lebih tinggi dibandingkan Cluster 1, menunjukkan bahwa area ini memiliki populasi pemilih tetap yang lebih besar.
Pada variabel DPTb, Cluster 2 memiliki rata-rata sebesar 92,57. Cluster 2 memiliki jumlah pemilih tambahan yang lebih tinggi dibandingkan Cluster 1, menunjukkan bahwa area ini mungkin memiliki populasi yang lebih dinamis atau pertumbuhan pemilih yang lebih besar.
Pada variabel DPK, Cluster 2 memiliki rata-rata DPK sebesar 265,57. Cluster 2 memiliki jumlah pemilih khusus yang lebih tinggi.
Pada variabel DPTDis, Cluster 2 memiliki rata-rata tingkat disabilitas sebesar 44. Cluster 2 memiliki proporsi pemilih dengan disabilitas yang lebih tinggi dibandingkan Cluster 1.
Pada variabel Golput, Cluster 2 memiliki rata-rata jumlah golput sebesar 4067,57. Cluster 2 memiliki jumlah golput yang lebih tinggi, menunjukkan bahwa partisipasi pemilih di area ini mungkin lebih rendah daripada Cluster 1.

PENUTUP

Kesimpulan

Berdasarkan hasil analisis pengelompokkan kelurahan di Kota Malang berdasarkan jumlah pemilih dan jumlah pemilih abstain pada pemilihan calon presiden 2024 menggunakan analisis Cluster hierarki dengan metode average linkage dan jarak Euclidean, diperoleh dua Cluster yang menggambarkan karakteristik populasi pemilih di Kota Malang.

Cluster 1 terdiri dari 50 kelurahan dengan area yang lebih kecil, memiliki jumlah pemilih yang kecil dengan angka golput yang rendah, menunjukkan partisipasi pemilih yang relatif tinggi.

Sebaliknya, Cluster 2 terdiri dari 7 kelurahan dengan area yang lebih luas, memiliki populasi jumlah pemilih yang lebih besar dengan angka golput yang lebih tinggi, menunjukkan adanya tantangan dalam partisipasi pemilih.

Saran

Penelitian mengenai partisipasi dalam pemilihan umum memerlukan penelitian lebih lanjut untuk mengetahui tindakan yang dapat dilakukan untuk meningkatkan partisipasi dalam pemilihan mendatang, maka tersapat beberapa saran untuk penelitian selanjutnya, yaitu :

(1). Penelitian lebih lanjut dapat difokuskan pada analisis faktor-faktor spesifik, seperti demografi, sosioekonomi, atau aksesibilitas terhadap tempat pemungutan suara. Identifikasi spesifik akan membantu dalam merancang hasil penelitian yang lebih mendalam.

(2). Selain metode hierarki dengan average linkage dan jarak Euclidean, peneliti selanjutnya bisa mencoba metode lain untuk melihat apakah hasil pengelompokan memberikan wawasan yang berbeda atau lebih dalam tentang pola partisipasi pemilih.

Peneliti selanjutnya dapat melengkapi analisis dengan pendekatan kualitatif wawancara atau survei terhadap yang dapat memberikan pemahaman yang lebih mendalam tentang hambatan atau motivasi yang memengaruhi partisipasi pemilih.

Daftar Pustaka

Derisma, Firdaus, & Yusya, R. P. (2016). Perancangan Ikat Pinggang Elektronik Untuk Tunanetra Menggunakan Mikrokontroller Dan Global Positioning System (Gps) Pada Smartphone Android. Jurnal Teknik Elektro ITP, 5(2), 130-136.

Syamhuri, W. B., Furqon, M. T., & Dewi, C. (2022). Pengelompokan Film Berdasarkan Alur Cerita menggunakan Metode Self Organizing Maps dan Silhouette Coefficient (Vol. 6, Issue 12). http://j-ptiik.ub.ac.id

Sa’adah, U., Rochayani, M.Y., Lestari, D.W., dan Lusia, D.A. 2021. Kupas Tuntas Algoritma Data Mining dan Implementasinya Menggunakan R. UB Press.

Undang-Undang Nomor 7 Tahun 2017 tentang Pemilihan Umum

Komisi Pemilihan Umum. (2009). Peraturan Komisi Pemilihan Umum Nomor 63 Tahun 2009 tentang Pedoman Penyusunan Tata Kerja Komisi Pemilihan Umum Provinsi, Komisi Pemilihan Umum Kabupaten/Kota, Panitia Pemilihan Kecamatan, Panitia Pemungutan Suara, dan Kelompok Penyelenggara Pemungutan Suara dalam Pemilihan Umum Kepala Daerah dan Wakil Kepala Daerah.

Komisi Pemilihan Umum. (2022). Peraturan Komisi Pemilihan Umum Nomor 7 Tahun 2022 tentang Penyusunan Daftar Pemilih Dalam Penyelenggaraan Pemilihan Umum dan Sistem Informasi Data Pemilih.

Pengelompokkan Kelurahan di Kota Malang Berdasarkan Jumlah Pemilih pada PEMILU 2024

Salma Vanda Azzah Naifah

22 November 2024

PENDAHULUAN

Latar Belakang

Tujuan Penelitian

Tinjauan Pustaka

Statistika Deskriptif

Uji Sampel Representatif

Uji Asumsi Non Multikolinearitas

Analisis Cluster

Jarak Euclidean

Metode Analisis Cluster Hierarki

Single Linkage

Average Linkage

Complete Linkage

Ward Linkage

Koefisien Korelasi Cophenetic

Koefisien Silhouette

Indeks Validitas

Data

SOURCE CODE

Library yang Dibutuhkan

Import Data

Uji Sampel Representatif

Uji Asumsi Non Multikolinearitas

Analisis Cluster

Korelasi cophenetic

Koefisien Silhouette

Indeks Validitas

Dendogram

Hasil Aggregate Cluster

HASIL DAN PEMBAHASAN

Statistika Deskriptif

Hasil Uji

Uji Sampel Representatif

Uji Asumsi Non Multikolinearitas

Korelasi Cophenetic

Korelasi Cophenetic pada Berbagai Metode Linkage

Koefisien Silhouette

Indeks Validitas

Anggota Cluster

Data Cluster dan Anggota

Hasil Aggregat

PENUTUP

Kesimpulan

Saran

Daftar Pustaka