1 Pendahuluan

1.1 Latar Belakang

Perkembangan teknologi komunikasi di Indonesia, khususnya 4G LTE, mengalami kemajuan pesat dengan tingkat penetrasi internet mencapai 72,78% hingga 79,5% dari total populasi pada tahun 2024 (BPS, 2025; APJII, 2024). Kualitas layanan jaringan ini diukur melalui tiga parameter standar internasional, yaitu Reference Signal Received Power (RSRP), Reference Signal Received Quality (RSRQ), dan Signal to Interference plus Noise Ratio (SINR). Menurut Afroz et al. (2015) dan Akram et al. (2023), ketiga parameter tersebut saling melengkapi dalam memberikan gambaran komprehensif mengenai performa jaringan serta kondisi riil di suatu wilayah.

Periode Natal dan Tahun Baru (Nataru) 2025/2026 menjadi ujian bagi infrastruktur ini karena adanya pergerakan 110,67 juta orang yang memicu lonjakan trafik telekomunikasi sebesar 7—20% (Indonesia.go.id, 2024; Rakyat Merdeka, 2024). Guna menjaga kualitas layanan, Kementerian Komunikasi dan Digital (Komdigi) melakukan pemantauan di 110 kabupaten/kota sejak 19 Desember 2025 hingga 4 Januari 2026. Data yang dihimpun mencakup ribuan titik pengukuran parameter RSRP, RSRQ, dan SINR yang memerlukan pendekatan analisis sistematis untuk mengolah volume data yang besar tersebut.

Untuk efisiensi, penelitian ini menerapkan teknik clustering yang didefinisikan oleh Han, Kamber, dan Pei (2012) sebagai proses pengelompokan objek berdasarkan kemiripan karakteristiknya. Metode yang dipilih adalah K-Medoids atau algoritma Partitioning Around Medoids (PAM) yang diperkenalkan oleh Kaufman dan Rousseeuw (1990). Penggunaan metode ini dianggap sangat relevan untuk memetakan kualitas sinyal karena kemampuannya dalam mengorganisir data yang kompleks ke dalam kategori-kategori yang memiliki kesamaan tinggi di dalam kelompoknya namun berbeda secara signifikan antar kelompok.

Algoritma K-Medoids dipilih karena lebih robust terhadap outlier dan noise dibandingkan K-Means, yang sangat penting mengingat data kualitas sinyal sering dipengaruhi oleh jarak BTS dan penghalang fisik (Kaufman & Rousseeuw, 1990; Tamtama, 2019). Penelitian ini mengelompokkan kualitas sinyal di 110 wilayah ke dalam empat kategori: Baik Sekali, Baik, Cukup, dan Kurang. Hasil akhir dari analisis ini diharapkan menjadi masukan strategis bagi Komdigi dalam pengambilan keputusan terkait pemerataan serta peningkatan kualitas infrastruktur telekomunikasi nasional.

1.2 Rumusan Masalah

Berdasarkan latar belakang yang telah diuraikan, rumusan masalah dalam penelitian ini adalah sebagai berikut:

  1. Bagaimana penerapan metode K-Medoids clustering dalam mengelompokkan kualitas sinyal 4G di 110 kabupaten/kota di Indonesia berdasarkan ketiga parameter tersebut?

  2. Ke dalam kelompok mana sajakah kota-kota di Indonesia terklasifikasi berdasarkan kategori kualitas sinyal Baik Sekali, Baik, Cukup, dan Kurang?

1.3 Tujuan Penelitian

Berdasarkan rumusan masalah yang telah ditetapkan, tujuan dari penelitian ini adalah:

  1. Menerapkan metode K-Medoids clustering untuk mengelompokkan kota-kota di Indonesia berdasarkan profil kualitas sinyal 4G-nya.

  2. Menghasilkan pengelompokan kota-kota di Indonesia ke dalam empat kategori kualitas sinyal, yaitu Baik Sekali, Baik, Cukup, dan Kurang, beserta kota representatif (medoid) dari masing-masing kelompok.

1.4 Manfaat Penelitian

Penelitian ini diharapkan dapat memberikan manfaat bagi berbagai pihak, antara lain:

  1. Bagi Kementerian Komunikasi dan Digital (Komdigi) Hasil penelitian dapat dijadikan sebagai bahan evaluasi dan referensi dalam memetakan kondisi kualitas jaringan 4G secara nasional, terutama pada periode dengan trafik tinggi seperti Nataru. Peta clustering yang dihasilkan dapat membantu Komdigi dalam memprioritaskan wilayah yang membutuhkan intervensi dan peningkatan infrastruktur telekomunikasi.

  2. Bagi Operator Telekomunikasi Pengelompokan kualitas sinyal per kota dapat memberikan gambaran komparatif mengenai kualitas layanan di berbagai wilayah, sehingga operator dapat menyusun strategi pengembangan jaringan yang lebih tepat sasaran dan efisien.

  3. Bagi Pengembangan Ilmu Pengetahuan Penelitian ini berkontribusi pada penerapan metode machine learning, khususnya K-Medoids clustering, dalam domain telekomunikasi. Hasil penelitian dapat menjadi referensi bagi penelitian selanjutnya yang berkaitan dengan analisis kualitas jaringan seluler di Indonesia.

  4. Bagi Penulis Penelitian ini menjadi sarana untuk mengaplikasikan ilmu yang diperoleh selama perkuliahan, khususnya di bidang analisis data dan machine learning, dalam konteks permasalahan nyata yang dihadapi selama kegiatan magang di Komdigi. Penulis dapat memperoleh pengalaman langsung dalam mengolah dan menganalisis data berskala nasional.

2 Tinjauan Pustaka

2.1 Jaringan 4G LTE (Long Term Evolution)

Teknologi Long Term Evolution (LTE) merupakan standar jaringan seluler generasi keempat (4G) yang dikembangkan oleh 3rd Generation Partnership Project (3GPP) dan ditetapkan dalam dokumen Release 8. Berdasarkan spesifikasi 3GPP, jaringan 4G LTE mampu menyediakan kecepatan unduh hingga 100 Mbps dan kecepatan unggah hingga 50 Mbps dengan menggunakan teknik modulasi Orthogonal Frequency Division Multiplexing (OFDM) pada sisi downlink dan Single Carrier Frequency Division Multiple Access (SC-FDMA) pada sisi uplink (3GPP, 2008).

Jaringan 4G LTE telah menjadi tulang punggung konektivitas digital di Indonesia. Menurut Asosiasi Penyelenggara Jasa Internet Indonesia (APJII), jumlah pengguna internet di Indonesia pada tahun 2024 mencapai 221,56 juta jiwa atau setara 79,5 persen dari total populasi, dengan sebagian besar akses dilakukan melalui jaringan seluler berbasis 4G (APJII, 2024). Arsitektur jaringan LTE terdiri atas perangkat pengguna (User Equipment/UE), jaringan akses radio (Evolved Universal Terrestrial Radio Access Network/E-UTRAN) yang tersusun dari evolved NodeB (eNodeB), dan jaringan inti (Evolved Packet Core/EPC). Interaksi antara ketiga komponen ini menentukan kualitas layanan yang diterima pengguna akhir.

2.2 Parameter Kualitas Sinyal 4G LTE

Pengukuran kualitas sinyal pada jaringan 4G LTE mengacu pada tiga parameter utama yang telah distandarkan oleh 3GPP, yaitu RSRP, RSRQ, dan SINR. Ketiga parameter ini secara bersama-sama memberikan gambaran menyeluruh mengenai kondisi jaringan di suatu titik pengukuran (Afroz et al., 2015).

2.3 Reference Signal Received Power (RSRP)

RSRP (Reference Signal Received Power) didefinisikan oleh 3GPP sebagai rata-rata linier daya yang diterima dari resource element yang membawa sinyal referensi sel (3GPP, 2008). RSRP merupakan indikator utama kekuatan sinyal yang diterima perangkat dari base station terdekat, tanpa memperhitungkan interferensi dan noise dari sumber lain. Karena itu, RSRP menjadi parameter yang digunakan oleh perangkat UE dalam proses pemilihan dan pergantian sel (cell selection dan handover) (Afroz et al., 2015).

Secara matematis, RSRP diformulasikan sebagai berikut: \[ RSRP (dBm) = RSSI (dBm) − 10 × log₁₀(12 × N) \]

di mana N adalah jumlah Physical Resource Block (PRB) yang digunakan pada bandwidth pengukuran. RSRP dinyatakan dalam satuan dBm (decibel-milliwatt) dengan rentang tipikal −44 dBm (kondisi sangat baik) hingga −140 dBm (sinyal tidak terdeteksi) (MCA, 2024). Semakin mendekati nol, semakin kuat sinyal yang diterima.

2.4 Reference Signal Received Quality (RSRQ)

RSRQ (Reference Signal Received Quality) merupakan parameter pengukuran kualitas sinyal referensi yang diterima perangkat. Berbeda dari RSRP yang hanya mengukur kekuatan sinyal berguna, RSRQ juga mempertimbangkan interferensi dan noise sehingga lebih mencerminkan kualitas koneksi yang sesungguhnya. Menurut 3GPP (2008), RSRQ didefinisikan sebagai:

\[ RSRQ = (N × RSRP) / (E-UTRA Carrier RSSI) \] di mana N adalah jumlah Resource Block pada bandwidth pengukuran dan RSSI adalah total daya yang diterima termasuk sinyal interferensi dari sel lain dan noise termal. Berdasarkan Afroz et al. (2015), RSRQ memberikan informasi tambahan yang diperlukan ketika RSRP saja tidak mencukupi untuk membuat keputusan handover yang andal. RSRQ dinyatakan dalam satuan dB dengan rentang tipikal −3 dB (kualitas sangat baik) hingga −19,5 dB (kualitas sangat buruk); semakin mendekati nol, semakin baik kualitas sinyalnya (CableFree, 2018).

2.5 Signal to Interference plus Noise Ratio (SINR)

SINR (Signal to Interference plus Noise Ratio) mengukur rasio antara daya sinyal berguna yang diterima terhadap total daya interferensi dan noise. Secara matematis, SINR diformulasikan sebagai: \[ SINR (dB) = 10 × log_{10}(P_{sinyal}/P_{interfensi}+P_{noise}) \] di mana P_sinyal adalah daya sinyal yang diinginkan, P_interferensi adalah total daya interferensi dari sel lain, dan P_noise adalah daya noise termal (Edvan, 2016). Meskipun tidak secara resmi didefinisikan dalam spesifikasi 3GPP, SINR digunakan secara luas oleh industri LTE dan oleh perangkat UE untuk menghitung Channel Quality Indicator (CQI) yang dilaporkan ke jaringan (Signalbooster, 2021). Nilai SINR yang negatif mengindikasikan bahwa jaringan 4G tidak berfungsi optimal di lokasi tersebut.

Berdasarkan ketiga parameter di atas, berikut adalah tabel kategorisasi kualitas sinyal 4G LTE yang umum digunakan sebagai acuan industri:

Kategori Kualitas Sinyal 4G LTE Berdasarkan RSRP, RSRQ, dan SINR
Kategori RSRP RSRQ SINR
Sangat Baik > -92 > -10 > 20
Baik -102 s.d -92 -12 s.d -10 15 s.d 20
Cukup -105 s.d -102 -16 s.d -12 8 s.d 15
Kurang < -105 < -16 < 8

2.6 Data Mining dan Analisis Klaster

Data mining didefinisikan oleh Han, Kamber, dan Pei (2012) sebagai proses pengekstraksian pengetahuan yang menarik, tidak sepele, tersembunyi sebelumnya, dan berpotensi berguna dari data dalam jumlah besar. Salah satu tugas utama dalam data mining adalah analisis klaster (cluster analysis), yaitu proses pengelompokan sekumpulan objek ke dalam kelas-kelas berdasarkan kemiripan karakteristiknya, sehingga objek-objek dalam satu kelompok memiliki kesamaan yang tinggi satu sama lain namun berbeda secara signifikan dari objek di kelompok lain (Han et al., 2012).

Clustering termasuk dalam kategori pembelajaran mesin tanpa pengawasan (unsupervised machine learning) karena tidak memerlukan label kelas pada data masukan. Metode clustering secara umum dibagi menjadi beberapa pendekatan, antara lain: (1) metode partisi, seperti K-Means dan K-Medoids; (2) metode hierarki, seperti agglomerative clustering; (3) metode berbasis densitas, seperti DBSCAN; dan (4) metode berbasis model (Han et al., 2012). Dalam penelitian ini digunakan metode partisi, khususnya K-Medoids, karena sifatnya yang lebih robust terhadap data sinyal telekomunikasi yang rentan mengandung nilai ekstrem.

2.7 Normalisasi Data (Standardisasi Z-Score)

Sebelum proses clustering dilakukan, normalisasi data diperlukan untuk memastikan bahwa seluruh variabel berada pada skala yang setara. Tanpa normalisasi, variabel dengan rentang nilai besar akan mendominasi perhitungan jarak sehingga menghasilkan pengelompokan yang bias. Metode normalisasi yang digunakan dalam penelitian ini adalah Z-Score Standardization, yang diformulasikan sebagai: \[ z_{iv} = (x_{iv} − \bar{x}_{v}) / s_v \] di mana \(x_{iv}\) adalah nilai variabel v pada objek ke-i, \(\bar{x}_v\) adalah nilai rata-rata variabel v, dan \(s_v\) adalah standar deviasi variabel v dari seluruh data. Hasil transformasi Z-Score menghasilkan distribusi dengan rata-rata (μ) = 0 dan standar deviasi (σ) = 1 untuk setiap variabel (Han et al., 2012).

2.8 Algoritma K-Medoids (Partitioning Around Medoids)

K-Medoids merupakan metode clustering berbasis partisi yang diperkenalkan oleh Kaufman dan Rousseeuw (1990) dalam buku Finding Groups in Data: An Introduction to Cluster Analysis. Algoritma ini juga dikenal dengan nama Partitioning Around Medoids (PAM). Perbedaan mendasar antara K-Medoids dan K-Means terletak pada representasi pusat klaster: K-Medoids menggunakan medoid, yaitu titik data nyata yang paling representatif dalam suatu klaster, bukan nilai rata-rata yang mungkin tidak merepresentasikan titik data manapun (Park & Jun, 2009).

Medoid didefinisikan sebagai objek m_c dalam klaster C yang meminimalkan total jarak ke seluruh anggota klasternya: \[ m_c = argmin_{x_i ∈ C} Σ_{x_j ∈ C} d(x_i, x_j) \]

2.8.1 Fungsi Jarak Euclidean

Pengukuran jarak antar objek dalam algoritma K-Medoids penelitian ini menggunakan Euclidean Distance. Untuk dua objek x_i dan x_j dengan p variabel, jarak Euclidean diformulasikan sebagai: \[ d(x_i, x_j) = \sqrt{Σ_{v=1}^{p} (x_{iv} − x_{jv})²} \] Untuk data penelitian ini dengan tiga variabel (RSRP, RSRQ, SINR), rumus tersebut menjadi: \[ d(x_i, x_j) = \sqrt{(RSRP_i−RSRP_j)² + (RSRQ_i−RSRQ_j)² + (SINR_i−SINR_j)²} \]

2.8.2 Tahapan Algoritma PAM

Algoritma PAM bekerja dalam dua fase utama, yaitu fase BUILD (inisialisasi) dan fase SWAP (optimasi iteratif) (Kaufman & Rousseeuw, 1990).

Fase BUILD bertujuan memilih k medoid awal. Pertama, dipilih objek pertama m₁ yang meminimalkan total jarak ke semua objek lain: \[ m₁ = argmin_{x_i} Σ_{j=1}^{n} d(x_i, x_j) \] Untuk memilih medoid berikutnya m_s (s = 2, 3, …, k), dihitung gain dari penambahan kandidat x_i: \[ g(x_i) = Σ_{j=1}^{n} max(D_j − d(x_i, x_j), 0) \] di mana \(D_j\) adalah jarak objek j ke medoid terdekat yang telah dipilih sebelumnya. Dipilih \(x_i\) dengan nilai \(g(x_i)\) terbesar hingga k medoid terpilih.

Fase SWAP bertujuan meningkatkan kualitas partisi dengan mencoba menukar medoid m_i dengan non-medoid x_h. Fungsi objektif yang diminimalkan (Total Cost) adalah: \[ TC = Σ_{c=1}^{k} Σ_{x_j ∈ C_c} d(x_j, m_c) \] Perubahan total cost akibat penukaran \((m_i, x_h)\) dihitung sebagai: \[ ΔTC_{ih} = Σ_{j ≠ i,h} ΔC_{jih} \] Penukaran dilakukan jika min\((ΔTC_{ih})\) < 0, yang berarti terdapat penukaran yang menurunkan total cost. Proses ini diulangi hingga tidak ada penukaran yang menghasilkan penurunan cost (konvergen) (Kaufman & Rousseeuw, 1990; Schubert & Rousseeuw, 2019).

3 Metodologi Penelitian

3.1 Jenis dan Sumber Data

Data yang digunakan dalam penelitian ini merupakan data sekunder yang diperoleh dari Unit Pelaksana Teknis (UPT) Kementerian Komunikasi dan Digital (Komdigi) yang tersebar di seluruh wilayah Indonesia. Data dikumpulkan selama periode Natal dan Tahun Baru (Nataru) 2024/2025, yakni mulai tanggal 19 Desember 2024 hingga 4 Januari 2025, sebagai bagian dari kegiatan pemantauan kualitas jaringan telekomunikasi nasional.

Data yang digunakan mencakup 9.801 rekaman pengukuran dari 110 kabupaten/kota yang tersebar di seluruh provinsi di Indonesia. Setiap rekaman memuat nilai rata-rata tiga parameter kualitas sinyal 4G LTE, yaitu RSRP, RSRQ, dan SINR.

3.2 Variabel Penelitian

Variabel yang digunakan dalam penelitian ini seluruhnya merupakan variabel independen (tidak terdapat variabel dependen) karena metode clustering bersifat unsupervised. Terdapat tiga variabel yang digunakan, yaitu: • RSRP : Rata-rata Reference Signal Received Power per kota (dBm) — mengukur kekuatan sinyal yang diterima perangkat dari base station • RSRQ : Rata-rata Reference Signal Received Quality per kota (dB) — mengukur kualitas sinyal dengan memperhitungkan interferensi • SINR : Rata-rata Signal to Interference plus Noise Ratio per kota (dB) — mengukur rasio sinyal berguna terhadap total gangguan dan noise

3.3 Teknik Analisis Data

Metode analisis yang digunakan dalam penelitian ini adalah K-Medoids Clustering dengan algoritma Partitioning Around Medoids (PAM) untuk mengelompokkan 110 kabupaten/kota ke dalam empat kategori kualitas sinyal 4G, yaitu Baik Sekali, Baik, Cukup, dan Kurang. Tahapan analisis yang dilakukan dalam penelitian ini meliputi:

  1. Agregasi data per kota dengan menghitung rata-rata RSRP, RSRQ, dan SINR dari seluruh titik pengukuran di setiap kabupaten/kota.

  2. Normalisasi data menggunakan Z-Score Standardization agar ketiga variabel berada pada skala yang setara.

  3. Validasi jumlah cluster k = 4 menggunakan Elbow Method dan Silhouette Method.

  4. Menjalankan algoritma K-Medoids PAM dengan k = 4 dan Euclidean Distance sebagai metrik jarak.

  5. Pelabelan cluster berdasarkan skor gabungan rata-rata ketiga variabel (Baik Sekali, Baik, Cukup, Kurang).

  6. Evaluasi kualitas clustering menggunakan Silhouette Score dan Davies-Bouldin Index.

3.4 Software yang Digunakan

Pengolahan dan analisis data dalam penelitian ini dilakukan menggunakan perangkat lunak R dengan RStudio sebagai lingkungan pengembangan (IDE). Beberapa package R yang digunakan antara lain readxl untuk membaca data dari file Excel, dplyr untuk manipulasi dan agregasi data, cluster (fungsi pam()) untuk menjalankan algoritma K-Medoids, factoextra untuk visualisasi hasil clustering dan penentuan jumlah cluster optimal, serta ggplot2 dan writexl untuk visualisasi dan ekspor hasil analisis.

4 Hasil dan Pembahasan

4.1 Agregasi Data per Kota

Data mentah yang diperoleh dari UPT Komdigi seluruh Indonesia selama periode Nataru 2024/2025 memuat 9.801 rekaman pengukuran dari 110 kabupaten/kota. Setiap kota memiliki banyak titik pengukuran, sehingga perlu dilakukan agregasi dengan menghitung nilai rata-rata RSRP, RSRQ, dan SINR untuk setiap kota agar setiap kota terwakili oleh satu baris data.

Sebelum agregasi, nama kolom distandarisasi agar lebih mudah digunakan dalam proses analisis selanjutnya.

## # A tibble: 10 × 5
##    Kota          Zona                        RSRP   RSRQ  SINR
##    <chr>         <chr>                      <dbl>  <dbl> <dbl>
##  1 Aceh Tamiang  Aceh                       -90.3 -11.3   6.95
##  2 Badung        Bali                       -85.5 -12.2   8.12
##  3 Bandung       Jawa Barat                 -86.7 -15.0   3.12
##  4 Bandung Barat Jawa Barat                 -83.3 -14.9   5.42
##  5 Bangka Barat  Kepulauan Bangka Belitung  -97.2 -12.6   9.02
##  6 Banjar        Kalimantan Selatan         -90.3 -12.3   3.84
##  7 Bantul        Daerah Istimewa Yogyakarta -91.0 -13.0   3.43
##  8 Batang        Jawa Tengah                -80.8  -9.53 19.8 
##  9 Batanghari    Jambi                      -92.2 -12.0   8.95
## 10 Bekasi        Jawa Barat                 -91.3 -13.2   6.65

Hasil agregasi menghasilkan 110 kota sebagai unit analisis, masing-masing dengan satu nilai rata-rata RSRP, RSRQ, dan SINR yang merepresentasikan kondisi sinyal 4G di kota tersebut selama periode Nataru.

4.2 Pengecekan Missing Value

Sebelum analisis dilanjutkan, dilakukan pengecekan terhadap nilai yang hilang (missing value) pada seluruh variabel. Keberadaan missing value dapat memengaruhi hasil clustering secara signifikan sehingga perlu dipastikan data bersih sebelum diproses lebih lanjut.

## Kota Zona RSRP RSRQ SINR 
##    0    0    0    0    0

4.3 Analisis Statistik Deskriptif

Statistik deskriptif digunakan untuk memahami karakteristik umum data sebelum proses clustering dilakukan. Ringkasan statistik ini mencakup nilai minimum, kuartil pertama, median, rata-rata, kuartil ketiga, dan nilai maksimum dari masing-masing variabel RSRP, RSRQ, dan SINR.

##       RSRP              RSRQ              SINR       
##  Min.   :-101.83   Min.   :-16.539   Min.   :-1.775  
##  1st Qu.: -91.90   1st Qu.:-13.600   1st Qu.: 4.327  
##  Median : -88.51   Median :-12.313   Median : 6.079  
##  Mean   : -88.67   Mean   :-12.403   Mean   : 6.470  
##  3rd Qu.: -85.87   3rd Qu.:-11.304   3rd Qu.: 8.296  
##  Max.   : -75.67   Max.   : -8.967   Max.   :20.053

Untuk mempermudah pemahaman distribusi dan mengidentifikasi keberadaan outlier pada masing-masing variabel, ditampilkan pula boxplot dari ketiga variabel secara berdampingan.

Berdasarkan boxplot di atas dapat diamati rentang sebaran nilai dan posisi median dari masing-masing parameter kualitas sinyal 4G di seluruh kota yang diamati. Keberadaan titik-titik di luar whisker mengindikasikan adanya kota-kota dengan nilai yang relatif ekstrem dibanding kota lainnya.

4.4 Normalisasi Data

Karena ketiga variabel (RSRP, RSRQ, dan SINR) memiliki satuan dan rentang nilai yang berbeda, normalisasi Z-Score Standardization dilakukan sebelum proses clustering. Tanpa normalisasi, variabel dengan rentang nilai yang lebih besar akan mendominasi perhitungan jarak sehingga menghasilkan pengelompokan yang bias.

Rumus Z-Score: \(z_{iv} = \frac{x_{iv} - \bar{x}_v}{s_v}\)

Hasil transformasi akan menghasilkan data dengan rata-rata = 0 dan standar deviasi = 1 untuk setiap variabel.

## Mean : 0 0 0
## SD   : 1 1 1

Nilai mean yang sangat mendekati 0 dan standar deviasi yang tepat bernilai 1 pada setiap variabel mengkonfirmasi bahwa proses normalisasi telah berhasil dilakukan dengan benar.

4.5 Penentuan Jumlah Cluster Optimal

Meskipun jumlah cluster telah ditetapkan sebesar k = 4 sesuai dengan empat kategori kualitas sinyal yang diinginkan (Baik Sekali, Baik, Cukup, Kurang), validasi tetap dilakukan menggunakan dua metode berikut.

4.5.1 Elbow Method

Elbow Method memplot nilai Total Within-Cluster Sum of Squares (WSS) terhadap berbagai nilai k. Nilai k yang optimal ditunjukkan oleh titik “siku” (elbow) di mana penambahan jumlah cluster tidak lagi secara signifikan mengurangi nilai WSS.

Grafik Elbow Method di atas memperlihatkan penurunan nilai WSS seiring bertambahnya jumlah cluster. Titik siku (elbow) yang terlihat pada grafik mengindikasikan nilai k yang direkomendasikan, di mana penambahan cluster lebih lanjut tidak memberikan penurunan WSS yang berarti.

4.5.2 Silhouette Method

Silhouette Method mengukur seberapa baik setiap objek berada di clusternya sendiri dibandingkan cluster terdekat lainnya. Nilai k yang menghasilkan rata-rata Silhouette Score tertinggi merupakan jumlah cluster yang paling optimal.

Grafik Silhouette Method di atas menunjukkan rata-rata Silhouette Score untuk setiap nilai k. Hasil dari kedua metode ini digunakan sebagai konfirmasi bahwa penetapan k = 4 telah sesuai dan dapat dipertanggungjawabkan secara analitis.

4.6 Clustering K-Medoids (PAM)

Setelah data dinormalisasi dan jumlah cluster divalidasi, proses clustering dijalankan menggunakan fungsi pam() dari package cluster dengan k = 4 dan metrik jarak Euclidean. Algoritma PAM (Partitioning Around Medoids) bekerja dengan memilih medoid — titik data nyata yang paling representatif — sebagai pusat setiap cluster.

## Indeks medoid: 69 83 70 91
## Kota yang menjadi medoid tiap cluster:
## [1] "Kota Sorong"     "Lampung Selatan" "Kota Surabaya"   "Mamuju"

Keempat kota medoid di atas merupakan kota yang paling representatif (paling sentral) dari masing-masing cluster yang terbentuk. Kota-kota ini akan dijadikan acuan dalam interpretasi karakteristik setiap kategori kualitas sinyal.

4.7 Pelabelan Cluster

Setelah empat cluster terbentuk, setiap cluster diberi label kategori berdasarkan skor gabungan rata-rata ketiga variabel. Cluster dengan skor gabungan tertinggi (nilai RSRP, RSRQ, dan SINR yang paling baik) ditetapkan sebagai kategori Baik Sekali, diikuti oleh Baik, Cukup, dan Kurang.

## # A tibble: 4 × 6
##   Cluster n_kota mean_RSRP mean_RSRQ mean_SINR   skor
##     <int>  <int>     <dbl>     <dbl>     <dbl>  <dbl>
## 1       1     32     -88.8     -10.7     10.3   -89.1
## 2       2     25     -87.0     -11.9      6.23  -92.7
## 3       3     36     -85.8     -14.1      3.68  -96.2
## 4       4     17     -96.9     -12.8      5.49 -104.
## 
## Distribusi kota per kategori:
## 
## Baik Sekali        Baik       Cukup      Kurang 
##          32          25          36          17

Distribusi di atas menunjukkan jumlah kota yang masuk ke dalam masing-masing kategori. Kategori dengan jumlah kota terbanyak mengindikasikan kondisi yang paling umum ditemui di seluruh Indonesia selama periode Nataru 2024/2025.

4.8 Visualisasi Hasil Clustering

4.8.1 Plot PCA 2D

Karena data memiliki tiga dimensi (RSRP, RSRQ, SINR), hasil clustering divisualisasikan dalam ruang dua dimensi menggunakan reduksi dimensi Principal Component Analysis (PCA). Setiap titik mewakili satu kota, sedangkan warna menunjukkan kategori clusternya.

Plot PCA di atas memperlihatkan posisi setiap kota dalam ruang dua dimensi beserta batas konveks (convex hull) dari masing-masing cluster. Kota-kota yang berada berdekatan memiliki profil kualitas sinyal yang serupa, sedangkan kota-kota yang berjauhan memiliki karakteristik yang berbeda signifikan.

4.8.2 Distribusi per Kategori

Bar chart berikut menampilkan jumlah kota yang masuk ke dalam masing-masing kategori kualitas sinyal 4G hasil clustering.

Visualisasi di atas memberikan gambaran seberapa besar proporsi kota-kota di Indonesia yang masuk dalam masing-masing kategori kualitas sinyal selama periode Nataru 2024/2025.

4.8.3 Scatter Plot RSRP vs SINR

Scatter plot berikut menampilkan hubungan antara variabel RSRP (kekuatan sinyal) dan SINR (rasio sinyal terhadap gangguan), dengan warna yang membedakan kategori cluster.

Scatter plot ini menggambarkan pola pemisahan antar cluster berdasarkan dua dimensi utama. Kota-kota yang berada di kanan atas (RSRP mendekati nol, SINR tinggi) cenderung masuk dalam kategori Baik Sekali, sedangkan kota-kota di kiri bawah menunjukkan kondisi sinyal yang lebih lemah.

4.8.4 Scatter Plot RSRP vs RSRQ

Scatter plot berikut menampilkan hubungan antara variabel RSRP (kekuatan sinyal) dan RSRQ (kualitas sinyal), yang keduanya mencerminkan kondisi penerimaan sinyal dari sisi perangkat pengguna.

Pola sebaran pada scatter plot ini menunjukkan korelasi antara kekuatan dan kualitas sinyal di berbagai kota. Kota-kota dengan RSRP yang lebih baik (mendekati nol) umumnya juga memiliki RSRQ yang lebih tinggi, namun variasi RSRQ yang disebabkan oleh interferensi lokal menyebabkan beberapa kota memiliki RSRP baik namun RSRQ yang lebih rendah.

Tabel ringkasan berikut merekap karakteristik setiap kategori cluster yang terbentuk, mencakup jumlah kota, nilai rata-rata ketiga parameter kualitas sinyal, serta kota medoid (kota paling representatif) dari masing-masing kategori.

## # A tibble: 4 × 6
##   Kategori    Jumlah_Kota Mean_RSRP Mean_RSRQ Mean_SINR Medoid         
##   <fct>             <int>     <dbl>     <dbl>     <dbl> <chr>          
## 1 Baik Sekali          32     -88.8     -10.7     10.3  Kota Sorong    
## 2 Baik                 25     -87.0     -11.9      6.23 Lampung Selatan
## 3 Cukup                36     -85.8     -14.1      3.68 Kota Surabaya  
## 4 Kurang               17     -96.9     -12.8      5.49 Mamuju

Berdasarkan tabel ringkasan di atas, terlihat perbedaan yang jelas pada nilai rata-rata ketiga parameter antar kategori. Kota-kota dalam kategori Baik Sekali memiliki nilai RSRP dan RSRQ yang paling mendekati nol serta SINR tertinggi, sedangkan kota-kota dalam kategori Kurang menunjukkan kondisi sebaliknya. Perbedaan yang konsisten ini mengkonfirmasi bahwa keempat cluster yang terbentuk memiliki karakteristik yang berbeda secara bermakna.

5 Penutup

5.1 kesimpulan

Berdasarkan hasil analisis clustering kualitas sinyal 4G LTE di 110 kabupaten/kota di Indonesia menggunakan metode K-Medoids dengan algoritma Partitioning Around Medoids (PAM) pada data periode Natal dan Tahun Baru (Nataru) 19 Desember 2024 hingga 4 Januari 2025 yang bersumber dari Unit Pelaksana Teknis (UPT) Kementerian Komunikasi dan Digital (Komdigi), diperoleh kesimpulan sebagai berikut.

  1. Kondisi kualitas sinyal 4G LTE di Indonesia selama periode Nataru 2024/2025 bervariasi secara signifikan antarkabupaten/kota. Secara agregat, nilai rata-rata RSRP seluruh kota berada pada −88,67 dBm, rata-rata RSRQ sebesar −12,40 dB, dan rata-rata SINR sebesar 6,47 dB. Variasi yang besar pada ketiga parameter ini mencerminkan adanya disparitas kualitas jaringan 4G yang nyata di berbagai wilayah Indonesia, yang sebagian dapat dikaitkan dengan ketidakmerataan infrastruktur telekomunikasi serta tekanan lonjakan trafik selama periode libur Nataru.

  2. Metode K-Medoids dengan algoritma PAM berhasil diterapkan pada data kualitas sinyal 4G yang telah diagregasi per kota dan dinormalisasi menggunakan Z-Score Standardization. Algoritma PAM bekerja melalui dua fase, yaitu fase BUILD untuk inisialisasi medoid dan fase SWAP untuk optimasi iteratif menggunakan Euclidean Distance, hingga mencapai konvergensi dan menghasilkan empat cluster yang bermakna.

  3. Keempat cluster yang terbentuk berhasil diklasifikasikan ke dalam empat kategori kualitas sinyal berdasarkan skor gabungan rata-rata RSRP, RSRQ, dan SINR. Ringkasan hasil clustering disajikan pada tabel berikut.

Ringkasan Hasil K-Medoids Clustering Kualitas Sinyal 4G per Kategori
Kategori Jumlah_Kota Rata_RSRP_dBm Rata_RSRQ_dB Rata_SINR_dB Kota_Medoid
Baik Sekali 32 (29,1%) -88,80 -10,65 10,32 Kota Sorong
Baik 25 (22,7%) -86,98 -11,95 6,23 Lampung Selatan
Cukup 36 (32,7%) -85,82 -14,08 3,68 Kota Surabaya
Kurang 17 (15,5%) -96,92 -12,81 5,49 Mamuju
Total 110 (100%) -88,67 -12,40 6,47

Kategori Baik Sekali mencakup 32 kota (29,1%) yang tersebar di berbagai provinsi di luar Jawa, antara lain Jawa Tengah, Papua, Maluku, Kalimantan, dan Sulawesi, dengan rata-rata SINR tertinggi sebesar 10,32 dB. Kota Sorong terpilih sebagai medoid yang paling merepresentasikan kategori ini. Kategori Baik mencakup 25 kota (22,7%) yang didominasi oleh kota-kota di Kalimantan, Sulawesi, dan Sumatera, dengan medoid Lampung Selatan.

Kategori Cukup merupakan kategori dengan jumlah kota terbanyak, yaitu 36 kota (32,7%), yang sebagian besar merupakan kota-kota besar di Pulau Jawa seperti seluruh wilayah administrasi DKI Jakarta, Kota Bandung, Kota Surabaya, Kota Semarang, Kota Yogyakarta, dan kawasan Jabodetabek. Hal ini mengindikasikan bahwa kepadatan penduduk dan trafik data yang tinggi di pusat-pusat kota besar berdampak pada penurunan kualitas sinyal selama periode Nataru. Medoid kategori ini adalah Kota Surabaya. Kategori Kurang mencakup 17 kota (15,5%) yang tersebar di wilayah Lampung, Jawa Tengah, Kalimantan Utara, Sulawesi Barat, dan beberapa daerah di Nusa Tenggara serta Papua, dengan rata-rata RSRP terendah sebesar −96,92 dBm. Medoid kategori ini adalah Mamuju.

  1. Evaluasi kualitas clustering menggunakan dua metrik menghasilkan nilai Silhouette Score rata-rata sebesar 0,2537 dan Davies-Bouldin Index sebesar 1,0272. Nilai Silhouette Score yang berada pada rentang 0,25—0,50 menunjukkan bahwa struktur cluster yang terbentuk tergolong cukup (reasonable) menurut interpretasi Kaufman dan Rousseeuw (1990), sementara nilai DBI yang mendekati 1 mengindikasikan tingkat pemisahan antara cluster yang memadai. Nilai evaluasi ini dapat dipahami mengingat karakteristik sinyal di berbagai kota memiliki pola yang saling tumpang tindih, terutama pada daerah perkotaan yang memiliki kondisi interferensi beragam.

5.2 Saran

Berdasarkan kesimpulan yang telah diuraikan, berikut adalah saran yang dapat diberikan kepada berbagai pihak terkait.

  1. Bagi Kementerian Komunikasi dan Digital (Komdigi) Sebanyak 53 kota yang tergolong dalam kategori Cukup (36 kota) dan Kurang (17 kota) perlu menjadi prioritas dalam program peningkatan kualitas infrastruktur jaringan telekomunikasi. Perhatian khusus perlu diberikan kepada kota-kota besar di Pulau Jawa yang masuk kategori Cukup, seperti DKI Jakarta, Bandung, dan Surabaya, mengingat tingginya trafik data di wilayah tersebut saat Nataru. Selain itu, kota-kota terpencil dalam kategori Kurang seperti Keerom (Papua) dan Minahasa Utara perlu mendapat penanganan dari sisi pemerataan infrastruktur. Komdigi juga disarankan untuk menjadikan pemantauan kualitas sinyal periode Nataru sebagai kegiatan rutin dan terstandar guna memungkinkan analisis tren dari tahun ke tahun.

  2. Bagi Operator Telekomunikasi Hasil clustering ini dapat dimanfaatkan oleh operator sebagai dasar prioritasi investasi jaringan. Wilayah-wilayah dalam kategori Kurang dan Cukup perlu mendapat perhatian dalam hal penambahan kapasitas BTS, optimasi parameter jaringan, serta peningkatan kualitas backhaul. Mengingat bahwa mayoritas kota dalam kategori Cukup merupakan kota besar yang padat penduduk, operator disarankan untuk menerapkan strategi manajemen trafik yang adaptif selama periode lonjakan penggunaan seperti Nataru.

  3. Bagi Penelitian Selanjutnya Guna meningkatkan kualitas hasil analisis, penelitian selanjutnya disarankan untuk:

  1. mengeksplorasi metode clustering lain seperti DBSCAN atau Hierarchical Agglomerative Clustering sebagai pembanding terhadap K-Medoids;

  2. menambahkan variabel pelengkap seperti kecepatan unduh aktual, latensi jaringan, atau kepadatan penduduk untuk memperkaya dimensi analisis;

  3. memperluas cakupan data ke seluruh 514 kabupaten/kota di Indonesia agar peta kualitas sinyal lebih representatif dan menyeluruh;

  4. melakukan analisis komparatif antara kondisi sinyal pada periode Nataru dan periode normal untuk mengukur dampak lonjakan trafik secara terukur; serta

  5. mengintegrasikan data spasial untuk menghasilkan peta tematik kualitas sinyal yang dapat mendukung pengambilan keputusan kebijakan berbasis wilayah.