Pendahuluan

Latar Belakang

Perkembangan teknologi komunikasi di Indonesia, khususnya 4G LTE, mengalami kemajuan pesat dengan tingkat penetrasi internet mencapai 72,78% hingga 79,5% dari total populasi pada tahun 2024 (BPS, 2025; APJII, 2024). Kualitas layanan jaringan ini diukur melalui tiga parameter standar internasional, yaitu Reference Signal Received Power (RSRP), Reference Signal Received Quality (RSRQ), dan Signal to Interference plus Noise Ratio (SINR). Menurut Afroz et al. (2015) dan Akram et al. (2023), ketiga parameter tersebut saling melengkapi dalam memberikan gambaran komprehensif mengenai performa jaringan serta kondisi riil di suatu wilayah.

Periode Natal dan Tahun Baru (Nataru) 2024/2025 menjadi ujian bagi infrastruktur ini karena adanya pergerakan 110,67 juta orang yang memicu lonjakan trafik telekomunikasi sebesar 7—20% (Indonesia.go.id, 2024; Rakyat Merdeka, 2024). Guna menjaga kualitas layanan, Kementerian Komunikasi dan Digital (Komdigi) melakukan pemantauan di 110 kabupaten/kota sejak 16 Desember 2024 hingga 4 Januari 2025 (Komdigi, 2024). Data yang dihimpun mencakup ribuan titik pengukuran parameter RSRP, RSRQ, dan SINR yang memerlukan pendekatan analisis sistematis untuk mengolah volume data yang besar tersebut.

Untuk efisiensi, penelitian ini menerapkan teknik clustering yang didefinisikan oleh Han, Kamber, dan Pei (2012) sebagai proses pengelompokan objek berdasarkan kemiripan karakteristiknya. Metode yang dipilih adalah K-Medoids atau algoritma Partitioning Around Medoids (PAM) yang diperkenalkan oleh Kaufman dan Rousseeuw (1990). Penggunaan metode ini dianggap sangat relevan untuk memetakan kualitas sinyal karena kemampuannya dalam mengorganisir data yang kompleks ke dalam kategori-kategori yang memiliki kesamaan tinggi di dalam kelompoknya namun berbeda secara signifikan antar kelompok.

Algoritma K-Medoids dipilih karena lebih robust terhadap outlier dan noise dibandingkan K-Means, yang sangat penting mengingat data kualitas sinyal sering dipengaruhi oleh jarak BTS dan penghalang fisik (Kaufman & Rousseeuw, 1990; Tamtama, 2019). Penelitian ini mengelompokkan kualitas sinyal di 110 wilayah ke dalam empat kategori: Baik Sekali, Baik, Cukup, dan Kurang. Hasil akhir dari analisis ini diharapkan menjadi masukan strategis bagi Komdigi dalam pengambilan keputusan terkait pemerataan serta peningkatan kualitas infrastruktur telekomunikasi nasional.

Rumusan Masalah

Berdasarkan latar belakang yang telah diuraikan, rumusan masalah dalam penelitian ini adalah sebagai berikut:

Bagaimana penerapan metode K-Medoids clustering dalam mengelompokkan kualitas sinyal 4G di 110 kabupaten/kota di Indonesia berdasarkan ketiga parameter tersebut?
Ke dalam kelompok mana sajakah kota-kota di Indonesia terklasifikasi berdasarkan kategori kualitas sinyal Baik Sekali, Baik, Cukup, dan Kurang?

Tujuan Penelitian

Berdasarkan rumusan masalah yang telah ditetapkan, tujuan dari penelitian ini adalah:

Menerapkan metode K-Medoids clustering untuk mengelompokkan kota-kota di Indonesia berdasarkan profil kualitas sinyal 4G-nya.
Menghasilkan pengelompokan kota-kota di Indonesia ke dalam empat kategori kualitas sinyal, yaitu Baik Sekali, Baik, Cukup, dan Kurang, beserta kota representatif (medoid) dari masing-masing kelompok.

Manfaat Penelitian

Penelitian ini diharapkan dapat memberikan manfaat bagi berbagai pihak, antara lain:

Bagi Kementerian Komunikasi dan Digital (Komdigi) Hasil penelitian dapat dijadikan sebagai bahan evaluasi dan referensi dalam memetakan kondisi kualitas jaringan 4G secara nasional, terutama pada periode dengan trafik tinggi seperti Nataru. Peta clustering yang dihasilkan dapat membantu Komdigi dalam memprioritaskan wilayah yang membutuhkan intervensi dan peningkatan infrastruktur telekomunikasi.
Bagi Operator Telekomunikasi Pengelompokan kualitas sinyal per kota dapat memberikan gambaran komparatif mengenai kualitas layanan di berbagai wilayah, sehingga operator dapat menyusun strategi pengembangan jaringan yang lebih tepat sasaran dan efisien.
Bagi Pengembangan Ilmu Pengetahuan Penelitian ini berkontribusi pada penerapan metode machine learning, khususnya K-Medoids clustering, dalam domain telekomunikasi. Hasil penelitian dapat menjadi referensi bagi penelitian selanjutnya yang berkaitan dengan analisis kualitas jaringan seluler di Indonesia.
Bagi Penulis Penelitian ini menjadi sarana untuk mengaplikasikan ilmu yang diperoleh selama perkuliahan, khususnya di bidang analisis data dan machine learning, dalam konteks permasalahan nyata yang dihadapi selama kegiatan magang di Komdigi. Penulis dapat memperoleh pengalaman langsung dalam mengolah dan menganalisis data berskala nasional.

Tinjauan Pustaka

Jaringan 4G LTE (Long Term Evolution)

Teknologi Long Term Evolution (LTE) merupakan standar jaringan seluler generasi keempat (4G) yang dikembangkan oleh 3rd Generation Partnership Project (3GPP) dan ditetapkan dalam dokumen Release 8. Berdasarkan spesifikasi 3GPP, jaringan 4G LTE mampu menyediakan kecepatan unduh hingga 100 Mbps dan kecepatan unggah hingga 50 Mbps dengan menggunakan teknik modulasi Orthogonal Frequency Division Multiplexing (OFDM) pada sisi downlink dan Single Carrier Frequency Division Multiple Access (SC-FDMA) pada sisi uplink (3GPP, 2008).

Jaringan 4G LTE telah menjadi tulang punggung konektivitas digital di Indonesia. Menurut Asosiasi Penyelenggara Jasa Internet Indonesia (APJII), jumlah pengguna internet di Indonesia pada tahun 2024 mencapai 221,56 juta jiwa atau setara 79,5 persen dari total populasi, dengan sebagian besar akses dilakukan melalui jaringan seluler berbasis 4G (APJII, 2024). Arsitektur jaringan LTE terdiri atas perangkat pengguna (User Equipment/UE), jaringan akses radio (Evolved Universal Terrestrial Radio Access Network/E-UTRAN) yang tersusun dari evolved NodeB (eNodeB), dan jaringan inti (Evolved Packet Core/EPC). Interaksi antara ketiga komponen ini menentukan kualitas layanan yang diterima pengguna akhir.

Parameter Kualitas Sinyal 4G LTE

Pengukuran kualitas sinyal pada jaringan 4G LTE mengacu pada tiga parameter utama yang telah distandarkan oleh 3GPP, yaitu RSRP, RSRQ, dan SINR. Ketiga parameter ini secara bersama-sama memberikan gambaran menyeluruh mengenai kondisi jaringan di suatu titik pengukuran (Afroz et al., 2015).

Reference Signal Received Power (RSRP)

RSRP (Reference Signal Received Power) didefinisikan oleh 3GPP sebagai rata-rata linier daya yang diterima dari resource element yang membawa sinyal referensi sel (3GPP, 2008). RSRP merupakan indikator utama kekuatan sinyal yang diterima perangkat dari base station terdekat, tanpa memperhitungkan interferensi dan noise dari sumber lain. Karena itu, RSRP menjadi parameter yang digunakan oleh perangkat UE dalam proses pemilihan dan pergantian sel (cell selection dan handover) (Afroz et al., 2015).

Secara matematis, RSRP diformulasikan sebagai berikut: \[ RSRP (dBm) = RSSI (dBm) − 10 × log₁₀(12 × N) \]

di mana N adalah jumlah Physical Resource Block (PRB) yang digunakan pada bandwidth pengukuran. RSRP dinyatakan dalam satuan dBm (decibel-milliwatt) dengan rentang tipikal −44 dBm (kondisi sangat baik) hingga −140 dBm (sinyal tidak terdeteksi) (MCA, 2024). Semakin mendekati nol, semakin kuat sinyal yang diterima.

Reference Signal Received Quality (RSRQ)

RSRQ (Reference Signal Received Quality) merupakan parameter pengukuran kualitas sinyal referensi yang diterima perangkat. Berbeda dari RSRP yang hanya mengukur kekuatan sinyal berguna, RSRQ juga mempertimbangkan interferensi dan noise sehingga lebih mencerminkan kualitas koneksi yang sesungguhnya. Menurut 3GPP (2008), RSRQ didefinisikan sebagai:

\[ RSRQ = (N × RSRP) / (E-UTRA Carrier RSSI) \] di mana N adalah jumlah Resource Block pada bandwidth pengukuran dan RSSI adalah total daya yang diterima termasuk sinyal interferensi dari sel lain dan noise termal. Berdasarkan Afroz et al. (2015), RSRQ memberikan informasi tambahan yang diperlukan ketika RSRP saja tidak mencukupi untuk membuat keputusan handover yang andal. RSRQ dinyatakan dalam satuan dB dengan rentang tipikal −3 dB (kualitas sangat baik) hingga −19,5 dB (kualitas sangat buruk); semakin mendekati nol, semakin baik kualitas sinyalnya (CableFree, 2018).

Signal to Interference plus Noise Ratio (SINR)

SINR (Signal to Interference plus Noise Ratio) mengukur rasio antara daya sinyal berguna yang diterima terhadap total daya interferensi dan noise. Secara matematis, SINR diformulasikan sebagai: \[ SINR (dB) = 10 × log_{10}(P_{sinyal}/P_{interfensi}+P_{noise}) \] di mana P_sinyal adalah daya sinyal yang diinginkan, P_interferensi adalah total daya interferensi dari sel lain, dan P_noise adalah daya noise termal (Edvan, 2016). Meskipun tidak secara resmi didefinisikan dalam spesifikasi 3GPP, SINR digunakan secara luas oleh industri LTE dan oleh perangkat UE untuk menghitung Channel Quality Indicator (CQI) yang dilaporkan ke jaringan (Signalbooster, 2021). Nilai SINR yang negatif mengindikasikan bahwa jaringan 4G tidak berfungsi optimal di lokasi tersebut.

Berdasarkan ketiga parameter di atas, berikut adalah tabel kategorisasi kualitas sinyal 4G LTE yang umum digunakan sebagai acuan industri:

Kategori Kualitas Sinyal 4G LTE Berdasarkan RSRP, RSRQ, dan SINR
Kategori	RSRP	RSRQ	SINR
Sangat Baik	> -92	> -10	> 20
Baik	-102 s.d -92	-12 s.d -10	15 s.d 20
Cukup	-105 s.d -102	-16 s.d -12	8 s.d 15
Kurang	< -105	< -16	< 8

Data Mining dan Analisis Klaster

Data mining didefinisikan oleh Han, Kamber, dan Pei (2012) sebagai proses pengekstraksian pengetahuan yang menarik, tidak sepele, tersembunyi sebelumnya, dan berpotensi berguna dari data dalam jumlah besar. Salah satu tugas utama dalam data mining adalah analisis klaster (cluster analysis), yaitu proses pengelompokan sekumpulan objek ke dalam kelas-kelas berdasarkan kemiripan karakteristiknya, sehingga objek-objek dalam satu kelompok memiliki kesamaan yang tinggi satu sama lain namun berbeda secara signifikan dari objek di kelompok lain (Han et al., 2012).

Clustering termasuk dalam kategori pembelajaran mesin tanpa pengawasan (unsupervised machine learning) karena tidak memerlukan label kelas pada data masukan. Metode clustering secara umum dibagi menjadi beberapa pendekatan, antara lain: (1) metode partisi, seperti K-Means dan K-Medoids; (2) metode hierarki, seperti agglomerative clustering; (3) metode berbasis densitas, seperti DBSCAN; dan (4) metode berbasis model (Han et al., 2012). Dalam penelitian ini digunakan metode partisi, khususnya K-Medoids, karena sifatnya yang lebih robust terhadap data sinyal telekomunikasi yang rentan mengandung nilai ekstrem.

Normalisasi Data (Standardisasi Z-Score)

Sebelum proses clustering dilakukan, normalisasi data diperlukan untuk memastikan bahwa seluruh variabel berada pada skala yang setara. Tanpa normalisasi, variabel dengan rentang nilai besar akan mendominasi perhitungan jarak sehingga menghasilkan pengelompokan yang bias. Metode normalisasi yang digunakan dalam penelitian ini adalah Z-Score Standardization, yang diformulasikan sebagai: \[ z_{iv} = (x_{iv} − \bar{x}_{v}) / s_v \] di mana \(x_{iv}\) adalah nilai variabel v pada objek ke-i, \(\bar{x}_v\) adalah nilai rata-rata variabel v, dan \(s_v\) adalah standar deviasi variabel v dari seluruh data. Hasil transformasi Z-Score menghasilkan distribusi dengan rata-rata (μ) = 0 dan standar deviasi (σ) = 1 untuk setiap variabel (Han et al., 2012).

Algoritma K-Medoids (Partitioning Around Medoids)

K-Medoids merupakan metode clustering berbasis partisi yang diperkenalkan oleh Kaufman dan Rousseeuw (1990) dalam buku Finding Groups in Data: An Introduction to Cluster Analysis. Algoritma ini juga dikenal dengan nama Partitioning Around Medoids (PAM). Perbedaan mendasar antara K-Medoids dan K-Means terletak pada representasi pusat klaster: K-Medoids menggunakan medoid, yaitu titik data nyata yang paling representatif dalam suatu klaster, bukan nilai rata-rata yang mungkin tidak merepresentasikan titik data manapun (Park & Jun, 2009).

Medoid didefinisikan sebagai objek m_c dalam klaster C yang meminimalkan total jarak ke seluruh anggota klasternya: \[ m_c = argmin_{x_i ∈ C} Σ_{x_j ∈ C} d(x_i, x_j) \]

Fungsi Jarak Euclidean

Pengukuran jarak antar objek dalam algoritma K-Medoids penelitian ini menggunakan Euclidean Distance. Untuk dua objek x_i dan x_j dengan p variabel, jarak Euclidean diformulasikan sebagai: \[ d(x_i, x_j) = \sqrt{Σ_{v=1}^{p} (x_{iv} − x_{jv})²} \] Untuk data penelitian ini dengan tiga variabel (RSRP, RSRQ, SINR), rumus tersebut menjadi: \[ d(x_i, x_j) = \sqrt{(RSRP_i−RSRP_j)² + (RSRQ_i−RSRQ_j)² + (SINR_i−SINR_j)²} \]

Tahapan Algoritma PAM

Algoritma PAM bekerja dalam dua fase utama, yaitu fase BUILD (inisialisasi) dan fase SWAP (optimasi iteratif) (Kaufman & Rousseeuw, 1990).

Fase BUILD bertujuan memilih k medoid awal. Pertama, dipilih objek pertama m₁ yang meminimalkan total jarak ke semua objek lain: \[ m₁ = argmin_{x_i} Σ_{j=1}^{n} d(x_i, x_j) \] Untuk memilih medoid berikutnya m_s (s = 2, 3, …, k), dihitung gain dari penambahan kandidat x_i: \[ g(x_i) = Σ_{j=1}^{n} max(D_j − d(x_i, x_j), 0) \] di mana \(D_j\) adalah jarak objek j ke medoid terdekat yang telah dipilih sebelumnya. Dipilih \(x_i\) dengan nilai \(g(x_i)\) terbesar hingga k medoid terpilih.

Fase SWAP bertujuan meningkatkan kualitas partisi dengan mencoba menukar medoid m_i dengan non-medoid x_h. Fungsi objektif yang diminimalkan (Total Cost) adalah: \[ TC = Σ_{c=1}^{k} Σ_{x_j ∈ C_c} d(x_j, m_c) \] Perubahan total cost akibat penukaran \((m_i, x_h)\) dihitung sebagai: \[ ΔTC_{ih} = Σ_{j ≠ i,h} ΔC_{jih} \] Penukaran dilakukan jika min\((ΔTC_{ih})\) < 0, yang berarti terdapat penukaran yang menurunkan total cost. Proses ini diulangi hingga tidak ada penukaran yang menghasilkan penurunan cost (konvergen) (Kaufman & Rousseeuw, 1990; Schubert & Rousseeuw, 2019).

K medoids

Rizqi Fadhil M

2026-03-08