Kekerasan merupakan salah satu masalah sosial yang kompleks di Indonesia, dengan dampak yang tidak hanya dirasakan oleh korban tetapi juga oleh keluarga, masyarakat, bahkan hingga ke tingkat kebijakan nasional. Berdasarkan data yang dihimpun, kekerasan di Indonesia terbagi ke dalam berbagai jenis, seperti kekerasan fisik, psikis, seksual, eksploitasi, penelantaran, dan tindak pidana perdagangan orang (TPPO). Masing-masing jenis kekerasan ini tidak hanya terjadi secara sporadis, tetapi juga menunjukkan pola yang berbeda di setiap wilayah.
Misalnya, kekerasan seksual memiliki prevalensi tinggi di daerah urban yang padat penduduk, sementara kasus penelantaran anak cenderung lebih banyak terjadi di wilayah pedesaan dengan tingkat kemiskinan tinggi (Setiawan, 2021). Faktor-faktor seperti budaya patriarki, ketimpangan sosial ekonomi, rendahnya akses pendidikan, dan lemahnya penegakan hukum diduga kuat menjadi penyebab utama tingginya angka kekerasan di Indonesia (Kusuma et al., 2020).
Namun, upaya penanganan sering kali menemui kendala, seperti kurangnya pemetaan berbasis data yang mampu menggambarkan karakteristik wilayah dan hubungan antar variabel penyebab kekerasan. Akibatnya, kebijakan dan intervensi yang dirancang cenderung bersifat generalisasi, sehingga efektivitasnya tidak optimal. Oleh karena itu, penelitian yang bertujuan untuk menganalisis pola kekerasan dan mengidentifikasi faktor-faktor utama penyebabnya sangat diperlukan.
Dalam penelitian sosial, pendekatan berbasis data sering kali menjadi solusi dalam memahami permasalahan yang kompleks seperti kekerasan. Analisis cluster adalah salah satu metode yang digunakan untuk mengelompokkan data berdasarkan kesamaan karakteristik. Metode ini memungkinkan wilayah-wilayah di Indonesia untuk dikelompokkan ke dalam kategori tertentu berdasarkan pola kasus kekerasan yang terjadi. Dengan demikian, hasil analisis cluster dapat memberikan gambaran yang lebih jelas tentang distribusi kekerasan di setiap wilayah dan membantu memprioritaskan intervensi pada kelompok yang paling rentan (Everitt et al., 2011).
Selain itu, untuk menggali lebih dalam faktor-faktor yang memengaruhi terjadinya kekerasan, analisis faktor digunakan untuk mereduksi sejumlah besar variabel menjadi beberapa dimensi utama. Misalnya, berbagai jenis kekerasan dapat dikaitkan dengan dimensi-dimensi seperti tingkat pendidikan, akses terhadap layanan kesehatan, dan status sosial-ekonomi. Metode ini sangat bermanfaat dalam memahami hubungan antara berbagai variabel dan memberikan dasar yang kuat untuk penyusunan kebijakan berbasis bukti (Field, 2013).
Penggunaan gabungan kedua metode ini memberikan kerangka kerja yang holistik untuk tidak hanya memahami pola distribusi kekerasan tetapi juga untuk mengidentifikasi akar permasalahan yang menjadi penyebab utama. Dengan demikian, penelitian ini diharapkan dapat menjadi acuan untuk menyusun kebijakan yang lebih efektif dan tepat sasaran dalam mencegah dan mengurangi kekerasan di Indonesia.
Sholikhah (2016) dalam penelitiannya menyatakan bahwa statistika deskriptif adalah statistika yang tingkat pengerjaannya adalah untuk menghimpun, mengatur, dan mengolah data untuk dapat disajikan dan memberikan gambaran yang jelas mengenai suatu kondisi atau peristiwa tertentu dimana data diambil. Statistika ini bertujuan menyederhanakan data melalui ukuran pemusatan seperti mean, median, dan modus, serta ukuran penyebaran seperti range, variansi, dan standar deviasi. Selain itu, ukuran posisi seperti kuartil dan persentil digunakan untuk mengetahui distribusi data. Penyajian data dalam bentuk tabel, grafik, dan diagram membantu memvisualisasikan informasi secara lebih jelas. Statistika deskriptif banyak diterapkan dalam bidang ekonomi, pendidikan, kesehatan, dan bisnis untuk memahami pola, tren, atau karakteristik data sebelum melanjutkan ke analisis lebih lanjut.
Menurut Williams (2010), Analisis faktor bertujuan untuk mengidentifikasi struktur yang mendasari hubungan antar variabel yang ada, dengan cara mengurangi dimensi data yang besar menjadi faktor-faktor yang lebih sedikit, namun tetap mampu menjelaskan variasi dalam data tersebut. Faktor-faktor ini dibentuk dengan memaksimalkan penjelasan dari kelompok variabel, bukan untuk memprediksi variabel yang tidak bebas. Variabel-variabel yang memiliki korelasi tinggi akan dikelompokkan bersama dalam satu faktor, sementara variabel yang memiliki korelasi rendah akan membentuk faktor yang terpisah. Dengan demikian, analisis faktor bertujuan untuk mengidentifikasi dimensi umum yang mendasari sejumlah besar variabel, yang disebut faktor.
Dalam model analisis faktor, vektor acak \(X= (X_1+X_2+X_3+⋯+X_p)\) diasumsikan memiliki rata-rata μ dan matriks ragam Σ, yang bergantung secara linier pada sejumlah faktor yang tidak teramati, yaitu faktor umum \(F_1+F_2+F_3+⋯+F_m\)dan faktor khusus \(e_1+e_2+e_3+⋯+e_p\) ini dapat dirumuskan sebagai berikut:
\(X_1-μ_1 = λ_{11}F_1+λ_{12}F_2+⋯+λ_{1m}F_m+e_1\)
\(X_2-μ_2 = λ_{21}F_1+λ_{22}F_2+⋯+λ_{2m}F_m+e_2\)
\(X_p-μ_p = λ_{p1}F_1+λ_{p2}F_2+⋯+λ_{pm}F_m+e_p\)
Menurut Santoso (2006:13), ada beberapa asumsi yang perlu dipenuhi dalam analisis faktor, antara lain: 1. Korelasi antara variabel independen harus cukup kuat, contohnya lebih dari 0,5. 2. Korelasi parsial antara dua variabel, yang mengontrol variabel lainnya, harus kecil. 3. Pengujian terhadap seluruh matriks korelasi antar variabel dilakukan dengan menggunakan Bartlett Test of Sphericity atau Measure Sampling Adequacy (MSA). Pengujian ini mengharuskan adanya korelasi signifikan di antara beberapa variabel. 4. Pada beberapa situasi, sebaiknya uji asumsi klasik antar faktor juga dipenuhi.
Berikut merupakan uji yang harus dapat dilakukan untuk memeriksa asumsi diatas:
Multikolinearitas mengacu pada situasi di mana dua atau lebih variabel independen dalam dataset memiliki hubungan linier yang sangat tinggi (Field, 2013). Dalam konteks analisis faktor, multikolinearitas dapat mengindikasikan bahwa beberapa variabel hampir identik dalam hal variasinya. Hal ini dapat menyebabkan masalah seperti:
Ketidakstabilan matriks korelasi, yang dapat mengganggu ekstraksi faktor.
Kesulitan dalam menentukan bobot atau loading faktor secara akurat.
Distorsi interpretasi hasil karena faktor yang dihasilkan mungkin tidak mencerminkan dimensi sebenarnya dari data.
Untuk mendeteksi multikolinearitas dalam analisis faktor, beberapa langkah evaluasi dapat dilakukan:
Multikolinearitas dapat terjadi jika korelasi antar variabel terlalu tinggi (misalnya, di atas 0.9). Matriks korelasi digunakan sebagai langkah awal untuk memeriksa hubungan antar variabel.
Determinan dari matriks korelasi (determinant R) yang mendekati nol menunjukkan adanya multikolinearitas yang kuat (Field, 2013).
VIF di atas nilai kritis (biasanya 5 atau 10) menunjukkan tingkat multikolinearitas yang tinggi (Hair et al., 2014).
Uji Kaiser-Meyer-Olkin (KMO) digunakan untuk mengukur kesesuaian data untuk analisis faktor. Uji ini mengukur proporsi varians dalam data yang dapat dijelaskan oleh faktor-faktor yang diidentifikasi, dengan tujuan untuk memastikan bahwa data cukup kuat untuk dianalisis menggunakan analisis faktor. KMO memberikan informasi mengenai kecocokan data untuk analisis multivariat.
Menurut Kaiser (1974), nilai KMO berkisar antara 0 hingga 1, dengan interpretasi sebagai berikut:
KMO > 0.90: Sangat baik
0.80 < KMO < 0.90: Baik
0.70 < KMO < 0.80: Cukup baik
0.60 < KMO < 0.70: Marginal
KMO < 0.60: Tidak memadai untuk analisis faktor
Measure of Sampling Adequacy (MSA) adalah ukuran yang mengukur kesesuaian antara setiap variabel dengan variabel lainnya dalam analisis faktor. MSA mengukur seberapa baik variabel tertentu dapat diwakili oleh faktor-faktor yang diekstraksi dalam model. MSA yang tinggi menunjukkan bahwa variabel dapat diprediksi dengan baik oleh faktor-faktor yang ada.
Nilai MSA untuk setiap variabel biasanya dihitung sebagai bagian dari uji KMO, dengan rentang nilai dari 0 hingga 1. Secara umum, nilai MSA di atas 0.5 dianggap cukup baik untuk analisis faktor, meskipun semakin tinggi nilainya (dekat dengan 1), semakin baik kualitas data untuk analisis faktor.
Uji Bartlett digunakan untuk menguji hipotesis nol bahwa matriks korelasi variabel-variabel yang diuji adalah matriks identitas, yang berarti bahwa tidak ada korelasi antar variabel. Uji ini sangat penting dalam analisis faktor untuk menilai apakah data memiliki korelasi yang cukup antar variabel untuk melanjutkan ke analisis faktor.
Jika hasil uji Bartlett menunjukkan nilai signifikansi yang rendah (p-value < 0.05), maka hipotesis nol ditolak, yang menunjukkan bahwa matriks korelasi bukan matriks identitas, dan oleh karena itu data cocok untuk analisis faktor. Sebaliknya, jika nilai p lebih besar dari 0.05, maka data tidak menunjukkan korelasi yang cukup untuk melakukan analisis faktor, dan uji faktor mungkin tidak tepat dilakukan.
Analisis cluster hierarki (Hierarchical Cluster Analysis) adalah metode statistik yang digunakan untuk mengelompokkan objek atau unit ke dalam kelompok yang memiliki kesamaan karakteristik. Metode ini dapat dilakukan dengan dua pendekatan utama yaitu agglomerative (penggabungan) dan divisive (pemecahan). Pada pendekatan agglomerative, setiap objek dimulai sebagai klaster terpisah, kemudian secara bertahap digabungkan berdasarkan kedekatan atau kesamaan karakteristik, hingga semua objek tergabung dalam satu klaster. Sebaliknya, pendekatan divisive dimulai dengan satu klaster yang mencakup semua objek dan kemudian memecahnya menjadi beberapa klaster berdasarkan perbedaan terbesar antar objek. Analisis ini sering melibatkan perhitungan jarak antar objek atau klaster menggunakan berbagai metrik jarak seperti Euclidean distance dan Manhattan distance. Hasil dari analisis ini sering divisualisasikan dalam bentuk dendrogram, yang menggambarkan bagaimana objek-objek dikelompokkan pada setiap tingkat dalam proses clustering.
Indeks validitas dalam analisis cluster seringkali melibatkan konsep pengukuran yang digunakan untuk menilai kualitas hasil dari pembagian data dalam kelompok atau cluster. Validitas dalam analisis cluster mengukur seberapa baik data dapat dikelompokkan dalam struktur yang bermakna, baik berdasarkan kesamaan atau perbedaan antar titik data. Beberapa indeks validitas yang umum digunakan antara lain adalah Connectivity, Dunn Index, dan Silhouette Index. Berikut adalah tinjauan pustaka terkait indeks validitas tersebut:
Dalam konteks analisis cluster mengacu pada pengukuran kedekatan antar objek yang berada dalam cluster yang sama, serta kedekatannya dengan objek-objek yang berada di luar cluster tersebut. Pengukuran ini sering kali digunakan untuk menilai kualitas cluster dengan memperhatikan bagaimana objek-objek dalam cluster terhubung satu sama lain. Dalam hal ini, nilai connectivity yang lebih rendah menunjukkan bahwa objek dalam cluster lebih saling terhubung dan lebih homogen. Connectivity mengukur apakah objek dalam suatu cluster saling terkait secara langsung, atau ada penghubung lain yang menunjukkan jarak antar objek dalam satu cluster.
Connectivity biasanya digunakan dalam algoritma clustering seperti agglomerative hierarchical clustering. Sebagai ukuran validitas, connectivity mengidentifikasi seberapa baik pengelompokan yang terjadi berdasarkan kedekatan jarak antar objek di dalam cluster, serta sejauh mana hubungan antar cluster yang dihasilkan. Misalnya, jika connectivity antar objek dalam suatu cluster sangat tinggi, maka cluster tersebut bisa dianggap lebih baik, karena objek-objek dalam cluster tersebut lebih terhubung dengan baik.
Adalah salah satu indeks validitas yang digunakan untuk menilai kualitas hasil cluster berdasarkan dua faktor yaitu pemisahan antar cluster dan kompaktnya setiap cluster. Dunn Index menghitung rasio antara jarak minimum antar dua titik data yang berbeda cluster dengan diameter cluster terbesar. Intinya, nilai Dunn Index yang lebih tinggi menunjukkan bahwa cluster lebih terpisah (dengan jarak antar cluster yang lebih besar) dan lebih kompak (dengan ukuran cluster yang lebih kecil atau lebih rapat). Hal ini menunjukkan kualitas pengelompokan yang lebih baik.
Indeks Silhouette digunakan untuk menilai kualitas pengelompokan dengan mengukur kedekatan setiap objek dalam cluster dengan objek lainnya di dalam cluster yang sama, dibandingkan dengan objek terdekat di cluster yang berbeda. Nilai Silhouette berkisar antara -1 hingga 1, dengan nilai yang lebih tinggi menunjukkan hasil pengelompokan yang lebih baik. Penelitian oleh Rousseeuw (1987) mengemukakan bahwa indeks ini memberikan gambaran yang jelas tentang konsistensi objek dalam cluster yang sama serta perbedaan antar cluster yang berbeda.
Dalam analisis cluster, linkage merujuk pada cara atau metode untuk mengukur jarak antar cluster selama proses hierarchical clustering. Linkage adalah konsep penting dalam metode agglomerative hierarchical clustering, di mana cluster yang terpisah secara berurutan digabungkan berdasarkan ukuran jaraknya. Terdapat beberapa jenis metode linkage yang umum digunakan, masing-masing dengan cara yang berbeda untuk mendefinisikan jarak antar cluster. Di bawah ini adalah tinjauan pustaka mengenai berbagai metode linkage yang digunakan dalam analisis cluster, beserta referensi yang relevan.
Single Linkage Single linkage, atau nearest point linkage, adalah metode di mana jarak antar cluster diukur dengan mencari pasangan objek yang paling dekat antara dua cluster yang berbeda. Ini berarti bahwa jarak antara dua cluster ditentukan oleh jarak terpendek antara dua titik data, satu dari masing-masing cluster. Keunggulan dari metode ini adalah kemampuannya dalam menangani cluster yang berbentuk memanjang, namun kelemahannya adalah dapat menghasilkan cluster yang tidak homogen karena penggabungan yang terlalu cepat.
Complete Linkage Complete linkage, atau farthest point linkage, mengukur jarak antar cluster dengan cara mencari jarak terjauh antara dua titik data, satu dari masing-masing cluster. Metode ini menghasilkan cluster yang lebih padat dan lebih kompak karena meminimalkan jarak terjauh antar objek dalam cluster. Complete linkage cenderung menghasilkan cluster yang lebih seimbang dan homogen dibandingkan dengan single linkage.
Average Linkage Average linkage adalah metode yang menghitung jarak antar cluster dengan mengambil rata-rata semua pasangan titik data, satu dari setiap cluster. Dalam hal ini, jarak antar cluster diukur sebagai rata-rata jarak antara setiap pasangan titik data di cluster yang berbeda. Metode ini memberikan keseimbangan antara single dan complete linkage, memberikan hasil yang lebih stabil dalam hal kompaktnya cluster.
Mengidentifikasi Pola Regional Kekerasan Menggunakan analisis cluster untuk mengelompokkan wilayah berdasarkan pola kejadian kekerasan.
Menganalisis Faktor Penyebab Kekerasan Menggunakan analisis faktor untuk menemukan dimensi utama yang memengaruhi tingkat dan jenis kekerasan di wilayah tertentu.
Memberikan Rekomendasi Kebijakan Berdasarkan hasil analisis, merumuskan strategi pencegahan kekerasan yang sesuai dengan kebutuhan tiap wilayah.
> library(readxl) # Untuk membaca file Excel dan CSV
> library(car) # Diagnostik regresi dan uji multikolinearitas
> library(psych) # Analisis psikometri dan faktor analisis
> library(GPArotation) # Rotasi faktor dalam analisis faktor
> library(REdaS) # Uji Bartlett dan sphering
> library(clValid) # Validitas internal clustering
> library(dplyr) # Manipulasi data (filter, arrange, dsb.)
> library(kableExtra) # Membuat dan menata tabel
> library(GGally) # Visualisasi hubungan antar variabel
> library(pheatmap) # Membuat heatmap
> library(rmarkdown) # Untuk membuat laporan
> library(ggplot2) #Visualisasi
> library(clValid) #Validasi hasil clustering
> data_kekerasan <- read.csv("C:/Users/Shella Mitha/Downloads/jumlah_kekerasan_anmul.csv")
> paged_table(data_kekerasan)
> deskriptif<- summary(data_kekerasan)
Digunakan untuk menghasilkan statistik deskriptif dari data yang ada dalam data_kekerasan dan menyimpannya ke dalam variabel deskriptif. Fungsi summary() memberikan ringkasan statistik dari setiap kolom dalam dataset, yang meliputi informasi berikut:
Min (Minimum): Nilai terkecil dalam setiap kolom (variabel).
1st Qu. (Kuartil Pertama): Nilai yang membagi 25% data terendah.
Median: Nilai tengah atau 50% data berada di bawah atau di atas nilai ini.
Mean (Rata-rata): Rata-rata nilai dari setiap kolom.
3rd Qu. (Kuartil Ketiga): Nilai yang membagi 25% data tertinggi.
Max (Maksimum): Nilai tertinggi dalam setiap kolom.
Dengan demikian, summary(data_kekerasan) memberikan gambaran umum tentang distribusi data dari setiap variabel dalam dataset data_kekerasan, termasuk rentang nilai, posisi tengah, dan ukuran penyebaran (variabilitas). Hasil ini sangat berguna untuk memahami karakteristik dasar data sebelum melanjutkan analisis lebih lanjut.
> # Mengonversi semua kolom integer menjadi numeric
> data_kekerasan[] <- lapply(data_kekerasan, function(x) if (is.integer(x)) as.numeric(x) else x)
>
> # Memeriksa struktur data setelah konversi
> str(data_kekerasan)
'data.frame': 38 obs. of 9 variables:
$ No : num 1 2 3 4 5 6 7 8 9 10 ...
$ Cakupan : chr "ACEH" "SUMATERA UTARA" "SUMATERA BARAT" "RIAU" ...
$ Fisik : num 147 412 168 135 72 172 71 98 30 78 ...
$ Psikis : num 155 168 163 197 86 101 60 125 23 77 ...
$ Seksual : num 291 686 486 572 189 274 181 542 75 240 ...
$ Eksploitasi : num 2 8 10 13 1 2 14 11 0 10 ...
$ TPPO : num 3 1 2 4 6 3 6 6 1 4 ...
$ Penelantaran: num 81 141 28 36 17 12 12 5 5 40 ...
$ Lainnya : num 95 154 46 168 22 71 20 20 15 57 ...
>
> # Uji KMO dan MSA
> ujikmo <- KMOS(data_kekerasan[,-c(1,2)])
> msa_data <- ujikmo$MSA
> msa_df <- data.frame(MSA = msa_data)
Langkah pertama mengonversi tipe data kolom integer menjadi numeric, yang penting untuk memastikan konsistensi tipe data dalam analisis lebih lanjut.
Langkah kedua memeriksa struktur data setelah konversi untuk memastikan bahwa tipe data telah diubah dengan benar.
Langkah ketiga melakukan uji KMO untuk mengevaluasi kecocokan data untuk analisis faktor, dan hasilnya disimpan dalam format yang mudah dipahami dan dianalisis lebih lanjut.
> #Menghitung nilai korelasi
> kolerasi <- cor(data_kekerasan[,-c(1,2)],method='kendall')
> pairs.panels(data_kekerasan[,-c(1,2)],
+ smooth = FALSE,density = FALSE,method = "kendall",
+ pch = 21,lm = FALSE,cor = TRUE,jiggle = FALSE,
+ factor = 2,hist.col = 4,stars = TRUE,ci = TRUE)
Kode pertama menghitung nilai korelasi antar variabel dalam dataset
menggunakan metode Kendall, yang cocok untuk data ordinal.
Kode kedua membuat visualisasi korelasi dalam bentuk matriks plot, dengan menampilkan nilai korelasi antar variabel serta interval kepercayaan dan bintang yang menandakan tingkat signifikansi. Ini memberikan gambaran yang lebih jelas dan mudah dipahami tentang hubungan antar variabel dalam dataset.
> ujibart <- bart_spher(data_kekerasan[,-c(1,2)])
Hasil dari uji Bartlett ini disimpan dalam objek ujibart, dan Anda bisa memeriksa hasilnya menggunakan summary(ujibart) atau ujibart untuk melihat apakah data memenuhi syarat untuk analisis faktor lebih lanjut.
> # Buat scree plot
> eigen <- eigen(cor(data_kekerasan[,-c(1,2)]))
> plot(
+ eigen$values,
+ type = "b", # Tipe plot (b: garis dan titik)
+ xlab = "Komponen Faktor", # Label sumbu X
+ ylab = "Nilai Eigen", # Label sumbu Y
+ main = "Scree Plot", # Judul plot
+ pch = 19, # Jenis simbol untuk titik
+ col = "blue" # Warna garis dan titik
+ )
> # Ekstrak hasil faktor analisis
> nfactor = 2 # Menentukan jumlah faktor dari hasil Scree Plot
> PFA <- fa(data_kekerasan[,-c(1,2)], nfactors = nfactor, rotate = "varimax", fm = "pa")
>
> FA <- fa(r = cor(data_kekerasan[,-c(1,2)]), nfactors = 2, n.obs = nrow(data_kekerasan[,-c(1,2)]),
+ rotate = "varimax")
Hasil :
> deskriptif
No Cakupan Fisik Psikis
Min. : 1.00 Length:38 Min. : 5.00 Min. : 0.00
1st Qu.:10.25 Class :character 1st Qu.: 45.75 1st Qu.: 33.25
Median :19.50 Mode :character Median : 84.50 Median : 85.50
Mean :19.50 Mean :116.05 Mean :118.71
3rd Qu.:28.75 3rd Qu.:150.75 3rd Qu.:161.50
Max. :38.00 Max. :427.00 Max. :483.00
Seksual Eksploitasi TPPO Penelantaran
Min. : 0.00 Min. : 0.000 Min. : 0.000 Min. : 0.00
1st Qu.: 99.25 1st Qu.: 1.000 1st Qu.: 1.000 1st Qu.: 10.25
Median : 222.50 Median : 3.000 Median : 3.500 Median : 18.50
Mean : 287.68 Mean : 6.842 Mean : 5.421 Mean : 35.05
3rd Qu.: 381.00 3rd Qu.:11.000 3rd Qu.: 6.000 3rd Qu.: 39.00
Max. :1120.00 Max. :31.000 Max. :19.000 Max. :141.00
Lainnya
Min. : 0.00
1st Qu.: 16.25
Median : 31.50
Mean : 65.97
3rd Qu.: 89.00
Max. :460.00
Berdasarkan hasil deskriptif data, dapat disimpulkan bahwa:
Fisik, Psikis, dan Seksual menunjukkan nilai yang bervariasi, dengan rata-rata nilai Fisik (116.05), Psikis (118.71), dan Seksual (287.68) yang menunjukkan kecenderungan ke arah nilai yang lebih tinggi, meskipun terdapat variasi yang signifikan antara nilai minimum dan maksimum.
Eksploitasi memiliki nilai rata-rata (6.84), dengan sebagian besar data berada pada rentang yang lebih rendah (nilai minimum 0 dan maksimum 31), menunjukkan variasi yang cukup besar pada fenomena eksploitasi.
TPPO (Trafficking Perdagangan Orang) menunjukkan nilai rata-rata (5.42), dengan sebagian besar data berada pada rentang 1 hingga 6.
Penelantaran dan Lainnya menunjukkan tingkat variasi yang tinggi, dengan rata-rata masing-masing 35.05 dan 65.97, serta nilai maksimum yang cukup besar (141 dan 460), mengindikasikan adanya data ekstrim yang mempengaruhi distribusi.
Hasil :
> kolerasi <- cor(data_kekerasan[,-c(1,2)],method='kendall')
> pairs.panels(data_kekerasan[,-c(1,2)],
+ smooth = FALSE,density = FALSE,method = "kendall",
+ pch = 21,lm = FALSE,cor = TRUE,jiggle = FALSE,
+ factor = 2,hist.col = 4,stars = TRUE,ci = TRUE)
Penjelasan :
Plot pasangan di atas menampilkan koefisien korelasi antar variabel. Jika ditemukan korelasi yang tinggi antara dua variabel, hal tersebut bisa menjadi tanda potensial adanya multikolinearitas. Namun, dapat dilihat bahwa nilai korelasi masih berada dalam rentang yang aman, yaitu < 0.8.
> # Mengonversi semua kolom integer menjadi numeric
> data_kekerasan[] <- lapply(data_kekerasan, function(x) if (is.integer(x)) as.numeric(x) else x)
'data.frame': 38 obs. of 9 variables:
$ No : num 1 2 3 4 5 6 7 8 9 10 ...
$ Cakupan : chr "ACEH" "SUMATERA UTARA" "SUMATERA BARAT" "RIAU" ...
$ Fisik : num 147 412 168 135 72 172 71 98 30 78 ...
$ Psikis : num 155 168 163 197 86 101 60 125 23 77 ...
$ Seksual : num 291 686 486 572 189 274 181 542 75 240 ...
$ Eksploitasi : num 2 8 10 13 1 2 14 11 0 10 ...
$ TPPO : num 3 1 2 4 6 3 6 6 1 4 ...
$ Penelantaran: num 81 141 28 36 17 12 12 5 5 40 ...
$ Lainnya : num 95 154 46 168 22 71 20 20 15 57 ...
Hipotesis :
\(H_0\): Jumlah data cukup untuk difaktorkan
\(H_1\): Jumlah data tidak cukup untuk difaktorkan
Hasil :
> ujikmo
Kaiser-Meyer-Olkin Statistics
Call: KMOS(x = data_kekerasan[, -c(1, 2)])
Measures of Sampling Adequacy (MSA):
Fisik Psikis Seksual Eksploitasi TPPO Penelantaran
0.8282286 0.9181770 0.8402981 0.8912785 0.7752890 0.8414385
Lainnya
0.8340870
KMO-Criterion: 0.8509879
KMO \((0.85) ≥ 0.5\), maka tolak \(H_0\).
Interpretasi :
Pengujian di atas menghasilkan nilai KMO sebesar 0.85 yang lebih dari 0.5 sehingga cukup mengindikasikan bahwa terdapat dependensi antar variabel.
Hasil :
> msa_df
Interpretasi :
Pengujian di atas menghasilkan nilai KMO sebesar 0.85 yang lebih dari 0.5 sehingga cukup mengindikasikan bahwa terdapat dependensi antar variabel.
Hipotesis :
\(H_0\): Tidak terdapat korelasi yang signifikan antar variabel
\(H_1\): Terdapat korelasi yang signifikan antar variabel
Hasil :
> ujibart
Bartlett's Test of Sphericity
Call: bart_spher(x = data_kekerasan[, -c(1, 2)])
X2 = 242.827
df = 21
p-value < 2.22e-16
p-value \((< 2.22e-16) < 0.05\), maka tolak \(H_0\).
Interpretasi :
Pada taraf nyata 5%, antar variabel saling berkorelasi dan matriks korelasi antar variabel layak digunakan dalam analisis faktor.
> plot(
+ eigen$values,
+ type = "b", # Tipe plot (b: garis dan titik)
+ xlab = "Komponen Faktor", # Label sumbu X
+ ylab = "Nilai Eigen", # Label sumbu Y
+ main = "Scree Plot", # Judul plot
+ pch = 19, # Jenis simbol untuk titik
+ col = "green" # Warna garis dan titik
+ )
> abline(h = 1, col = "red", lty = 2)
Terlihat bahwa terdapat 2 titik yang berada diatas garis batas yaitu bernilai lebih dari 1, sehingga dapat disimpulkan banyak faktor yang akan diekstrak sejumlah 2 faktor.
Diagram FA
> FA <- fa(r = cor(data_kekerasan[,-c(1,2)]), nfactors = 2, n.obs = nrow(data_kekerasan[,-c(1,2)]),
+ rotate = "varimax")
> FA
Factor Analysis using method = minres
Call: fa(r = cor(data_kekerasan[, -c(1, 2)]), nfactors = 2, n.obs = nrow(data_kekerasan[,
-c(1, 2)]), rotate = "varimax")
Standardized loadings (pattern matrix) based upon correlation matrix
MR1 MR2 h2 u2 com
Fisik 0.65 0.65 0.84 0.1567 2.0
Psikis 0.77 0.52 0.86 0.1404 1.8
Seksual 0.79 0.52 0.90 0.1008 1.7
Eksploitasi 0.70 0.35 0.61 0.3903 1.5
TPPO 0.52 0.22 0.32 0.6850 1.4
Penelantaran 0.41 0.91 1.00 -0.0031 1.4
Lainnya 0.67 0.50 0.71 0.2925 1.9
MR1 MR2
SS loadings 3.01 2.23
Proportion Var 0.43 0.32
Cumulative Var 0.43 0.75
Proportion Explained 0.57 0.43
Cumulative Proportion 0.57 1.00
Mean item complexity = 1.7
Test of the hypothesis that 2 factors are sufficient.
df null model = 21 with the objective function = 7.18 with Chi Square = 242.83
df of the model are 8 and the objective function was 0.45
The root mean square of the residuals (RMSR) is 0.03
The df corrected root mean square of the residuals is 0.05
The harmonic n.obs is 38 with the empirical chi square 1.82 with prob < 0.99
The total n.obs was 38 with Likelihood Chi Square = 14.46 with prob < 0.07
Tucker Lewis Index of factoring reliability = 0.92
RMSEA index = 0.143 and the 90 % confidence intervals are 0 0.268
BIC = -14.64
Fit based upon off diagonal values = 1
>
> fa.diagram(FA)
Didapatkan model dari analisis faktor sebagai berikut:
\(X_1 = 0.71 PA_1+ 0.56 PA_2+ e_1\)
\(X_2 = 0.80 PA_1+ 0.46 PA_2+ e_2\)
\(X_3 = 0.83 PA_1+ 0.45 PA_2+ e_3\)
\(X_4 = 0.71 PA_1+ 0.32 PA_2+ e_4\)
\(X_5 = 0.53 PA_1+ 0.18 PA_2+ e_5\)
\(X_6 = 0.42 PA_1+ 1 PA_2+ e_6\)
\(X_7 = 0.72 PA_1+ 0.44 PA_2+ e_7\)
Berdasarkan hasil analisis, diketahui bahwa terbentuk dua faktor yang mendasari berbagai jenis kekerasan berbagai provinsi di Indonesia. Hubungan antara PA1 dan PA2 menunjukkan bahwa kekerasan fisik, psikis, dan seksual lebih dipengaruhi oleh PA1, sementara faktor PA2 lebih dominan dalam menjelaskan kekerasan penelantaran. Dilihat dari nilai proportion variance, kekerasan fisik, psikis, dan seksual dijelaskan 48% dan kekerasan penelantaran 29%.
Berikut merupakan nilai korelasi cophenetic yang akan digunakan sebagai dasar dalam menentukan metode terbaik yang akan digunakan dalam analisis cluster:
> # Melakukan standarisasi data (menghapus kolom yang tidak relevan)
> datacluster <- scale(data_kekerasan[,-c(1,2)])
>
> # Menghitung jarak Euclidean antar objek
> jarak <- dist(datacluster, method = "euclidean")
>
> # Melakukan analisis hierarchical clustering dengan berbagai metode linkage
> single <- hclust(jarak, method = "single") # Metode Single Linkage
> complete <- hclust(jarak, method = "complete") # Metode Complete Linkage
> average <- hclust(jarak, method = "average") # Metode Average Linkage
>
> # Menghitung koefisien korelasi cophenetic antara hasil clustering dan jarak asli
> cor_single <- cor(cophenetic(single), jarak)
> cor_complete <- cor(cophenetic(complete), jarak)
> cor_avg <- cor(cophenetic(average), jarak)
>
> cophenetic_correlations <- data.frame(Single = cor_single,
+ Average = cor_avg,
+ Complete = cor_complete)
> cophenetic_correlations
Berdasarkan tabel diatas, didapatkan nilai korelasi yang paling mendekati 1 adalah metode average. Sehingga, pada penelitian kali ini metode average linkage akan dipilih sebagai metode yang akan digunakan.
> datacluster <- data.frame(data_kekerasan[,-c(1,2)]) # Menghapus kolom tidak relevan
> inval <- clValid(datacluster, clMethods = "hierarchical", validation = "internal",
+ metric = "euclidean", method = "average", nClust = 2)
> validity_index <- clValid(datacluster, 2:5, clMethods = "hierarchical",
+ validation = "internal", metric = "euclidean",
+ method = "average")
> optimalScores(validity_index)
Berdasarkan hasil evaluasi menggunakan tiga indeks validitas cluster, yaitu Indeks Connectivity, Indeks Dunn, dan Indeks Silhouette, jumlah cluster optimal yang dipilih adalah dua, sesuai dengan hasil pengelompokkan menggunakan metode Average Linkage.
> # Plot dendrogram untuk metode Average Linkage dengan visualisasi yang lebih baik
> plot(average, main = "Dendrogram: Metode Average Linkage", hang = -1,
+ col.main = "darkblue", col.axis = "darkred", col.lab = "darkgreen",
+ sub = "Dendrogram untuk clustering dengan metode Average Linkage", cex.main = 1.2)
>
> # Menandai kelompok pada dendrogram dengan warna yang lebih jelas
> rect.hclust(average, k = 2, border = c("blue", "red"))
Interpretasi :
Berdasarkan hasil output di atas, dapat disimpulkan bahwa data dibagi menjadi 2 cluster yaitu: Cluster 1 terdiri dari Jawa Barat dan Jawa Timur Cluster 2 terdiri dari Aceh, Sumatera Utara, Sumatera Barat, Riau, Jambi, Sumatera Selatan, Bengkulu, Lampung, Kepulauan Bangka Belitung, Kepulauan Riau, DKI Jakarta, Jawa Tengah, DI Yogyakarta, Banten, Bali, Nusa Tenggara Barat, Nusa Tenggara Timur, Kalimantan Barat, Kalimantan Tengah, Kalimantan Selatan, Kalimantan Timur, Kalimantan Utara, Sulawesi Utara, Sulawesi Tengah, Sulawesi Selatan, Sulawesi Tenggara, Gorontalo, Sulawesi Barat, Maluku, Maluku Utara, Papua Barat, Papua, Papua Pegunungan, Papua Selatan, Papua Tengah, Papua Barat Daya.
Hasil :
> average_cut1 <- cutree(average, 2) # Membagi data ke dalam 2 cluster
> ratacluster <- aggregate(datacluster, list(average_cut1), mean) # Menghitung rata-rata setiap cluster
>
> tabelrata <- kable(ratacluster %>% arrange(Group.1),
+ caption = "Tabel Karakteristik Setiap Cluster",
+ col.names = c("Cluster", "Fisik", "Psikis", "Seksual", "Eksploitasi", "TPPO", "Penelantaran", "Lainnya"),
+ align = "c",
+ booktabs = TRUE) # Menggunakan booktabs untuk gaya tabel yang lebih baik
> tabelrata
| Cluster | Fisik | Psikis | Seksual | Eksploitasi | TPPO | Penelantaran | Lainnya |
|---|---|---|---|---|---|---|---|
| 1 | 101.1111 | 100.8889 | 250.5 | 5.75 | 4.861111 | 29.77778 | 50.25 |
| 2 | 385.0000 | 439.5000 | 957.0 | 26.50 | 15.500000 | 130.00000 | 349.00 |
Interpretasi :
Terdapat perbedaan yang signifikan antara kedua cluster, dengan Cluster 1 menunjukkan tingkat kekerasan yang rendah dan Cluster 2 menunjukkan tingkat kekerasan yang tinggi. Intervensi dan kebijakan yang berbeda dapat diterapkan di kedua cluster ini untuk mengurangi kekerasan di wilayah dengan tingkat kekerasan tinggi serta mempertahankan keamanan di wilayah dengan tingkat kekerasan rendah.
Berdasarkan hasil dan pembahasan di atas, didaptkan kesimpulan sebagai berikut :
Hasil analisis cluster menunjukkan bahwa wilayah Indonesia dapat dikelompokkan menjadi dua cluster berdasarkan pola kekerasan yang terjadi. Cluster 1 mencakup wilayah dengan tingkat kekerasan rendah (Jawa Barat dan Jawa Timur), sedangkan Cluster 2 terdiri dari wilayah dengan tingkat kekerasan yang lebih tinggi (wilayah lainnya di Indonesia). Temuan ini menggambarkan adanya perbedaan yang signifikan dalam tingkat kekerasan antar wilayah, yang dapat dipengaruhi oleh faktor sosial, ekonomi, dan budaya setempat.
Melalui analisis faktor, ditemukan bahwa kekerasan di Indonesia dipengaruhi oleh dua faktor utama. Faktor pertama (PA1) berhubungan dengan kekerasan fisik, psikis, dan seksual, sementara faktor kedua (PA2) lebih dominan memengaruhi kekerasan penelantaran. Dengan proporsi variansi masing-masing sebesar 48% dan 29%, hasil ini memberikan gambaran yang lebih jelas mengenai dimensi-dimensi kekerasan yang perlu diperhatikan dalam kebijakan pencegahan.
Berdasarkan hasil analisis cluster dan faktor, kebijakan pencegahan kekerasan harus disesuaikan dengan karakteristik wilayah. Untuk wilayah dengan tingkat kekerasan tinggi (Cluster 2), kebijakan yang lebih intensif dan berbasis pada pendekatan sosial-ekonomi serta penanggulangan kekerasan fisik dan psikis perlu diterapkan. Sementara untuk wilayah dengan kekerasan rendah (Cluster 1), kebijakan lebih fokus pada upaya pencegahan yang berbasis edukasi dan penguatan sistem sosial. Dalam konteks kekerasan penelantaran, diperlukan program yang berfokus pada perlindungan sosial dan pemberdayaan keluarga.
Berdasarkan penelitian yang telah dilakukan, terdapat beberapa saran yang bisa dipertimbangkan :
Pemerintah daerah harus merancang kebijakan yang lebih spesifik dan berbasis data untuk masing-masing cluster. Wilayah dengan tingkat kekerasan tinggi perlu mendapatkan perhatian lebih dalam hal penyuluhan, program pemberdayaan masyarakat, dan penegakan hukum yang lebih tegas.
Kolaborasi antar daerah, terutama antara wilayah dengan kekerasan tinggi dan rendah, sangat penting untuk berbagi pengalaman dan strategi efektif dalam menanggulangi kekerasan. Ini dapat mempercepat penyebaran kebijakan yang berhasil di satu wilayah ke wilayah lainnya.
Disarankan untuk melakukan pemantauan dan evaluasi secara berkala terhadap implementasi kebijakan yang telah diterapkan, dengan fokus pada efektivitas program yang berfokus pada pengurangan kekerasan fisik, psikis, seksual, dan penelantaran. Hal ini bertujuan untuk mengetahui apakah kebijakan yang diterapkan sudah memberikan dampak yang signifikan terhadap penurunan kekerasan di masing-masing wilayah.
Diperlukan penelitian lanjutan untuk menggali lebih dalam faktor-faktor sosial dan budaya yang berkontribusi pada kekerasan di tingkat wilayah, serta untuk mengembangkan metode analisis yang lebih terperinci dalam memetakan dinamika kekerasan di Indonesia. Dengan demikian, hasil analisis ini dapat memberikan dasar yang kuat untuk pengambilan keputusan dan formulasi kebijakan yang lebih tepat sasaran dalam upaya pengurangan kekerasan di Indonesia.
Sholikhah, A. (2016). Statistik deskriptif dalam penelitian kualitatif. KOMUNIKA: Jurnal Dakwah Dan Komunikasi, 10(2), 342-362.
Williams, B., Onsman, A., & Brown, T. (2010). Exploratory factor analysis: A five-step guide for novices. Australasian journal of paramedicine, 8, 1-13.
Santoso, S. (2006). Statistik Multivariat: Analisis Faktor dan Penerapannya. Salemba Empat
Everitt, B. S., Landau, S., Leese, M., & Stahl, D. (2011). Cluster Analysis. John Wiley & Sons.
Field, A. (2013). Discovering Statistics Using IBM SPSS Statistics. SAGE Publications.
Kusuma, D., Prasetyo, Y., & Sari, W. (2020). Faktor sosial dan budaya dalam kasus kekerasan domestik di Indonesia. Jurnal Penelitian Sosial, 15(1), 45-58.
Setiawan, B. (2021). Studi distribusi kekerasan berbasis data di Indonesia. Jurnal Sosiologi Indonesia, 17(2), 103-119.
Kaiser, H. F. (1974). An index of factorial simplicity. Psychometrika, 39(1), 31-36.
Field, A. (2013). Discovering Statistics Using IBM SPSS Statistics. SAGE Publications.
Hair, J. F., Black, W. C., Babin, B. J., & Anderson, R. E. (2014). Multivariate Data Analysis. Pearson.
Tabachnick, B. G., & Fidell, L. S. (2019). Using Multivariate Statistics. Pearson.