Perdagangan antar wilayah merupakan salah satu indikator penting dalam melihat hubungan ekonomi antar daerah di Indonesia. Perbedaan potensi sumber daya, kapasitas produksi, serta kebutuhan konsumsi antarprovinsi menyebabkan terjadinya arus distribusi barang yang berbeda-beda di setiap wilayah. Kondisi ini dapat menimbulkan ketidakseimbangan perdagangan, yang tercermin dari adanya wilayah yang mengalami surplus maupun defisit dalam aktivitas perdagangan. Oleh karena itu, analisis terhadap data perdagangan antar wilayah menjadi penting untuk memahami pola distribusi barang, intensitas aktivitas ekonomi, serta keterkaitan antarprovinsi di Indonesia.
Data yang digunakan dalam analisis ini bersumber dari publikasi resmi yang diterbitkan oleh Badan Pusat Statistik berjudul “Perdagangan Antar Wilayah Indonesia 2024” yang dapat diakses pada link berikut: Perdagangan Antar Wilayah Indonesia 2024. Data yang digunakan memuat beberapa variabel penting, antara lain provinsi dan pulau untuk menunjukkan wilayah asal data, total penjualan dan total pembelian dalam satuan ton yang menggambarkan volume perdagangan barang, serta total penjualan dan pembelian dalam rupiah (triliun) yang menunjukkan nilai ekonomi dari aktivitas perdagangan tersebut. Selain itu, data juga mencakup total perdagangan, moda transportasi utama, serta kondisi nilai transaksi (surplus atau defisit) yang dapat digunakan untuk melihat keseimbangan perdagangan antar wilayah. Data dari publikasi tersebut kemudian dientrikan secara mandiri ke dalam format Microsoft Excel agar lebih mudah diolah dan divisualisasikan menggunakan berbagai metode visualisasi data kategorik. Data tersebut dapat diakses pada link berikut: Dataset Perdagangan Antar WIlayah Indonesia 2024.
#Import Data
library(readxl)
library(ggplot2)
library(dplyr)
library(geodata)
library(tmap)
library(sf)
library(ggridges)
library(scales)
data.perdagangan=read_xlsx("C:/Users/CLIENT/Downloads/dataset_perdagangan_provinsi_indonesia (2).xlsx")
DT::datatable(data.perdagangan)
Visualisasi data kategorik digunakan untuk menampilkan dan memahami pola distribusi data yang berbentuk kategori. Pada analisis ini digunakan beberapa visualisasi, yaitu grouped bar chart, needle chart, pie chart, dan peta spasial.
Grouped bar chart merupakan salah satu bentuk visualisasi data yang
digunakan untuk membandingkan beberapa kategori yang memiliki lebih dari
satu kelompok atau subkategori. Grafik ini menampilkan batang yang
dikelompokkan berdasarkan kategori utama sehingga memudahkan dalam
melihat perbedaan atau pola antar kelompok dalam setiap kategori. Dengan
menggunakan grouped bar chart, hubungan antara dua variabel kategorik
dapat divisualisasikan secara lebih jelas sehingga mempermudah proses
interpretasi dan perbandingan data. Untuk membuat kelompok atau grup
pada bar chart, dapat ditambahkan perintah
mapping pada proses visualisasi, misalnya
dengan memetakan variabel tertentu ke dalam estetika seperti
fill sehingga batang pada grafik akan
terbagi berdasarkan kategori yang berbeda.
Pada dataset perdagangan antar wilayah yang digunakan dalam analisis ini, grouped bar chart digunakan untuk membandingkan kondisi nilai transasksi antar pulau, seperti terlihat pada grafik berikut.
ggplot(data = data.perdagangan,
mapping = aes(x = Pulau, fill = `Kondisi Nilai Transaksi`)) +
geom_bar(position = "dodge", stat = "count") +
labs(x = "Pulau",
fill = "Kondisi Nilai Transaksi",
y = "Jumlah Provinsi") +
scale_fill_manual(values = c(
"Defisit" = "#9B111E",
"Surplus" = "springgreen"
)) +
theme_light()
Pada visualisasi grouped bar chart tersebut menunjukkan perbandingan jumlah provinsi yang mengalami kondisi defisit dan surplus nilai transaksi perdagangan pada setiap pulau di Indonesia. Secara umum terlihat bahwa jumlah provinsi dengan kondisi defisit lebih banyak dibandingkan surplus di beberapa wilayah. Pulau Jawa, Papua, dan Sumatera memiliki jumlah provinsi defisit yang relatif lebih tinggi dibandingkan provinsi yang mengalami surplus. Sebaliknya, Pulau Kalimantan menunjukkan kondisi yang berbeda karena jumlah provinsi dengan surplus lebih banyak dibandingkan defisit. Sementara itu, di wilayah seperti Bali, Maluku, dan Nusa Tenggara hanya terlihat provinsi dengan kondisi defisit, sedangkan Sulawesi menunjukkan jumlah yang relatif seimbang antara defisit dan surplus. Secara keseluruhan, grafik ini menunjukkan bahwa ketidakseimbangan perdagangan antar wilayah masih cukup terlihat, di mana sebagian besar provinsi di beberapa pulau lebih banyak mengalami defisit dibandingkan surplus dalam nilai transaksi perdagangan antar wilayah.
Needle chart merupakan jenis diagram batang yang menampilkan data dalam bentuk garis vertikal tipis seperti jarum (needle) yang membentang dari sumbu horizontal ke titik data tertentu. Grafik ini digunakan untuk memperlihatkan perbandingan nilai antar kategori secara lebih ringkas, sekaligus memudahkan dalam melihat perbedaan besar kecilnya nilai pada setiap kategori. Needle chart sering digunakan untuk menggambarkan tren data diskrit, perubahan nilai dari waktu ke waktu, atau perbandingan antara kategori tertentu.
Pada dataset perdagangan antar wilayah yang digunakan dalam analisis ini, needle chart dimanfaatkan untuk menampilkan perbandingan jumlah provinsi antar pulau dengan kondisi nilai transaksinya.
# Hitung frekuensi
freqtab <- as.data.frame(table(data.perdagangan$Pulau,
data.perdagangan$`Kondisi Nilai Transaksi`))
# Needle chart
ggplot(freqtab,
aes(x = reorder(Var1, Freq), y = Freq, color = Var2)) +
geom_segment(aes(x = reorder(Var1, Freq),
xend = reorder(Var1, Freq),
y = 0, yend = Freq),
linewidth = 1) +
geom_point(size = 4) +
coord_flip() +
facet_wrap(~Var2, ncol = 2) +
labs(x = "Pulau",
y = "Jumlah Provinsi",
color = "Kondisi Nilai Transaksi") +
scale_color_manual(values = c(
"Defisit" = "red",
"Surplus" = "green"
)) +
theme_light()
Grafik tersebut menunjukkan perbandingan jumlah provinsi yang mengalami defisit dan surplus nilai transaksi perdagangan pada setiap pulau di Indonesia. Terlihat bahwa Sumatera memiliki jumlah provinsi dengan defisit paling banyak yaitu 6 provinsi, namun juga memiliki jumlah provinsi yang cukup besar yang mengalami surplus yaitu sebanyak 4 provinsi, sehingga aktivitas perdagangannya relatif beragam. Jawa dan Papua juga cenderung didominasi oleh provinsi yang mengalami defisit dibandingkan surplus. Berbeda dengan itu, Kalimantan menunjukkan kondisi sebaliknya, di mana jumlah provinsi yang mengalami surplus lebih banyak daripada yang defisit, mengindikasikan kinerja perdagangan yang relatif lebih kuat. Sulawesi memiliki kondisi yang cukup seimbang antara defisit dan surplus. Sementara itu, wilayah dengan jumlah provinsi lebih sedikit seperti Bali, Maluku, dan Nusa Tenggara cenderung didominasi oleh kondisi defisit dan hanya sedikit yang mengalami surplus. Secara umum, grafik ini menunjukkan bahwa ketimpangan kondisi nilai transaksi perdagangan antar wilayah masih terlihat, dengan sebagian besar pulau memiliki lebih banyak provinsi yang mengalami defisit dibandingkan surplus.
Pie chart merupakan salah satu jenis diagram yang digunakan untuk menampilkan proporsi atau persentase suatu kategori terhadap keseluruhan data. Grafik ini berbentuk lingkaran yang dibagi menjadi beberapa bagian, di mana setiap bagian mewakili proporsi dari masing-masing kategori dalam data. Dengan menggunakan pie chart, dapat mempermudah melihat perbandingan kontribusi setiap kategori terhadap total keseluruhan data secara visual.
Pada dataset perdagangan antar wilayah yang digunakan dalam analisis ini, pie chart dimanfaatkan untuk menampilkan persentase moda transportasi utama yang digunakan dalam aktivitas perdagangan antar wilayah.
# Hitung frekuensi
df <- data.perdagangan %>%
group_by(`Moda Transportasi Utama`) %>%
summarise(counts = n())
# Hitung persentase
df <- df %>%
mutate(prop = round(counts * 100 / sum(counts), 1))
# Tampilkan pie chart
ggplot(df, aes(x = "", y = prop, fill = `Moda Transportasi Utama`)) +
geom_bar(width = 1, stat = "identity", color = "white") +
geom_text(aes(label = paste0(prop, "%")),
position = position_stack(vjust = 0.5),
color = "white") +
coord_polar("y", start = 0) +
ggpubr::fill_palette("Dark1") +
labs(fill = "Moda Transportasi Utama") +
theme_void() +
theme(legend.position = "right")
Grafik tersebut menunjukkan bahwa angkutan air laut merupakan moda transportasi utama yang paling dominan dalam kegiatan perdagangan antarwilayah dengan proporsi sekitar 52,6%, yang menandakan bahwa lebih dari setengah distribusi barang bergantung pada jalur laut. Selanjutnya, angkutan jalan menempati posisi kedua dengan proporsi 42,1%, menunjukkan bahwa transportasi darat juga memiliki peran penting dalam mendukung distribusi barang, terutama untuk wilayah yang terhubung melalui jaringan jalan. Sementara itu, angkutan ASDP dan angkutan udara hanya menyumbang masing-masing sekitar 2,6%, yang menunjukkan bahwa kedua moda tersebut digunakan dalam skala yang jauh lebih kecil. Secara keseluruhan, grafik ini mengindikasikan bahwa sistem distribusi perdagangan di Indonesia masih sangat bergantung pada transportasi laut sebagai jalur utama, dengan dukungan transportasi darat sebagai penghubung distribusi di dalam wilayah.
Peta spasial adalah representasi visual dari data geografis yang menunjukkan posisi, hubungan, dan karakteristik fitur atau objek di permukaan bumi, biasanya berbasis koordinat (x,y). Data ini menghubungkan informasi lokasi (di mana) dengan atribut (apa) untuk analisis dalam sistem informasi geografis (SIG), mencakup bentuk titik, garis, dan poligon. Package yang digunakan adalah dplyr geodata, sf, dan tmap.
#Peta
indo_prov <- geodata::gadm("IDN", level = 1, path = ".")
data.perdagangan$Provinsi[
data.perdagangan$Provinsi == "Kepulauan Bangka Belitung"
] <- "Bangka Belitung"
data.perdagangan$Provinsi[
data.perdagangan$Provinsi == "DKI Jakarta"
] <- "Jakarta Raya"
data.perdagangan$Provinsi[
data.perdagangan$Provinsi == "DI Yogyakarta"
] <- "Yogyakarta"
data.perdagangan$Provinsi[
data.perdagangan$Provinsi %in% c(
"Papua Selatan",
"Papua Tengah",
"Papua Pegunungan"
)
] <- "Papua"
data.perdagangan$Provinsi[
data.perdagangan$Provinsi == "Papua Barat Daya"
] <- "Papua Barat"
peta_data <- merge(
indo_prov,
data.perdagangan,
by.x = "NAME_1",
by.y = "Provinsi",
all.x = TRUE
)
peta_sf <- st_as_sf(peta_data)
ggplot(peta_sf) +
geom_sf(aes(fill = `Kondisi Nilai Transaksi`), color = "black") +
scale_fill_manual(
values = c("Surplus" = "green", "Defisit" = "red")
) +
labs(title = "Peta Kondisi Nilai Transaksi Antar Provinsi", fill = "Kondisi Transaksi") +
theme_minimal()
ggplot(peta_sf) +
geom_sf(aes(fill = `Moda Transportasi Utama`), color = "black") +
scale_fill_manual(
values = c("Angkutan jalan" = "darkgrey", "Angkutan air laut" = "blue", "Angkutan ASDP" = "lightblue", "Angkutan udara" = "white")
) +
labs(title = "Peta Moda Transportasi Utama Provinsi", fill = "Moda Transportasi Utama") +
theme_minimal()
Berdasarkan peta spasial yang ditampilkan untuk beberapa variabel numerik, dapat dilakukan analisis distribusi data perdagangan antar provinsi di Indonesia sebagai berikut.
Peta ini menunjukkan kondisi transaksi perdagangan setiap provinsi, yaitu apakah mengalami surplus atau defisit (Surplus berarti nilai penjualan lebih besar dibandingkan nilai pembelian. Sedangkan defisit berarti nilai pembelian lebih besar dibandingkan nilai penjualan).
Dari peta terlihat bahwa beberapa provinsi mengalami surplus perdagangan, yang menunjukkan bahwa provinsi tersebut menjadi pemasok barang bagi wilayah lain. Namun, mayoritas provinsi mengalami defisit, menunjukkan bahwa wilayah tersebut lebih banyak mengimpor barang dari provinsi lain untuk memenuhi kebutuhan domestiknya.
Perbedaan ini biasanya dipengaruhi oleh faktor seperti kapasitas produksi daerah, aktivitas industri, jumlah penduduk, posisi geografis, dan infrastruktur perdagangan.
Peta ini menunjukkan jenis moda transportasi utama yang digunakan dalam perdagangan antar wilayah, seperti angkutan jalan, angkutan air laut, angkutan ASDP (penyeberangan), dan angkutan udara.
Dari peta terlihat bahwa:
Angkutan jalan banyak digunakan di wilayah dengan konektivitas darat yang baik, seperti Pulau Jawa dan sebagian Sumatera.
Angkutan laut lebih dominan di wilayah kepulauan karena kondisi geografis Indonesia yang terdiri dari banyak pulau.
ASDP biasanya digunakan pada daerah yang memiliki banyak jalur penyeberangan air yang relatif dekat.
Angkutan udara biasanya digunakan untuk wilayah dengan akses darat dan laut yang lebih terbatas atau untuk pengiriman barang bernilai tinggi dan cepat.
Pola ini menunjukkan bahwa geografi Indonesia sangat mempengaruhi sistem distribusi logistik dan perdagangan antar wilayah.
Histogram adalah grafik batang yang menggambarkan distribusi frekuensi dari sekumpulan data numerik kontinu, di mana lebar batang menunjukkan interval kelas (bins) dan tingginya menunjukkan frekuensi data dalam rentang tersebut. Berbeda dengan diagram batang biasa, batang pada histogram saling berhimpit, menunjukkan data yang berkesinambungan. Histogram berguna untuk melihat pola distribusi, kemenjuluran, dan outlier. Untuk membuat histogram di R Studio, kita gunakan package ggplot2
ggplot(data.perdagangan, aes(x = `Total Penjualan (Rp Triliun)`)) +
geom_histogram(bins = 30, fill = "skyblue", color = "black") +
labs(
title = "Histogram Total Penjualan (Rp Triliun) Antar Provinsi",
x = "Total Penjualan (Rp Triliun)",
y = "Frekuensi"
) +
theme_minimal()
ggplot(data.perdagangan, aes(x = `Total Penjualan (Ton)`)) +
geom_histogram(bins = 30, fill = "orange", color = "black") +
labs(
title = "Histogram Total Penjualan (ton) Antar Provinsi",
x = "Total Penjualan (Ton)",
y = "Frekuensi"
) +
theme_minimal()
ggplot(data.perdagangan, aes(x = `Total Pembelian (Rp Triliun)`)) +
geom_histogram(bins = 30, fill = "brown", color = "black") +
labs(
title = "Histogram Total Pembelian (Rp Triliun) Antar Provinsi",
x = "Total Pembelian (Rp Triliun)",
y = "Frekuensi"
) +
theme_minimal()
ggplot(data.perdagangan, aes(x = `Total Pembelian (Ton)`)) +
geom_histogram(bins = 30, fill = "black", color = "black") +
labs(
title = "Histogram Total Pembelian (ton) Antar Provinsi",
x = "Total Pembelian (Ton)",
y = "Frekuensi"
) +
theme_minimal()
ggplot(data.perdagangan, aes(x = `Total (Rp Triliun)`)) +
geom_histogram(bins = 30, fill = "darkgreen", color = "black") +
labs(
title = "Histogram Total (Rp Triliun) Antar Provinsi",
x = "Total (Rp Triliun)",
y = "Frekuensi"
) +
theme_minimal()
ggplot(data.perdagangan, aes(x = `Total (Ton)`)) +
geom_histogram(bins = 30, fill = "darkblue", color = "black") +
labs(
title = "Histogram Total (ton) Antar Provinsi",
x = "Total (Ton)",
y = "Frekuensi"
) +
theme_minimal()
Berdasarkan histogram yang ditampilkan untuk beberapa variabel numerik, dapat dilakukan analisis distribusi data perdagangan antar provinsi di Indonesia sebagai berikut.
Histogram ini menunjukkan distribusi nilai total penjualan antar provinsi dalam satuan rupiah (triliun). Sebagian besar provinsi memiliki nilai penjualan yang relatif rendah hingga menengah, sementara hanya beberapa provinsi yang memiliki nilai penjualan sangat tinggi. Hal ini menunjukkan adanya ketimpangan aktivitas perdagangan antar provinsi, di mana provinsi dengan aktivitas ekonomi besar seperti provinsi di Pulau Jawa cenderung memiliki nilai penjualan yang jauh lebih besar dibandingkan provinsi lainnya.
Histogram ini menggambarkan distribusi jumlah barang yang dijual antar provinsi dalam satuan ton. Polanya hampir sama dengan histogram nilai penjualan, yaitu sebagian besar provinsi berada pada kategori volume perdagangan yang lebih kecil, sedangkan hanya beberapa provinsi yang memiliki volume perdagangan sangat besar. Hal ini menunjukkan bahwa pusat distribusi barang masih terkonsentrasi pada beberapa wilayah tertentu.
Histogram ini menunjukkan distribusi nilai pembelian barang oleh provinsi. Dari grafik terlihat bahwa sebagian besar provinsi memiliki nilai pembelian yang tidak terlalu tinggi, namun terdapat beberapa provinsi dengan nilai pembelian yang sangat besar. Hal ini dapat menunjukkan bahwa beberapa provinsi memiliki ketergantungan yang lebih tinggi terhadap pasokan barang dari wilayah lain.
Histogram ini menunjukkan volume barang yang dibeli oleh provinsi. Pola distribusi yang muncul menunjukkan bahwa sebagian besar provinsi memiliki volume pembelian yang relatif rendah hingga sedang, sedangkan beberapa provinsi memiliki volume pembelian yang jauh lebih besar. Distribusi ini menunjukkan bahwa kegiatan konsumsi dan distribusi barang juga tidak merata antar wilayah.
Histogram total perdagangan menunjukkan gabungan nilai transaksi perdagangan antar provinsi. Dari grafik terlihat bahwa sebagian besar provinsi berada pada kelompok nilai perdagangan rendah hingga menengah, sedangkan hanya beberapa provinsi yang memiliki total perdagangan sangat besar. Hal ini menunjukkan bahwa aktivitas perdagangan nasional masih terkonsentrasi pada provinsi tertentu yang memiliki aktivitas ekonomi tinggi.
Histogram ini menggambarkan total volume perdagangan antar provinsi dalam ton. Pola distribusinya menunjukkan bahwa sebagian besar provinsi memiliki volume perdagangan relatif kecil, sedangkan hanya beberapa provinsi yang memiliki volume perdagangan sangat besar. Hal ini mengindikasikan adanya ketimpangan distribusi logistik antar wilayah di Indonesia.
Seluruh distribusi data cenderung miring ke kanan (right-skewed) karena terdapat sedikit provinsi dengan nilai dan volume penjualan dan pembelian (baik parsial maupun total) sangat tinggi
Untuk membuat density plot menggunakan ggplot2 kita cukup menggunakan
function geom_density(). Pada data yang kamu gunakan,
density plot berfungsi untuk melihat pola distribusi Total Penjualan (Rp
Triliun) pada setiap pulau. Dengan menggunakan data tersebut, grafik
density membantu menunjukkan bagaimana nilai penjualan tersebar di
masing-masing wilayah.
##Density
ggplot(data = data.perdagangan, mapping = aes(x = `Total Penjualan (Rp Triliun)` )) +
geom_density(fill = "coral", alpha = 0.7) +
scale_x_continuous(labels = comma) +
scale_y_continuous(labels = comma) +
labs(x = "Total Penjualan (Rp Triliun)")
Berdasarkan density plot pada variabel Total Penjualan (Rp Triliun) yang dibuat menggunakan R dengan bantuan paket ggplot2, terlihat bahwa distribusi Total Penjualan (Rp Triliun) antar provinsi tidak merata dan cenderung miring ke kanan (right-skewed). Kepadatan data paling tinggi berada pada nilai penjualan yang relatif kecil, yaitu pada kisaran sekitar 0 hingga 25 triliun rupiah. Hal ini menunjukkan bahwa sebagian besar provinsi di Indonesia memiliki total nilai penjualan yang relatif rendah. Berdasarkan ringkasan statistik data, nilai minimum penjualan tercatat sekitar 0,000077 triliun rupiah, median sebesar 13,52 triliun rupiah, dan nilai rata-rata sekitar 40,80 triliun rupiah. Nilai maksimum mencapai sekitar 431,96 triliun rupiah, yang jauh lebih tinggi dibandingkan sebagian besar data lainnya. Perbedaan yang cukup besar antara nilai maksimum dan sebagian besar nilai lainnya menyebabkan distribusi data memanjang ke arah kanan pada grafik. Pola ini juga mengindikasikan adanya nilai ekstrem (outlier) yang kemungkinan berasal dari provinsi dengan aktivitas perdagangan yang sangat tinggi. Secara keseluruhan, dapat disimpulkan bahwa mayoritas provinsi memiliki total penjualan yang relatif kecil, sementara hanya beberapa provinsi yang memiliki nilai penjualan sangat besar sehingga membuat distribusi data menjadi tidak simetris.
Kita dapat membandingkan sebaran menggunakan density plot berdasarkan kategori. Misal akan dilihat sebaran harga Total Penjualan (Rp Triliun) berdasarkan kategori Pulau. Hasilnya sebagai berikut.
ggplot(data = data.perdagangan, mapping = aes(x = `Total Penjualan (Rp Triliun)` , fill = Pulau, color = Pulau)) +
geom_density(alpha = 0.7) +
scale_x_continuous(labels = comma) +
scale_y_continuous(labels = comma) +
labs(x = "Total Penjualan (Rp Triliun)")
Berdasarkan grafik tersebut distribusi total penjualan perdagangan antar pulau di Indonesia tidak merata. Sebagian besar wilayah di luar Jawa dan Sumatera cenderung memiliki nilai penjualan yang lebih kecil dan terkonsentrasi pada rentang rendah, sedangkan pulau Jawa dan Sumatera menunjukkan variasi yang lebih besar serta memiliki beberapa provinsi dengan tingkat penjualan yang sangat tinggi. Hal ini mengindikasikan bahwa aktivitas perdagangan nasional masih relatif terpusat di wilayah tersebut.
Untuk mengurangi kesulitan dalam mengamati visual tersebut maka perlu
dipisah per kategori dengan menggunakan visualisasi ridgeline plot atau
disebut juga joyplot dengan menggunakan fungsi
geom_density_ridges().
ggplot(data = data.perdagangan, mapping = aes(x = `Total Penjualan (Rp Triliun)`, y= Pulau,fill = Pulau)) +
geom_density_ridges() +
labs(x = "Total Penjualan (Rp Triliun) ", y = "Pulau")
## Picking joint bandwidth of 6.37
Berdasarkan grafik tersebut dapat dilakukan analisis distribusi data perdagangan antar provinsi di Indonesia sebagai berikut.
Untuk membuat boxplot di ggplot2 kita dapat gunakan function
geom_boxplot(). Pada data boxplot berfungsi untuk
menunjukkan nilai median, rentang kuartil, serta penyebaran data
penjualan antar provinsi. Selain itu, boxplot juga membantu
mengidentifikasi adanya nilai ekstrem atau outlier, yaitu provinsi yang
memiliki nilai penjualan atau pembelian jauh lebih tinggi dibandingkan
provinsi lainnya.
#Boxplot total penjulan
ggplot(data = data.perdagangan, mapping = aes(x = `Total Penjualan (Rp Triliun)`)) +
geom_boxplot()
Berdasarkan visualisasi boxplot total penjualan (Rp triliun), terlihat bahwa sebagian besar nilai penjualan berada pada kisaran yang relatif rendah. Hal ini dapat dilihat dari posisi kotak pada boxplot yang berada di sekitar rentang 0 hingga 30 triliun. Garis yang terdapat di dalam kotak menunjukkan nilai median yang berada pada kisaran belasan hingga sekitar 20 triliun, yang mengindikasikan bahwa setengah dari data memiliki nilai penjualan di bawah median tersebut dan setengah lainnya berada di atasnya. Rentang antara kuartil pertama (Q1) dan kuartil ketiga (Q3) menunjukkan bahwa sekitar 50% data utama berada pada kisaran kurang lebih 5 hingga 25 triliun. Selain itu, terdapat beberapa titik yang berada jauh di sebelah kanan kotak yang menandakan adanya outlier, dengan nilai penjualan berkisar antara sekitar 60 hingga lebih dari 400 triliun. Keberadaan outlier tersebut menunjukkan bahwa terdapat beberapa wilayah yang memiliki total penjualan jauh lebih tinggi dibandingkan mayoritas wilayah lainnya. Secara keseluruhan, distribusi data menunjukkan pola yang condong ke kanan (right-skewed) karena sebagian besar nilai berada pada tingkat rendah, namun terdapat beberapa nilai yang sangat besar.
Membuat boxplot secara vertikal menggunakan perintah
coord_flip(). Hasilnya sebagai berikut.
ggplot(data = data.perdagangan, mapping = aes(x = `Total Penjualan (Rp Triliun)`)) +
geom_boxplot() +
coord_flip()
Posisi pada boxplot tersebut terlihat seperti itu karena sebagian besar nilai total penjualan berada pada kisaran yang rendah, sedangkan hanya sedikit data yang memiliki nilai sangat besar. Akibatnya, kotak (box) dan garis median berada di bagian bawah grafik karena mayoritas data terkonsentrasi pada nilai yang kecil. Sementara itu, beberapa titik yang berada jauh di atas kotak merupakan nilai pencilan (outlier) yang menunjukkan adanya beberapa wilayah dengan total penjualan yang jauh lebih tinggi dibandingkan data lainnya. Perbedaan nilai yang cukup besar antara sebagian besar data dan beberapa nilai yang sangat tinggi menyebabkan sebaran data menjadi tidak merata dan membuat grafik terlihat memanjang ke arah atas.
Selanjutnya memberi warna berbeda untuk setiap box berdasarkan
kategorinya. Kita dapat menambahkan argumen fill dengan
nilai berupa nama variabel dari kategori yang ingin kita gunakan untuk
perbandingan boxplot. Misalnya kita ingin membandingkan sebaran dari
variabel Total Penjualan (Rp Triliun) berdasarkan pulau menggunakan
boxplot. Hasilnya sebagai berikut.
ggplot(data = data.perdagangan, mapping = aes(x = `Total Penjualan (Rp Triliun)`, y = `Pulau`, fill = Pulau )) +
geom_boxplot()
Grafik tersebut menunjukkan bahwa Pulau Jawa memiliki nilai total penjualan yang paling tinggi dibandingkan pulau lainnya, yang terlihat dari posisi box yang berada paling jauh ke arah kanan. Selain itu, terdapat satu titik yang berada sangat jauh dari data lainnya yang merupakan outlier, menandakan adanya nilai penjualan yang sangat besar. Sementara itu, Pulau Sumatera dan Sulawesi berada pada posisi menengah dengan nilai penjualan yang lebih tinggi dibanding beberapa pulau lain, tetapi masih jauh lebih rendah dibandingkan Pulau Jawa. Di sisi lain, Kalimantan, Nusa Tenggara, Papua, Maluku, dan Bali memiliki posisi box yang lebih ke kiri karena nilai total penjualannya relatif lebih kecil dan variasinya tidak terlalu besar. Secara keseluruhan, grafik ini menunjukkan bahwa distribusi total penjualan antar pulau tidak merata dan aktivitas penjualan paling dominan terjadi di Pulau Jawa.
Untuk menghilangkan legend dari color kita dapat tambahkan
theme(legend.position = "none").Hasilnya sebagai
berikut.
ggplot(data = data.perdagangan, mapping = aes(x =`Total Penjualan (Rp Triliun)` , y = `Pulau`, fill = Pulau )) +
geom_boxplot() +
theme(legend.position = "none")
Melalui visualisasi ini, boxplot memperlihatkan sebaran data penjualan pada masing-masing pulau, termasuk nilai median, rentang kuartil, serta kemungkinan adanya nilai pencilan (outlier). Dengan grafik ini, perbandingan tingkat dan variasi total penjualan antar pulau dapat diamati dengan lebih jelas.
Plot ini dibentuk dengan menggabungkan antara density plot dengan
boxplot dengan fungsi geom_violin(). violin plot digunakan
untuk melihat dan membandingkan distribusi Total Penjualan (Rp Triliun)
pada setiap pulau, sehingga dapat diketahui pulau mana yang memiliki
penjualan lebih terkonsentrasi, lebih bervariasi, atau memiliki beberapa
kelompok nilai penjualan.
ggplot(data = data.perdagangan, mapping = aes(x = `Total Penjualan (Rp Triliun)` ,y="all")) +
geom_violin(fill="green",alpha=0.5) +
geom_boxplot(fill="blue",width=0.1) +
scale_x_continuous(labels = comma)
Berdasarkan visualisasi violin plot yang dikombinasikan dengan boxplot pada variabel Total Penjualan (Rp Triliun) dari data perdagangan provinsi di Indonesia yang diolah menggunakan R dengan paket ggplot2, terlihat bahwa penyebaran nilai penjualan antar provinsi tidak merata dan menunjukkan pola distribusi yang condong ke kanan (right-skewed). Kepadatan data terbesar berada pada rentang nilai penjualan yang relatif kecil, yaitu sekitar 0 hingga kurang lebih 25 triliun rupiah, yang menandakan bahwa sebagian besar provinsi memiliki total penjualan yang relatif rendah. Hal ini terlihat dari bagian violin plot yang lebih lebar pada rentang nilai tersebut serta posisi boxplot yang berada di area nilai rendah. Di sisi lain, terdapat beberapa titik yang tersebar jauh ke arah kanan hingga mencapai lebih dari 400 triliun rupiah, yang menunjukkan adanya provinsi dengan nilai penjualan yang jauh lebih tinggi dibandingkan provinsi lainnya. Titik-titik tersebut mengindikasikan keberadaan nilai ekstrem (outlier) dalam data.
QQ-Plot (Quantile-Quantile Plot) merupakan grafik yang digunakan untuk membandingkan sebaran data empiris dengan sebaran teoritis tertentu. Plot ini berguna untuk memeriksa apakah data memiliki bentuk distribusi yang sama dengan distribusi yang dispesifikasikan, misalnya distribusi normal. Jadi dapat disimpulkan bahwa QQ-Plot ini tujuannya adalah untuk melihat apakah data berdistribusi normal. Misalnya kita ingin melihat pola sebaran data Total Penjualan (ton) pada setiap provinsi di indonesia, apakah data tersebut berdistribusi normal atau tidak.
ggplot(data = data.perdagangan, aes(sample = `Total Penjualan (Ton)`)) +
stat_qq(col="blue", size=0.9) +
stat_qq_line(col="darkgreen", linewidth=1)
Berdasarkan grafik QQ-Plot pada variabel Total Penjualan (Ton), terlihat bahwa titik-titik data tidak mengikuti garis diagonal secara konsisten dan cenderung menyimpang ke arah kanan atau melengkung menjauhi garis. Ini menunjukkan bahwa data Total Penjualan (Ton) antar provinsi di Indonesia tidak berdistribusi normal. Penyimpangan tersebut kemungkinan disebabkan oleh adanya perbedaan yang cukup dalam jumlah penjualan antar provinsi sehingga terdapat beberapa nilai yang jauh lebih tinggi dibandingkan yang lain. Sebagai contoh, total penjualan Provinsi Jakarta mencapai 24233937 ton, sedangkan total penjualan Provinsi Papua Pegunungan hanya sekitar 0,53 ton.
Scatter plot digunakan untuk melihat hubungan atau pola antara dua variabel numeriK. Misalnya kita ingin melihat hubungan antara Total Penjualan (Ton) dan Total Pembelian (Ton) antar provinsi di Indonesia, dimana:
Untuk membuat scatter plot menggunakan ggplot2, kita
dapat menggunakan fungsi geom_point(). Kita juga bisa
memberikan warna yang berbeda pada setiap titik untuk membedakan
kategori tertentu. Misalnya pola sebaran antara Total Penjualan (Ton)
dan Total Pembelian (Ton) berdasarkan kategori pulau.
ggplot(data = data.perdagangan, mapping = aes(x = `Total Penjualan (Ton)`, y = `Total Pembelian (Ton)`, color = Pulau)) +
geom_point(size = 3, alpha = 0.8)
Berdasarkan grafik scatter plot diatas terlihat, adanya korelasi positif antara Total Penjualan (Ton) dan Total Pembelian (Ton) antar provinsi di Indonesia, dimana provinsi yang memiliki angka penjualan tinggi cenderung memiliki angka pembelian yang tinggi juga. Namun, penyebaran titik data menunjukkan ketimpangan volume perdagangan yang sangat signifikan antar wilayah, yang ditandai dengan banyaknya titik yang menyebar menjauhi garis diagonal.
Note: Grafik ini menggunakan notasi ilmiah, di mana titik 0.0e+00 mewakili angka nol (titik awal), sementara angka 7.5e+07 mewakili skala hingga 75 juta ton.
Jika kita perhatikan lebih detail, visualisasi berdasarkan kategori pulau menunjukkan pembagian level aktivitas perdagangan sebagai berikut:
Line Chart (diagram garis) digunakan untuk menunjukkan pola perubahan atau perbandingan nilai suatu variabel secara berurutan. Dimana grafik ini menampilkan titik-titik data yang dihubungkan oleh garis, sehingga kita bisa melihat naik turun nilai dengan lebih jelas. Fungsi utama dari Line Chart antaralain:
Pada dataset yang digunakan dalam analisis ini tidak terdapat variabel waktu, sehingga visualisasi Line Chart dibuat dengan menggunakan variabel kategori yaitu provinsi sebagai X dan Total Penjualan (Ton) sebagai Y. Jadi grafik ini digunakan untuk memperlihatkan perbandingan nilai total penjualan antar provinsi di Indonesia.
ggplot(data = data.perdagangan, aes(x= Provinsi, y=`Total Penjualan (Ton)`, group = 1)) +
geom_line() +
labs(x = "Provinsi", y = "Total Penjualan (Ton)") +
theme(axis.text.x = element_text(angle = 90, hjust = 1))
Grafik Line Chart tersebut menunjukkan perbandingan Total Penjualan (Ton) pada setiap provinsi di Indonesia. Dari grafik terlihat bahwa terdapat perbedaan yang cukup besar antar provinsi. Sebagai contoh, Provinsi Aceh memiliki total penjualan yang sangat tinggi, yaitu berada pada kisaran sekitar 90 juta ton. Setelah itu terjadi penurunan yang cukup tajam pada Provinsi Bali, yang memiliki nilai penjualan jauh lebih kecil dibandingkan Aceh. Selanjutnya, pada Provinsi Banten terlihat kembali adanya peningkatan nilai penjualan yaitu sekitar 55 juta ton. Kemudian untuk beberapa provinsi lain seperti DI Yogyakarta, Gorontalo, dan Maluku terlihat memiliki nilai penjualan yang relatif kecil karena titik pada grafik berada sangat dekat dengan angka 0 pada sumbu Y. Lalu terjadi peningkatan kembali pada provinsi Sumatera Selatan yang mencapai kisaran sekitar 60 juta ton, sebelum kembali menurun pada Sumatera Utara yang berada di kisaran sekitar 35 juta ton.
Dapat disimpulkan secara keseluruhan, grafik ini memperlihatkan adanya variasi atau ketimpangan penjualan antar provinsi, dimana hanya beberapa provinsi yang memiliki nilai penjualan sangat tinggi sementara sebagian besar provinsi lainnya memiliki nilai yang relatif lebih rendah. Selain itu, perubahan nilai penjualan dari satu provinsi ke provinsi berikutnya, ditunjukkan oleh naik turunnya garis pada grafik.
Untuk menambah estetika dapat dilakukan dengan mengarsir daerah di
bawah plot deret provinsi. Plot ini disebut Area Plot dengan menggunakan
fungsi geom_area().
ggplot(data = data.perdagangan, aes(x= Provinsi, y=`Total Penjualan (Ton)`, group = 1)) +
geom_line(lwd=1.2, col="darkgreen") +
geom_area(fill="green", alpha=0.3) +
labs(x = "Provinsi", y = "Total Penjualan (Ton)") +
theme(axis.text.x = element_text(angle = 90, hjust = 1))
Line Chart digunakan untuk menampilkan perbandingan nilai suatu variabel pada beberapa kategori. Misalnya kita akan membuat perbandingan total penjualan (ton) pada setiap provinsi di Indonesia.
ggplot(data = data.perdagangan, aes(x= Provinsi, y=`Total Penjualan (Ton)`, group = 1)) +
geom_line(aes(y= `Total Penjualan (Ton)`), lwd=1.2, col="blue") +
labs(x = "Provinsi", y = "Total Penjualan (Ton)") +
theme(axis.text.x = element_text(angle = 90, hjust = 1))
Analisis visual data perdagangan antar wilayah di Indonesia tahun 2024 menunjukkan bahwa perekonomian nasional masih ditandai dengan perbedaan besar dalam jumlah dan nilai transaksi. Dengan menggunakan pendekatan kategoriK, ditemukan bahwa sebagian besar provinsi masih mengalami defisit, dengan ketergantungan logistik yang sangat tinggi pada angkutan laut sebagai jalur utama distribusi antar pulau. Peta spasial dan pie chart menunjukkan bahwa meskipun koneksi darat kuat di daerah seperti Jawa, jalur laut tetap menjadi faktor utama dalam pergerakan barang di seluruh negeri.
Sementara berdasarkan visualisasi data numerik, dapat disimpulkan bahwa data perdagangan antar provinsi di Indonesia menunjukkan pola distribusi yang tidak merata. Visualisasi seperti histogram, density plot, ridgeline plot, boxplot, violin plot, dan QQ-plot menunjukkan bahwa sebagian besar provinsi memiliki total nilai penjualan dan pembelian yang cenderung kecil, sedangkan beberapa provinsi lainnya memiliki nilai yang sangat besar. Hal ini terlihat dari distribusi data yang cenderung miring ke kanan (right-skewed) dan terdapat outlier.
Selain itu, visualisasi scatter plot, line chart, membantu memperlihatkan hubungan serta perbandingan nilai perdagangan di antara provinsi. Scatter plot menunjukkan adanya hubungan (korelasi) positif antara total penjualan dan total pembelian, yang dimana provinsi dengan angka penjualan tinggi cenderung memiliki angka pembelian yang tinggi juga. Sementara itu, line chart dan area plot digunakan untuk memudahkan dalam melihat perbedaan besar dalam volume penjualan antar provinsi. Secara keseluruhan, hasil visualisasi ini memberikan gambaran bahwa aktivitas perdagangan nasional masih terfokus di beberapa wilayah tertentu yang memiliki tingkat ekonomi yang lebih maju, sementara mayoritas provinsi lainnya memiliki tingkat aktivitas perdagangan yang relatif lebih rendah. Dengan demikian, hasil ini menekankan pentingnya peningkatan infrastruktur dan penerapan kebijakan distribusi yang lebih seimbang untuk mengurangi defisit dan memastikan arus perdagangan yang adil antar provinsi di masa mendatang.