Diagram Sankey adalah tools yang berguna untuk memvisualisasikan aliran data antar kategori. Dengan menggunakan Diagram Sankey diperoleh beberapa keuntungan, yaitu:
Dalam Diagram Sankey, indeks numerik digunakan untuk mewakili node (titik awal dan akhir aliran). Setiap node memiliki indeks yang dimulai dari 0. Indeks ini digunakan dalam daftar source dan target untuk menunjukkan aliran dari satu node ke node lainnya.
pacman::p_load(networkD3)
# Definisikan node (kuintil di setiap tahun)
nodes <- data.frame(
name = c("Q1 2020", "Q2 2020", "Q3 2020", "Q4 2020", "Q5 2020",
"Q1 2021", "Q2 2021", "Q3 2021", "Q4 2021", "Q5 2021")
)
Penjelasan di atas sebagai berikut: Didefinisikan terdapat 10 node, dengan indeks mulai dari 0 hingga 9:
Indeks node mulai dari 0, jadi Q1 2020 adalah 0, Q2 2020 adalah 1, dst.
links <- data.frame(
source = c(0, 1, 2, 3, 4, 0, 1, 2, 3, 4),
target = c(5, 6, 7, 8, 9, 6, 7, 8, 9, 5),
value = c(10, 5, 15, 20, 10, 5, 10, 5, 15, 20)
)
Penjelasan di atas adalah: source = 0 dan target = 5 berarti ada aliran dari “Q1 2020” ke “Q1 2021”. source = 1 dan target = 6 berarti ada aliran dari “Q2 2020” ke “Q2 2021”, dst
value menentukan seberapa besar aliran (misalnya, jumlah orang yang berpindah dari satu kuintil ke kuintil lainnya).
Setiap aliran dari source ke target diwakili oleh garis dengan lebar proporsional terhadap value.
sankeyNetwork(Links = links, Nodes = nodes,
Source = "source", Target = "target",
Value = "value", NodeID = "name",
units = "People", fontSize = 12, nodeWidth = 30)
Direktorat Statistik Kesejahteraan Rakyat, BPS, saptahas@bps.go.id