Visualisasi Data Rekap Produksi Padi di Aceh pada Tahun 2018-2023 dan Jumlah Penduduk Kab. Toba 2023[untuk peta spasial]
VISUALISASI DATA KATEGORIK
Input Data
##
## Attaching package: 'dplyr'
## The following objects are masked from 'package:stats':
##
## filter, lag
## The following objects are masked from 'package:base':
##
## intersect, setdiff, setequal, union
## Warning: package 'readxl' was built under R version 4.5.2
Bar Chart
data2023 <- datapadi %>%
filter(tahun == 2023)
ggplot(data = data2023, aes(x = nama_kabupaten_kota, y = rekap_produksi_padi)) +
geom_col() +
theme(axis.text.x = element_text(angle = 90))## Warning: Removed 1 row containing missing values or values outside the scale range
## (`geom_col()`).
Bar chart memperlihatkan distribusi produksi padi tahun 2023 menurut kabupaten/kota di Provinsi Aceh. Visualisasi ini menunjukkan adanya variasi produksi antardaerah, sehingga dapat diidentifikasi wilayah dengan produksi tertinggi maupun terendah.
Bar Chart dengan tabel frekuensi
datapadi$kategori_produksi <- cut(datapadi$rekap_produksi_padi,
breaks = 3,
labels = c("Rendah", "Sedang", "Tinggi"))
freqtab <- as.data.frame(table(datapadi$kategori_produksi))
freqtab## Var1 Freq
## 1 Rendah 106
## 2 Sedang 21
## 3 Tinggi 5
Data produksi padi kemudian dikelompokkan ke dalam tiga kategori, yaitu rendah, sedang, dan tinggi. Tabel frekuensi menunjukkan banyaknya data yang masuk ke masing-masing kategori tersebut. Melalui tabel ini, dapat diketahui kategori produksi mana yang paling dominan dan kategori mana yang paling sedikit jumlahnya.
Membuat Bar Chart
cara lain
Bar chart frekuensi menampilkan jumlah observasi pada masing-masing kategori produksi padi, yaitu rendah, sedang, dan tinggi. Grafik ini menunjukkan sebaran data berdasarkan kategori. Kategori dengan batang tertinggi menunjukkan kelompok yang paling banyak jumlah datanya, sedangkan kategori dengan batang terendah menunjukkan kelompok yang paling sedikit.
Modifikasi Bar Chart
ggplot(data = freqtab, aes(x = Var1, y = Freq)) +
geom_col(fill = "mediumpurple", alpha = 0.7) +
labs(title = "Frekuensi Kategori Produksi Padi di Provinsi Aceh",
x = "Kategori Produksi Padi",
y = "Frekuensi") +
geom_text(aes(label = Freq), vjust = -0.25)Modifikasi bar chart memberikan tampilan visual yang lebih informatif karena dilengkapi judul, label sumbu, warna, serta angka frekuensi di atas batang. Secara isi, grafik ini tetap menunjukkan distribusi jumlah data pada kategori produksi padi. Penambahan label angka membantu pembaca mengetahui frekuensi tiap kategori secara lebih jelas tanpa harus memperkirakan dari tinggi batang.
Needle Chart
ggplot(data = freqtab,
mapping = aes(x = reorder(Var1, Freq), y = Freq)) +
geom_segment(aes(x = reorder(Var1, Freq),
xend = reorder(Var1, Freq),
y = 0, yend = Freq), color = "thistle3") +
geom_point(color = "orchid3", size = 4, alpha = 0.7) +
geom_text(aes(label = Freq), vjust = -1.00) +
coord_flip() +
labs(y = "Frekuensi",
x = "Kategori Produksi Padi")Needle chart menampilkan frekuensi tiap kategori produksi padi dalam bentuk titik dan garis. Grafik ini memiliki makna yang sama dengan bar chart frekuensi, yaitu membandingkan jumlah data pada kategori rendah, sedang, dan tinggi. Perbedaannya terletak pada bentuk visualisasi yang lebih sederhana. Dari grafik ini tetap dapat dilihat kategori mana yang frekuensinya paling besar dan paling kecil.
Grouped Bar Chart
ggplot(data = datapadi,
mapping = aes(x = kategori_produksi, fill = as.factor(tahun))) +
geom_bar(position = "dodge", stat = "count") +
labs(x = "Kategori Produksi Padi",
fill = "Tahun",
y = "Jumlah Data") +
scale_fill_brewer(palette = "RdPu") +
theme_light()Grouped bar chart menunjukkan perbandingan kategori produksi padi berdasarkan tahun. Setiap kategori produksi dibandingkan antar tahun melalui batang yang diletakkan berdampingan. Visualisasi ini memudahkan untuk melihat perubahan jumlah data pada kategori rendah, sedang, dan tinggi dari tahun ke tahun. Jika terdapat perbedaan tinggi batang antar tahun, maka hal tersebut menunjukkan adanya perubahan distribusi kategori produksi.
Stacked Bar Chart
ggplot(data = datapadi,
mapping = aes(x = kategori_produksi, fill =as.factor(tahun))) +
geom_bar(position = "stack", stat = "count") +
labs(x = "Kategori Produksi Padi",
fill = "Tahun",
y = "Jumlah Data") +
scale_fill_brewer(palette = "RdPu") +
theme_light()Stacked bar chart menampilkan jumlah data pada setiap kategori produksi padi dengan susunan berdasarkan tahun. Grafik ini berguna untuk melihat total jumlah data dalam setiap kategori sekaligus komposisi tiap tahunnya. Semakin tinggi total batang, semakin besar jumlah data pada kategori tersebut. Warna yang berbeda memperlihatkan kontribusi masing-masing tahun terhadap total kategori.
Pie Chart
pertama kita harus menyiapkan data dengan meringkas menjadi tabel frekuensi.
## # A tibble: 4 × 2
## kategori_produksi counts
## <fct> <int>
## 1 Rendah 106
## 2 Sedang 21
## 3 Tinggi 5
## 4 <NA> 6
Selanjutnya mengitung posisi label teks sebagai jumlah kumulatif proporsi.
df <- df %>%
arrange(desc(kategori_produksi)) %>%
mutate(prop = round(counts*100/sum(counts), 1),
lab.ypos = cumsum(prop) - 0.5*prop)
head(df, 4)## # A tibble: 4 × 4
## kategori_produksi counts prop lab.ypos
## <fct> <int> <dbl> <dbl>
## 1 Tinggi 5 3.6 1.8
## 2 Sedang 21 15.2 11.2
## 3 Rendah 106 76.8 57.2
## 4 <NA> 6 4.3 97.7
Setelah itu, kita dapat membuat grafik Pie Chart
ggplot(df, aes(x = "", y = prop, fill = kategori_produksi)) +
geom_bar(width = 1, stat = "identity", color = "black") +
geom_text(aes(y = lab.ypos, label = prop), color = "magenta")+
coord_polar("y", start = 0)+
ggpubr::fill_palette("RdPu")+
theme_void()Pie chart menunjukkan proporsi masing-masing kategori produksi padi terhadap keseluruhan data. Setiap irisan lingkaran mewakili persentase kategori rendah, sedang, atau tinggi. Semakin besar irisan, semakin besar proporsi kategori tersebut dalam data. Dengan pie chart, pembaca dapat melihat kategori produksi mana yang paling mendominasi secara persentase.
Peta Spasial
## Warning: package 'DT' was built under R version 4.5.2
## Warning: package 'sf' was built under R version 4.5.2
## Linking to GEOS 3.13.1, GDAL 3.11.4, PROJ 9.7.0; sf_use_s2() is TRUE
Import Data Excel dan SHP
#Import Data Excel
data.spasial <- read_xlsx(
"C:/Users/HP/OneDrive/Documents/MATA KULIAH/EKSPLORASI DAN VISUALISASI DATA/jumlah_penduduk_toba_2023.xlsx",
sheet = 1,
skip = 2
)
#IMPORT PETA SHP
shp.toba <- read_sf(
"C:/Users/HP/OneDrive/Documents/MATA KULIAH/EKSPLORASI DAN VISUALISASI DATA/SHP Kab. Toba/ADMINISTRASI_AR_KECAMATAN.shp"
)
head(data.spasial)## # A tibble: 6 × 6
## No. Kecamatan `Laki-laki` Perempuan Jumlah `Rasio Jenis Kelamin`
## <chr> <chr> <chr> <chr> <chr> <chr>
## 1 <NA> (1) (2) (3) (4) (5)
## 2 1 Balige 23248 23320 46568 99.69
## 3 2 Tampahan 2673 2666 5339 100.26
## 4 3 Laguboti 11564 11815 23379 97.88
## 5 4 Habinsaran 9277 9088 18365 102.08
## 6 5 Borbor 4455 4213 8668 105.74
cek nama variabel
## [1] "NAMOBJ" "FCODE" "REMARK" "METADATA" "SRS_ID"
## [6] "KDBBPS" "KDCBPS" "KDCPUM" "KDEBPS" "KDEPUM"
## [11] "KDPBPS" "KDPKAB" "KDPPUM" "LUASWH" "TIPADM"
## [16] "WADMKC" "WADMKD" "WADMKK" "WADMPR" "WIADKC"
## [21] "WIADKK" "WIADPR" "WIADKD" "UUPP" "SHAPE_Leng"
## [26] "SHAPE_Area" "geometry"
## [1] "No." "Kecamatan" "Laki-laki"
## [4] "Perempuan" "Jumlah" "Rasio Jenis Kelamin"
Menggabungkan Data
#Menggabungkan Data ke file SHP
shp.toba$WADMKC <- toupper(trimws(shp.toba$WADMKC))
data.spasial$Kecamatan <- toupper(trimws(data.spasial$Kecamatan))
gabung.toba <- left_join(shp.toba, data.spasial, by = c("WADMKC" = "Kecamatan"))
head(gabung.toba)## Simple feature collection with 6 features and 31 fields
## Geometry type: MULTIPOLYGON
## Dimension: XY
## Bounding box: xmin: 98.93711 ymin: 2 xmax: 99.45938 ymax: 2.303353
## Geodetic CRS: WGS 84
## # A tibble: 6 × 32
## NAMOBJ FCODE REMARK METADATA SRS_ID KDBBPS KDCBPS KDCPUM KDEBPS KDEPUM KDPBPS
## <chr> <chr> <chr> <chr> <chr> <chr> <chr> <chr> <chr> <chr> <chr>
## 1 Tarutu… BA03… <NA> TASWIL1… SRGI … <NA> <NA> 12.02… <NA> <NA> <NA>
## 2 Siatas… BA03… <NA> TASWIL1… SRGI … <NA> <NA> 12.02… <NA> <NA> <NA>
## 3 Siboro… BA03… <NA> TASWIL1… SRGI … <NA> <NA> 12.02… <NA> <NA> <NA>
## 4 Sipahu… BA03… <NA> TASWIL1… SRGI … <NA> <NA> 12.02… <NA> <NA> <NA>
## 5 Pangar… BA03… <NA> TASWIL1… SRGI … <NA> <NA> 12.02… <NA> <NA> <NA>
## 6 Garoga BA03… <NA> TASWIL1… SRGI … <NA> <NA> 12.02… <NA> <NA> <NA>
## # ℹ 21 more variables: KDPKAB <chr>, KDPPUM <chr>, LUASWH <dbl>, TIPADM <int>,
## # WADMKC <chr>, WADMKD <chr>, WADMKK <chr>, WADMPR <chr>, WIADKC <chr>,
## # WIADKK <chr>, WIADPR <chr>, WIADKD <chr>, UUPP <chr>, SHAPE_Leng <dbl>,
## # SHAPE_Area <dbl>, geometry <MULTIPOLYGON [°]>, No. <chr>,
## # `Laki-laki` <chr>, Perempuan <chr>, Jumlah <chr>,
## # `Rasio Jenis Kelamin` <chr>
## chr [1:52] NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA "46568" ...
## [1] "TARUTUNG" "SIATAS BARITA" "SIBORONG-BORONG"
## [4] "SIPAHUTAR" "PANGARIBUAN" "GAROGA"
## [7] "MUARA" "AEK BILAH" "PAMATANG SIDAMANIK"
## [10] "HATONDUHAN" "DOLOK PANRIBUAN" "GIRSANG SIPANGAN BOLON"
## [13] "BANDAR PULAU" "BANDAR PASIR MANDOGE" "AEK SONGSONGAN"
## [16] "RAHUNING" "BILAH BARAT" "BILAH HULU"
## [19] "BALIGE" "LAGUBOTI" "SILAEN"
## [22] "HABINSARAN" "PINTU POHAN MERANTI" "BORBOR"
## [25] "PORSEA" "AJIBATA" "LUMBAN JULU"
## [28] "ULUAN" "SIGUMPAR" "SIANTAR NARUMONDA"
## [31] "NASSAU" "TAMPAHAN" "BONATUA LUNASI"
## [34] "PARMAKSIAN" "POLLUNG" "BAKTIRAJA"
## [37] "PARANGINAN" "LINTONG NIHUTA" "DOLOK SANGGUL"
## [40] "SIMANINDO" "ONAN RUNGGU" "NAINGGOLAN"
## [43] "PALIPI" "RONGGUR NIHUTA" "PANGURURAN"
## [46] "SITIO-TIO" "DOLOK SIGOMPULON" "KUALUH HULU"
## [49] "AEK KUO" "NA IX - X" "AEK NATAS"
## [52] "KUALUH SELATAN"
## [1] "(1)" "BALIGE" "TAMPAHAN"
## [4] "LAGUBOTI" "HABINSARAN" "BORBOR"
## [7] "NASSAU" "SILAEN" "SIGUMPAR"
## [10] "PORSEA" "PINTU POHAN MERANTI" "SIANTAR NARUMONDA"
## [13] "PARMAKSIAN" "LUMBAN JULU" "ULUAN"
## [16] "AJIBATA" "BONATUA LUNASI" "JUMLAH"
## [19] NA
Pada tahap ini, data atribut jumlah penduduk dari file Excel digabungkan dengan data peta shapefile berdasarkan nama kecamatan. Tujuan penggabungan ini adalah agar setiap wilayah pada peta memiliki informasi jumlah penduduk yang sesuai. Tahap ini sangat penting karena menjadi dasar dalam pembuatan peta tematik.
Peta spasial menunjukkan persebaran jumlah penduduk menurut kecamatan di Kabupaten Toba. Perbedaan warna pada peta merepresentasikan besar kecilnya jumlah penduduk. Kecamatan dengan warna lebih gelap menunjukkan jumlah penduduk yang lebih tinggi, sedangkan warna yang lebih terang menunjukkan jumlah penduduk yang lebih rendah. Visualisasi ini memudahkan pembaca melihat pola persebaran penduduk antarwilayah secara geografis.
Pemetaan data Spasial
plot.toba = ggplot(data=gabung.toba) +
geom_sf(aes(fill = Jumlah),color="white", size=0.3) +
scale_fill_distiller("Jumlah Penduduk", palette = "BuPu", na.value = "grey80")
plot.toba## Warning: package 'tmap' was built under R version 4.5.2
## Warning: package 'mapview' was built under R version 4.5.2
Visualisasi menggunakan mapview menampilkan peta
interaktif jumlah penduduk per kecamatan. Keunggulan peta ini adalah
pengguna dapat memperbesar, memperkecil, dan meninjau detail wilayah
secara langsung. Peta interaktif ini membantu eksplorasi data spasial
dengan lebih fleksibel dibandingkan peta statis.
VISUALISASI DATA NUMERIK
Input Data
Histogram
Histogram digunakan untuk melihat distribusi frekuensi dari suatu variabel numerik. Dengan histogram, kita dapat mengetahui bagaimana pola penyebaran data, apakah data cenderung merata, condong ke kiri, atau condong ke kanan. Pada visualisasi ini akan ditampilkan distribusi jumlah produksi padi di Provinsi Aceh berdasarkan data rekap produksi padi yang tersedia. Grafik ini membantu untuk melihat kisaran produksi padi yang paling sering muncul.
library(scales)
ggplot(data = padi, aes(x = rekap_produksi_padi)) +
geom_histogram(bins = 30, color = "white", fill = "pink") +
scale_x_continuous(labels = comma) +
labs(x = "Produksi Padi (Ton)",
y = "Frekuensi")## Warning: Removed 6 rows containing non-finite outside the scale range
## (`stat_bin()`).
Pada grafik histogram terlihat bahwa sebagian besar batang berada pada
rentang produksi padi yang rendah hingga menengah. Sementara itu
terdapat beberapa batang yang memanjang hingga nilai produksi yang
sangat tinggi. Hal ini menunjukkan bahwa sebagian besar kabupaten/kota
di Aceh memiliki produksi padi yang relatif rendah sampai sedang,
sedangkan hanya beberapa wilayah yang memiliki produksi yang jauh lebih
tinggi dibandingkan wilayah lainnya. Distribusi data juga terlihat
condong ke kanan, yang berarti terdapat sedikit wilayah dengan produksi
sangat besar yang menyebabkan ekor distribusi memanjang ke sisi
kanan..
Density Plot
Density plot digunakan untuk melihat pola distribusi data secara lebih halus dibandingkan histogram. Grafik ini memperlihatkan bentuk distribusi data sehingga dapat membantu mengidentifikasi apakah data cenderung simetris, miring, atau memiliki lebih dari satu puncak distribusi. Pada visualisasi ini akan ditampilkan distribusi kepadatan produksi padi di Provinsi Aceh.
ggplot(data = padi, aes(x = rekap_produksi_padi)) +
geom_density(fill = "pink", alpha = 0.7) +
scale_x_continuous(labels = comma) +
labs(x = "Produksi Padi (Ton)")## Warning: Removed 6 rows containing non-finite outside the scale range
## (`stat_density()`).
Pada grafik density terlihat bahwa kurva memiliki puncak di bagian kiri
dan kemudian menurun ke arah kanan.Hal ini menunjukkan bahwa nilai
produksi padi yang paling sering muncul berada pada rentang produksi
yang relatif rendah. Sementara itu semakin ke kanan jumlah datanya
semakin sedikit. Bentuk kurva yang condong ke kanan (right skewed)
menunjukkan bahwa hanya sebagian kecil wilayah yang memiliki produksi
padi yang sangat tinggi dibandingkan wilayah lainnya.
Ridgeline Plot
Ridgeline plot digunakan untuk memvisualisasikan distribusi data dari beberapa kelompok secara terpisah sehingga lebih mudah dibandingkan. Pada visualisasi ini akan ditampilkan distribusi produksi padi pada masing-masing kabupaten/kota di Provinsi Aceh.
## Warning: package 'ggridges' was built under R version 4.5.2
ggplot(data = padi,
aes(x = rekap_produksi_padi,
y = nama_kabupaten_kota,
fill = nama_kabupaten_kota)) +
geom_density_ridges() +
labs(x = "Produksi Padi (Ton)",
y = "Kabupaten/Kota")## Picking joint bandwidth of 4730
## Warning: Removed 6 rows containing non-finite outside the scale range
## (`stat_density_ridges()`).
Ridgeline plot memperlihatkan pola distribusi produksi padi pada setiap
kabupaten/kota. Dari grafik tersebut dapat dilihat perbedaan tingkat
produksi antar wilayah serta sebaran produksinya. Wilayah dengan kurva
yang berada lebih ke kanan menunjukkan tingkat produksi yang lebih
tinggi.
Boxplot
Boxplot digunakan untuk menggambarkan sebaran data serta mendeteksi adanya nilai pencilan (outlier). Grafik ini juga memudahkan dalam membandingkan distribusi data antar kelompok. Pada visualisasi ini akan dibandingkan produksi padi berdasarkan kabupaten/kota di Provinsi Aceh.
ggplot(data = padi,
aes(x = rekap_produksi_padi,
y = nama_kabupaten_kota,
fill = nama_kabupaten_kota)) +
geom_boxplot() +
theme(legend.position = "none") +
labs(x = "Produksi Padi",
y = "Kabupaten/Kota")## Warning: Removed 6 rows containing non-finite outside the scale range
## (`stat_boxplot()`).
Boxplot memperlihatkan perbandingan produksi padi antar kabupaten/kota
serta menunjukkan median, sebaran data, dan kemungkinan adanya nilai
pencilan. Kabupaten atau kota yang memiliki garis median lebih tinggi
menunjukkan bahwa wilayah tersebut memiliki tingkat produksi padi yang
relatif lebih besar. Ukuran kotak yang lebih panjang menunjukkan variasi
produksi yang lebih besar. Jika terdapat titik di luar whisker, maka
titik tersebut merupakan outlier yang menunjukkan adanya wilayah dengan
produksi padi yang jauh lebih tinggi atau lebih rendah dibandingkan
wilayah lainnya
Violin Plot
Violin plot merupakan gabungan antara density plot dan boxplot. Grafik ini digunakan untuk melihat distribusi data sekaligus penyebaran nilai secara lebih detail. Pada visualisasi ini akan ditampilkan distribusi keseluruhan produksi padi di Provinsi Aceh.
ggplot(data = padi,
aes(x = rekap_produksi_padi, y = "Semua Data")) +
geom_violin(fill="violet", alpha=0.5) +
geom_boxplot(width=0.1) +
scale_x_continuous(labels = comma)## Warning: Removed 6 rows containing non-finite outside the scale range
## (`stat_ydensity()`).
## Warning: Removed 6 rows containing non-finite outside the scale range
## (`stat_boxplot()`).
Pada violin plot terlihat bahwa bagian yang lebih lebar berada pada
nilai produksi yang lebih rendah hingga menengah. Hal ini menunjukkan
bahwa sebagian besar data produksi padi berada pada rentang tersebut.
Sedangkan bagian yang semakin menyempit ke arah kanan menunjukkan bahwa
hanya sedikit wilayah yang memiliki produksi padi yang sangat
tinggi.
QQ Plot
QQ Plot digunakan untuk memeriksa apakah suatu data mengikuti distribusi normal atau tidak. Grafik ini membandingkan distribusi empiris data dengan distribusi normal teoritis. Pada visualisasi ini akan dilihat apakah data produksi padi di Provinsi Aceh mengikuti distribusi normal atau tidak.
ggplot(data = padi, aes(sample = rekap_produksi_padi)) +
stat_qq(col="blue") +
stat_qq_line(col="red")## Warning: Removed 6 rows containing non-finite outside the scale range
## (`stat_qq()`).
## Warning: Removed 6 rows containing non-finite outside the scale range
## (`stat_qq_line()`).
Pada Q-Q plot terlihat bahwa beberapa titik mengikuti garis diagonal
merah, tetapi terdapat banyak titik yang menyimpang dari garis tersebut
terutama pada bagian ujungnya. Hal ini menunjukkan bahwa data produksi
padi tidak sepenuhnya mengikuti distribusi normal. Penyimpangan tersebut
kemungkinan disebabkan oleh adanya nilai produksi yang sangat tinggi
pada beberapa wilayah, sehingga distribusi data menjadi tidak
simetris.
Scatter Plot
Scatter plot digunakan untuk melihat hubungan antara dua variabel numerik. Pada visualisasi ini akan ditampilkan hubungan antara tahun dan jumlah produksi padi di Provinsi Aceh.
ggplot(data = padi,
aes(x = tahun,
y = rekap_produksi_padi,
color = nama_kabupaten_kota)) +
geom_jitter(width = 0.2, alpha = 0.6) +
geom_smooth(aes(group = 1),
method = "lm",
color = "black",
se = FALSE) +
labs(x = "Tahun",
y = "Produksi Padi (Ton)",
color = "Kabupaten",
title = "Scatter Plot Produksi Padi di Provinsi Aceh")## `geom_smooth()` using formula = 'y ~ x'
## Warning: Removed 6 rows containing non-finite outside the scale range
## (`stat_smooth()`).
## Warning: Removed 6 rows containing missing values or values outside the scale range
## (`geom_point()`).
Berdasarkan scatter plot yang ditampilkan, terlihat hubungan antara
tahun dan jumlah produksi padi di berbagai kabupaten/kota di Provinsi
Aceh. Titik-titik pada grafik menunjukkan nilai produksi padi pada
masing-masing kabupaten pada tahun tertentu. Dengan penggunaan
geom_jitter(), titik-titik data menjadi lebih tersebar sehingga
mengurangi penumpukan dan memudahkan pengamatan pola distribusi data.
Selain itu, ditambahkan garis tren menggunakan geom_smooth() untuk
menunjukkan kecenderungan perubahan produksi padi dari waktu ke waktu.
Garis tren tersebut membantu menggambarkan apakah produksi padi di
Provinsi Aceh cenderung meningkat, menurun, atau relatif stabil selama
periode pengamatan.
Line Chart (Tren Produksi)
Line chart digunakan untuk melihat tren perubahan data dari waktu ke waktu. Pada visualisasi ini akan ditampilkan tren produksi padi di Provinsi Aceh berdasarkan tahun pada masing-masing kabupaten/kota.
library(dplyr)
library(ggplot2)
padi_total <- padi %>%
group_by(tahun) %>%
summarise(total_produksi = sum(rekap_produksi_padi, na.rm = TRUE))
ggplot(padi_total, aes(x = tahun, y = total_produksi)) +
geom_line(color = "blue", linewidth = 1.2) +
geom_point() +
labs(x = "Tahun",
y = "Total Produksi Padi Aceh")
Berdasarkan grafik line chart yang ditampilkan, dapat dilihat bahwa
total produksi padi di Provinsi Aceh mengalami perubahan dari tahun ke
tahun. Grafik ini menunjukkan tren produksi padi yang merupakan hasil
akumulasi produksi dari seluruh kabupaten/kota di Provinsi Aceh pada
setiap periode waktu. Dari pola garis pada grafik tersebut terlihat
bahwa produksi padi tidak selalu berada pada tingkat yang sama setiap
tahunnya, melainkan mengalami fluktuasi. Pada beberapa tahun tertentu
terlihat adanya peningkatan produksi padi yang ditunjukkan oleh garis
yang naik, sedangkan pada tahun lainnya terlihat penurunan produksi yang
ditunjukkan oleh garis yang menurun. Visualisasi ini membantu dalam
memahami perkembangan produksi padi secara keseluruhan di Provinsi Aceh
serta memudahkan dalam mengidentifikasi periode waktu dimana produksi
padi mengalami peningkatan maupun penurunan.
Area Plot
Area plot merupakan pengembangan dari line chart yang menambahkan arsiran pada area di bawah garis sehingga perubahan nilai dari waktu ke waktu lebih mudah diamati. Pada visualisasi ini akan ditampilkan tren produksi padi pada salah satu kabupaten/kota di Provinsi Aceh berdasarkan tahun.
ggplot(data = padi, aes(x = tahun, y = rekap_produksi_padi)) +
geom_line(linewidth = 1.2, col = "darkgreen") +
geom_area(fill = "green", alpha = 0.3) +
labs(x = "Tahun", y = "Produksi Padi (Ton)")## Warning: Removed 6 rows containing non-finite outside the scale range
## (`stat_align()`).
Berdasarkan area plot yang ditampilkan, dapat dilihat bahwa produksi
padi di Provinsi Aceh mengalami perubahan dari tahun ke tahun. Area
berwarna hijau menunjukkan besarnya produksi padi pada setiap tahun,
sehingga semakin tinggi area yang terbentuk maka semakin besar pula
jumlah produksi padi pada tahun tersebut. Dari grafik tersebut juga
dapat diamati tren kenaikan maupun penurunan produksi padi sepanjang
periode pengamatan. Perubahan ini dapat dipengaruhi oleh berbagai faktor
seperti luas lahan panen, kondisi cuaca, serta kebijakan di sektor
pertanian. Dengan menggunakan area plot, pola perkembangan produksi padi
dari waktu ke waktu dapat terlihat dengan lebih jelas karena tidak hanya
ditampilkan dalam bentuk garis, tetapi juga melalui area yang
merepresentasikan besarnya nilai produksi.
Multiple Line Chart
Multiple line chart digunakan untuk membandingkan tren data deret waktu dari beberapa kelompok secara bersamaan. Pada visualisasi ini akan dibandingkan tren produksi padi pada beberapa kabupaten/kota di Provinsi Aceh. Contoh membandingkan beberapa wilayah:
library(dplyr)
padi2 <- padi %>%
filter(nama_kabupaten_kota %in% c("Kabupaten Aceh Besar","Kabupaten Aceh Utara","Kabupaten Pidie"))
ggplot(data = padi2, aes(x = tahun,
y = rekap_produksi_padi,
color = nama_kabupaten_kota)) +
geom_line(linewidth = 1.2) +
labs(x = "Tahun",
y = "Produksi Padi (Ton)",
color = "Kabupaten")
Berdasarkan grafik multiple line chart yang ditampilkan, dapat dilihat
perbandingan tren produksi padi pada Kabupaten Aceh Besar, Aceh Utara,
dan Pidie dari tahun ke tahun. Setiap garis pada grafik mewakili satu
kabupaten/kota sehingga memudahkan dalam mengamati perubahan produksi
padi pada masing-masing wilayah. Dari grafik tersebut terlihat bahwa
produksi padi di ketiga kabupaten tersebut mengalami fluktuasi dari
waktu ke waktu, dimana pada beberapa tahun terjadi peningkatan produksi
yang ditunjukkan oleh garis yang naik, sedangkan pada tahun lainnya
terlihat penurunan produksi yang ditunjukkan oleh garis yang menurun.
Selain itu, perbedaan ketinggian garis pada grafik menunjukkan bahwa
tingkat produksi padi di masing-masing kabupaten tidak sama. Kabupaten
yang memiliki garis lebih tinggi menunjukkan tingkat produksi padi yang
lebih besar dibandingkan kabupaten lainnya. Dengan menggunakan multiple
line chart, perbandingan perkembangan produksi padi antar kabupaten
dapat diamati dengan lebih jelas, sehingga memudahkan dalam melihat
wilayah mana yang memiliki produksi lebih tinggi serta bagaimana
perubahan produksinya dari tahun ke tahun.