title: “Visualisasi Data Kategorik dan Numerik” author: “Kelompok (Isi Nama Anggota)” date: “2026-03-08” output: “html_document” —
Visualisasi data merupakan metode penting dalam analisis data untuk menyajikan informasi secara lebih mudah dipahami. Dengan menggunakan grafik, pola, distribusi, serta hubungan antar variabel dapat terlihat dengan lebih jelas.
Pada tugas ini dilakukan visualisasi data terhadap Produksi Tanaman Perkebunan Menurut Provinsi dan Jenis Tanaman Tahun 2024. Dataset ini berisi informasi produksi berbagai komoditas perkebunan seperti kelapa sawit, karet, kopi, kakao, dan tebu di berbagai provinsi di Indonesia.
Tujuan dari analisis ini adalah untuk:
Dataset yang digunakan berasal dari data produksi tanaman perkebunan Indonesia tahun 2024.
Alasan memilih dataset ini:
library(ggplot2)
library(dplyr)
library(tidyr)
library(stringr)
library(readxl)
library(janitor)
library(writexl)
data <- read_excel("Produksi Tanaman Perkebunan Menurut Provinsi dan Jenis Tanaman, 2024 udah dirapihin222.xlsx", sheet = 2)
head(data)
## # A tibble: 6 × 7
## Wilayah `Kelapa Sawit` Kelapa Karet Kopi Kakao Teh
## <chr> <chr> <chr> <chr> <chr> <chr> <chr>
## 1 Sumatra 25.398,67 931,47 1.609,09 601,91 163,93 24,48
## 2 Jawa 79,59 517,20 63,95 110,42 16,73 94,43
## 3 Bali & Nusa Tenggara 0,00 180,35 0,00 45,51 28,54 0,00
## 4 Kalimantan 18.188,09 127,87 448,31 4,34 4,08 0,00
## 5 Sulawesi 982,68 683,80 5,36 46,13 378,04 0,00
## 6 Maluku 42,47 311,90 0,60 0,51 15,97 0,00
data <- data %>%
rename(wilayah = `Wilayah`)
colnames(data)
## [1] "wilayah" "Kelapa Sawit" "Kelapa" "Karet" "Kopi"
## [6] "Kakao" "Teh"
data <- data %>%
filter(!is.na(wilayah))
data <- data %>%
mutate(across(
- wilayah,
~ as.numeric(gsub(",", ".", gsub("\\.", "", .)))
))
data <- data %>%
filter(wilayah != "INDONESIA")
data
## # A tibble: 7 × 7
## wilayah `Kelapa Sawit` Kelapa Karet Kopi Kakao Teh
## <chr> <dbl> <dbl> <dbl> <dbl> <dbl> <dbl>
## 1 Sumatra 25399. 931. 1609. 602. 164. 24.5
## 2 Jawa 79.6 517. 64.0 110. 16.7 94.4
## 3 Bali & Nusa Tenggara 0 180. 0 45.5 28.5 0
## 4 Kalimantan 18188. 128. 448. 4.34 4.08 0
## 5 Sulawesi 983. 684. 5.36 46.1 378. 0
## 6 Maluku 42.5 312. 0.6 0.51 16.0 0
## 7 Papua 745. 31.7 4.82 4.55 9.83 0
data_long <- data %>%
pivot_longer(
cols = -wilayah,
names_to = "tanaman",
values_to = "produksi"
)
write_xlsx(data_long, "data_perkebunan_long.xlsx")
write_xlsx(data, "dara_perkebunan.xlsx")
data1 <- read_excel("data_perkebunan_long.xlsx")
head(data1)
## # A tibble: 6 × 3
## wilayah tanaman produksi
## <chr> <chr> <dbl>
## 1 Sumatra Kelapa Sawit 25399.
## 2 Sumatra Kelapa 931.
## 3 Sumatra Karet 1609.
## 4 Sumatra Kopi 602.
## 5 Sumatra Kakao 164.
## 6 Sumatra Teh 24.5
tail(data1)
## # A tibble: 6 × 3
## wilayah tanaman produksi
## <chr> <chr> <dbl>
## 1 Papua Kelapa Sawit 745.
## 2 Papua Kelapa 31.7
## 3 Papua Karet 4.82
## 4 Papua Kopi 4.55
## 5 Papua Kakao 9.83
## 6 Papua Teh 0
Interpretasi
Grafik menunjukkan perbandingan produksi kelapa sawit antar provinsi di Indonesia. Beberapa provinsi memiliki produksi jauh lebih tinggi dibandingkan provinsi lainnya.
Interpretasi
Histogram menunjukkan distribusi produksi kelapa sawit di berbagai provinsi. Sebagian besar provinsi memiliki produksi dalam kategori rendah hingga menengah.
Interpretasi
Diagram pie menunjukkan proporsi kontribusi masing-masing jenis tanaman terhadap total produksi perkebunan di Indonesia.
Interpretasi
Boxplot menunjukkan penyebaran data produksi karet serta adanya kemungkinan provinsi dengan produksi yang sangat tinggi.
Interpretasi
Grafik ini menunjukkan kontribusi masing-masing jenis tanaman dalam total produksi perkebunan di setiap provinsi.
Interpretasi
Scatter plot menunjukkan hubungan antara produksi kelapa sawit dan karet pada masing-masing provinsi.
colnames(data1)
## [1] "wilayah" "tanaman" "produksi"
top_kopi <- data1 %>%
filter(tanaman == "Kopi") %>%
arrange(desc(produksi)) %>%
slice(1:10)
ggplot(top_kopi, aes(x = reorder(wilayah, produksi), y = produksi)) +
geom_bar(stat = "identity", fill = "brown") +
coord_flip() +
scale_y_log10() +
labs(
title = "Top Produksi Kopi",
x = "Wilayah",
y = "Produksi Kopi (log scale)"
) +
theme_minimal()
Interpretasi
Grafik bar chart menunjukkan perbandingan produksi kopi antar wilayah di Indonesia. Terlihat bahwa Sumatra merupakan wilayah dengan produksi kopi tertinggi, dengan nilai produksi yang jauh lebih besar dibanding wilayah lainnya. Hal ini menunjukkan bahwa Sumatra menjadi pusat utama produksi kopi nasional.
Wilayah Jawa menempati posisi kedua dengan tingkat produksi yang cukup signifikan, meskipun masih jauh di bawah Sumatra. Sementara itu, wilayah Sulawesi dan Bali & Nusa Tenggara memiliki produksi kopi yang lebih rendah dibandingkan dua wilayah utama tersebut, namun tetap memberikan kontribusi terhadap total produksi kopi nasional.
Di sisi lain, wilayah Papua, Kalimantan, dan Maluku memiliki produksi kopi yang relatif sangat kecil. Hal ini menunjukkan bahwa komoditas kopi belum menjadi komoditas perkebunan utama di wilayah-wilayah tersebut.
Secara keseluruhan, grafik ini memperlihatkan bahwa produksi kopi di Indonesia terkonsentrasi pada beberapa wilayah tertentu, khususnya Sumatra.
library(dplyr)
library(ggplot2)
data_kakao <- data1 %>%
filter(tanaman == "Kakao")
ggplot(data_kakao, aes(x = produksi)) +
geom_density(fill = "purple", alpha = 0.6) +
labs(
title = "Density Plot Distribusi Produksi Kakao",
x = "Produksi Kakao",
y = "Density"
) +
theme_minimal()
Interpretasi
Density plot menggambarkan pola distribusi produksi kakao di berbagai wilayah di Indonesia. Dari grafik terlihat bahwa sebagian besar wilayah memiliki tingkat produksi kakao yang relatif rendah hingga menengah.
Kepadatan tertinggi pada grafik berada pada nilai produksi yang lebih kecil, yang menunjukkan bahwa sebagian besar wilayah menghasilkan kakao dalam jumlah yang tidak terlalu besar. Hal ini menandakan bahwa produksi kakao tidak tersebar secara merata di seluruh wilayah.
Selain itu, terdapat beberapa nilai produksi yang lebih tinggi yang membentuk bagian ekor distribusi di sisi kanan grafik. Nilai ini menunjukkan adanya wilayah tertentu yang memiliki produksi kakao jauh lebih tinggi dibanding wilayah lainnya.
Secara umum, distribusi ini menunjukkan bahwa produksi kakao di Indonesia cenderung tidak merata, dengan sebagian kecil wilayah memiliki produksi yang jauh lebih tinggi dibandingkan wilayah lainnya
Berdasarkan visualisasi yang dilakukan, dapat disimpulkan bahwa produksi tanaman perkebunan di Indonesia memiliki variasi yang cukup besar antar provinsi. Beberapa komoditas seperti kelapa sawit memiliki kontribusi yang sangat besar dibandingkan komoditas lainnya.
Visualisasi data membantu dalam memahami pola distribusi, perbandingan produksi antar wilayah, serta hubungan antar variabel produksi tanaman perkebunan.