title: “Visualisasi Data Kategorik dan Numerik” author: “Kelompok (Isi Nama Anggota)” date: “2026-03-08” output: “html_document” —

1 Pendahuluan

Visualisasi data merupakan metode penting dalam analisis data untuk menyajikan informasi secara lebih mudah dipahami. Dengan menggunakan grafik, pola, distribusi, serta hubungan antar variabel dapat terlihat dengan lebih jelas.

Pada tugas ini dilakukan visualisasi data terhadap Produksi Tanaman Perkebunan Menurut Provinsi dan Jenis Tanaman Tahun 2024. Dataset ini berisi informasi produksi berbagai komoditas perkebunan seperti kelapa sawit, karet, kopi, kakao, dan tebu di berbagai provinsi di Indonesia.

Tujuan dari analisis ini adalah untuk:


2 Sumber Data

Dataset yang digunakan berasal dari data produksi tanaman perkebunan Indonesia tahun 2024.

Link data: https://www.bps.go.id/id/statistics-table/2/MjU2NiMy/produksi-tanaman-perkebunan-menurut-provinsi-dan-jenis-tanaman--ribu-ton-.html

Alasan memilih dataset ini:


3 Persiapan Data

library(ggplot2)
library(dplyr)
library(tidyr)
library(stringr)
library(readxl)
library(janitor)
library(writexl)

data <- read_excel("Produksi Tanaman Perkebunan Menurut Provinsi dan Jenis Tanaman, 2024 udah dirapihin222.xlsx", sheet = 2) 

head(data)
## # A tibble: 6 × 7
##   Wilayah              `Kelapa Sawit` Kelapa Karet    Kopi   Kakao  Teh  
##   <chr>                <chr>          <chr>  <chr>    <chr>  <chr>  <chr>
## 1 Sumatra              25.398,67      931,47 1.609,09 601,91 163,93 24,48
## 2 Jawa                 79,59          517,20 63,95    110,42 16,73  94,43
## 3 Bali & Nusa Tenggara 0,00           180,35 0,00     45,51  28,54  0,00 
## 4 Kalimantan           18.188,09      127,87 448,31   4,34   4,08   0,00 
## 5 Sulawesi             982,68         683,80 5,36     46,13  378,04 0,00 
## 6 Maluku               42,47          311,90 0,60     0,51   15,97  0,00
data <- data %>%
rename(wilayah = `Wilayah`)
colnames(data)
## [1] "wilayah"      "Kelapa Sawit" "Kelapa"       "Karet"        "Kopi"        
## [6] "Kakao"        "Teh"
data <- data %>%
filter(!is.na(wilayah))
data <- data %>%
mutate(across(
- wilayah,
~ as.numeric(gsub(",", ".", gsub("\\.", "", .)))
))
data <- data %>%
  filter(wilayah != "INDONESIA")
data
## # A tibble: 7 × 7
##   wilayah              `Kelapa Sawit` Kelapa   Karet   Kopi  Kakao   Teh
##   <chr>                         <dbl>  <dbl>   <dbl>  <dbl>  <dbl> <dbl>
## 1 Sumatra                     25399.   931.  1609.   602.   164.    24.5
## 2 Jawa                           79.6  517.    64.0  110.    16.7   94.4
## 3 Bali & Nusa Tenggara            0    180.     0     45.5   28.5    0  
## 4 Kalimantan                  18188.   128.   448.     4.34   4.08   0  
## 5 Sulawesi                      983.   684.     5.36  46.1  378.     0  
## 6 Maluku                         42.5  312.     0.6    0.51  16.0    0  
## 7 Papua                         745.    31.7    4.82   4.55   9.83   0
data_long <- data %>%
pivot_longer(
cols = -wilayah,
names_to = "tanaman",
values_to = "produksi"
)
write_xlsx(data_long, "data_perkebunan_long.xlsx")
write_xlsx(data, "dara_perkebunan.xlsx")
data1 <- read_excel("data_perkebunan_long.xlsx")


head(data1)
## # A tibble: 6 × 3
##   wilayah tanaman      produksi
##   <chr>   <chr>           <dbl>
## 1 Sumatra Kelapa Sawit  25399. 
## 2 Sumatra Kelapa          931. 
## 3 Sumatra Karet          1609. 
## 4 Sumatra Kopi            602. 
## 5 Sumatra Kakao           164. 
## 6 Sumatra Teh              24.5
tail(data1)
## # A tibble: 6 × 3
##   wilayah tanaman      produksi
##   <chr>   <chr>           <dbl>
## 1 Papua   Kelapa Sawit   745.  
## 2 Papua   Kelapa          31.7 
## 3 Papua   Karet            4.82
## 4 Papua   Kopi             4.55
## 5 Papua   Kakao            9.83
## 6 Papua   Teh              0

4 Visualisasi Data

Visualisasi Hiastogram & Bar Chart

1. Bar Chart Produksi Kelapa Sawit per Provinsi (Kategorik vs Numerik)

Interpretasi

Grafik menunjukkan perbandingan produksi kelapa sawit antar provinsi di Indonesia. Beberapa provinsi memiliki produksi jauh lebih tinggi dibandingkan provinsi lainnya.


2. Histogram Distribusi Produksi Kelapa Sawit (Numerik)

Interpretasi

Histogram menunjukkan distribusi produksi kelapa sawit di berbagai provinsi. Sebagian besar provinsi memiliki produksi dalam kategori rendah hingga menengah.


Visualisasi Boxplot & Pie Chart

3. Pie Chart Proporsi Produksi Tanaman (Kategorik vs Numerik)

Interpretasi

Diagram pie menunjukkan proporsi kontribusi masing-masing jenis tanaman terhadap total produksi perkebunan di Indonesia.


4. Boxplot Produksi Karet antar Provinsi (Numerik)

Interpretasi

Boxplot menunjukkan penyebaran data produksi karet serta adanya kemungkinan provinsi dengan produksi yang sangat tinggi.


Visualisasi Stacked Bar Chart & Scatter Plot

5. Stacked Bar Chart Produksi Tanaman per Provinsi (Kategorik vs Numerik)

Interpretasi

Grafik ini menunjukkan kontribusi masing-masing jenis tanaman dalam total produksi perkebunan di setiap provinsi.


6. Scatter Plot Produksi Kelapa Sawit vs Karet (Numerik vs Numerik)

Interpretasi

Scatter plot menunjukkan hubungan antara produksi kelapa sawit dan karet pada masing-masing provinsi.


Visualisasi Bar Chart dan Density Plot

7. Bar Chart Top 10 Produksi Kopi (Kategorik vs Numerik)

colnames(data1)
## [1] "wilayah"  "tanaman"  "produksi"
top_kopi <- data1 %>%
  filter(tanaman == "Kopi") %>%
  arrange(desc(produksi)) %>%
  slice(1:10)

ggplot(top_kopi, aes(x = reorder(wilayah, produksi), y = produksi)) +
  geom_bar(stat = "identity", fill = "brown") +
  coord_flip() +
  scale_y_log10() +
  labs(
    title = "Top Produksi Kopi",
    x = "Wilayah",
    y = "Produksi Kopi (log scale)"
  ) +
  theme_minimal()

Interpretasi

Grafik bar chart menunjukkan perbandingan produksi kopi antar wilayah di Indonesia. Terlihat bahwa Sumatra merupakan wilayah dengan produksi kopi tertinggi, dengan nilai produksi yang jauh lebih besar dibanding wilayah lainnya. Hal ini menunjukkan bahwa Sumatra menjadi pusat utama produksi kopi nasional.

Wilayah Jawa menempati posisi kedua dengan tingkat produksi yang cukup signifikan, meskipun masih jauh di bawah Sumatra. Sementara itu, wilayah Sulawesi dan Bali & Nusa Tenggara memiliki produksi kopi yang lebih rendah dibandingkan dua wilayah utama tersebut, namun tetap memberikan kontribusi terhadap total produksi kopi nasional.

Di sisi lain, wilayah Papua, Kalimantan, dan Maluku memiliki produksi kopi yang relatif sangat kecil. Hal ini menunjukkan bahwa komoditas kopi belum menjadi komoditas perkebunan utama di wilayah-wilayah tersebut.

Secara keseluruhan, grafik ini memperlihatkan bahwa produksi kopi di Indonesia terkonsentrasi pada beberapa wilayah tertentu, khususnya Sumatra.


8. Density Plot Distribusi Produksi Kakao (Numerik)

library(dplyr)
library(ggplot2)

data_kakao <- data1 %>%
  filter(tanaman == "Kakao")

ggplot(data_kakao, aes(x = produksi)) +
  geom_density(fill = "purple", alpha = 0.6) +
  labs(
    title = "Density Plot Distribusi Produksi Kakao",
    x = "Produksi Kakao",
    y = "Density"
  ) +
  theme_minimal()

Interpretasi

Density plot menggambarkan pola distribusi produksi kakao di berbagai wilayah di Indonesia. Dari grafik terlihat bahwa sebagian besar wilayah memiliki tingkat produksi kakao yang relatif rendah hingga menengah.

Kepadatan tertinggi pada grafik berada pada nilai produksi yang lebih kecil, yang menunjukkan bahwa sebagian besar wilayah menghasilkan kakao dalam jumlah yang tidak terlalu besar. Hal ini menandakan bahwa produksi kakao tidak tersebar secara merata di seluruh wilayah.

Selain itu, terdapat beberapa nilai produksi yang lebih tinggi yang membentuk bagian ekor distribusi di sisi kanan grafik. Nilai ini menunjukkan adanya wilayah tertentu yang memiliki produksi kakao jauh lebih tinggi dibanding wilayah lainnya.

Secara umum, distribusi ini menunjukkan bahwa produksi kakao di Indonesia cenderung tidak merata, dengan sebagian kecil wilayah memiliki produksi yang jauh lebih tinggi dibandingkan wilayah lainnya


5 Kesimpulan

Berdasarkan visualisasi yang dilakukan, dapat disimpulkan bahwa produksi tanaman perkebunan di Indonesia memiliki variasi yang cukup besar antar provinsi. Beberapa komoditas seperti kelapa sawit memiliki kontribusi yang sangat besar dibandingkan komoditas lainnya.

Visualisasi data membantu dalam memahami pola distribusi, perbandingan produksi antar wilayah, serta hubungan antar variabel produksi tanaman perkebunan.