1. Pendahuluan

Data berikut merupakan Data Pariwisata Daerah di Indonesia yang berisi informasi mengenai berbagai destinasi wisata di beberapa daerah terkenal. Tujuan dari data ini adalah untuk menggambarkan jumlah wisatawan, pendapatan yang dihasilkan, serta tingkat kepuasan pengunjung berdasarkan jenis wisata yang ditawarkan di tiap daerah.

Dataset ini terdiri dari 10 daerah wisata utama, mencakup berbagai jenis wisata seperti pantai, budaya, alam, kuliner, bahari, dan sejarah. Setiap daerah memiliki karakteristik berbeda yang tercermin melalui banyaknya wisatawan yang berkunjung dan pendapatan yang diperoleh dari kegiatan pariwisata.

Tujuan dari penyusunan data Pariwisata Daerah ini dengan Visualisasi adalah untuk: 1. Menyajikan data pariwisata seacara informatik dan menarik. 2. Meningkatkan pemahaman terhadap hubungan antar faktor. 3. Mendukung pengambilan keputusan dan evaluasi.

2. Persiapan Data

library(knitr)
library(DT)

tanggal <- seq(from = as.Date("2024-02-02"),
               to = as.Date("2024-11-02"),
               by = "month")

nama_daerah <- c("Bali", "Yogyakarta", "Lombok", "Bandung", "Labuan Bajo", "Medan", "Makassar", "Malang", "Raja Ampat", "Danau Toba")
nama_daerah <- factor(nama_daerah)

jenis_wisata <- c("Pantai", "Budaya", "Alam", "Kuliner", "Bahari", "Sejarah", "Bahari", "Alam", "Bahari", "Alam")
jenis_wisata <- factor(jenis_wisata)

jumlah_wisatawan <- c(500000, 320000, 210000, 280000, 150000, 175000, 200000, 240000, 120000, 160000)

pendapatan_jualan <- c(1250.5, 870.3, 645.8, 710.6, 530.4, 590.7, 640.2, 720.5, 450.3, 510.9)

tingkat_kepuasan <- c("Sangat Tinggi", "Tinggi", "Sedang", "Tinggi", "Sedang", "Tinggi", "Sedang", "Tinggi", "Sangat Tinggi", "Sedang")
tingkat_kepuasan <- factor(tingkat_kepuasan,
                           levels = c("Sangat Tinggi", "Tinggi", "Sedang"),
                           ordered = TRUE)

Data_Pariwisata_Daerah <- data.frame(tanggal, nama_daerah, jenis_wisata, jumlah_wisatawan, pendapatan_jualan, tingkat_kepuasan)

datatable(Data_Pariwisata_Daerah, caption = "Data Pariwisata Daerah")
# Download Paket
library(ggplot2)
# Membuat atau Membaca Dataset

3. Visualisasi Data

3.1 Bar Chart

library(ggplot2)

ggplot(Data_Pariwisata_Daerah, 
       aes(x = reorder(nama_daerah, jumlah_wisatawan),
           y = jumlah_wisatawan, fill = jenis_wisata)) +
  geom_col() +
  labs(
    title = "Jumlah Wisatawan per Daerah di Indonesia (Urut dari tertinggi)",
    x = "Nama Daerah",
    y = "Jumlah Wisatawan",
    fill = "Jenis Wisata"
  ) +
  theme_minimal() +
  theme(axis.text.x = element_text(angle = 45, hjust = 1))

Definisi, Aturan Penggunaan, Kelebihan dan Kekurangan

Definisi

Diagram batang yang menampilkan perbandingan antar kategori seperti nama daerah atau jenis wisata dengan panjang batang menunjukkan nilai seperti pendapatan dan jumlah wisatawan.

Aturan Penggunaan

  1. Gunakan untuk data kategorik di sumbu X dan data numerik di sumbu Y.
  2. Hindari terlalu banyak kategori agar tetap terbaca.
  3. Urutkan batang agar mudah dibandingkan.

Kelebihan

  1. Mudah dibaca dan dibandingkan.
  2. Cocok untuk menunjukkan perbedaan antar kelompok.
  3. Bisa dikombinasikan dengan warna untuk subkategori.

Kekurangan

  1. Tidak menunjukkan tren waktu.
  2. Kurang efektif untuk data kontinu.
  3. Terlalu banyak kategori membuat lebih padat dan sulit untuk dibaca.

Insight

Tujuan: Menunjukkan perbandingan jumlah wisatawan antar daerah.

  1. Bali menempati posisi tertinggi dengan 500.000 wisatawan, jauh di atas daerah lain.
  2. Daerah seperti Raja Ampat dan Labuan Bajo memiliki jumlah wisatawan yang lebih sedikit, meskipun terkenal secara internasional, ini bisa jadi karena akses yang lebih sulit.
  3. Tren umum menunjukkan daerah dengan infrastruktur dan promosi kuat (Bali, Bandung, Yogyakarta) memiliki kunjungan wisatawan tertinggi.

3.2 Histogram

library(ggplot2)

ggplot(Data_Pariwisata_Daerah, aes(x = pendapatan_jualan)) + 
  geom_histogram(binwidth = 100, fill = "orange", color = "black") + 
  labs(
    title = "Pendapatan Pariwisata per Daerah",
    x = "Pendapatan (Juta Rupiah)",
    y = "Frekuensi"
  ) + 
  theme_minimal()

Definisi, Aturan Penggunaan, Kelebihan dan Kekurangan

Definisi

Diagram batang yang menunjukkan distribusi frekuensi dari data kontinu seperti pendapatan atau jumlah wisatawan.

Aturan Penggunaan

  1. Gunakan untuk data numerik kontinu.
  2. Tentukan lebar intervar kelas dengan tepat, jika terlalu besar membuat detail hilang, terlalu kecil membuat grafik berisik.

Kelebihan

  1. Menunjukkan bentuk distribusi data.
  2. Membantu identifikasi outlier atau sebaran data.

Kekurangan

  1. Sensitif terhadap ukuran binwidth.
  2. Tidak cocok untuk data kategorik.
  3. Sulit digunakan untuk membandingkan banyak kelompok sekaligus.

Insight

Tujuan: Melihat persebaran nilai pendapatan antar daerah.

  1. Distribusi agak miring ke kanan: sebagian besar daerah memiliki pendapatan menengah ke bawah, hanya sedikit yang sangat tinggi (seperti Bali).
  2. Artinya, sektor pariwisata masih belum merata antar daerah.

3.3 Boxplot

library(ggplot2)

ggplot(Data_Pariwisata_Daerah, aes(x = jenis_wisata, y = pendapatan_jualan, fill = jenis_wisata)) + 
  geom_boxplot() +
  labs(
    title = "Sebaran Pendapatan Pariwisata berdasarkan Jenis Wisata",
    x = "Jenis Wisata", 
    y = "Pendapatan (Juta Rupiah)"
  ) +
  theme_minimal()

Definisi, Aturan Penggunaan, Kelebihan dan Kekurangan

Definisi

Grafik yang menampilkan ringkasan 5 angka yaitu min, Q1, median, Q3, max dan outlier dari data numerik.

Aturan Penggunaan

  1. Gunakan unntuk membandingkan distribusi numerik antar kategori.
  2. Ideal untuk melihat persebaran data dan outlier.

Kelebihan

  1. Efektif untuk menampilkan rentang data.
  2. Ringkas, informatif dan cocok untuk perbandingan antar kelompok.

Kekurangan

  1. Tidak menampilkan detail frekuensi atau bentuk distribusi.
  2. Bisa membingungkan untuk pembaca awam tanpa penjelasan.

Insight

Tujuan: Membandingkan variasi pendapatan per kategori wisata.

  1. Wisata pantai dan bahari memiliki rentang pendapatan lebih lebar, potensi tinggi tapi juga risiko fluktuasi besar.
  2. Wisata budaya dan kuliner lebih stabil tapi dengan median lebih rendah.

3.4 Pie Chart

library(ggplot2)

# Hitung total wisatawan per jenis data
data_pie <- aggregate(jumlah_wisatawan ~ jenis_wisata, data = Data_Pariwisata_Daerah, sum)

ggplot(data_pie, aes(x = "", y = jumlah_wisatawan, fill = jenis_wisata)) +
  geom_col(width = 1) + 
  coord_polar(theta = "y") +
  labs(
    title = "Persentase Jumlah Wisatawan per Jenis Wisata",
    fill = "Jenis Wisata"
  ) +
  theme_void() +
  theme(plot.title = element_text(hjust = 0.5))

# Menambahkan Persentase
data_pie$persen <-  round(
  (data_pie$jumlah_wisatawan / sum(data_pie$jumlah_wisatawan)) * 100, 1)

ggplot(data_pie, aes(x = "", y = jumlah_wisatawan, fill = jenis_wisata)) +
  geom_col(width = 1) +
  coord_polar(theta = "y") +
  geom_text(aes(label = paste0(persen, "%")),
            position = position_stack(vjust = 0.5)) +
  labs(
    title = "Persentase Jumlah Wisatawan per Jenis Wisata",
    fill = "Jenis Wisata" 
  ) +
  theme_void() +
  theme(plot.title = element_text(hjust = 0.5))

Definisi, Aturan Penggunaan, Kelebihan dan Kekurangan

Definisi

Diagram lingkaran yang membagi satu lingkaran penuh menjadi potongan berdaasarkan proporsi kategori.

Aturan Penggunaan

  1. Gunakan untuk data kategorik nominal dengan total keseluruhan 100%.
  2. Hindari terlalu banyak kategori agar tidak membingungkan.

Kelebihan

  1. Menarik secara visual.
  2. Baik untuk menunjukkan bagian dari keseluruhan atau proportion.

Kekurangan

  1. Sulit membandingkan antar bagian kecil.
  2. Tidak akurat untuk analisis kuantitatif.
  3. Tidak cocok untuk data dengan nilai mirip-mirip.

Insight

Tujuan: Menunjukkan distribusi jenis wisata di tiap daerah.

  1. Jenis wisata “Alam” dan “Bahari” mendominasi peta pariwisata Indonesia.
  2. Jenis wisata budaya dan kuliner masih lebih sedikit, peluang besar untuk dikembangkan sebagai daya tarik baru.

3.5 Scatter Plot

library(ggplot2)

ggplot(Data_Pariwisata_Daerah, aes(x = jumlah_wisatawan, y = pendapatan_jualan)) + 
  geom_smooth(method = "lm", se = FALSE, linetype = "dashed", color = "red") +  
  geom_text(
    aes(label = nama_daerah),
    vjust = -1,              
    size = 3.5,
    color = "black"
  ) +
  labs(
    title = "Hubungan Jumlah Wisatawan dan Pendapatan Pariwisata Daerah",
    x = "Jumlah Wisatawan",
    y = "Pendapatan (Juta Rupiah)"
  ) +
  theme_minimal()
## `geom_smooth()` using formula = 'y ~ x'

# Definisi, Aturan Penggunaan, Kelebihan dan Kekurangan

Definisi

Grafik titik-titik yang menunjukkan antar dua variabel numerik seperti jumlah wisatawan dan pendapatan.

Aturan Penggunaan

  1. Gunakan ketika ingin melihat korelasi atau pola hubungan antara dua variabel numerik.
  2. Tambahkan geom_smooth(method=“lm’) untuk menampilkan garis tren.

Kelebihan

  1. Sangat bagus untuk melihat pola hubungan linear dan non linear.
  2. Bisa menampilkan banyank titik sekaligus.
  3. Dapat ditambah warna untuk membedakan kategori.

Kekurangan

  1. Kurang informatif untuk data kategorik.
  2. Sulit dibaca jika terlalu banyak titik.

Insight

Tujuan: Melihat apakah semakin banyak wisatawan berarti semakin besar pendapatan.

  1. Terdapat korelasi positif antara jumlah wisatawan dan pendapatan (garis trend naik).
  2. Namun tidak semua daerah efisien, misalnya ada daerah dengan wisatawan banyak tapi pendapatan relatif kecil, bisa jadi karena harga tiket atau lama tinggal rendah.

3.6 Line Plot

library(ggplot2)

ggplot(Data_Pariwisata_Daerah, 
       aes(x = tanggal, y = pendapatan_jualan, group = 1)) +  
  geom_line(linewidth = 1.2, color = "steelblue") +             
  geom_point(size = 3, color = "red") +                  
  labs(
    title = "Perubahan Pendapatan Pariwisata per Daerah",
    x = "Tanggal",
    y = "Pendapatan (Juta Rupiah)"
  ) +
  theme_minimal()

Definisi, Aturan Penggunaan, Kelebihan dan Kekurangan

Definisi

Grafik garis yang menghubungkan titik-titik data berdasarkan urutan waktu atau kategori berurutan.

Aturan Penggunaan

  1. Gunakan untuk data berdasarkan tanggal atau waktu.
  2. Pastikan titik-titiknya diurutkan berdasarkan waktu.

Kelebihan

  1. Sangat baik untuk melihat tren dan perubahan dari waktu ke waktu.
  2. Dapat menampilkan beberapa garis untuk perbandingan antar kelompok.

Kekurangan

  1. Tidak cocok untuk kategori tidak berurutan atau nominal.
  2. Terlalu banyak garis bisa membuat grafik sulit dibaca.

Insight

Tujuan: Menunjukkan perubahan pendapatan berdasarkan tanggal/waktu.

  1. Terlihat fluktuasi antar bulan, namun cenderung stabil untuk daerah besar seperti Bali dan Yogyakarta.
  2. Ada beberapa penurunan pada bulan tertentu, mungkin dipengaruhi musim hujan atau faktor non-ekonomi.

3.7 Density Plot

library(ggplot2)

ggplot(Data_Pariwisata_Daerah, aes(x = pendapatan_jualan)) +
  geom_density(fill = "skyblue", color = "black", alpha = 0.7) +
  labs(
    title = "Distribusi Umum Pendapatan Pariwisata",
    x = "Pendapatan (Juta Rupiah)",
    y = "Kepadatan (Density)"
  ) +
  theme_minimal()

Definisi, Aturan Penggunaan, Kelebihan dan Kekurangan

Definisi

Mirip histogram, tapi menampilkan kurva halus yang menggambarkan distribusi probabilitas dari data numerik.

Aturan Penggunaan

  1. Gunakan untuk melihat bentuk distribusi data, apakah miring kanan, kiri, atau normal.
  2. Biasanya menggunakan geom_density().

Kelebihan

  1. Lebih halus dan estetis dibanding histogram.
  2. Bisa dibandingkan antar kelompok dengan warna berbeda.

Kekurangan

  1. Sulit dipahami untuk pemula.
  2. Tidak menunjukkan frekuensi sebenarnya karena bersifat relatif.

Insight

Tujuan: Melihat kepadatan data dan pola distribusi antar kelompok.

  1. Sebagian besar daerah memiliki pendapatan di kisaran menengah, sementara hanya beberapa seperti Bali dan Yogyakarta yang menonjol dengan nilai tinggi.
  2. Hal ini menandakan bahwa pendapatan pariwisata belum merata antar daerah.

3.8 Ridgeline Plot

library(dplyr)
## 
## Attaching package: 'dplyr'
## The following objects are masked from 'package:stats':
## 
##     filter, lag
## The following objects are masked from 'package:base':
## 
##     intersect, setdiff, setequal, union
data_ridges <- Data_Pariwisata_Daerah %>%
  group_by(nama_daerah) %>%
  slice(rep(1:n(), each = 10)) %>%  
  mutate(pendapatan_jualan = pendapatan_jualan + rnorm(10, 0, 50)) 

library(ggplot2)
library(ggridges)

ggplot(data_ridges, aes(x = pendapatan_jualan, y = nama_daerah, fill = nama_daerah)) +
  geom_density_ridges(alpha = 0.8, color = "white", scale = 1.2) +
  labs(
    title = "Distribusi Pendapatan Pariwisata per Daerah (Simulasi)",
    x = "Pendapatan (Juta Rupiah)",
    y = "Nama Daerah"
  ) +
  theme_minimal() +
  theme(legend.position = "none",
        plot.title = element_text(size = 14, face = "bold")
  )
## Picking joint bandwidth of 25.4

Definisi, Aturan Penggunaan, Kelebihan dan Kekurangan

Definisi

Grafik berbentuk gelombang yang menunjukkan distribusi data untuk banyak kelompok secara bertumpuk vertical.

Aturan Penggunaan

  1. Gunakan untuk membandingkan distribusi antar kategori.
  2. Butuh cukup banyak data per kategori bukan hanya satu nilai.
  3. Gunakan geom_density_ridges() dari paket ggridges.

Kelebihan

  1. Sangat bagus untuk membandingkan bentuk distribusi antar kelompok.
  2. Menarik secara visual dan informatif.

Kekurangan

  1. Tidak cocok untuk data kecil atau satu nilai perkelompok.
  2. Bisa sulit dibaca jika banyak kategori atau warna mirip.

Insight

Tujuan: Melihat kepadatan data dan pola distribusi antar kelompok.

  1. Wisata alam dan bahari memiliki sebaran pendapatan yang lebih luas, sedangkan wisata budaya dan kuliner lebih stabil namun rendah.
  2. Artinya, jenis wisata berpengaruh terhadap tingkat dan kestabilan pendapatan daerah.

4. Kesimpulan

Kesimpulan Umum

  1. Bali, Bandung, dan Yogyakarta adalah tiga besar destinasi paling populer sekaligus paling menguntungkan.

  2. Jenis wisata alam dan bahari menjadi daya tarik utama pariwisata Indonesia.

  3. Ada hubungan positif antara jumlah wisatawan dan pendapatan, tetapi efisiensi ekonomi antar daerah berbeda.

  4. Pemerataan pariwisata masih menjadi tantangan besar, banyak daerah potensial yang belum tergarap optimal.

(Insight sudah tertera di visualisasi masing-masing)