Data berikut merupakan Data Pariwisata Daerah di Indonesia yang berisi informasi mengenai berbagai destinasi wisata di beberapa daerah terkenal. Tujuan dari data ini adalah untuk menggambarkan jumlah wisatawan, pendapatan yang dihasilkan, serta tingkat kepuasan pengunjung berdasarkan jenis wisata yang ditawarkan di tiap daerah.
Dataset ini terdiri dari 10 daerah wisata utama, mencakup berbagai jenis wisata seperti pantai, budaya, alam, kuliner, bahari, dan sejarah. Setiap daerah memiliki karakteristik berbeda yang tercermin melalui banyaknya wisatawan yang berkunjung dan pendapatan yang diperoleh dari kegiatan pariwisata.
Tujuan dari penyusunan data Pariwisata Daerah ini dengan Visualisasi adalah untuk: 1. Menyajikan data pariwisata seacara informatik dan menarik. 2. Meningkatkan pemahaman terhadap hubungan antar faktor. 3. Mendukung pengambilan keputusan dan evaluasi.
library(knitr)
library(DT)
tanggal <- seq(from = as.Date("2024-02-02"),
to = as.Date("2024-11-02"),
by = "month")
nama_daerah <- c("Bali", "Yogyakarta", "Lombok", "Bandung", "Labuan Bajo", "Medan", "Makassar", "Malang", "Raja Ampat", "Danau Toba")
nama_daerah <- factor(nama_daerah)
jenis_wisata <- c("Pantai", "Budaya", "Alam", "Kuliner", "Bahari", "Sejarah", "Bahari", "Alam", "Bahari", "Alam")
jenis_wisata <- factor(jenis_wisata)
jumlah_wisatawan <- c(500000, 320000, 210000, 280000, 150000, 175000, 200000, 240000, 120000, 160000)
pendapatan_jualan <- c(1250.5, 870.3, 645.8, 710.6, 530.4, 590.7, 640.2, 720.5, 450.3, 510.9)
tingkat_kepuasan <- c("Sangat Tinggi", "Tinggi", "Sedang", "Tinggi", "Sedang", "Tinggi", "Sedang", "Tinggi", "Sangat Tinggi", "Sedang")
tingkat_kepuasan <- factor(tingkat_kepuasan,
levels = c("Sangat Tinggi", "Tinggi", "Sedang"),
ordered = TRUE)
Data_Pariwisata_Daerah <- data.frame(tanggal, nama_daerah, jenis_wisata, jumlah_wisatawan, pendapatan_jualan, tingkat_kepuasan)
datatable(Data_Pariwisata_Daerah, caption = "Data Pariwisata Daerah")
# Download Paket
library(ggplot2)
# Membuat atau Membaca Dataset
library(ggplot2)
ggplot(Data_Pariwisata_Daerah,
aes(x = reorder(nama_daerah, jumlah_wisatawan),
y = jumlah_wisatawan, fill = jenis_wisata)) +
geom_col() +
labs(
title = "Jumlah Wisatawan per Daerah di Indonesia (Urut dari tertinggi)",
x = "Nama Daerah",
y = "Jumlah Wisatawan",
fill = "Jenis Wisata"
) +
theme_minimal() +
theme(axis.text.x = element_text(angle = 45, hjust = 1))
Diagram batang yang menampilkan perbandingan antar kategori seperti nama daerah atau jenis wisata dengan panjang batang menunjukkan nilai seperti pendapatan dan jumlah wisatawan.
Tujuan: Menunjukkan perbandingan jumlah wisatawan antar daerah.
library(ggplot2)
ggplot(Data_Pariwisata_Daerah, aes(x = pendapatan_jualan)) +
geom_histogram(binwidth = 100, fill = "orange", color = "black") +
labs(
title = "Pendapatan Pariwisata per Daerah",
x = "Pendapatan (Juta Rupiah)",
y = "Frekuensi"
) +
theme_minimal()
Diagram batang yang menunjukkan distribusi frekuensi dari data kontinu seperti pendapatan atau jumlah wisatawan.
Tujuan: Melihat persebaran nilai pendapatan antar daerah.
library(ggplot2)
ggplot(Data_Pariwisata_Daerah, aes(x = jenis_wisata, y = pendapatan_jualan, fill = jenis_wisata)) +
geom_boxplot() +
labs(
title = "Sebaran Pendapatan Pariwisata berdasarkan Jenis Wisata",
x = "Jenis Wisata",
y = "Pendapatan (Juta Rupiah)"
) +
theme_minimal()
Grafik yang menampilkan ringkasan 5 angka yaitu min, Q1, median, Q3, max dan outlier dari data numerik.
Tujuan: Membandingkan variasi pendapatan per kategori wisata.
library(ggplot2)
# Hitung total wisatawan per jenis data
data_pie <- aggregate(jumlah_wisatawan ~ jenis_wisata, data = Data_Pariwisata_Daerah, sum)
ggplot(data_pie, aes(x = "", y = jumlah_wisatawan, fill = jenis_wisata)) +
geom_col(width = 1) +
coord_polar(theta = "y") +
labs(
title = "Persentase Jumlah Wisatawan per Jenis Wisata",
fill = "Jenis Wisata"
) +
theme_void() +
theme(plot.title = element_text(hjust = 0.5))
# Menambahkan Persentase
data_pie$persen <- round(
(data_pie$jumlah_wisatawan / sum(data_pie$jumlah_wisatawan)) * 100, 1)
ggplot(data_pie, aes(x = "", y = jumlah_wisatawan, fill = jenis_wisata)) +
geom_col(width = 1) +
coord_polar(theta = "y") +
geom_text(aes(label = paste0(persen, "%")),
position = position_stack(vjust = 0.5)) +
labs(
title = "Persentase Jumlah Wisatawan per Jenis Wisata",
fill = "Jenis Wisata"
) +
theme_void() +
theme(plot.title = element_text(hjust = 0.5))
Diagram lingkaran yang membagi satu lingkaran penuh menjadi potongan berdaasarkan proporsi kategori.
Tujuan: Menunjukkan distribusi jenis wisata di tiap daerah.
library(ggplot2)
ggplot(Data_Pariwisata_Daerah, aes(x = jumlah_wisatawan, y = pendapatan_jualan)) +
geom_smooth(method = "lm", se = FALSE, linetype = "dashed", color = "red") +
geom_text(
aes(label = nama_daerah),
vjust = -1,
size = 3.5,
color = "black"
) +
labs(
title = "Hubungan Jumlah Wisatawan dan Pendapatan Pariwisata Daerah",
x = "Jumlah Wisatawan",
y = "Pendapatan (Juta Rupiah)"
) +
theme_minimal()
## `geom_smooth()` using formula = 'y ~ x'
# Definisi, Aturan Penggunaan, Kelebihan dan Kekurangan
Grafik titik-titik yang menunjukkan antar dua variabel numerik seperti jumlah wisatawan dan pendapatan.
Tujuan: Melihat apakah semakin banyak wisatawan berarti semakin besar pendapatan.
library(ggplot2)
ggplot(Data_Pariwisata_Daerah,
aes(x = tanggal, y = pendapatan_jualan, group = 1)) +
geom_line(linewidth = 1.2, color = "steelblue") +
geom_point(size = 3, color = "red") +
labs(
title = "Perubahan Pendapatan Pariwisata per Daerah",
x = "Tanggal",
y = "Pendapatan (Juta Rupiah)"
) +
theme_minimal()
Grafik garis yang menghubungkan titik-titik data berdasarkan urutan waktu atau kategori berurutan.
Tujuan: Menunjukkan perubahan pendapatan berdasarkan tanggal/waktu.
library(ggplot2)
ggplot(Data_Pariwisata_Daerah, aes(x = pendapatan_jualan)) +
geom_density(fill = "skyblue", color = "black", alpha = 0.7) +
labs(
title = "Distribusi Umum Pendapatan Pariwisata",
x = "Pendapatan (Juta Rupiah)",
y = "Kepadatan (Density)"
) +
theme_minimal()
Mirip histogram, tapi menampilkan kurva halus yang menggambarkan distribusi probabilitas dari data numerik.
Tujuan: Melihat kepadatan data dan pola distribusi antar kelompok.
library(dplyr)
##
## Attaching package: 'dplyr'
## The following objects are masked from 'package:stats':
##
## filter, lag
## The following objects are masked from 'package:base':
##
## intersect, setdiff, setequal, union
data_ridges <- Data_Pariwisata_Daerah %>%
group_by(nama_daerah) %>%
slice(rep(1:n(), each = 10)) %>%
mutate(pendapatan_jualan = pendapatan_jualan + rnorm(10, 0, 50))
library(ggplot2)
library(ggridges)
ggplot(data_ridges, aes(x = pendapatan_jualan, y = nama_daerah, fill = nama_daerah)) +
geom_density_ridges(alpha = 0.8, color = "white", scale = 1.2) +
labs(
title = "Distribusi Pendapatan Pariwisata per Daerah (Simulasi)",
x = "Pendapatan (Juta Rupiah)",
y = "Nama Daerah"
) +
theme_minimal() +
theme(legend.position = "none",
plot.title = element_text(size = 14, face = "bold")
)
## Picking joint bandwidth of 25.4
Grafik berbentuk gelombang yang menunjukkan distribusi data untuk banyak kelompok secara bertumpuk vertical.
Tujuan: Melihat kepadatan data dan pola distribusi antar kelompok.
Bali, Bandung, dan Yogyakarta adalah tiga besar destinasi paling populer sekaligus paling menguntungkan.
Jenis wisata alam dan bahari menjadi daya tarik utama pariwisata Indonesia.
Ada hubungan positif antara jumlah wisatawan dan pendapatan, tetapi efisiensi ekonomi antar daerah berbeda.
Pemerataan pariwisata masih menjadi tantangan besar, banyak daerah potensial yang belum tergarap optimal.
(Insight sudah tertera di visualisasi masing-masing)