Studi kasus

Pemerintah kota berencana untuk meningkatkan penggunaan transportasi ramah lingkungan, salah satunya melalui layanan penyewaan sepeda umum. Untuk mendukung kebijakan tersebut, diperlukan pemahaman mengenai pola penggunaan sepeda serta faktor-faktor yang memengaruhinya.

library(readxl)
bike <- read_excel("~/VISDAT/bike.xlsx")
View(bike)

Data yang digunakan dalam studi ini merupakan data penyewaan sepeda harian yang mencakup informasi mengenai jumlah total penyewaan sepeda, kondisi cuaca, suhu harian, serta jenis hari (hari kerja dan hari libur). Data ini dianalisis untuk mengetahui bagaimana faktor lingkungan dan waktu berhubungan dengan tingkat penggunaan sepeda.

Visualisasi Data Kontinu (Bivariat)

Visualisasi data kontinu (bivariat) adalah teknik visualisasi yang digunakan untuk menampilkan dan menganalisis hubungan antara dua variabel yang sama-sama bersifat numerik (kontinu). Disebut bivariat karena visualisasi ini melibatkan dua variabel yang dianalisis secara bersamaan.

Dalam visualisasi ini, setiap pengamatan direpresentasikan sebagai titik data yang menunjukkan pasangan nilai dari kedua variabel. Tujuan utama visualisasi data kontinu bivariat adalah untuk mengidentifikasi pola hubungan, seperti hubungan positif, negatif, atau tidak adanya hubungan antara kedua variabel tersebut.

Scater plot

Scatter plot digunakan untuk melihat hubungan antara dua variabel numerik, yaitu suhu (temp) dan jumlah penyewaan sepeda (cnt). Setiap titik pada grafik merepresentasikan satu pengamatan harian berdasarkan nilai suhu dan total penyewaan sepeda pada hari tersebut.

ggplot(bike, aes(x = temp, y = cnt)) +
  geom_point(alpha = 0.5, color = "brown") +
  labs(
    title = "wind speed x Jumlah Penyewaan Sepeda",
    x = "wind speed",
    y = "Jumlah Penyewaan"
  ) +
  theme_minimal()

Berdasarkan grafik, terlihat bahwa pola hubungan antara kecepatan angin dan jumlah penyewaan sepeda cenderung negatif. Pada nilai kecepatan angin yang lebih rendah, jumlah penyewaan sepeda relatif lebih tinggi dan memiliki variasi yang cukup besar. Sebaliknya, ketika kecepatan angin meningkat, jumlah penyewaan sepeda cenderung menurun.

Namun demikian, sebaran titik yang cukup luas menunjukkan bahwa hubungan ini tidak terlalu kuat. Artinya, meskipun kecepatan angin berpengaruh terhadap penggunaan sepeda, faktor lain seperti suhu, kondisi cuaca, dan jenis hari juga turut memengaruhi jumlah penyewaan sepeda.

boxplot

Boxplot digunakan untuk membandingkan distribusi jumlah penyewaan sepeda (cnt) berdasarkan jenis hari (workingday), yaitu hari kerja dan hari libur. Visualisasi ini membantu melihat perbedaan median, sebaran data, serta kemungkinan adanya nilai ekstrem.

ggplot(bike, aes(x = factor(workingday), y = cnt)) +
  geom_boxplot(fill = "pink", alpha = 0.7) +
  labs(
    title = "Perbandingan Penyewaan Sepeda: Hari Kerja vs Libur",
    x = "Hari Kerja (0 = Libur, 1 = Kerja)",
    y = "Jumlah Penyewaan"
  ) +
  theme_minimal()

Berdasarkan grafik, terlihat bahwa median jumlah penyewaan sepeda pada hari kerja lebih tinggi dibandingkan hari libur. Selain itu, sebaran data pada hari kerja juga cenderung lebih besar, yang menunjukkan variasi jumlah penyewaan yang lebih tinggi. Hal ini mengindikasikan bahwa pada hari kerja terdapat lebih banyak aktivitas yang melibatkan penggunaan sepeda.

Sementara itu, pada hari libur, jumlah penyewaan sepeda relatif lebih rendah dan distribusinya lebih sempit. Hal ini menunjukkan bahwa meskipun sepeda tetap digunakan pada hari libur, intensitas penggunaannya tidak setinggi pada hari kerja.

Stacked bar

Stacked bar plot digunakan untuk melihat total penyewaan sepeda (cnt) berdasarkan kondisi cuaca (weathersit), dengan pembagian berdasarkan jenis hari (workingday). Tinggi batang menunjukkan akumulasi jumlah penyewaan sepeda pada setiap kategori cuaca.

ggplot(bike, aes(x = weathersit, y = cnt, fill = workingday)) +
  geom_bar(stat = "summary", fun = "sum") +
  labs(
    title = "Total Penyewaan Sepeda berdasarkan Kondisi Cuaca",
    x = "Kondisi Cuaca",
    y = "Total Penyewaan Sepeda",
  ) +
  theme_minimal()

Penyewaan paling tinggi terjadi pada kondisi cuaca 1, yang kemungkinan merepresentasikan cuaca cerah atau paling ideal, sehingga masyarakat lebih nyaman dan tertarik untuk bersepeda. Ketika memasuki kondisi cuaca 2, jumlah penyewaan menurun cukup drastis, menandakan bahwa cuaca yang kurang baik mulai mengurangi minat pengguna. Sementara itu, pada kondisi cuaca 3, total penyewaan sangat rendah, hampir tidak ada, yang mengindikasikan bahwa cuaca buruk membuat aktivitas bersepeda jarang dilakukan. Secara keseluruhan, semakin buruk kondisi cuaca, semakin kecil jumlah penyewaan sepeda.