Dataset yang digunakan dalam analisis ini adalah Bike Sharing Dataset. Bike Sharing Dataset merupakan kumpulan data yang memuat informasi mengenai jumlah penyewaan sepeda harian pada sistem bike sharing. Selain jumlah penyewaan, dataset ini juga mencakup berbagai variabel pendukung seperti tanggal pengamatan, kondisi cuaca, musim, dan hari kerja.
Pada laporan ini, analisis difokuskan pada variabel jumlah penyewaan sepeda untuk mengetahui bagaimana pola penggunaannya berdasarkan dimensi waktu. Visualisasi data digunakan sebagai sarana eksplorasi guna memperoleh pemahaman yang lebih baik mengenai karakteristik data, baik dalam skala bulanan maupun harian.
Melalui visualisasi yang disajikan, diharapkan dapat menjawab beberapa pertanyaan berikut.
Dalam analisis ini digunakan dua variabel utama, yaitu:
dteday, yaitu variabel yang menunjukkan tanggal pengamatan dan digunakan sebagai representasi waktu dalam analisis time series.
cnt, yaitu variabel yang menunjukkan jumlah total penyewaan sepeda pada setiap hari pengamatan.
Variabel dteday digunakan untuk mengamati perubahan data berdasarkan waktu, sedangkan variabel cnt digunakan sebagai indikator utama untuk menggambarkan tingkat penggunaan layanan bike sharing.
Visualisasi pertama yang digunakan adalah bar chart rata-rata penyewaan sepeda per bulan. Grafik ini bertujuan untuk memberikan gambaran umum mengenai pola penggunaan layanan bike sharing sepanjang tahun.
rata_bulanan <- day %>%
mutate(
Bulan = factor(
format(dteday, "%b"),
levels = month.abb
)
) %>%
group_by(Bulan) %>%
summarise(
Rata_Rata = mean(cnt)
)
ggplot(rata_bulanan,
aes(x = Bulan,
y = Rata_Rata)) +
geom_col(fill = "#C9A28D") +
labs(
title = "Rata-rata Penyewaan Sepeda per Bulan",
x = "Bulan",
y = "Rata-rata Jumlah Penyewaan"
) +
theme_minimal() +
theme(
plot.title = element_text(
hjust = 0.5,
face = "bold",
color = "#9A5C5C"
)
)Berdasarkan visualisasi yang diperoleh, terlihat bahwa rata-rata jumlah penyewaan sepeda berbeda pada setiap bulan. Kondisi ini menunjukkan adanya pola musiman dalam penggunaan layanan bike sharing.
Rata-rata penyewaan cenderung meningkat mulai pertengahan tahun dan mencapai nilai yang relatif tinggi pada bulan Juni hingga September. Sebaliknya, rata-rata penyewaan pada bulan Januari dan Februari berada pada tingkat yang lebih rendah dibandingkan bulan lainnya.
Setelah memperoleh gambaran umum melalui rata-rata bulanan, analisis dilanjutkan menggunakan time series line chart berdasarkan data harian.
p <- ggplot(day,
aes(x = dteday,
y = cnt)) +
geom_line(color = "#9A5C5C") +
labs(
title = "Time Series Jumlah Penyewaan Sepeda per Hari",
x = "Tanggal",
y = "Jumlah Penyewaan Sepeda"
) +
theme_minimal() +
theme(
plot.title = element_text(
hjust = 0.5,
face = "bold",
color = "#9A5C5C"
)
)
ggplotly(p)Berdasarkan grafik time series, terlihat bahwa jumlah penyewaan sepeda mengalami perubahan yang cukup dinamis sepanjang periode pengamatan. Terdapat beberapa fase peningkatan dan penurunan yang menunjukkan bahwa penggunaan layanan bike sharing bersifat fluktuatif.
Pada awal tahun 2011, jumlah penyewaan masih relatif rendah. Namun, seiring berjalannya waktu, jumlah penyewaan menunjukkan kecenderungan meningkat hingga mencapai tingkat yang lebih tinggi pada tahun 2012.
Untuk memperjelas kecenderungan jangka panjang pada data penyewaan sepeda, digunakan metode moving average 30 hari.
day$MA30 <- rollmean(
day$cnt,
30,
fill = NA,
align = "right"
)
p2 <- ggplot(day,
aes(x = dteday)) +
geom_line(
aes(y = cnt),
color = "grey80"
) +
geom_line(
aes(y = MA30),
color = "#9A5C5C",
linewidth = 1
) +
labs(
title = "Time Series Penyewaan Sepeda dengan Moving Average 30 Hari",
x = "Tanggal",
y = "Jumlah Penyewaan Sepeda"
) +
theme_minimal() +
theme(
plot.title = element_text(
hjust = 0.5,
face = "bold",
color = "#9A5C5C"
)
)
ggplotly(p2)Hasil visualisasi moving average menunjukkan bahwa tren penyewaan sepeda mengalami peningkatan dari tahun 2011 menuju tahun 2012. Tren kembali meningkat sepanjang tahun 2012 hingga mencapai tingkat penggunaan yang relatif tinggi.
Secara keseluruhan, penggunaan moving average berhasil memperlihatkan bahwa meskipun data harian memiliki fluktuasi yang cukup besar, terdapat pola tren jangka panjang berupa peningkatan penggunaan layanan bike sharing selama periode observasi.
Berdasarkan hasil visualisasi yang telah dilakukan, dapat disimpulkan bahwa jumlah penyewaan sepeda menunjukkan adanya pola musiman sekaligus tren jangka panjang.
Bar chart rata-rata bulanan memperlihatkan bahwa penyewaan sepeda cenderung lebih tinggi pada pertengahan tahun dan lebih rendah pada awal tahun. Sementara itu, grafik time series harian menunjukkan adanya fluktuasi jumlah penyewaan dari waktu ke waktu.
Setelah dilakukan pemulusan menggunakan moving average 30 hari, terlihat bahwa penggunaan layanan bike sharing secara umum mengalami peningkatan selama periode pengamatan, khususnya dari tahun 2011 menuju tahun 2012. Dengan demikian, kombinasi ketiga visualisasi tersebut mampu memberikan gambaran yang lebih komprehensif mengenai karakteristik data penyewaan sepeda berdasarkan dimensi waktu.