Dataset yang digunakan dalam analisis ini adalah Bike Sharing Dataset yang dapat diakses melalui tautan berikut: Klik di sini. Data ini berisi informasi mengenai jumlah penyewaan sepeda pada sistem bike sharing. Data ini mencatat berbagai variabel yang berkaitan dengan aktivitas penyewaan sepeda setiap harinya, seperti tanggal pengamatan, kondisi cuaca, musim, hari kerja, serta jumlah total penyewaan sepeda.
Pada analisis ini digunakan data harian (day) yang mencatat jumlah penyewaan sepeda dari tahun 2011 hingga 2012. Dataset ini memungkinkan untuk dilakukan analisis time series guna melihat bagaimana pola perubahan jumlah penyewaan sepeda dari waktu ke waktu.
Ada dua visualisasi time series yang digunakan, yaitu line plot time series dan time series dengan moving average 30 hari. Line plot digunakan untuk menampilkan perubahan jumlah penyewaan sepeda dari waktu ke waktu sehingga pola fluktuasi harian dapat terlihat dengan jelas. Sementara itu, penambahan moving average digunakan untuk menghaluskan fluktuasi harian sehingga tren jangka panjang dalam penyewaan sepeda dapat diamati dengan lebih mudah.
Melalui visualisasi tersebut diharapkan dapat menjawab beberapa pertanyaan analisis, seperti:
Dalam visualisasi time series ini digunakan dua variabel utama, yaitu:
dteday Variabel ini menunjukkan tanggal pengamatan
dan berfungsi sebagai variabel waktu dalam analisis time
series.
cnt Variabel ini menunjukkan jumlah total penyewaan
sepeda pada hari tersebut yang merupakan gabungan dari pengguna
terdaftar dan pengguna kasual.
Variabel dteday digunakan karena analisis yang dilakukan
bertujuan untuk melihat perubahan data berdasarkan waktu, sedangkan
variabel cnt digunakan karena merupakan indikator utama
yang menggambarkan tingkat penggunaan layanan bike sharing.
Visualisasi time series line chart digunakan untuk menampilkan
perubahan suatu variabel terhadap waktu. Pada analisis ini, grafik garis
digunakan untuk menunjukkan bagaimana jumlah penyewaan sepeda
(cnt) berubah dari hari ke hari berdasarkan tanggal
pengamatan (dteday). Melalui visualisasi ini, pola
fluktuasi serta kecenderungan peningkatan atau penurunan jumlah
penyewaan sepeda selama periode pengamatan dapat diamati.
library(ggplot2)
library(plotly)
# ubah tanggal
day$dteday <- as.Date(day$dteday)
p <- ggplot(day, aes(x = dteday, y = cnt)) +
geom_line(color = "blue") +
labs(
title = "Time Series Jumlah Penyewaan Sepeda per Hari",
x = "Tanggal",
y = "Jumlah Penyewaan Sepeda"
) +
theme_minimal()
ggplotly(p)
Berdasarkan visualisasi Time Series Line Chart, terlihat bahwa jumlah penyewaan sepeda per hari mengalami perubahan yang naik turun dari waktu ke waktu selama periode 2011 hingga awal 2013. Hal ini menunjukkan bahwa pola penyewaan sepeda bersifat fluktuatif, dengan beberapa periode mengalami kenaikan dan beberapa periode lainnya mengalami penurunan.
Pada awal tahun 2011, jumlah penyewaan sepeda masih relatif rendah, yaitu sekitar 800 hingga 2000 penyewaan per hari. Kemudian pada pertengahan tahun 2011, jumlah penyewaan mulai meningkat hingga mencapai sekitar 5000 hingga 6000 penyewaan per hari. Jika dilihat secara keseluruhan, terdapat tren peningkatan jumlah penyewaan sepeda dari tahun 2011 menuju tahun 2012, karena pada tahun 2012 jumlah penyewaan terlihat lebih tinggi dibandingkan tahun sebelumnya.
Periode dengan jumlah penyewaan tertinggi terlihat pada tahun 2012, di mana beberapa hari mencapai sekitar 7000 hingga 8000 penyewaan sepeda per hari. Sebaliknya, periode dengan jumlah penyewaan terendah terjadi pada awal tahun 2011, ketika jumlah penyewaan masih berada di bawah 2000 penyewaan per hari. Namun karena data harian sangat berfluktuasi, tren jangka panjang masih belum terlihat dengan sangat jelas pada grafik ini.
Selain grafik time series dasar, digunakan juga time series plot dengan moving average 30 hari untuk memperjelas pola tren data. Moving average merupakan teknik perataan data yang digunakan untuk mengurangi fluktuasi harian sehingga tren jangka panjang dalam jumlah penyewaan sepeda dapat terlihat dengan lebih jelas. Dengan visualisasi ini, perubahan tren penggunaan sepeda selama periode pengamatan dapat dianalisis dengan lebih mudah.
library(ggplot2)
library(plotly)
library(zoo)
# ubah format tanggal
day$dteday <- as.Date(day$dteday)
# moving average
day$MA30 <- rollmean(day$cnt, 30, fill = NA, align = "right")
p2 <- ggplot(day, aes(x = dteday)) +
geom_line(aes(y = cnt), color = "grey70") +
geom_line(aes(y = MA30), color = "red", linewidth = 1) +
labs(
title = "Time Series Penyewaan Sepeda dengan Moving Average 30 Hari",
x = "Tanggal",
y = "Jumlah Penyewaan Sepeda"
) +
theme_minimal()
ggplotly(p2)
Pada visualisasi Time Series Plot dengan Moving Average 30 hari, garis abu-abu menunjukkan jumlah penyewaan sepeda harian yang masih sangat berfluktuasi, sedangkan garis merah menunjukkan rata-rata penyewaan sepeda selama 30 hari yang membuat pola tren menjadi lebih jelas.
Dari garis moving average tersebut terlihat bahwa pada awal 2011, rata-rata penyewaan sepeda masih berada di kisaran sekitar 1000 hingga 1500 penyewaan per hari. Tren kemudian meningkat hingga mencapai sekitar 4500 hingga 5000 penyewaan per hari pada pertengahan tahun 2011. Setelah itu terjadi penurunan pada akhir 2011 hingga awal 2012, dengan rata-rata sekitar 2500 hingga 3000 penyewaan per hari.
Namun setelah periode tersebut, tren kembali meningkat cukup jelas sepanjang tahun 2012, bahkan mencapai sekitar 6500 hingga lebih dari 7000 penyewaan per hari pada pertengahan hingga akhir tahun. Hal ini menunjukkan bahwa tren jangka panjang penyewaan sepeda cenderung meningkat, meskipun terdapat fluktuasi harian yang cukup besar.
Dengan demikian, visualisasi ini membantu menjawab pertanyaan analisis mengenai bagaimana tren jangka panjang penyewaan sepeda setelah fluktuasi harian diminimalkan, yaitu menunjukkan bahwa secara umum penggunaan sepeda semakin meningkat dari tahun 2011 ke tahun 2012, sebelum kemudian sedikit menurun pada akhir periode pengamatan.
Berdasarkan visualisasi Bar Chart rata-rata penyewaan sepeda per bulan, terlihat bahwa jumlah penyewaan sepeda berbeda-beda pada setiap bulan. Hal ini menunjukkan bahwa terdapat pola musiman dalam penggunaan sepeda.
Beberapa bulan memiliki rata-rata penyewaan yang lebih tinggi dibandingkan bulan lainnya. Misalnya, pada bulan Juni hingga September, rata-rata penyewaan sepeda terlihat lebih tinggi, yaitu sekitar 5000 hingga lebih dari 6000 penyewaan sepeda per hari. Hal ini menunjukkan bahwa pada periode tersebut penggunaan sepeda cenderung meningkat.
Sebaliknya, pada bulan Januari dan Februari, rata-rata penyewaan sepeda terlihat lebih rendah, yaitu sekitar 2000 hingga 3000 penyewaan per hari. Ini menunjukkan bahwa pada awal tahun jumlah penyewaan sepeda cenderung lebih sedikit dibandingkan bulan lainnya.
Dari visualisasi ini dapat disimpulkan bahwa penyewaan sepeda cenderung lebih tinggi pada pertengahan tahun dan lebih rendah pada awal tahun, yang kemungkinan dipengaruhi oleh faktor seperti cuaca, musim, atau aktivitas masyarakat. Visualisasi ini membantu melihat pola bulanan penyewaan sepeda yang sebelumnya tidak terlalu terlihat pada grafik time series harian.