Pendahuluan

Visualisasi data runtun waktu (time series) merupakan metode penyajian data yang digunakan untuk melihat perubahan suatu variabel berdasarkan urutan waktu. Melalui pendekatan ini, kita dapat mengamati pola perubahan data dari waktu ke waktu, seperti tren jangka panjang, fluktuasi harian, maupun pola musiman yang mungkin terjadi. Dalam analisis ini, beberapa teknik visualisasi runtun waktu digunakan untuk memahami bagaimana jumlah penyewaan sepeda berubah sepanjang periode pengamatan.

Analisis Data

Dataset yang digunakan berasal dari sistem bike sharing di Washington, D.C., yang diperoleh dari UCI Machine Learning Repository. Data yang dianalisis merupakan data penyewaan sepeda harian selama periode tahun 2011 hingga 2012. Dataset ini memuat informasi jumlah penyewaan sepeda (cnt) sebagai variabel utama yang diamati dari waktu ke waktu. Dalam analisis runtun waktu ini digunakan beberapa bentuk visualisasi, seperti grafik tren harian, grafik tren menggunakan average, analisis pola musiman berdasarkan bulan, serta distribusi data menggunakan jitter plot, untuk melihat pola perubahan dan variasi jumlah penyewaan sepeda sepanjang periode pengamatan.

Berikut merupakan penjelasan variabel

No. Variabel Penjelasan
1. instant Nomor urutan data.
2. dteday Tanggal pengamatan yang menunjukkan waktu pencatatan data penyewaan sepeda.
3. season Musim pada saat data dicatat (Spring, Summer, Fall, Winter).
4. yr Tahun pengamatan, yaitu 2011 atau 2012.
5. mnth Bulan pengamatan dari Januari hingga Desember.
6. holiday Menunjukkan apakah hari tersebut merupakan hari libur atau bukan.
7. weekday Hari dalam satu minggu (Senin hingga Minggu).
8. workingday Menunjukkan apakah hari tersebut merupakan hari kerja atau bukan.
9. weathersit Kondisi cuaca pada hari tersebut (cerah, berawan, dan hujan ringan).
10. temp Temperatur atau suhu udara pada hari tersebut (dalam skala yang telah dinormalisasi).
11. cnt Total jumlah penyewaan sepeda pada hari tersebut.

berikut merupakan tabel data yang menyajikan dataset dengan keseluruhan variabel.

Setelah melihat dan mengetahui informasi serta penjelasan mengenai dataset ini, selanjutnya kita akan melakukan analisis time series menggunakan visualisasi dengan ggplot.

ggplot(bike, aes(x = dteday, y = cnt)) +
  geom_line(color = "navy") +
  labs(title = "Tren Penyewaan Sepeda Harian",
       x = "Tanggal",
       y = "Jumlah Penyewaan") +
  theme_minimal()

Grafik harian menunjukkan bagaimana jumlah penyewaan sepeda berubah setiap hari selama periode tahun 2011 hingga 2012. Dari grafik terlihat bahwa angka penyewaan naik dan turun secara tajam dari hari ke hari. Meskipun demikian, secara keseluruhan ada kecenderungan peningkatan jumlah penyewaan dari awal tahun 2011 hingga pertengahan tahun 2012. Setelah mencapai puncaknya di sekitar pertengahan hingga akhir tahun 2012, jumlah penyewaan mulai menurun kembali menjelang akhir periode pengamatan. Hal ini menandakan bahwa permintaan sepeda tidak stabil setiap hari, namun memiliki pola perubahan dalam jangka waktu yang lebih panjang.

ggplot(bike, aes(dteday, cnt)) +
  geom_line(alpha = 0.4) +
  geom_line(aes(y = ma30), color = "blue", size = 1) +
  labs(title = "Trend Penyewaan Sepeda (Moving Average)")

Grafik dengan metode rata-rata (average) digunakan untuk memperhalus fluktuasi harian yang tajam, sehingga pola tren jangka panjang menjadi lebih jelas. Dengan menghitung rata-rata penyewaan setiap 30 hari, terlihat bahwa tren peningkatan jumlah penyewaan sepeda dari tahun 2011 menuju 2012 lebih mudah diamati. Grafik ini juga menunjukkan adanya periode penurunan pada awal tahun 2012, yang kemudian diikuti kenaikan hingga mencapai nilai tertinggi pada pertengahan hingga akhir tahun 2012. Metode ini membantu kita melihat perubahan jangka panjang tanpa terganggu oleh naik turunnya data harian.

ggplot(bike, aes(x = mnth, y = cnt)) +
  geom_boxplot(fill = "skyblue") +
  labs(title = "Pola Musiman Penyewaan Sepeda",
       x = "Bulan",
       y = "Jumlah Penyewaan") +
  theme_minimal()

Grafik boxplot per bulan menunjukkan adanya pola musiman dalam penyewaan sepeda. Terlihat bahwa jumlah penyewaan cenderung lebih rendah pada bulan-bulan awal tahun, seperti Januari dan Februari. Kemudian, jumlah penyewaan mulai meningkat pada bulan Maret dan mencapai puncaknya pada pertengahan tahun, yaitu sekitar Juni hingga September. Setelah itu, jumlah penyewaan kembali menurun pada bulan Oktober hingga Desember. Pola ini mengindikasikan bahwa musim memengaruhi minat masyarakat dalam menggunakan sepeda, di mana bulan-bulan tertentu memiliki tingkat penyewaan yang lebih tinggi dibandingkan bulan lainnya.

ggplot(bike, aes(x = mnth, y = cnt, color = yr)) +
  geom_jitter(alpha = 0.3, width = 0.2, height = 0) +
  scale_color_manual(values = c("2011" = "blue", "2012" = "red")) +
  labs(title = "Jitter Plot: Distribusi Penyewaan Sepeda per Bulan",
       subtitle = "Titik-titik menunjukkan seluruh data, dengan warna berdasarkan tahun",
       x = "Bulan", y = "Total Penyewaan (cnt)",
       color = "Tahun") +
  theme_minimal() +
  theme(axis.text.x = element_text(angle = 45, hjust = 1))

Grafik jitter plot (sebaran titik) memperlihatkan distribusi jumlah penyewaan sepeda pada setiap bulan, dengan warna berbeda untuk tahun 2011 dan 2012. Dari grafik ini, titik-titik yang mewakili tahun 2012 umumnya berada pada nilai yang lebih tinggi dibandingkan tahun 2011. Hal ini menunjukkan bahwa hampir di setiap bulan, penyewaan sepeda pada tahun 2012 lebih banyak daripada tahun sebelumnya. Kemudian, jika kita analisis terlihat bahwa pola data pada 2011 dan 2012 mengalami kemiripan seperti yang telah dijelaskan sebelumnya yaitu pada bulan awal rendah kemudian meningkat pada bulan pertengahan dan kembali menurun. selain itu titik-titik data yang menyebar menunjukkan banyaknya variasi jumlah peminjaman sepeda yang mungkin dipengaruhi oleh cuaca, hari kerja maupun suhu.

Kesimpulan

Berdasarkan seluruh hasil visualisasi data, dapat disimpulkan bahwa jumlah penyewaan sepeda cenderung meningkat dari tahun 2011 ke tahun 2012. Selain itu, terdapat pola musiman yang jelas, di mana penyewaan lebih tinggi pada pertengahan tahun dan lebih rendah pada awal serta akhir tahun. Meskipun demikian, data harian menunjukkan fluktuasi yang tajam, yang berarti jumlah penyewaan bisa berubah secara signifikan dari hari ke hari. Oleh karena itu, metode analisis seperti rata-rata bergerak sangat berguna untuk melihat pola perubahan jangka panjang dari data penyewaan sepeda.