Visualisasi data merupakan salah satu tahap penting dalam analisis data eksploratif, khususnya pada data time series. Melalui visualisasi, peneliti dapat memahami pola perubahan data dari waktu ke waktu serta mengidentifikasi kecenderungan tren yang mungkin terdapat dalam data.

Pada analisis ini digunakan dataset penyewaan sepeda harian (bike sharing dataset). Variabel utama yang dianalisis adalah jumlah penyewaan sepeda (cnt) yang diamati setiap hari (dteday).

Tujuan dari analisis yang dilakukan ini adalah untuk memvisualisasikan pola perubahan jumlah penyewaan sepeda terhadap waktu menggunakan dua pendekatan visualisasi, yaitu:

  1. Line plot untuk menggambarkan perubahan data secara langsung dari waktu ke waktu.
  2. Smoothing plot untuk melihat kecenderungan tren data yang lebih halus dengan mengurangi perubahan naik-turun data yang terjadi dalam waktu singkat.

Pada tahap awal analisis, data terlebih dahulu diimpor ke di R menggunakan fungsi read_csv(). Dataset yang digunakan merupakan data penyewaan sepeda harian yang terdiri dari beberapa variabel yang berkaitan dengan kondisi waktu, cuaca, serta jumlah penyewaan sepeda.

Dari Hasil impor data kita dapat melihat bahwa dataset memiliki 731 observasi dan 16 variabel. Variabel dteday merepresentasikan tanggal pengamatan, sedangkan variabel cnt menunjukkan jumlah total penyewaan sepeda pada hari tersebut. Selain itu terdapat beberapa variabel lain seperti temperatur (temp), kelembaban (hum), kecepatan angin (windspeed), serta jumlah penyewaan berdasarkan kategori pengguna yaitu casual dan registered.

Pemeriksaan struktur data dilakukan untuk memastikan bahwa setiap variabel telah terbaca dengan tipe data yang sesuai sehingga dapat digunakan dalam proses analisis selanjutnya. Setelah data berhasil diimpor dan diverifikasi strukturnya, langkah berikutnya adalah melakukan visualisasi data time series. Visualisasi ini bertujuan untuk memberikan gambaran awal mengenai pola perubahan jumlah penyewaan sepeda dari waktu ke waktu. Dengan menggunakan grafik, kita dapat mengidentifikasi pola fluktuasi, kecenderungan tren, serta dinamika penggunaan sepeda selama periode pengamatan.

Pada tahap selanjutnya akan ditampilkan line plot untuk melihat pola perubahan data secara langsung, kemudian dilanjutkan dengan smoothing plot untuk mengamati kecenderungan tren yang lebih halus dalam data.

Visualisasi Data Menggunakan Line Plot dan Smoothing Plot

Pada penelitian ini Line plot digunakan untuk menggambarkan perubahan jumlah penyewaan sepeda terhadap waktu. Dengan menggunakan grafik ini, kita dapat melihat bagaimana fluktuasi jumlah penyewaan sepeda yang terjadi setiap hari selama periode pengamatan.

Grafik ini membantu dalam memahami pola umum data serta melihat apakah terdapat peningkatan atau penurunan jumlah penyewaan sepeda sepanjang waktu.

ggplot(data_bike, aes(x = dteday, y = cnt)) +
  geom_line(color = "darkgrey") +
  labs(
    title = "Line Plot Jumlah Penyewaan Sepeda Harian",
    x = "Tanggal",
    y = "Jumlah Penyewaan Sepeda"
  ) +
  theme_minimal()


Berdasarkan grafik line plot jumlah penyewaan sepeda harian, terlihat bahwa data mengalami fluktuasi yang cukup signifikan sepanjang periode pengamatan dari tahun 2011 hingga awal tahun 2013. Pada awal tahun 2011, jumlah penyewaan sepeda masih berada pada tingkat yang relatif rendah, yaitu sekitar 1000 hingga 2000 penyewaan per hari. Seiring berjalannya waktu, jumlah penyewaan sepeda menunjukkan kecenderungan meningkat, khususnya memasuki pertengahan tahun 2011.

Memasuki tahun 2012, jumlah penyewaan sepeda terlihat berada pada tingkat yang lebih tinggi dibandingkan tahun sebelumnya. Pada beberapa periode, jumlah penyewaan bahkan mencapai lebih dari 7000 hingga 8000 penyewaan per hari. Hal ini menunjukkan bahwa penggunaan layanan penyewaan sepeda semakin meningkat dari waktu ke waktu.

Selain itu, grafik juga memperlihatkan adanya fluktuasi harian yang cukup tajam, yang kemungkinan dipengaruhi oleh berbagai faktor seperti kondisi cuaca, hari kerja, hari libur, maupun aktivitas masyarakat. Fluktuasi tersebut menyebabkan pola grafik terlihat bergerigi karena adanya perubahan jumlah penyewaan yang terjadi secara cepat dari satu hari ke hari berikutnya. Meskipun demikian, dari grafik ini dapat kita lihat bahwa adanya kecenderungan peningkatan penggunaan sepeda pada periode tertentu, yang mengindikasikan adanya pola tren dalam data.

Untuk memperoleh gambaran tren yang lebih jelas dan mengurangi pengaruh fluktuasi jangka pendek pada data, langkah selanjutnya adalah melakukan visualisasi menggunakan smoothing plot. Teknik smoothing akan membantu memperhalus pola data sehingga kecenderungan perubahan jumlah penyewaan sepeda dari waktu ke waktu dapat diamati dengan lebih jelas.

ggplot(data_bike, aes(x = dteday, y = cnt)) +
  geom_line(color = "gray") +
  geom_smooth(method = "loess", color = "red", se = FALSE) +
  labs(
    title = "Smoothing Plot Penyewaan Sepeda",
    x = "Tanggal",
    y = "Jumlah Penyewaan Sepeda"
  ) +
  theme_minimal()
## `geom_smooth()` using formula = 'y ~ x'


Berdasarkan hasil visualisasi smoothing plot yang ditampilkan dapat kita lihat adanya pola kecenderungan (trend) jumlah penyewaan sepeda yang lebih jelas dibandingkan dengan grafik sebelumnya. Garis merah pada grafik merupakan hasil proses smoothing yang berfungsi untuk menghaluskan data sehingga fluktuasi harian yang terlalu tajam dapat dikurangi.

Dari grafik tersebut dapat diamati bahwa pada awal tahun 2011 jumlah penyewaan sepeda masih relatif rendah. Selanjutnya terjadi peningkatan secara bertahap hingga pertengahan tahun 2011. Setelah itu, jumlah penyewaan sepeda mengalami sedikit penurunan menjelang akhir tahun 2011.

Memasuki tahun 2012, jumlah penyewaan sepeda kembali menunjukkan peningkatan yang cukup signifikan. Pada periode ini terlihat bahwa penggunaan sepeda mencapai tingkat yang lebih tinggi dibandingkan tahun sebelumnya. Hal ini menunjukkan bahwa minat masyarakat terhadap layanan penyewaan sepeda cenderung meningkat seiring berjalannya waktu.

Namun demikian, pada akhir periode pengamatan terlihat adanya kecenderungan penurunan jumlah penyewaan sepeda. Penurunan ini dapat disebabkan oleh berbagai faktor seperti perubahan musim, kondisi cuaca, maupun faktor lain yang mempengaruhi aktivitas masyarakat.

Secara keseluruhan, smoothing plot ini membantu memperlihatkan pola tren utama dalam data, yaitu adanya kecenderungan peningkatan jumlah penyewaan sepeda dari tahun 2011 hingga pertengahan tahun 2012 sebelum akhirnya mengalami penurunan pada akhir periode pengamatan.