Visualisasi data merupakan salah satu tahap penting dalam eksplorasi data, terutama ketika data memiliki dimensi waktu. Data yang diamati berdasarkan urutan waktu dikenal sebagai data time series. Melalui visualisasi, peneliti dapat melihat pola perubahan suatu variabel dari waktu ke waktu, seperti tren, fluktuasi, maupun kemungkinan adanya pola musiman. Visualisasi juga membantu memahami karakteristik data sebelum dilakukan analisis statistik yang lebih lanjut.

Pada analisis ini digunakan Bike Sharing Dataset, yaitu dataset yang berisi informasi mengenai aktivitas penyewaan sepeda harian. Dataset ini memuat beberapa variabel seperti tanggal (dteday), musim (season), temperatur (temp), kelembaban (hum), kecepatan angin (windspeed), serta jumlah total penyewaan sepeda (cnt). Dengan memanfaatkan bahasa pemrograman R programming language dan paket visualisasi ggplot2, dilakukan eksplorasi data untuk melihat bagaimana jumlah penyewaan sepeda berubah dari waktu ke waktu.

Untuk mengetahui variabel apa saja yang terdapat dalam dataset, digunakan fungsi colnames() untuk menampilkan nama setiap kolom pada data.

##  [1] "instant"    "dteday"     "season"     "yr"         "mnth"      
##  [6] "holiday"    "weekday"    "workingday" "weathersit" "temp"      
## [11] "atemp"      "hum"        "windspeed"  "casual"     "registered"
## [16] "cnt"

Sebelum dilakukan visualisasi data, dataset terlebih dahulu ditampilkan dalam bentuk tabel untuk memberikan gambaran awal mengenai struktur dan nilai pada setiap variabel.

Visualisasi 1

Visualisasi pertama menampilkan grafik garis yang menggambarkan perubahan jumlah penyewaan sepeda (cnt) dari waktu ke waktu berdasarkan variabel tanggal (dteday). Grafik ini memberikan gambaran awal mengenai bagaimana aktivitas penyewaan sepeda berubah sepanjang periode pengamatan. Dengan menggunakan geom_line(), setiap titik data dihubungkan sehingga membentuk pola perubahan jumlah penyewaan sepeda dari hari ke hari.

Berdasarkan grafik tersebut terlihat bahwa jumlah penyewaan sepeda mengalami fluktuasi yang cukup besar sepanjang waktu. Pada beberapa periode terlihat adanya peningkatan jumlah penyewaan sepeda yang cukup signifikan, sementara pada periode lain terjadi penurunan. Fluktuasi ini menunjukkan bahwa penggunaan sepeda tidak selalu stabil dan kemungkinan dipengaruhi oleh berbagai faktor seperti kondisi cuaca, musim, maupun aktivitas masyarakat.

Visualisasi 2

Pada visualisasi kedua ditambahkan garis smoothing menggunakan metode LOESS untuk membantu melihat pola tren secara lebih jelas. Metode smoothing digunakan untuk mengurangi variasi acak pada data harian sehingga pola umum yang terdapat dalam data dapat terlihat dengan lebih mudah. Pada kode yang digunakan, garis smoothing ditambahkan menggunakan fungsi geom_smooth() dengan parameter tertentu untuk menghasilkan kurva yang lebih halus.

Jika dibandingkan dengan grafik pertama, garis smoothing memberikan gambaran tren yang lebih stabil karena fluktuasi kecil pada data harian telah dihaluskan. Melalui garis ini dapat terlihat kecenderungan perubahan jumlah penyewaan sepeda secara lebih jelas dalam periode pengamatan. Dengan demikian, visualisasi kedua melengkapi visualisasi pertama dengan membantu mengidentifikasi tren umum yang mungkin tidak terlalu terlihat pada grafik data mentah.

Kesimpulan

Berdasarkan hasil visualisasi data time series pada dataset penyewaan sepeda, dapat dilihat bahwa jumlah penyewaan sepeda mengalami fluktuasi dari waktu ke waktu. Grafik time series dasar memberikan gambaran mengenai variasi harian pada jumlah penyewaan sepeda, sedangkan penggunaan metode smoothing membantu memperjelas tren umum yang terdapat dalam data tersebut.

Melalui kedua visualisasi tersebut dapat disimpulkan bahwa visualisasi data sangat membantu dalam memahami pola pada data time series. Dengan memahami pola tersebut, peneliti dapat memperoleh gambaran awal mengenai karakteristik data sebelum melakukan analisis statistik yang lebih lanjut.