Pendahuluan

Visualisasi data merupakan salah satu langkah penting dalam analisis data karena dapat membantu memahami pola, tren, serta hubungan antar variabel secara lebih jelas. Salah satu bentuk visualisasi yang sering digunakan dalam analisis data adalah visualisasi data time series. Data time series adalah data yang dikumpulkan secara berurutan berdasarkan waktu, seperti per hari, per bulan, atau per tahun. Dalam studi kasus ini digunakan data jumlah penyewaan sepeda (Bike Sharing Dataset) yang berisi informasi mengenai jumlah sepeda yang disewa dalam periode waktu tertentu. Dataset ini mencatat berbagai informasi terkait aktivitas penyewaan sepeda, seperti tanggal pengamatan, kondisi cuaca, serta jumlah total sepeda yang disewa pada hari tersebut.

Melalui visualisasi tersebut diharapkan dapat menjawab pertanyaan analisis berikut antara lain:

  1. Bagaimana pola perubahan jumlah penyewaan sepeda dari waktu ke waktu?

  2. Apakah terdapat tren peningkatan atau penurunan dalam jumlah penyewaan sepeda selama periode pengamatan?

  3. Kapan periode dengan jumlah penyewaan sepeda tertinggi dan terendah terjadi?

  4. Bagaimana tren jangka panjang penyewaan sepeda setelah fluktuasi harian diminimalkan menggunakan metode smoothing atau moving average?

Sebelum itu, lakukan import data dari file CSV ke dalam R menggunakan fungsi read.csv() atau jika dari file Excel maka gunakan fungsi read_excel().

library(readxl)
bike_data <- read_excel("~/DataBikeSharing.xlsx")
colnames(bike_data)
##  [1] "instant"    "dteday"     "season"     "yr"         "mnth"      
##  [6] "holiday"    "weekday"    "workingday" "weathersit" "temp"      
## [11] "atemp"      "hum"        "windspeed"  "casual"     "registered"
## [16] "cnt"

Berdasarkan output di atas, terdapat 16 variabel dalam dataset tersebut, baik variabel numerik maupun kategorik. Variabel numeriknya antara lain temp, atemp, hum, windspeed, casual, registered, dan cnt. Sedangkan variabel kategoriknya antara lain seperti season, weathersit, dan workingday. Beberapa variabel kategorik tersebut telah dilakukan proses recode sehingga memiliki label yang lebih deskriptif (misalnya “Spring”, “Summer”, “Fall”, “Winter”). Proses recode ini tidak mengubah struktur data, justru memudahkan kita membuat visualisasi menjadi lebih informatif dan mudah dipahami oleh pembaca. Berikut tampilan dataset yang akan digunakan:

Visualisasi Data

Setelah import dan memuat data, maka kita akan melakukan visualisasi dengan data tersebut. Variabel utama yang akan digunakan antara lain tanggal (dteday) sebagai penanda waktu dan jumlah penyewaan sepeda (cnt) sebagai variabel yang diamati. Selain itu, variabel kondisi cuaca (weather) juga digunakan untuk melihat bagaimana kondisi lingkungan dapat memengaruhi jumlah penyewaan sepeda.

Line Plot

ggplot(bike_data, aes(x = dteday, y = cnt)) +
  geom_line(color = "orchid4") +
  labs(
    title = "Tren Jumlah Penyewaan Sepeda",
    x = "Tanggal",
    y = "Jumlah Sepeda Disewa"
  ) +
  theme_minimal()

Grafik line plot ini menunjukkan jumlah penyewaan sepeda mengalami perubahan yang cukup besar setiap harinya. Pada awal tahun 2011 jumlah penyewaan masih relatif rendah, yaitu sekitar seribuan sepeda per hari. Seiring berjalannya waktu, jumlah penyewaan sepeda tersebut cenderung meningkat hingga pertengahan tahun 2011, lalu mengalami beberapa penurunan dan kenaikan kecil. Memasuki tahun 2012, jumlah penyewaan terlihat meningkat lebih tinggi dibanding tahun sebelumnya, bahkan pada beberapa periode mencapai lebih dari sekitar 7.000–8.000 penyewaan per hari. Namun, di akhir periode pengamatan terlihat jumlah penyewaan mengalami penurunan kembali. Berdasarkan grafik ini, perubahan yang terjadi kemungkinan dipengaruhi oleh berbagai faktor seperti cuaca, hari kerja atau akhir pekan, maupun musim.

Line Plot dengan Smoothing

ggplot(bike_data, aes(x = dteday, y = cnt)) +
    geom_line(alpha = 0.4, color = "wheat4") +
    geom_smooth(method = "loess", color = "violetred4", se = FALSE) +
    labs(
        title = "Tren Penyewaan Sepeda dengan Smoothing",
        x = "Tanggal",
        y = "Jumlah Sepeda Disewa"
    ) +
    theme_minimal()

Grafik di atas menampilkan data yang sama tetapi dilengkapi dengan garis smoothing yang berfungsi untuk memperlihatkan tren umum secara lebih jelas dengan mengurangi pengaruh pola perubahan harian. Dari garis lengkungan yang terlihat, dapat diketahui bahwa penyewaan sepeda pada awal tahun 2011 menunjukkan peningkatan yang cukup jelas hingga sekitar pertengahan tahun. Setelah itu, penyewaan sepeda mengalami sedikit penurunan menjelang akhir tahun 2011. Lalu memasuki tahun 2012, kembali meningkat dengan cukup signifikan dan mencapai puncaknya pada pertengahan hingga akhir tahun 2012. Setelah mencapai titik tersebut, jumlah penyewaan sepeda mulai menunjukkan kecenderungan menurun menjelang akhir periode pengamatan. Dengan adanya smoothing ini, pola perubahan jangka panjang menjadi lebih mudah dipahami, yaitu bahwa jumlah penggunaan sepeda secara umum meningkat dari tahun 2011 ke 2012 sebelum akhirnya sedikit menurun di akhir periode.

Boxplot

ggplot(bike_data, aes(x=weathersit, y=cnt)) +
  geom_boxplot(fill="rosybrown") +
  labs(title="Distribusi Penyewaan Sepeda Berdasarkan Kondisi Cuaca",
       x="Cuaca",
       y="Jumlah Penyewaan")

Boxplot ini menunjukkan bagaimana jumlah penyewaan sepeda berbeda pada beberapa kondisi cuaca, yaitu cerah (Clear), berawan (Cloudy), dan hujan ringan (Light Rain). Pada cuaca cerah, jumlah penyewaan sepeda cenderung paling tinggi. Nilai tengah (median) penyewaan berada di sekitar 4.800–5.000 sepeda per hari. Selain itu, rentang data juga cukup lebar, yang menunjukkan bahwa pada beberapa hari jumlah penyewaan bisa jauh lebih tinggi. Hal ini menunjukkan bahwa ketika cuaca cerah, masyarakat lebih tertarik untuk menggunakan sepeda.

Lalu pada cuaca berawan, jumlah penyewaan sepeda masih cukup tinggi, namun sedikit lebih rendah dibandingkan saat cuaca cerah. Nilai tengah penyewaan berada di sekitar 4.000 sepeda per hari, yang menunjukkan bahwa kondisi berawan masih cukup mendukung aktivitas bersepeda. Sementara itu, pada kondisi hujan ringan, jumlah penyewaan sepeda terlihat jauh lebih rendah dibandingkan dua kondisi cuaca lainnya. Nilai tengah penyewaan hanya sekitar 1.700–2.000 sepeda per hari. Hal ini menunjukkan bahwa ketika terjadi hujan, meskipun hanya ringan, minat masyarakat untuk menyewa sepeda cenderung menurun. Sehingga dapat disimpulkan, semakin baik kondisi cuaca, semakin tinggi pula jumlah penyewaan sepeda. Sebaliknya, ketika cuaca kurang mendukung seperti saat hujan, jumlah penyewaan sepeda cenderung menurun.

Kesimpulan

Berdasarkan hasil visualisasi data yang telah dilakukan sebelumnya terhadap data penyewaan sepeda, dapat diperoleh beberapa kesimpulan terkait julah penyewaan sepeda selama periode pengamatan.

  1. Pola perubahan jumlah penyewaan sepeda dari waktu ke waktu menunjukkan adanya perubahan harian yang cukup besar, di mana jumlah penyewaan dapat meningkat atau menurun secara signifikan pada hari-hari tertentu. Meskipun demikian, secara umum terlihat bahwa jumlah penyewaan ini cenderung meningkat dari awal periode pengamatan hingga mencapai titik tertentu sebelum akhirnya kembali menurun menjelang akhir periode.

  2. Dari visualisasi juga menunjukkan bahwa terdapat peningkatan jumlah penyewaan sepeda dari tahun 2011 hingga pertengahan tahun 2012. Setelah mencapai puncaknya pada sekitar pertengahan hingga akhir tahun 2012, jumlah penyewaan sepeda menunjukkan kecenderungan menurun menjelang akhir periode pengamatan.

  3. Periode dengan jumlah penyewaan sepeda tertinggi umumnya terjadi pada pertengahan hingga akhir tahun 2012, yang mencapai sekitaran 7.000 hingga 8.000 sepeda per hari. Sebaliknya, jumlah penyewaan terendah umumnya terjadi pada awal periode pengamatan di tahun 2011 serta pada beberapa hari tertentu yang kemungkinan dipengaruhi oleh kondisi yang kurang mendukung.

  4. Setelah perubahan harian diminimalkan melalui metode smoothing, terlihat bahwa tren jangka panjang penyewaan sepeda menunjukkan pola peningkatan yang cukup jelas pada awal hingga pertengahan periode, yang kemudian diikuti dengan penurunan secara bertahap menjelang akhir periode pengamatan dalam dataset.

Sehingga secara keseluruhan, visualisasi data menunjukkan bahwa penggunaan layanan penyewaan sepeda mengalami perkembangan yang cukup signifikan selama periode pengamatan, namun tetap dipengaruhi oleh berbagai faktor yang menyebabkan perubahan dalam jumlah penyewaan dari waktu ke waktu. Visualisasi ini juga membantu memberikan gambaran yang lebih jelas mengenai dinamika penggunaan layanan penyewaan sepeda sehingga dapat menjadi dasar untuk analisis lebih lanjut, bahkan untuk menentukan kebijakan atau untuk perencanaan layanan sepeda yang lebih efektif terhadap kondisi lingkungan.