Studi Kasus

Dataset ini berasal dari sistem bike sharing di Washington, D.C., yang diperoleh dari UCI Machine Learning Repository. Dataset tersebut mencatat aktivitas penyewaan sepeda berdasarkan waktu (harian) selama dua tahun, lengkap dengan informasi terkait cuaca, musim, hari kerja, hari libur, serta tipe pengguna (casual dan registered). Karena data memiliki komponen waktu, maka analisis yang digunakan termasuk dalam analisis data time series, yaitu analisis yang memperhatikan perubahan suatu variabel dari waktu ke waktu.

Setelah memahami konteks pengumpulan data, langkah selanjutnya adalah menganalisis pola penyewaan sepeda sepanjang waktu untuk melihat bagaimana tren, variasi musiman, dan fluktuasi jumlah penyewaan terjadi dari hari ke hari. Analisis ini penting untuk memahami perilaku pengguna serta faktor-faktor yang mungkin memengaruhi perubahan jumlah penyewaan sepeda.

Pada tahap ini, analis mulai mengajukan pertanyaan:

Bagaimana perubahan jumlah penyewaan sepeda dari waktu ke waktu selama periode 2011–2012??

Untuk menjawab pertanyaan tersebut digunakan visualisasi data time series, yaitu visualisasi yang menampilkan perubahan nilai variabel terhadap waktu. Misalnya, line plot digunakan untuk memperlihatkan tren jumlah penyewaan sepeda (cnt) dari waktu ke waktu. Visualisasi ini membantu mengidentifikasi apakah terjadi peningkatan atau penurunan jumlah penyewaan dalam periode tertentu

Memuat Data dan Menjelajahi Struktur Data

Data diimpor dari file berformat CSV ke dalam R dengan menggunakan fungsi read.csv(). Pastikan lokasi atau path file disesuaikan dengan folder tempat dataset tersimpan di komputer Anda agar proses pembacaan data berjalan dengan benar. Berikut merupakan contoh kode yang digunakan untuk memuat data tersebut:

bike_data <- read.csv("C:/Users/User/Downloads/day.csv")
colnames(bike_data)
##  [1] "instant"    "dteday"     "season"     "yr"         "mnth"      
##  [6] "holiday"    "weekday"    "workingday" "weathersit" "temp"      
## [11] "atemp"      "hum"        "windspeed"  "casual"     "registered"
## [16] "cnt"

Berdasarkan output yang ditampilkan, dataset ini memiliki 16 variabel yang terdiri dari variabel numerik dan kategorik. Variabel numerik yang ada antara lain temp, atemp, hum, windspeed, casual, registered, dan cnt. Variabel-variabel tersebut memberikan informasi mengenai suhu, suhu terasa, kelembapan, kecepatan angin, jumlah penyewaan oleh pengguna casual, jumlah penyewaan oleh pengguna registered, serta total keseluruhan penyewaan sepeda.

Deskripsi Data Numerik
No Variabel.Numerik Keterangan
1 temp suhu dalam skala Celsius
2 atemp suhu yang dirasakan
3 hum kelembapan
4 windspeed kecepatan angin
5 casual jumlah penyewaan sepeda oleh pengguna kasual
6 registered jumlah penyewaan sepeda oleh pengguna terdaftar
7 cnt total jumlah penyewaan sepeda (casual + registered)

Sementara itu, variabel kategorik seperti season, weathersit, dan workingday dilakukan proses recode agar lebih mudah dibaca dan dipahami saat analisis maupun visualisasi. Dengan recode ini, angka-angka yang sebelumnya mewakili kategori akan diganti menjadi label yang lebih jelas. Tujuannya supaya interpretasi jadi lebih sederhana. Misalnya, saat membuat grafik jumlah penyewaan berdasarkan musim, kita bisa langsung melihat label “Spring”, “Summer”, “Fall”, atau “Winter” tanpa harus mengingat kode angka masing-masing musim. Visualisasi jadi lebih enak dilihat dan lebih mudah dipahami oleh orang yang membaca. Meskipun dilakukan recode, struktur datanya tetap sama. Yang berubah hanya penyajian nilai pada variabel kategoriknya menjadi lebih deskriptif, sehingga analisis dan visualisasi selanjutnya bisa dibuat lebih informatif dan tidak membingungkan.

Visualisasi Data

Line Chart

Line chart digunakan untuk menampilkan perubahan jumlah penyewaan sepeda berdasarkan urutan waktu selama periode 2011–2012. Grafik ini membantu dalam melihat pola tren, fluktuasi dari hari ke hari, serta kecenderungan naik atau turunnya jumlah penyewaan sepeda pada periode tertentu. Melalui visualisasi ini, pola penggunaan sepeda sepanjang waktu dapat diamati dengan lebih jelas, termasuk kemungkinan adanya pola musiman dalam data.

bike_data$dteday <- as.Date(bike_data$dteday)

ggplot(bike_data, aes(x = dteday, y = cnt)) +
  geom_line(color = "pink2", linewidth = 1) +
  labs(
    title = "Perubahan Jumlah Penyewaan Sepeda (2011–2012)",
    x = "Tanggal",
    y = "Jumlah Penyewaan Sepeda"
  ) +
  theme_minimal()

Berdasarkan line chart jumlah penyewaan sepeda dari tahun 2011 hingga 2012, terlihat bahwa jumlah penyewaan mengalami fluktuasi dari waktu ke waktu. Pada beberapa periode jumlah penyewaan meningkat cukup tinggi, sementara pada periode lain terlihat penurunan.

Selain itu, grafik juga menunjukkan adanya pola musiman, di mana jumlah penyewaan cenderung lebih tinggi pada waktu-waktu tertentu dan lebih rendah pada periode lainnya. Secara umum, jumlah penyewaan sepeda pada tahun 2012 terlihat lebih tinggi dibandingkan tahun 2011, yang menunjukkan adanya peningkatan penggunaan layanan bike sharing dari waktu ke waktu.

Hal ini menunjukkan bahwa penggunaan sepeda tidak bersifat tetap setiap hari, melainkan dipengaruhi oleh berbagai faktor seperti musim, kondisi cuaca, maupun aktivitas masyarakat.

Scatter Plot

Scatter plot digunakan untuk menampilkan sebaran jumlah penyewaan sepeda berdasarkan urutan waktu selama periode 2011–2012. Grafik ini membantu dalam melihat variasi data dari hari ke hari serta pola penyebaran titik yang menunjukkan fluktuasi jumlah penyewaan sepeda.

bike_data$dteday <- as.Date(bike_data$dteday)

ggplot(bike_data, aes(x = dteday, y = cnt)) +
  geom_point(color = "pink2", size = 2) +
  labs(
    title = "Scatter Plot Jumlah Penyewaan Sepeda (2011–2012)",
    x = "Tanggal",
    y = "Jumlah Penyewaan Sepeda"
  ) +
  theme_minimal()

Scatter plot menunjukkan bahwa jumlah penyewaan sepeda memiliki pola musiman yang jelas, yaitu cenderung rendah di awal dan akhir tahun serta meningkat di pertengahan tahun. Selain itu, terlihat bahwa pada tahun 2012 jumlah penyewaan umumnya lebih tinggi dibandingkan tahun 2011, yang menandakan adanya peningkatan penggunaan sepeda dari waktu ke waktu. Titik-titik yang menyebar juga menunjukkan adanya variasi harian yang cukup besar, kemungkinan dipengaruhi oleh faktor lain seperti cuaca atau hari libur.

Kesimpulan

Berdasarkan hasil visualisasi menggunakan line chart dan scatter plot, dapat disimpulkan bahwa jumlah penyewaan sepeda selama periode 2011–2012 mengalami perubahan yang dinamis dari waktu ke waktu. Terlihat adanya tren peningkatan, di mana jumlah penyewaan pada tahun 2012 umumnya lebih tinggi dibandingkan tahun 2011. Selain itu, pola musiman juga cukup jelas, dengan jumlah penyewaan yang cenderung meningkat pada pertengahan tahun dan menurun pada awal serta akhir tahun. Fluktuasi harian yang terjadi menunjukkan bahwa penyewaan sepeda tidak konstan, melainkan dipengaruhi oleh berbagai faktor seperti cuaca, hari libur, dan aktivitas masyarakat.