Bike Sharing Dataset
Atiqah Adawiyah Sholihah
Dataset yang digunakan dalam analisis ini merupakan data penyewaan sepeda harian (bike sharing) yang berasal dari sistem bike sharing di Washington, D.C. Dataset ini tersedia secara publik melalui UCI Machine Learning Repository dan dapat diakses di sini.
Dataset yang digunakan dalam analisis ini merupakan data penyewaan sepeda harian (bike sharing) yang berasal dari sistem di Washington, D.C., yang mencatat aktivitas selama periode dua tahun (2011–2012). Dataset ini menyediakan informasi komprehensif mengenai kondisi lingkungan—seperti suhu, kelembaban, dan kecepatan angin—serta variabel waktu yang krusial untuk analisis deret waktu (time series).
Berbeda dengan analisis bivariat yang cenderung melihat hubungan antarvariabel pada satu titik waktu, analisis deret waktu berfokus pada dinamika data yang berubah seiring dengan berjalannya waktu. Pendekatan ini sangat relevan karena penggunaan layanan bike sharing cenderung memiliki pola ketergantungan waktu yang kuat, baik itu bersifat musiman (seasonality) maupun tren pertumbuhan jangka panjang.
Pada analisis ini, fokus utama dialihkan untuk menjawab pertanyaan-pertanyaan strategis berbasis temporal:
Tabel berikut menyajikan rincian variabel numerik yang digunakan dalam analisis ini. Selain variabel-variabel tersebut, terdapat variabel dteday (tanggal) yang menjadi variabel utama dalam analisis time series untuk memetakan tren dan pola musiman.
| No. | Variabel Numerik | Keterangan |
|---|---|---|
| 1. | dteday |
anggal observasi (YYYY-MM-DD) sebagai sumbu waktu |
| 2. | temp |
suhu aktual (dinormalisasi dalam skala 0–1) |
| 3. | atemp |
suhu yang dirasakan (feeling temperature) |
| 4. | hum |
tingkat kelembaban udara |
| 5. | windspeed |
kecepatan angin |
| 6. | casual |
jumlah penyewaan sepeda oleh pengguna kasual |
| 7. | registered |
jumlah penyewaan sepeda oleh pengguna terdaftar |
| 8. | cnt |
total penyewaan sepeda (casual + registered) |
Sedangkan variabel-variabel kategorik seperti season, yr, mnth, holiday, workingday, dan weathersit telah dilakukan proses recoding agar lebih mudah dipahami dalam visualisasi. Dengan mengganti kode numerik menjadi label deskriptif, interpretasi pola musiman dan tren pada grafik menjadi lebih intuitif dan informatif bagi pembaca.
## [1] "instant" "dteday" "season" "yr" "mnth"
## [6] "holiday" "weekday" "workingday" "weathersit" "temp"
## [11] "atemp" "hum" "windspeed" "casual" "registered"
## [16] "cnt"
Setelah memahami karakteristik variabel, langkah selanjutnya adalah analisis deret waktu (time series). Analisis ini mengeksplorasi bagaimana jumlah penyewaan sepeda (cnt) berubah dan berfluktuasi seiring berjalannya waktu. Dengan menggunakan pendekatan ini, kita dapat mengidentifikasi pola tren jangka panjang, siklus musiman yang berulang, serta respons sistem terhadap perubahan kondisi eksternal secara berkelanjutan.
Pertanyaan:
Bagaimana tren jangka panjang penyewaan sepeda selama dua tahun
(2011-2012)?
Grafik ini menunjukkan naik-turunnya jumlah penyewaan sepeda setiap harinya. Angkanya sangat bervariasi, dari yang paling sepi di bawah 1.000 penyewaan per hari hingga yang paling ramai mencapai 8.000 sampai 9.000 penyewaan. Garis merah yang melengkung menunjukkan arah tren secara keseluruhan. Karena garis tersebut miring ke atas, ini membuktikan bahwa dari tahun 2011 ke 2012, minat masyarakat untuk menggunakan layanan sepeda ini semakin meningkat.
Pertanyaan:
Apakah ada pola keramaian yang selalu sama di setiap bulannya?
Grafik ini memperlihatkan “siklus” atau kebiasaan pengguna sepeda sepanjang tahun. Setiap awal tahun, tepatnya di bulan Januari, penyewaan selalu berada di titik terendah dengan rata-rata 2.000-2.500 penyewaan per hari. Namun, jumlah ini terus bertambah dan memuncak pada pertengahan tahun, yaitu bulan Juni hingga September, di mana rata-rata penyewaan harian bisa tembus di atas 5.500. Menariknya, rata-rata penyewaan di tahun 2012 selalu lebih tinggi dibandingkan tahun 2011, yang artinya sistem penyewaan sepeda ini semakin sukses di tahun kedua.
Pertanyaan:
Seberapa besar pengaruh cuaca terhadap jumlah penyewaan sepeda?
Visualisasi ini memisahkan data berdasarkan kondisi cuaca agar kita bisa melihat pengaruhnya dengan lebih objektif:
Kondisi Cerah (Clear): Merupakan waktu paling ideal bagi pengguna. Jumlah penyewaan sangat tinggi, seringkali berada di atas angka 6.000 per hari dengan pola yang sangat stabil.
Kondisi Berawan (Cloudy): Terjadi penurunan jumlah penyewaan dibandingkan saat cuaca cerah, namun aktivitas tetap terlihat cukup rutin di kisaran angka 4.000 hingga 5.000 penyewaan.
Kondisi Hujan Ringan (Light Rain): Kondisi ini memiliki dampak negatif yang paling nyata. Jumlah penyewaan anjlok drastis hingga di bawah angka 2.000 penyewaan per hari. Garis yang tidak beraturan pada kondisi ini menunjukkan bahwa saat cuaca buruk, orang cenderung menghindari penggunaan sepeda, yang pada akhirnya membuat pola penyewaan menjadi tidak konsisten.
Berdasarkan analisis deret waktu (time series) yang telah dilakukan terhadap data penyewaan sepeda selama periode 2011–2012, dapat ditarik beberapa kesimpulan strategis sebagai berikut:
Pertumbuhan Positif: Layanan bike sharing di Washington, D.C. menunjukkan tren pertumbuhan yang sehat. Hal ini dibuktikan dengan meningkatnya total volume penyewaan secara stabil dari tahun 2011 ke tahun 2012.
Pola Musiman yang Kuat: Terdapat ritme atau siklus tahunan yang sangat jelas. Permintaan penyewaan sepeda selalu mencapai titik terendah pada awal tahun (Januari) dan melonjak drastis hingga mencapai puncaknya pada pertengahan tahun (Juni hingga September). Pola yang berulang ini menunjukkan bahwa penggunaan sepeda sangat dipengaruhi oleh perubahan musim.
Cuaca sebagai Penentu Utama: Kondisi cuaca adalah faktor paling krusial yang menentukan volume penyewaan harian. Cuaca cerah menjadi pendukung utama stabilitas jumlah pengguna, sementara kondisi cuaca buruk seperti hujan ringan menjadi penghambat yang signifikan, yang menyebabkan penurunan volume penyewaan secara drastis serta pola penggunaan yang tidak teratur.
Secara keseluruhan, sistem penyewaan sepeda ini terbukti memiliki basis pengguna yang semakin luas di tahun kedua. Untuk perencanaan ke depan, manajemen layanan dapat memanfaatkan temuan pola musiman ini untuk mengoptimalkan ketersediaan armada, serta menyiapkan strategi khusus (seperti promosi atau penyesuaian operasional) guna memitigasi dampak cuaca buruk terhadap penurunan jumlah pengguna.