Dataset ini berasal dari sistem bike sharing di Washington, D.C., yang diperoleh dari UCI Machine Learning Repository. Dataset tersebut mencatat aktivitas penyewaan sepeda berdasarkan waktu (harian) selama dua tahun, lengkap dengan informasi terkait cuaca, musim, hari kerja, hari libur, serta tipe pengguna (casual dan registered). Karena data memiliki komponen waktu, maka analisis yang digunakan termasuk dalam analisis data time series, yaitu analisis yang memperhatikan perubahan suatu variabel dari waktu ke waktu.
Setelah memahami konteks pengumpulan data, langkah selanjutnya adalah menganalisis pola penyewaan sepeda sepanjang waktu untuk melihat bagaimana tren, variasi musiman, dan fluktuasi jumlah penyewaan terjadi dari hari ke hari. Analisis ini penting untuk memahami perilaku pengguna serta faktor-faktor yang mungkin memengaruhi perubahan jumlah penyewaan sepeda.
Pada tahap ini, analis mulai mengajukan pertanyaan:
Bagaimana perubahan jumlah penyewaan sepeda dari waktu ke waktu selama periode 2011–2012??
Untuk menjawab pertanyaan tersebut digunakan visualisasi data time series, yaitu visualisasi yang menampilkan perubahan nilai variabel terhadap waktu. Misalnya, line plot digunakan untuk memperlihatkan tren jumlah penyewaan sepeda (cnt) dari waktu ke waktu. Visualisasi ini membantu mengidentifikasi apakah terjadi peningkatan atau penurunan jumlah penyewaan dalam periode tertentu
Data diimpor dari file berformat CSV ke dalam R dengan menggunakan
fungsi read.csv(). Pastikan lokasi atau path file
disesuaikan dengan folder tempat dataset tersimpan di komputer Anda agar
proses pembacaan data berjalan dengan benar. Berikut merupakan contoh
kode yang digunakan untuk memuat data tersebut:
bike_data <- read.csv("C:/Users/User/Downloads/day.csv")
colnames(bike_data)
## [1] "instant" "dteday" "season" "yr" "mnth"
## [6] "holiday" "weekday" "workingday" "weathersit" "temp"
## [11] "atemp" "hum" "windspeed" "casual" "registered"
## [16] "cnt"
Berdasarkan output yang ditampilkan, dataset ini memiliki 16 variabel
yang terdiri dari variabel numerik dan kategorik. Variabel numerik yang
ada antara lain temp, atemp, hum,
windspeed, casual, registered,
dan cnt. Variabel-variabel tersebut memberikan informasi
mengenai suhu, suhu terasa, kelembapan, kecepatan angin, jumlah
penyewaan oleh pengguna casual, jumlah penyewaan oleh pengguna
registered, serta total keseluruhan penyewaan sepeda.
| No | Variabel.Numerik | Keterangan |
|---|---|---|
| 1 | temp | suhu dalam skala Celsius |
| 2 | atemp | suhu yang dirasakan |
| 3 | hum | kelembapan |
| 4 | windspeed | kecepatan angin |
| 5 | casual | jumlah penyewaan sepeda oleh pengguna kasual |
| 6 | registered | jumlah penyewaan sepeda oleh pengguna terdaftar |
| 7 | cnt | total jumlah penyewaan sepeda (casual + registered) |
Sementara itu, variabel kategorik seperti season,
weathersit, dan workingday dilakukan proses
recode agar lebih mudah dibaca dan dipahami saat analisis maupun
visualisasi. Dengan recode ini, angka-angka yang sebelumnya mewakili
kategori akan diganti menjadi label yang lebih jelas. Tujuannya supaya
interpretasi jadi lebih sederhana. Misalnya, saat membuat grafik jumlah
penyewaan berdasarkan musim, kita bisa langsung melihat label “Spring”,
“Summer”, “Fall”, atau “Winter” tanpa harus mengingat kode angka
masing-masing musim. Visualisasi jadi lebih enak dilihat dan lebih mudah
dipahami oleh orang yang membaca. Meskipun dilakukan recode, struktur
datanya tetap sama. Yang berubah hanya penyajian nilai pada variabel
kategoriknya menjadi lebih deskriptif, sehingga analisis dan visualisasi
selanjutnya bisa dibuat lebih informatif dan tidak membingungkan.
Line chart digunakan untuk menampilkan perubahan jumlah penyewaan sepeda berdasarkan urutan waktu selama periode 2011–2012. Grafik ini membantu dalam melihat pola tren, fluktuasi dari hari ke hari, serta kecenderungan naik atau turunnya jumlah penyewaan sepeda pada periode tertentu. Melalui visualisasi ini, pola penggunaan sepeda sepanjang waktu dapat diamati dengan lebih jelas, termasuk kemungkinan adanya pola musiman dalam data.
bike_data$dteday <- as.Date(bike_data$dteday)
ggplot(bike_data, aes(x = dteday, y = cnt)) +
geom_line(color = "pink2", linewidth = 1) +
labs(
title = "Perubahan Jumlah Penyewaan Sepeda (2011–2012)",
x = "Tanggal",
y = "Jumlah Penyewaan Sepeda"
) +
theme_minimal()
Berdasarkan line chart jumlah penyewaan sepeda dari tahun 2011 hingga 2012, terlihat bahwa jumlah penyewaan mengalami fluktuasi dari waktu ke waktu. Pada beberapa periode jumlah penyewaan meningkat cukup tinggi, sementara pada periode lain terlihat penurunan.
Selain itu, grafik juga menunjukkan adanya pola musiman, di mana jumlah penyewaan cenderung lebih tinggi pada waktu-waktu tertentu dan lebih rendah pada periode lainnya. Secara umum, jumlah penyewaan sepeda pada tahun 2012 terlihat lebih tinggi dibandingkan tahun 2011, yang menunjukkan adanya peningkatan penggunaan layanan bike sharing dari waktu ke waktu.
Hal ini menunjukkan bahwa penggunaan sepeda tidak bersifat tetap setiap hari, melainkan dipengaruhi oleh berbagai faktor seperti musim, kondisi cuaca, maupun aktivitas masyarakat.
Scatter plot digunakan untuk menampilkan sebaran jumlah penyewaan sepeda berdasarkan urutan waktu selama periode 2011–2012. Grafik ini membantu dalam melihat variasi data dari hari ke hari serta pola penyebaran titik yang menunjukkan fluktuasi jumlah penyewaan sepeda.
bike_data$dteday <- as.Date(bike_data$dteday)
ggplot(bike_data, aes(x = dteday, y = cnt)) +
geom_point(color = "pink2", size = 2) +
labs(
title = "Scatter Plot Jumlah Penyewaan Sepeda (2011–2012)",
x = "Tanggal",
y = "Jumlah Penyewaan Sepeda"
) +
theme_minimal()
Scatter plot menunjukkan bahwa jumlah penyewaan sepeda memiliki pola musiman yang jelas, yaitu cenderung rendah di awal dan akhir tahun serta meningkat di pertengahan tahun. Selain itu, terlihat bahwa pada tahun 2012 jumlah penyewaan umumnya lebih tinggi dibandingkan tahun 2011, yang menandakan adanya peningkatan penggunaan sepeda dari waktu ke waktu. Titik-titik yang menyebar juga menunjukkan adanya variasi harian yang cukup besar, kemungkinan dipengaruhi oleh faktor lain seperti cuaca atau hari libur.
Berdasarkan hasil visualisasi menggunakan line chart dan scatter plot, dapat disimpulkan bahwa jumlah penyewaan sepeda selama periode 2011–2012 mengalami perubahan yang dinamis dari waktu ke waktu. Terlihat adanya tren peningkatan, di mana jumlah penyewaan pada tahun 2012 umumnya lebih tinggi dibandingkan tahun 2011. Selain itu, pola musiman juga cukup jelas, dengan jumlah penyewaan yang cenderung meningkat pada pertengahan tahun dan menurun pada awal serta akhir tahun. Fluktuasi harian yang terjadi menunjukkan bahwa penyewaan sepeda tidak konstan, melainkan dipengaruhi oleh berbagai faktor seperti cuaca, hari libur, dan aktivitas masyarakat.