Studi kasus ini menggunakan dataset Bike Sharing Daily Data (day.csv) yang berisi data penyewaan sepeda harian selama periode tahun 2011–2012. Setiap baris data merepresentasikan satu hari pengamatan dengan berbagai informasi yang mencakup aspek waktu, kondisi lingkungan, serta karakteristik penggunaan sepeda. Variabel utama yang dianalisis adalah total jumlah penyewaan sepeda (cnt) yang didukung oleh beberapa variabel lain seperti musim (season), kondisi cuaca (weathersit), suhu (temp dan atemp), kelembapan (hum), kecepatan angin (windspeed), serta jenis hari seperti hari kerja (workingday) dan hari libur (holiday).
Dalam studi ini, fokus utama analisis adalah visualisasi runtun waktu (time series) untuk melihat pola perubahan jumlah penyewaan sepeda dari waktu ke waktu selama periode pengamatan. Melalui visualisasi runtun waktu, dapat diamati bagaimana tren penggunaan sepeda berkembang sepanjang tahun, serta apakah terdapat pola musiman atau fluktuasi tertentu yang dipengaruhi oleh kondisi lingkungan maupun waktu tertentu.
Beberapa pertanyaan yang menjadi dasar dalam analisis ini antara lain:
Bagaimana pola perubahan jumlah penyewaan sepeda dari waktu ke waktu selama periode pengamatan?
Apakah terdapat tren peningkatan atau penurunan jumlah penyewaan sepeda pada periode tertentu?
Apakah terdapat pola musiman yang terlihat pada data penyewaan sepeda sepanjang tahun?
Melalui pendekatan visualisasi data runtun waktu, analisis ini bertujuan untuk menggambarkan secara jelas dinamika jumlah penyewaan sepeda dari hari ke hari. Dengan memanfaatkan grafik time series, pola tren, fluktuasi, dan kemungkinan pengaruh faktor waktu terhadap tingkat penggunaan sepeda dapat diidentifikasi secara lebih mudah. Hasil visualisasi ini diharapkan dapat memberikan pemahaman yang lebih baik mengenai perilaku penggunaan sepeda dalam sistem transportasi perkotaan serta menjadi dasar untuk analisis lanjutan yang lebih mendalam.
Import data dari file CSV ke dalam R menggunakan fungsi
read.csv(). Pastikan untuk menyesuaikan path file dengan
lokasi di mana dataset disimpan di komputer Anda. Berikut adalah kode
untuk memuat data:
# Load data
bike_data <- read.csv("C:/Users/USER/Downloads/day.csv")
colnames(bike_data)
## [1] "instant" "dteday" "season" "yr" "mnth"
## [6] "holiday" "weekday" "workingday" "weathersit" "temp"
## [11] "atemp" "hum" "windspeed" "casual" "registered"
## [16] "cnt"
Berdasarkan hasil output yang ditampilkan, dataset ini terdiri dari
16 variabel yang mencakup kombinasi variabel numerik dan kategorik.
Variabel numerik yang terdapat dalam dataset meliputi temp,
atemp, hum, windspeed,
casual, registered, dan cnt.
Variabel-variabel tersebut merepresentasikan informasi terkait kondisi
lingkungan seperti suhu, suhu yang dirasakan, kelembapan udara, serta
kecepatan angin, sekaligus data penggunaan sepeda, yaitu jumlah
penyewaan oleh pengguna kasual, jumlah penyewaan oleh pengguna
terdaftar, dan total keseluruhan penyewaan sepeda. Dengan demikian,
variabel numerik ini menjadi komponen utama dalam analisis kuantitatif
untuk memahami pola penggunaan sepeda dalam sistem bike sharing.
| No | Variabel.Numerik | Keterangan |
|---|---|---|
| 1 | temp | suhu dalam skala Celsius |
| 2 | atemp | suhu yang dirasakan |
| 3 | hum | kelembapan |
| 4 | windspeed | kecepatan angin |
| 5 | casual | jumlah penyewaan sepeda oleh pengguna kasual |
| 6 | registered | jumlah penyewaan sepeda oleh pengguna terdaftar |
| 7 | cnt | total jumlah penyewaan sepeda (casual + registered) |
Tabel tersebut menampilkan deskripsi variabel numerik yang terdapat dalam dataset penyewaan sepeda. Variabel-variabel tersebut berupa data kuantitatif yang digunakan untuk menganalisis faktor lingkungan dan jumlah penggunaan sepeda. Beberapa variabel menggambarkan kondisi lingkungan seperti suhu (temp), suhu yang dirasakan (atemp), kelembapan (hum), dan kecepatan angin (windspeed). Selain itu, terdapat variabel yang menunjukkan jumlah penyewaan sepeda, yaitu casual untuk pengguna tidak terdaftar, registered untuk pengguna terdaftar, serta cnt yang merupakan total keseluruhan penyewaan sepeda dari kedua jenis pengguna tersebut. Tabel ini membantu memahami arti setiap variabel yang digunakan dalam analisis data.
Line chart digunakan untuk menunjukkan perubahan jumlah penyewaan sepeda dari waktu ke waktu secara berurutan selama periode 2011–2012. Grafik garis memudahkan dalam melihat pola tren, fluktuasi harian, serta kecenderungan peningkatan atau penurunan jumlah penyewaan sepeda dalam rentang waktu tertentu. Dengan visualisasi ini, pengguna dapat memahami dinamika penggunaan sepeda sepanjang periode pengamatan serta kemungkinan adanya pola musiman dalam data.
# Mengubah kolom tanggal menjadi format Date
bike_data$dteday <- as.Date(bike_data$dteday)
# Visualisasi time series
ggplot(bike_data, aes(x = dteday, y = cnt)) +
geom_line(color = "steelblue", linewidth = 1) +
labs(
title = "Grafik Time Series Penyewaan Sepeda (2011–2012)",
x = "Tanggal",
y = "Total Penyewaan Sepeda"
) +
theme_minimal()
Grafik time series penyewaan sepeda tahun 2011–2012 menunjukkan bahwa jumlah penyewaan sepeda mengalami fluktuasi dari waktu ke waktu, namun secara umum terlihat adanya pola musiman dan kecenderungan peningkatan pada periode tertentu. Pada awal tahun, jumlah penyewaan relatif lebih rendah, kemudian meningkat pada pertengahan tahun dan mencapai puncaknya sekitar pertengahan hingga akhir tahun 2012. Hal ini menunjukkan bahwa penggunaan sepeda cenderung lebih tinggi pada periode tertentu, kemungkinan dipengaruhi oleh faktor musiman, kondisi cuaca, atau aktivitas masyarakat. Selain itu, terdapat beberapa penurunan tajam pada beberapa hari yang menunjukkan variasi penggunaan sepeda dari hari ke hari.
Scatter Plot digunakan untuk menunjukkan sebaran jumlah penyewaan sepeda terhadap waktu selama periode 2011–2012. Dengan scatter plot, setiap titik merepresentasikan jumlah penyewaan sepeda pada suatu tanggal tertentu sehingga memudahkan dalam melihat pola fluktuasi, kepadatan data, serta perubahan jumlah penyewaan dari waktu ke waktu. Visualisasi ini juga membantu mengidentifikasi tren umum, variasi data, serta kemungkinan adanya nilai yang sangat tinggi atau sangat rendah dalam dataset.
ggplot(bike_data, aes(x = dteday, y = cnt)) +
geom_point(color = "steelblue", alpha = 0.7, size = 2) +
labs(
title = "Scatter Plot Time Series Penyewaan Sepeda (2011–2012)",
x = "Tanggal",
y = "Total Penyewaan Sepeda"
) +
theme_minimal()
Scatter plot time series tersebut menunjukkan sebaran jumlah penyewaan sepeda dari waktu ke waktu selama periode 2011–2012. Terlihat bahwa jumlah penyewaan sepeda mengalami fluktuasi namun cenderung meningkat pada pertengahan hingga akhir tahun, terutama pada tahun 2012 yang menunjukkan jumlah penyewaan lebih tinggi dibandingkan tahun 2011. Selain itu, terdapat beberapa titik dengan nilai sangat rendah yang menunjukkan hari-hari dengan penyewaan sepeda yang sedikit. Pola ini mengindikasikan adanya kemungkinan pengaruh faktor musiman atau kondisi tertentu terhadap tingkat penggunaan sepeda.
Boxplot digunakan untuk menampilkan distribusi jumlah penyewaan sepeda pada setiap tahun sehingga memudahkan dalam membandingkan pola data antara tahun 2011 dan 2012. Melalui boxplot, dapat terlihat nilai median, rentang data (minimum dan maksimum), kuartil, serta kemungkinan adanya outlier. Dengan demikian, boxplot membantu memahami persebaran dan variasi jumlah penyewaan sepeda tiap tahun serta perbedaan tingkat penyewaan antara kedua periode waktu tersebut.
# Mengubah tanggal menjadi format Date
bike_data$dteday <- as.Date(bike_data$dteday)
# Membuat variabel tahun
bike_data$year <- format(bike_data$dteday, "%Y")
# Boxplot per tahun
ggplot(bike_data, aes(x = year, y = cnt)) +
geom_boxplot(fill = "steelblue", alpha = 0.8) +
labs(
title = "Boxplot Penyewaan Sepeda per Tahun",
x = "Tahun",
y = "Total Penyewaan Sepeda"
) +
theme_minimal()
Boxplot tersebut menunjukkan bahwa jumlah penyewaan sepeda pada tahun 2012 cenderung lebih tinggi dibandingkan tahun 2011. Hal ini terlihat dari nilai median pada tahun 2012 yang berada di atas median tahun 2011, serta rentang distribusi data yang juga lebih tinggi. Selain itu, terdapat satu nilai pencilan (outlier) pada tahun 2012 yang menunjukkan adanya hari dengan jumlah penyewaan yang sangat rendah. Secara keseluruhan, visualisasi ini menunjukkan bahwa penggunaan sepeda mengalami peningkatan pada tahun 2012 dibandingkan tahun sebelumnya.
Berdasarkan analisis visualisasi time series pada data penyewaan sepeda tahun 2011–2012, dapat disimpulkan bahwa jumlah penyewaan sepeda mengalami perubahan dari waktu ke waktu dan secara umum menunjukkan kecenderungan meningkat, terutama pada tahun 2012 yang memiliki jumlah penyewaan lebih tinggi dibandingkan tahun 2011. Selain itu, terlihat adanya pola musiman, dimana jumlah penyewaan cenderung meningkat pada pertengahan tahun dan menurun pada awal atau akhir tahun. Hal ini menunjukkan bahwa penggunaan sepeda kemungkinan dipengaruhi oleh faktor waktu dan kondisi lingkungan tertentu. Secara keseluruhan, visualisasi time series membantu menggambarkan dinamika penggunaan sepeda serta mengidentifikasi pola perubahan penyewaan sepeda sepanjang periode pengamatan.