VISUALISASI DATA BIVARIATE

Bike Sharing Dataset

Atiqah Adawiyah Sholihah

Pendahuluan

Dataset yang digunakan dalam analisis ini merupakan data penyewaan sepeda harian (bike sharing) yang berasal dari sistem bike sharing di Washington, D.C. Dataset ini tersedia secara publik melalui UCI Machine Learning Repository dan dapat diakses di sini.

Dataset yang digunakan dalam analisis ini merupakan data penyewaan sepeda harian (bike sharing) yang berasal dari sistem di Washington, D.C., yang mencatat aktivitas selama periode dua tahun (2011–2012). Dataset ini menyediakan informasi komprehensif mengenai kondisi lingkungan—seperti suhu, kelembaban, dan kecepatan angin—serta variabel waktu yang krusial untuk analisis deret waktu (time series).

Berbeda dengan analisis bivariat yang cenderung melihat hubungan antarvariabel pada satu titik waktu, analisis deret waktu berfokus pada dinamika data yang berubah seiring dengan berjalannya waktu. Pendekatan ini sangat relevan karena penggunaan layanan bike sharing cenderung memiliki pola ketergantungan waktu yang kuat, baik itu bersifat musiman (seasonality) maupun tren pertumbuhan jangka panjang.

Pada analisis ini, fokus utama dialihkan untuk menjawab pertanyaan-pertanyaan strategis berbasis temporal:

  1. Bagaimana pola pertumbuhan atau penurunan total penyewaan sepeda dalam jangka panjang selama dua tahun tersebut?
  2. Pola Musiman (Seasonality): Apakah terdapat pola berulang dalam jumlah penyewaan setiap bulannya yang konsisten dari tahun ke tahun?
  3. Dinamika Berdasarkan Kondisi: Bagaimana fluktuasi penyewaan sepeda merespons perubahan kondisi cuaca dan hari kerja dalam rentang waktu yang berkelanjutan?

Deskripsi Data

Tabel berikut menyajikan rincian variabel numerik yang digunakan dalam analisis ini. Selain variabel-variabel tersebut, terdapat variabel dteday (tanggal) yang menjadi variabel utama dalam analisis time series untuk memetakan tren dan pola musiman.

No. Variabel Numerik Keterangan
1. dteday anggal observasi (YYYY-MM-DD) sebagai sumbu waktu
2. temp suhu aktual (dinormalisasi dalam skala 0–1)
3. atemp suhu yang dirasakan (feeling temperature)
4. hum tingkat kelembaban udara
5. windspeed kecepatan angin
6. casual jumlah penyewaan sepeda oleh pengguna kasual
7. registered jumlah penyewaan sepeda oleh pengguna terdaftar
8. cnt total penyewaan sepeda (casual + registered)

Sedangkan variabel-variabel kategorik seperti season, yr, mnth, holiday, workingday, dan weathersit telah dilakukan proses recoding agar lebih mudah dipahami dalam visualisasi. Dengan mengganti kode numerik menjadi label deskriptif, interpretasi pola musiman dan tren pada grafik menjadi lebih intuitif dan informatif bagi pembaca.

##  [1] "instant"    "dteday"     "season"     "yr"         "mnth"      
##  [6] "holiday"    "weekday"    "workingday" "weathersit" "temp"      
## [11] "atemp"      "hum"        "windspeed"  "casual"     "registered"
## [16] "cnt"

Visualisasi Data Time Series

Setelah memahami karakteristik variabel, langkah selanjutnya adalah analisis deret waktu (time series). Analisis ini mengeksplorasi bagaimana jumlah penyewaan sepeda (cnt) berubah dan berfluktuasi seiring berjalannya waktu. Dengan menggunakan pendekatan ini, kita dapat mengidentifikasi pola tren jangka panjang, siklus musiman yang berulang, serta respons sistem terhadap perubahan kondisi eksternal secara berkelanjutan.

1.Line Chart: Tren Harian Total Penyewaan

Pertanyaan:
Bagaimana tren jangka panjang penyewaan sepeda selama dua tahun (2011-2012)?

Grafik ini menunjukkan naik-turunnya jumlah penyewaan sepeda setiap harinya. Angkanya sangat bervariasi, dari yang paling sepi di bawah 1.000 penyewaan per hari hingga yang paling ramai mencapai 8.000 sampai 9.000 penyewaan. Garis merah yang melengkung menunjukkan arah tren secara keseluruhan. Karena garis tersebut miring ke atas, ini membuktikan bahwa dari tahun 2011 ke 2012, minat masyarakat untuk menggunakan layanan sepeda ini semakin meningkat.

2.Multi-Line Chart: Pola Bulanan (Perbandingan 2011 vs 2012)

Pertanyaan:
Apakah ada pola keramaian yang selalu sama di setiap bulannya?

Grafik ini memperlihatkan “siklus” atau kebiasaan pengguna sepeda sepanjang tahun. Setiap awal tahun, tepatnya di bulan Januari, penyewaan selalu berada di titik terendah dengan rata-rata 2.000-2.500 penyewaan per hari. Namun, jumlah ini terus bertambah dan memuncak pada pertengahan tahun, yaitu bulan Juni hingga September, di mana rata-rata penyewaan harian bisa tembus di atas 5.500. Menariknya, rata-rata penyewaan di tahun 2012 selalu lebih tinggi dibandingkan tahun 2011, yang artinya sistem penyewaan sepeda ini semakin sukses di tahun kedua.

3. Faceted Line Chart: Tren Penyewaan Berdasarkan Kondisi Cuaca

Pertanyaan:
Seberapa besar pengaruh cuaca terhadap jumlah penyewaan sepeda?

Visualisasi ini memisahkan data berdasarkan kondisi cuaca agar kita bisa melihat pengaruhnya dengan lebih objektif:

  1. Kondisi Cerah (Clear): Merupakan waktu paling ideal bagi pengguna. Jumlah penyewaan sangat tinggi, seringkali berada di atas angka 6.000 per hari dengan pola yang sangat stabil.

  2. Kondisi Berawan (Cloudy): Terjadi penurunan jumlah penyewaan dibandingkan saat cuaca cerah, namun aktivitas tetap terlihat cukup rutin di kisaran angka 4.000 hingga 5.000 penyewaan.

  3. Kondisi Hujan Ringan (Light Rain): Kondisi ini memiliki dampak negatif yang paling nyata. Jumlah penyewaan anjlok drastis hingga di bawah angka 2.000 penyewaan per hari. Garis yang tidak beraturan pada kondisi ini menunjukkan bahwa saat cuaca buruk, orang cenderung menghindari penggunaan sepeda, yang pada akhirnya membuat pola penyewaan menjadi tidak konsisten.

Kesimpulan

Berdasarkan analisis deret waktu (time series) yang telah dilakukan terhadap data penyewaan sepeda selama periode 2011–2012, dapat ditarik beberapa kesimpulan strategis sebagai berikut:

  1. Pertumbuhan Positif: Layanan bike sharing di Washington, D.C. menunjukkan tren pertumbuhan yang sehat. Hal ini dibuktikan dengan meningkatnya total volume penyewaan secara stabil dari tahun 2011 ke tahun 2012.

  2. Pola Musiman yang Kuat: Terdapat ritme atau siklus tahunan yang sangat jelas. Permintaan penyewaan sepeda selalu mencapai titik terendah pada awal tahun (Januari) dan melonjak drastis hingga mencapai puncaknya pada pertengahan tahun (Juni hingga September). Pola yang berulang ini menunjukkan bahwa penggunaan sepeda sangat dipengaruhi oleh perubahan musim.

  3. Cuaca sebagai Penentu Utama: Kondisi cuaca adalah faktor paling krusial yang menentukan volume penyewaan harian. Cuaca cerah menjadi pendukung utama stabilitas jumlah pengguna, sementara kondisi cuaca buruk seperti hujan ringan menjadi penghambat yang signifikan, yang menyebabkan penurunan volume penyewaan secara drastis serta pola penggunaan yang tidak teratur.

Secara keseluruhan, sistem penyewaan sepeda ini terbukti memiliki basis pengguna yang semakin luas di tahun kedua. Untuk perencanaan ke depan, manajemen layanan dapat memanfaatkan temuan pola musiman ini untuk mengoptimalkan ketersediaan armada, serta menyiapkan strategi khusus (seperti promosi atau penyesuaian operasional) guna memitigasi dampak cuaca buruk terhadap penurunan jumlah pengguna.