Analisis Penyewaan Sepeda per Hari tahun 2011-2012

Afry Dearny Sinaga

2026-02-19


Visualisasi data merupakan salah satu tahap penting dalam analisis data karena membantu memahami pola, hubungan, serta karakteristik data secara lebih mudah dan intuitif. Pada data kuantitatif, khususnya data yang bersifat kontinu, visualisasi sangat berguna untuk melihat distribusi nilai serta kecenderungan hubungan antar variabel.

Visualisasi kontinu bivariat adalah teknik visualisasi yang digunakan untuk menganalisis hubungan antara dua variabel numerik (kontinu). Tujuan utama dari visualisasi ini adalah untuk mengidentifikasi pola hubungan, arah korelasi (positif atau negatif), kekuatan hubungan, serta kemungkinan adanya pencilan (outlier). Beberapa bentuk visualisasi yang umum digunakan dalam analisis bivariat kontinu antara lain scatter plot, line plot, dan density plot, bubble plot, dan lain-lain. Dengan melakukan visualisasi bivariat sebelum analisis statistik lanjutan, peneliti dapat memperoleh gambaran awal mengenai hubungan antar variabel, sehingga interpretasi hasil analisis menjadi lebih tepat dan kontekstual.

Studi Kasus

Pada penelitian ini digunakan data yang memuat beberapa variabel numerik yang diamati dalam periode waktu tertentu (data harian). Data tersebut merepresentasikan fenomena nyata yang terjadi secara kontinu, sehingga memungkinkan dilakukan analisis hubungan antar variabel.

Studi kasus ini bertujuan untuk melihat apakah terdapat hubungan atau keterkaitan antara variabel pertama dan variabel kedua, serta bagaimana pola hubungan tersebut jika divisualisasikan. Analisis ini penting untuk memahami dinamika perubahan kedua variabel dan kemungkinan pengaruh satu variabel terhadap variabel lainnya.

Tujuan dari analisis ini adalah untuk menjawab pertanyaan:

  1. Apakah peningkatan suhu berpengaruh terhadap jumlah penyewaan sepeda?
  2. Apakah jumlah penyewaan sepeda berbeda secara signifikan antar musim?
  3. Bagaimana kondisi cuaca memengaruhi distribusi jumlah penyewaan sepeda?
  4. Apakah pola penggunaan sepeda berbeda antara hari kerja dan akhir pekan?
  5. Bagaimana tren perubahan jumlah penyewaan sepeda dari waktu ke waktu?
  6. Bagaimana pengaruh suhu dan kecepatan angin secara bersamaan terhadap jumlah penyewaan sepeda?

Karakteristik Data

Data yang digunakan dalam penelitian ini terdiri dari beberapa variabel yang menggambarkan pengamatan harian. Secara umum, variabel dalam dataset dapat dikelompokkan menjadi dua jenis, yaitu variabel kategorik dan variabel kontinu. Variabel kategorik adalah variabel yang berisi kelompok atau label tertentu dan tidak memiliki makna numerik secara matematis. Contohnya: season, weathersit, dan workingday. Sementara itu, variabel kontinu adalah variabel numerik yang nilainya dapat berada dalam rentang tertentu dan dapat dilakukan operasi matematika, berupa ukuran, jumlah, atau hasil pengukuran.Contohnya: temp, atemp, hum, windspeed, casual, registered, dan cnt.

Tabel Deskripsi Variabel
Variabel Jenis Deskripsi
season Kategorik Musim pada saat pengamatan
weathersit Kategorik Kondisi cuaca harian
workingday Kategorik Hari kerja atau hari libur
temp Kontinu Suhu udara rata-rata
atemp Kontinu Suhu yang dirasakan
hum Kontinu Tingkat kelembapan udara
windspeed Kontinu Kecepatan angin
casual Kontinu Jumlah pengguna tidak terdaftar
registered Kontinu Jumlah pengguna terdaftar
cnt Kontinu Total jumlah pengguna sepeda

Setelah dilakukan recoding, variabel kategorik seperti season, weathersit, dan workingday diubah menjadi bentuk faktor dengan label yang lebih deskriptif. Perubahan ini bertujuan agar visualisasi dan hasil analisis lebih mudah dipahami, karena kategori ditampilkan dalam bentuk nama yang merepresentasikan kondisi sebenarnya, bukan dalam bentuk kode angka. Misalnya kita dapat langsung mengubah label 1 = “Spring”, 2 = “Summer”, 3 = “Fall”, dan 4 = “Winter”. Hal ini membuat visualisasi lebih intuitif dan mudah dipahami oleh audiens. Struktur data tetap sama, namun interpretasi menjadi lebih intuitif dan informatif.


Visualisasi Data Kontinu (Bivariate)

Setelah memahami karakteristik data, analisis dapat dilanjutkan ke tahap berikutnya, yaitu visualisasi bivariate. Visualisasi bivariate digunakan untuk melihat hubungan antara dua variabel, misalnya bagaimana jumlah penyewaan sepeda (cnt) dipengaruhi oleh faktor lain seperti musim (season), kondisi cuaca (weathersit), suhu (temp), atau jenis hari (workingday). Pendekatan ini memungkinkan analis tidak hanya memahami bagaimana data tersebar, tetapi juga mulai mengeksplorasi faktor-faktor yang berasosiasi dengan perubahan jumlah penyewaan sepeda. Berikut adalah beberapa jenis visualisasi bivariate yang dapat digunakan untuk menganalisis hubungan antara jumlah penyewaan sepeda (cnt) dengan variabel lain dalam dataset:

Scatter Plot

Scatter plot adalah grafik yang menunjukkan hubungan antara dua variabel numerik. Setiap titik pada scatter plot mewakili satu pengamatan, dengan posisi titik ditentukan oleh nilai kedua variabel untuk melihat apakah peningkatan suhu berpengaruh terhadap jumlah penyewaan sepeda.

Scatter plot di atas menunjukkan hubungan antara suhu (temp) dan jumlah penyewaan sepeda (cnt). Setiap titik pada grafik mewakili satu hari, dengan posisi horizontal menunjukkan suhu dan posisi vertikal menunjukkan jumlah penyewaan sepeda pada hari tersebut. Dari visualisasi ini terlihat bahwa terdapat pola positif antara suhu dan jumlah penyewaan sepeda, di mana semakin tinggi suhu, semakin banyak penyewaan sepeda yang terjadi. Hal ini menunjukkan bahwa cuaca yang lebih hangat cenderung meningkatkan penggunaan sepeda, sementara suhu yang lebih rendah mungkin membuat orang enggan untuk menyewa sepeda. Meskipun terdapat beberapa titik yang menyebar, pola umum menunjukkan bahwa suhu memiliki pengaruh positif terhadap jumlah penyewaan sepeda.

Boxplot Bivariate

Boxplot bivariate digunakan untuk membandingkan distribusi variabel numerik (cnt) berdasarkan kategori dari variabel lain, seperti musim (season) dengan tujuan untuk mengetahui apakah jumlah penyewaan sepeda berbeda secara signifikan antar musim.

Boxplot bivariate di atas digunakan untuk membandingkan distribusi jumlah penyewaan sepeda (cnt) berdasarkan kategori musim (season). Setiap kotak pada grafik mewakili distribusi penyewaan sepeda untuk masing-masing musim, dengan garis di dalam kotak menunjukkan median, batas kotak menunjukkan kuartil pertama (Q1) dan kuartil ketiga (Q3), serta whisker yang memanjang menunjukkan rentang data. Dari visualisasi ini terlihat bahwa musim Summer memiliki jumlah penyewaan sepeda yang lebih tinggi dibandingkan dengan musim lainnya, dengan median yang berada di kisaran 5.000 penyewaan per hari. Sementara itu, musim Winter memiliki jumlah penyewaan yang lebih rendah, dengan median di bawah 3.000 penyewaan per hari. Hal ini menunjukkan bahwa penggunaan sepeda cenderung meningkat selama musim panas dan menurun selama musim dingin, kemungkinan karena faktor cuaca yang mempengaruhi kenyamanan dalam menggunakan sepeda.

Violin Plot Bivariate

Violin plot bivariate digunakan untuk membandingkan distribusi variabel numerik (cnt) berdasarkan kategori dari variabel lain, seperti kondisi cuaca (weathersit) dengan tujuan mengetahui bagaimana kondisi cuaca memengaruhi distribusi jumlah penyewaan sepeda.

Violin plot bivariate di atas digunakan untuk membandingkan distribusi jumlah penyewaan sepeda (cnt) berdasarkan kondisi cuaca (weathersit). Setiap bentuk violin mewakili distribusi penyewaan sepeda untuk masing-masing kondisi cuaca, dengan bagian yang lebih lebar menunjukkan bahwa lebih banyak hari memiliki jumlah penyewaan pada kisaran tersebut. Boxplot di dalam violin memberikan informasi statistik ringkas, seperti median dan kuartil. Dari visualisasi ini terlihat bahwa kondisi cuaca yang cerah (Clear) memiliki distribusi penyewaan sepeda yang lebih tinggi dan lebih padat dibandingkan dengan kondisi cuaca lainnya, seperti hujan ringan (Light Rain) atau hujan deras (Heavy Rain), yang memiliki distribusi penyewaan yang lebih rendah. Hal ini menunjukkan bahwa kondisi cuaca yang baik cenderung meningkatkan penggunaan sepeda, sementara kondisi cuaca yang buruk dapat mengurangi minat orang untuk menyewa sepeda.

BoxPlot

Boxplot menunjukkan distribusi jumlah penyewaan antara hari kerja dan hari libur/akhir pekan.Secara umum, median penyewaan pada hari kerja terlihat sedikit lebih tinggi dibandingkan akhir pekan. Hal ini menunjukkan bahwa aktivitas penggunaan sepeda cenderung lebih banyak terjadi pada hari kerja, kemungkinan karena digunakan sebagai sarana transportasi untuk berangkat kerja atau sekolah.

Selain itu, sebaran data pada kedua kelompok terlihat cukup lebar, yang menandakan variasi jumlah penyewaan yang cukup besar baik pada hari kerja maupun akhir pekan. Pada hari kerja, terdapat beberapa nilai yang sangat rendah hingga sangat tinggi, menunjukkan bahwa faktor lain seperti cuaca atau musim juga dapat memengaruhi jumlah penyewaan. Meskipun perbedaannya tidak terlalu ekstrem, secara keseluruhan dapat disimpulkan bahwa hari kerja memiliki kecenderungan jumlah penyewaan yang lebih tinggi dan lebih konsisten dibandingkan akhir pekan.

Line Plot

Line plot ini menunjukkan tren perubahan jumlah penyewaan sepeda dari waktu ke waktu. Berdasarkan grafik tren, jumlah penyewaan sepeda menunjukkan pola yang berfluktuasi namun memiliki kecenderungan meningkat dari awal tahun 2011 hingga pertengahan 2012. Pada awal 2011, jumlah penyewaan masih relatif rendah, kemudian meningkat secara bertahap hingga mencapai kisaran menengah pada pertengahan tahun. Setelah itu, terlihat beberapa penurunan dan kenaikan yang cukup tajam, yang menunjukkan adanya pengaruh faktor musiman atau kondisi tertentu seperti cuaca, hari libur, atau kondisi lingkungan.

Memasuki tahun 2012, jumlah penyewaan kembali meningkat dan mencapai level yang lebih tinggi dibandingkan tahun sebelumnya, bahkan beberapa kali mendekati nilai maksimum. Hal ini menunjukkan bahwa penggunaan sepeda semakin populer dari waktu ke waktu. Namun, di beberapa titik terlihat penurunan yang sangat tajam hingga mendekati nol, yang kemungkinan terjadi akibat kondisi ekstrem seperti cuaca buruk, hari tertentu dengan aktivitas rendah, atau gangguan operasional. Secara keseluruhan, grafik ini menunjukkan adanya tren pertumbuhan penggunaan sepeda, dengan pola musiman dan fluktuasi harian yang cukup kuat

Bubble Plot

Bubble Plot menunjukkan bagaimana pengaruh suhu dan kecepatan angin secara bersamaan terhadap jumlah penyewaan sepeda. Pada grafik bubble, terlihat hubungan antara suhu (sumbu X) dan jumlah penyewaan (sumbu Y), dengan ukuran dan warna gelembung merepresentasikan kecepatan angin. Dari pola titik yang terbentuk, terlihat bahwa semakin tinggi suhu, jumlah penyewaan cenderung meningkat. Pada suhu rendah, jumlah penyewaan umumnya berada pada kisaran rendah hingga sedang. Sebaliknya, pada suhu menengah hingga tinggi, banyak titik yang menunjukkan jumlah penyewaan yang lebih besar. Hal ini menunjukkan bahwa kondisi cuaca yang lebih hangat membuat masyarakat lebih tertarik untuk menggunakan sepeda.

Dari sisi kecepatan angin, terlihat bahwa gelembung dengan warna yang menunjukkan angin lebih kencang cenderung tidak terlalu banyak berada pada area penyewaan yang sangat tinggi. Ini mengindikasikan bahwa angin yang terlalu kuat dapat mengurangi kenyamanan, sehingga berpotensi menurunkan minat penggunaan sepeda. Sebaliknya, penyewaan yang tinggi lebih sering terjadi saat kecepatan angin berada pada tingkat rendah hingga sedang. Secara umum, grafik ini menunjukkan bahwa suhu memiliki pengaruh positif terhadap penyewaan, sedangkan kecepatan angin memiliki kecenderungan pengaruh negatif atau menghambat.


Kesimpulan

Analisis visualisasi data kontinu bivariat menunjukkan bahwa jumlah penyewaan sepeda dipengaruhi oleh kombinasi faktor cuaca, musim, hari dalam minggu, serta kondisi lingkungan. Beberapa poin penting yang dapat disimpulkan adalah:

  1. Pengaruh suhu : Semakin tinggi suhu udara, jumlah penyewaan sepeda cenderung meningkat, menunjukkan bahwa cuaca hangat mendorong aktivitas bersepeda.
  2. Pengaruh kecepatan angin : Angin yang terlalu kencang menurunkan jumlah penyewaan, sedangkan angin ringan hingga sedang tidak terlalu menghambat penggunaan sepeda.
  3. Pengaruh musim : Musim Summer memiliki jumlah penyewaan tertinggi, sedangkan musim Winter cenderung lebih rendah, menunjukkan pengaruh cuaca musiman terhadap kenyamanan bersepeda.
  4. Pengaruh kondisi cuaca harian : Hari dengan kondisi cerah (Clear) memiliki distribusi penyewaan tertinggi, sedangkan hujan atau salju menurunkan minat pengguna sepeda.
  5. Pengaruh jenis hari (workingday) : Hari kerja menunjukkan penyewaan yang lebih tinggi dibanding akhir pekan, kemungkinan karena penggunaan sepeda sebagai sarana transportasi rutin.
  6. Tren waktu : Jumlah penyewaan meningkat secara bertahap dari awal 2011 hingga pertengahan 2012, dengan fluktuasi harian dan musiman yang jelas terlihat.

Secara keseluruhan, penggunaan sepeda sangat dipengaruhi oleh faktor cuaca dan musim, dengan suhu sebagai faktor paling dominan yang meningkatkan jumlah penyewaan. Faktor lain seperti angin, hari kerja, dan kondisi musiman juga berperan signifikan, sehingga strategi pengelolaan layanan sepeda dapat mempertimbangkan kombinasi faktor-faktor ini untuk meningkatkan penggunaan.