Analisis data bivariat bertujuan untuk memahami hubungan antara dua variabel, baik berupa hubungan numerik maupun perbedaan antar kelompok kategori. Visualisasi data digunakan sebagai alat eksplorasi untuk mengidentifikasi pola, kecenderungan, dan perbedaan yang mungkin tidak langsung terlihat dari tabel data.

Dataset yang digunakan adalah Bike Sharing Dataset (by day) yang merekam aktivitas penyewaan sepeda harian di Washington, D.C. selama periode dua tahun. Dataset ini diperoleh dari UCI Machine Learning Repository dan memuat berbagai informasi, seperti kondisi cuaca, musim, jenis hari, serta jumlah penyewaan sepeda. Setelah memahami konteks pengumpulan data, tahap selanjutnya dalam analisis adalah mengevaluasi bagaimana perilaku variabel numerik dalam dataset tersebut.

Analisis ini menggunakan beberapa jenis visualisasi bivariat yang dipilih sesuai dengan tipe variabel, serta setiap visualisasi dibuat untuk menjawab pertanyaan analitis tertentu, bukan sekadar menampilkan grafik.

  1. Apakah kecepatan angin (windspeed) menunjukkan pola tertentu terhadap jumlah penyewaan sepeda (cnt)?
  2. Bagaimana sebaran jumlah penyewaan sepeda (cnt) pada setiap kategori kondisi cuaca (weathersit)?
  3. Bagaimana pola rata-rata jumlah penyewaan sepeda (cnt) sepanjang bulan dalam satu tahun?

Untuk menjawab pertanyaan tersebut, digunakan visualisasi bivariat untuk mengeksplorasi hubungan antarvariabel yang berpotensi menjelaskan perubahan jumlah penyewaan sepeda.

Memuat Data dan Menjelajahi Struktur Data

##  [1] "instant"    "dteday"     "season"     "yr"         "mnth"      
##  [6] "holiday"    "weekday"    "workingday" "weathersit" "temp"      
## [11] "atemp"      "hum"        "windspeed"  "casual"     "registered"
## [16] "cnt"

Berdasarkan output yang ditampilkan, dataset ini terdiri dari 16 variabel yang mencakup variabel numerik dan kategorik. Variabel numerik yang terdapat dalam dataset ini meliputi temp, atemp, hum, windspeed, casual, registered, dan cnt. Variabel-variabel tersebut merepresentasikan kondisi lingkungan seperti suhu, kelembapan, dan kecepatan angin, serta informasi terkait jumlah penyewaan sepeda oleh pengguna kasual, pengguna terdaftar, dan total penyewaan sepeda.

Adapun penjelasan lebih rinci mengenai variabel-variabel numerik tersebut disajikan pada tabel berikut.

No Variabel_Numerik Keterangan
1 temp suhu dalam skala Celsius
2 atemp suhu yang dirasakan
3 hum kelembapan
4 windspeed kecepatan angin
5 casual jumlah penyewaan sepeda oleh pengguna casual
6 registered jumlah penyewaan sepeda oleh pengguna terdaftar
7 cnt total jumlah penyewaan sepeda (casual + registered)

Tabel di atas menunjukkan variabel-variabel numerik utama dalam dataset Bike Sharing yang akan digunakan pada analisis selanjutnya. Variabel tersebut mencakup faktor lingkungan (suhu, kelembapan, dan kecepatan angin) serta variabel penggunaan sepeda oleh pengguna casual, terdaftar, dan total penyewaan.

Keberadaan variabel-variabel numerik ini memungkinkan analisis lebih lanjut untuk melihat distribusi data dan hubungan antarvariabel, khususnya bagaimana kondisi lingkungan dan jenis pengguna memengaruhi jumlah penyewaan sepeda.

Berikut adalah beberapa jenis visualisasi bivariate yang dapat digunakan untuk menganalisis hubungan antara jumlah penyewaan sepeda (cnt) dengan variabel lain dalam dataset:

Visualisasi Data Kontinu (Bivariate)

Scatter Plot

Apakah suhu udara berhubungan dengan jumlah penyewaan sepeda? Scatter plot digunakan untuk melihat hubungan antara dua variabel numerik, yaitu suhu udara (temp) dan jumlah penyewaan sepeda (cnt). Grafik ini menunjukkan bahwa ketika suhu berada pada tingkat sedang

Scatter plot menunjukkan bahwa jumlah penyewaan sepeda cenderung meningkat seiring dengan kenaikan suhu. Pada suhu rendah, jumlah penyewaan relatif kecil, sedangkan pada suhu yang lebih tinggi terlihat lebih banyak penyewaan sepeda.

Pola ini mengindikasikan bahwa suhu yang lebih hangat membuat aktivitas bersepeda lebih nyaman, sehingga mendorong peningkatan penggunaan sepeda.

Bloxplot

Apakah terdapat perbedaan jumlah penyewaan sepeda antar musim? Boxplot menunjukkan adanya perbedaan distribusi jumlah penyewaan sepeda pada setiap musim. Musim panas (Summer) dan gugur (Fall) cenderung memiliki median jumlah penyewaan yang lebih tinggi dibandingkan musim semi (Spring) dan musim dingin (Winter).

Selain itu, variasi penyewaan sepeda juga lebih besar pada musim panas dan gugur. Hal ini menunjukkan bahwa kondisi cuaca yang lebih hangat dan stabil pada musim tersebut mendorong peningkatan aktivitas bersepeda.

Violin Plot

Bagaimana distribusi penyewaan sepeda pada kondisi cuaca yang berbeda? Violin plot menunjukkan bahwa jumlah penyewaan sepeda cenderung lebih tinggi pada kondisi cuaca yang baik. Distribusi penyewaan juga terlihat lebih menyebar dibandingkan kondisi cuaca yang kurang baik.

Hal ini mengindikasikan bahwa kondisi cuaca yang buruk dapat menurunkan minat masyarakat untuk bersepeda.

Hexbin Plot

Apakah kecepatan angin menunjukkan pola tertentu terhadap jumlah penyewaan sepeda? Hexbin plot menunjukkan bahwa jumlah penyewaan sepeda lebih padat pada kecepatan angin rendah hingga sedang. Pada kecepatan angin yang lebih tinggi, jumlah penyewaan cenderung berkurang.

Hal ini mengindikasikan bahwa angin kencang menjadi faktor penghambat dalam aktivitas bersepeda.

Jitter Plot

Bagaimana sebaran jumlah penyewaan sepeda pada setiap kategori kondisi cuaca? Jitter plot menunjukkan bahwa sebaran jumlah penyewaan sepeda berbeda pada setiap kategori kondisi cuaca. Pada kondisi cuaca yang lebih baik, titik-titik data cenderung berada pada nilai penyewaan yang lebih tinggi dan tersebar lebih luas dibandingkan kondisi cuaca yang kurang baik.

Hal ini mengindikasikan bahwa kondisi cuaca berperan dalam menentukan intensitas penggunaan sepeda, di mana cuaca yang mendukung mendorong lebih banyak penyewaan sepeda, sedangkan cuaca yang buruk membatasi jumlah penyewaan.

Line Plot

Bagaimana pola rata-rata jumlah penyewaan sepeda sepanjang bulan dalam satu tahun? Line plot menunjukkan adanya pola musiman pada rata-rata penyewaan sepeda. Penyewaan meningkat pada pertengahan tahun dan menurun di awal serta akhir tahun.

Pola ini menunjukkan bahwa waktu dan musim berpengaruh terhadap intensitas penggunaan sepeda.

Kesimpulan

Berdasarkan hasil analisis data bivariat, dapat disimpulkan bahwa jumlah penyewaan sepeda dipengaruhi oleh faktor lingkungan dan waktu. Suhu, musim, kondisi cuaca, kelembapan, serta kecepatan angin menunjukkan hubungan yang jelas dengan jumlah penyewaan sepeda. Kondisi cuaca dan lingkungan yang lebih nyaman cenderung meningkatkan penggunaan sepeda.

Selain itu, faktor waktu juga berperan penting, terlihat dari adanya pola musiman dan perbedaan jumlah penyewaan antara hari kerja dan bukan hari kerja. Secara keseluruhan, visualisasi data bivariat membantu memahami hubungan antar variabel secara lebih mudah dan memberikan gambaran yang jelas mengenai faktor-faktor yang memengaruhi penggunaan sepeda.