Dataset yang digunakan dalam analisis ini berasal dari sistem bike sharing di Washington, D.C., yang tersedia melalui UCI Machine Learning Repository. Dataset ini mencatat aktivitas penyewaan sepeda harian selama periode dua tahun, termasuk informasi terkait kondisi lingkungan seperti suhu, kelembaban, dan kecepatan angin, serta informasi penggunaan seperti jumlah penyewaan sepeda per hari.

Sistem bike sharing merupakan salah satu bentuk transportasi modern yang sangat dipengaruhi oleh kondisi lingkungan dan pola aktivitas manusia. Faktor-faktor seperti cuaca, musim, dan kondisi atmosfer dapat memengaruhi keputusan seseorang untuk menggunakan sepeda. Oleh karena itu, memahami pola distribusi dan hubungan antar variabel dalam dataset ini menjadi penting untuk memperoleh wawasan mengenai perilaku penggunaan sepeda.

Tahap awal analisis dilakukan menggunakan visualisasi univariate kontinu, yaitu visualisasi yang berfokus pada satu variabel numerik dalam satu waktu. Tujuan dari visualisasi ini adalah untuk memahami karakteristik dasar data, termasuk bentuk distribusi, tingkat variasi, serta keberadaan nilai ekstrem (outlier). Dengan memahami distribusi suatu variabel secara individual, analis dapat memperoleh gambaran awal mengenai struktur data sebelum mengeksplorasi hubungan antar variabel.

Setelah memahami karakteristik masing-masing variabel secara individual, tahap selanjutnya adalah menggunakan visualisasi bivariate kontinu. Visualisasi ini bertujuan untuk mengeksplorasi hubungan antara dua variabel numerik secara simultan, khususnya untuk memahami bagaimana faktor lingkungan dan kondisi tertentu memengaruhi jumlah penyewaan sepeda. Melalui visualisasi bivariate, analis dapat mengidentifikasi pola hubungan, kekuatan asosiasi, serta kondisi tertentu yang berkaitan dengan peningkatan atau penurunan penggunaan sepeda.

Melalui kombinasi visualisasi univariate dan bivariate, analisis ini memberikan pemahaman yang lebih komprehensif mengenai distribusi data serta hubungan antar variabel, yang penting untuk mendukung pengambilan keputusan berbasis data.

Visualisasi Data Kontinu (Univariate)

Visualisasi data kontinu (univariat) merupakan metode yang digunakan untuk menampilkan distribusi serta karakteristik dari satu variabel numerik. Beberapa bentuk visualisasi yang sering digunakan untuk data kontinu antara lain histogram, density plot, boxplot, violin plot, dan scatter plot. Masing-masing jenis visualisasi tersebut memiliki keunggulan dan fungsi tersendiri dalam membantu proses pemahaman terhadap data. Berikut ini merupakan penjelasan singkat mengenai beberapa jenis visualisasi data kontinu (univariat):

Histogram

Histogram merupakan grafik yang digunakan untuk menampilkan distribusi frekuensi dari data kontinu. Grafik ini mengelompokkan data ke dalam beberapa interval (bin), kemudian menunjukkan jumlah observasi yang berada pada setiap interval tersebut.

Dari dataset kita ingin mengetahui, bagaimana distribusi kecepatan angin harian dalam dataset? Pada kisaran kecepatan angin berapa frekuensi paling tinggi terjadi?.

Histogram di atas menunjukkan distribusi frekuensi kecepatan angin harian (windspeed) dalam dataset. Terlihat bahwa sebagian besar nilai kecepatan angin terkonsentrasi pada kisaran sekitar 0.12 hingga 0.20, yang menunjukkan bahwa sebagian besar hari memiliki kecepatan angin yang relatif rendah hingga sedang.

Frekuensi observasi meningkat secara bertahap dari nilai kecepatan angin yang sangat rendah, mencapai puncaknya pada kisaran tersebut, kemudian menurun secara perlahan seiring dengan meningkatnya kecepatan angin. Hal ini menunjukkan bahwa hari dengan kecepatan angin yang lebih tinggi terjadi lebih jarang dibandingkan hari dengan kecepatan angin rendah hingga menengah.

Distribusi histogram juga menunjukkan bentuk yang sedikit condong ke kanan (right-skewed), yang ditandai dengan adanya ekor distribusi yang memanjang hingga nilai sekitar 0.5. Hal ini menunjukkan bahwa terdapat beberapa hari dengan kecepatan angin yang relatif tinggi, namun jumlahnya jauh lebih sedikit dibandingkan kondisi angin yang lebih tenang.

Secara keseluruhan, visualisasi ini menunjukkan bahwa dataset didominasi oleh kondisi kecepatan angin yang rendah hingga sedang, dengan hanya sedikit hari yang mengalami kecepatan angin tinggi. Pola ini penting untuk dipahami karena kecepatan angin merupakan salah satu faktor lingkungan yang dapat memengaruhi kenyamanan dan kecenderungan masyarakat dalam menggunakan sepeda.

Density Plot

Density plot merupakan grafik yang digunakan untuk menampilkan estimasi kepadatan probabilitas dari data kontinu. Grafik ini menggunakan kurva halus untuk menggambarkan pola distribusi data, sehingga dapat memberikan visualisasi yang lebih mulus dan informatif dibandingkan histogram.

Melalui visualisasi ini, kita dapat menjawab pertanyaan: bagaimana pola kepadatan distribusi kecepatan angin harian, serta pada kisaran kecepatan angin berapa data paling terkonsentrasi?

Density plot di atas menunjukkan distribusi kepadatan kecepatan angin harian (windspeed) dalam dataset dengan kurva yang halus dan kontinu. Terlihat bahwa kurva kepadatan mencapai puncaknya pada kisaran sekitar 0.14 hingga 0.18, yang menunjukkan bahwa kisaran tersebut merupakan kecepatan angin yang paling sering terjadi.

Kurva distribusi menunjukkan bentuk unimodal, yaitu hanya memiliki satu puncak utama, yang menandakan bahwa sebagian besar hari memiliki kecepatan angin yang terkonsentrasi pada kisaran rendah hingga menengah. Setelah mencapai puncak, kurva menurun secara bertahap ke arah kanan, membentuk ekor yang cukup panjang hingga mendekati nilai sekitar 0.5.

Bentuk distribusi yang condong ke kanan (right-skewed) ini menunjukkan bahwa terdapat sejumlah kecil hari dengan kecepatan angin yang relatif tinggi, namun jumlahnya jauh lebih sedikit dibandingkan hari dengan kecepatan angin rendah hingga sedang. Selain itu, kepadatan pada nilai kecepatan angin yang sangat rendah juga relatif kecil, yang menunjukkan bahwa kondisi tanpa angin hampir tidak terjadi.

Density plot ini memberikan gambaran yang lebih jelas mengenai pola distribusi dibandingkan histogram karena tidak dipengaruhi oleh pembagian interval kelas. Visualisasi ini menegaskan bahwa sebagian besar hari dalam dataset memiliki kecepatan angin yang moderat, dengan hanya sedikit hari yang mengalami kecepatan angin ekstrem.

Boxplot

Boxplot merupakan grafik yang digunakan untuk menampilkan distribusi data berdasarkan lima ukuran ringkasan utama, yaitu nilai minimum, kuartil pertama (Q1), median, kuartil ketiga (Q3), dan nilai maksimum. Selain itu, boxplot juga membantu dalam mengidentifikasi keberadaan outlier atau nilai yang berada di luar pola umum distribusi data. Berikut ini adalah contoh kode untuk membuat boxplot dari variabel windspeed:

Melalui visualisasi ini, dapat dianalisis bagaimana tingkat pemusatan, variasi, serta keberadaan outlier pada kecepatan angin harian. Boxplot di atas memberikan ringkasan statistik distribusi kecepatan angin harian (windspeed) melalui median, kuartil, serta potensi nilai outlier. Terlihat bahwa median kecepatan angin berada di sekitar 0.17 hingga 0.18, yang menunjukkan bahwa setengah dari hari dalam dataset memiliki kecepatan angin di bawah nilai tersebut dan setengah lainnya di atasnya. Hal ini menunjukkan bahwa kecepatan angin tipikal dalam dataset berada pada kisaran rendah hingga menengah.

Rentang interkuartil (Q1 hingga Q3) terlihat berada kira-kira antara 0.13 hingga 0.23, yang menunjukkan bahwa 50% data terkonsentrasi dalam kisaran tersebut. Hal ini menunjukkan bahwa sebagian besar hari memiliki kecepatan angin yang relatif stabil dan tidak terlalu jauh dari nilai tengah distribusi.

Whisker pada sisi kanan memanjang hingga sekitar 0.35, yang menunjukkan bahwa terdapat variasi kecepatan angin hingga tingkat yang lebih tinggi. Selain itu, terlihat beberapa titik di luar whisker pada sisi kanan, yaitu pada kisaran sekitar 0.38 hingga 0.52, yang merupakan outlier. Outlier ini menunjukkan bahwa terdapat beberapa hari dengan kecepatan angin yang jauh lebih tinggi dibandingkan sebagian besar hari lainnya.

Sebaliknya, tidak terlihat outlier yang signifikan pada sisi kiri, yang menunjukkan bahwa kecepatan angin yang sangat rendah relatif jarang terjadi atau masih berada dalam rentang distribusi normal.

Secara keseluruhan, boxplot ini menunjukkan bahwa distribusi kecepatan angin harian cenderung condong ke kanan (right-skewed), dengan sebagian besar nilai terkonsentrasi pada kisaran rendah hingga menengah, serta adanya sejumlah kecil hari dengan kecepatan angin yang jauh lebih tinggi. Informasi ini penting karena kondisi angin yang sangat kuat berpotensi memengaruhi kenyamanan dan kecenderungan masyarakat dalam menggunakan sepeda.

Violin Plot

Violin plot merupakan grafik yang mengombinasikan boxplot dan density plot dalam satu visualisasi. Grafik ini menampilkan distribusi data sekaligus memberikan informasi mengenai tingkat kepadatan data pada setiap nilai. Melalui visualisasi ini, dapat dianalisis bagaimana bentuk keseluruhan distribusi kecepatan angin harian, pada kisaran nilai mana data paling terkonsentrasi, serta bagaimana tingkat variasinya.

Violin plot di atas memberikan gambaran lengkap mengenai distribusi kecepatan angin harian (windspeed) dengan menggabungkan informasi kepadatan distribusi dan ringkasan statistik. Lebar violin pada setiap titik menunjukkan tingkat kepadatan data, di mana bagian yang lebih lebar menandakan bahwa lebih banyak hari memiliki kecepatan angin pada kisaran tersebut.

Terlihat bahwa bagian violin paling lebar berada pada kisaran sekitar 0.12 hingga 0.22, yang menunjukkan bahwa sebagian besar hari memiliki kecepatan angin pada kisaran rendah hingga menengah. Hal ini menunjukkan bahwa kondisi angin yang moderat merupakan kondisi yang paling umum terjadi dalam dataset.

Boxplot di dalam violin menunjukkan median kecepatan angin berada di sekitar 0.17 hingga 0.18, yang menegaskan bahwa nilai tengah distribusi berada dalam kisaran tersebut. Rentang interkuartil yang berada kira-kira antara 0.13 hingga 0.23 menunjukkan bahwa 50% data terkonsentrasi dalam kisaran ini, yang menunjukkan tingkat variasi yang moderat.

Bagian violin yang memanjang dan meruncing ke arah kanan hingga mendekati nilai sekitar 0.5 menunjukkan bahwa terdapat sejumlah kecil hari dengan kecepatan angin yang relatif tinggi, meskipun kepadatannya rendah. Sebaliknya, bagian kiri violin yang lebih pendek menunjukkan bahwa kecepatan angin yang sangat rendah relatif jarang terjadi.

Secara keseluruhan, bentuk distribusi yang lebih lebar di bagian tengah dan meruncing di bagian kanan menunjukkan bahwa distribusi kecepatan angin condong ke kanan (right-skewed), dengan sebagian besar hari memiliki kecepatan angin rendah hingga menengah, serta hanya sedikit hari dengan kecepatan angin yang sangat tinggi. Visualisasi ini memberikan pemahaman yang komprehensif mengenai pola distribusi, tingkat pemusatan, dan variasi kecepatan angin dalam dataset.

Kesimpulan

Berdasarkan histogram, density plot, boxplot, dan violin plot, dapat disimpulkan bahwa kecepatan angin harian dalam dataset memiliki distribusi yang terkonsentrasi pada kisaran rendah hingga menengah, dengan sebagian besar nilai berada di sekitar 0.12 hingga 0.22, dan median sekitar 0.17 hingga 0.18.

Histogram dan density plot menunjukkan bahwa distribusi memiliki satu puncak utama pada kisaran tersebut, yang menandakan bahwa kondisi angin moderat merupakan kondisi yang paling umum terjadi. Boxplot dan violin plot menunjukkan bahwa sebagian besar data berada dalam rentang interkuartil yang relatif sempit, yang menunjukkan bahwa variasi kecepatan angin tidak terlalu ekstrem untuk sebagian besar hari.

Namun, terdapat sejumlah kecil hari dengan kecepatan angin yang jauh lebih tinggi, yang terlihat sebagai ekor distribusi yang memanjang ke kanan serta sebagai outlier pada boxplot. Hal ini menunjukkan bahwa meskipun jarang terjadi, kondisi angin yang kuat tetap muncul dalam dataset.

Secara keseluruhan, dapat disimpulkan bahwa kecepatan angin harian dalam dataset cenderung stabil pada tingkat rendah hingga menengah, dengan distribusi yang sedikit condong ke kanan akibat adanya beberapa hari dengan kecepatan angin tinggi. Pemahaman ini penting sebagai dasar untuk analisis lebih lanjut mengenai bagaimana kecepatan angin memengaruhi jumlah penyewaan sepeda dalam analisis bivariate.

Visualisasi Data Kontinu (Bivariate)

Setelah memahami pola distribusi pada satu variabel, analisis dapat dilanjutkan ke tahap berikutnya, yaitu visualisasi bivariate. Visualisasi bivariate digunakan untuk mengamati hubungan antara dua variabel, sehingga analis dapat melihat bagaimana suatu variabel berkaitan atau berubah seiring dengan perubahan variabel lainnya. Pendekatan ini memungkinkan tidak hanya memahami persebaran data, tetapi juga mengeksplorasi kemungkinan adanya keterkaitan atau pola hubungan antarvariabel.

Dengan demikian, visualisasi univariate memberikan gambaran awal mengenai karakteristik dan variasi dari masing-masing variabel, sedangkan visualisasi bivariate membantu mengidentifikasi serta memahami hubungan antarvariabel secara lebih mendalam. Berikut ini adalah beberapa jenis visualisasi bivariate yang dapat digunakan untuk menganalisis hubungan antara dua variabel dalam dataset:

Scatter Plot

Scatter plot merupakan grafik yang digunakan untuk menampilkan hubungan antara dua variabel numerik. Setiap titik pada scatter plot merepresentasikan satu observasi, di mana posisi titik ditentukan oleh nilai masing-masing variabel pada sumbu horizontal dan sumbu vertikal. Bagaimana hubungan antara suhu yang dirasakan (apparent temperature) dan jumlah penyewaan sepeda? Posisi titik pada sumbu horizontal menunjukkan nilai suhu yang dirasakan, sedangkan posisi pada sumbu vertikal menunjukkan jumlah penyewaan sepeda. Melalui pola sebaran titik, dapat diamati arah, kekuatan, serta bentuk hubungan antara kedua variabel tersebut.

Hasil visualisasi menunjukkan adanya kecenderungan hubungan positif, yang ditandai dengan pola titik yang bergerak dari kiri bawah ke kanan atas. Hal ini mengindikasikan bahwa ketika suhu yang dirasakan meningkat, jumlah penyewaan sepeda juga cenderung meningkat. Pada kisaran suhu rendah, titik-titik terkonsentrasi pada nilai penyewaan yang relatif kecil, menandakan aktivitas penyewaan yang lebih terbatas.

Seiring meningkatnya suhu ke tingkat menengah dan tinggi, jumlah penyewaan sepeda menunjukkan peningkatan yang lebih signifikan. Namun, pada kisaran ini juga terlihat penyebaran titik yang lebih lebar, yang menunjukkan adanya variasi jumlah penyewaan meskipun berada pada tingkat suhu yang serupa. Variasi ini mengindikasikan bahwa selain suhu yang dirasakan, kemungkinan terdapat faktor lain yang turut memengaruhi jumlah penyewaan sepeda.

Secara keseluruhan, pola sebaran titik mengonfirmasi adanya hubungan positif antara suhu yang dirasakan dan jumlah penyewaan sepeda, meskipun hubungan tersebut tidak sepenuhnya linear sempurna karena adanya variasi dalam data.

Hexbin Plot

Hexbin plot tersebut menampilkan distribusi gabungan antara kelembaban dan jumlah penyewaan sepeda, di mana intensitas warna menunjukkan banyaknya observasi pada setiap kombinasi nilai. Semakin terang warna pada heksagon, semakin tinggi kepadatan data pada area tersebut. Visualisasi ini membantu melihat pola konsentrasi data tanpa terlalu padat seperti scatter plot biasa.

Kepadatan tertinggi terlihat pada kisaran kelembaban sekitar 0,45 hingga 0,70 dengan jumlah penyewaan sekitar 3.000 hingga 6.000 sepeda per hari. Hal ini menunjukkan bahwa sebagian besar observasi terkonsentrasi pada tingkat kelembaban menengah dengan tingkat penyewaan menengah hingga cukup tinggi. Area dengan kelembaban sangat rendah tampak memiliki observasi yang relatif lebih sedikit.

Secara pola, tidak terlihat hubungan linear yang kuat antara kelembaban dan jumlah penyewaan sepeda. Sebaran data cenderung menyebar secara vertikal pada berbagai tingkat kelembaban, yang menunjukkan bahwa pada satu tingkat kelembaban tertentu, jumlah penyewaan dapat bervariasi cukup besar. Namun demikian, penyewaan dengan jumlah sangat tinggi relatif jarang muncul pada kelembaban yang sangat tinggi, sehingga dapat mengindikasikan kecenderungan hubungan negatif yang lemah.

Secara keseluruhan, visualisasi ini menunjukkan bahwa kelembaban bukan satu-satunya faktor yang menentukan tingkat penyewaan sepeda. Meskipun terdapat pola konsentrasi pada kelembaban menengah, kekuatan dan arah hubungan antara kedua variabel ini perlu dikonfirmasi lebih lanjut melalui analisis kuantitatif seperti korelasi atau regresi.

2D Density Plot

Visualisasi 2D density plot (filled) menunjukkan distribusi gabungan antara kecepatan angin dan jumlah penyewaan sepeda. Warna yang lebih terang merepresentasikan area dengan kepadatan observasi yang lebih tinggi, yang berarti kombinasi nilai tersebut lebih sering muncul dalam dataset.

Terlihat bahwa kepadatan tertinggi terkonsentrasi pada kecepatan angin rendah hingga menengah dengan jumlah penyewaan sekitar 4.000–5.500 sepeda per hari. Hal ini menunjukkan bahwa sebagian besar aktivitas penyewaan terjadi pada kondisi angin yang relatif tidak terlalu kencang. Sebaliknya, pada kecepatan angin yang lebih tinggi, kepadatan observasi cenderung menurun. Ini mengindikasikan bahwa kombinasi angin kencang dan jumlah penyewaan tinggi relatif lebih jarang terjadi.

Secara keseluruhan, pola ini menunjukkan adanya kecenderungan bahwa semakin tinggi kecepatan angin, frekuensi penyewaan sepeda cenderung tidak sebesar pada kondisi angin rendah hingga sedang. Namun, untuk memastikan arah dan kekuatan hubungan tersebut, diperlukan analisis kuantitatif lebih lanjut seperti korelasi atau regresi.

Boxplot Bivariate

Visualisasi tersebut menggunakan boxplot untuk membandingkan distribusi jumlah penyewaan sepeda harian (cnt) pada tiga bulan terakhir dalam satu tahun, yaitu Oktober (10), November (11), dan Desember (12). Boxplot digunakan karena mampu merangkum karakteristik distribusi data secara ringkas melalui median, kuartil, rentang interkuartil, serta sebaran nilai minimum dan maksimum.

Berdasarkan grafik, bulan Oktober memiliki median jumlah penyewaan tertinggi, yaitu sekitar 5.000 penyewaan per hari. Hal ini menunjukkan bahwa tingkat penggunaan sepeda pada bulan tersebut relatif lebih tinggi dibandingkan dua bulan setelahnya. Selain itu, rentang interkuartil pada Oktober tampak lebih lebar, yang mengindikasikan variasi penggunaan sepeda antar hari lebih besar. Whisker bagian atas yang mencapai lebih dari 8.000 penyewaan menunjukkan adanya beberapa hari dengan tingkat penggunaan yang sangat tinggi.

Pada bulan November, median jumlah penyewaan menurun menjadi sekitar 4.000 per hari. Rentang interkuartilnya juga lebih sempit dibandingkan Oktober, yang menunjukkan bahwa distribusi penyewaan menjadi lebih terkonsentrasi dan variasinya relatif berkurang. Hal ini mencerminkan adanya penurunan tingkat penggunaan sepeda dibandingkan bulan sebelumnya.

Penurunan lebih lanjut terlihat pada bulan Desember, dengan median sekitar 3.500 penyewaan per hari. Posisi kuartil atas dan bawah juga lebih rendah dibandingkan dua bulan sebelumnya, sehingga secara umum tingkat penyewaan pada bulan Desember berada pada level yang lebih rendah. Meskipun demikian, panjang whisker menunjukkan bahwa variasi antar hari masih tetap ada.

Secara keseluruhan, boxplot ini memperlihatkan pola penurunan jumlah penyewaan sepeda dari Oktober hingga Desember. Pola tersebut mengindikasikan adanya perbedaan distribusi penggunaan sepeda antar bulan pada periode akhir tahun, yang kemungkinan berkaitan dengan faktor musiman atau kondisi lingkungan yang berubah.

Violin Bivariate

Violin plot bivariate digunakan untuk membandingkan distribusi jumlah penyewaan sepeda pada berbagai kategori kecepatan angin, yaitu rendah, sedang, dan tinggi. Violin plot dipilih karena mampu menampilkan pola distribusi dan kepadatan data secara jelas, sekaligus memberikan ringkasan statistik. Melalui visualisasi ini, dapat diamati perbedaan pola dan variasi jumlah penyewaan sepeda pada setiap tingkat kecepatan angin. Visualisasi di atas menunjukkan distribusi jumlah penyewaan sepeda harian (cnt) berdasarkan kategori kecepatan angin, yaitu rendah, sedang, dan tinggi. Lebar violin pada setiap kategori menunjukkan tingkat kepadatan data, di mana bagian yang lebih lebar menandakan bahwa lebih banyak hari memiliki jumlah penyewaan sepeda pada kisaran tersebut.

Terlihat bahwa kategori kecepatan angin rendah memiliki median jumlah penyewaan sepeda yang relatif lebih tinggi dibandingkan kategori lainnya, dengan sebagian besar distribusi terkonsentrasi pada kisaran sekitar 4.000 hingga 7.000 penyewaan per hari. Selain itu, bagian violin yang cukup lebar pada kisaran nilai tinggi menunjukkan bahwa pada kondisi angin rendah, terdapat banyak hari dengan tingkat penyewaan sepeda yang tinggi. Hal ini menunjukkan bahwa kondisi angin yang lebih tenang cenderung mendukung peningkatan penggunaan sepeda.

Pada kategori kecepatan angin sedang, median jumlah penyewaan sepeda sedikit lebih rendah dibandingkan kategori rendah, meskipun masih menunjukkan distribusi yang cukup luas. Kepadatan data terlihat terkonsentrasi pada kisaran sekitar 3.500 hingga 6.000 penyewaan per hari. Hal ini menunjukkan bahwa meskipun penggunaan sepeda masih cukup tinggi pada kondisi angin sedang, terdapat sedikit penurunan dibandingkan kondisi angin rendah.

Sebaliknya, kategori kecepatan angin tinggi menunjukkan median jumlah penyewaan sepeda yang lebih rendah dibandingkan dua kategori lainnya. Distribusi juga terlihat lebih terkonsentrasi pada kisaran yang lebih rendah, yaitu sekitar 2.000 hingga 5.000 penyewaan per hari, dengan lebih sedikit hari yang mencapai tingkat penyewaan yang sangat tinggi. Hal ini menunjukkan bahwa kecepatan angin yang tinggi cenderung berkaitan dengan penurunan jumlah penyewaan sepeda.

Bubble Plot

Setelah menganalisis pengaruh kecepatan angin terhadap jumlah penyewaan sepeda menggunakan violin plot, langkah selanjutnya adalah memahami hubungan yang lebih kompleks antara beberapa variabel lingkungan secara simultan. Dalam konteks ini, tidak hanya suhu yang diduga memengaruhi jumlah penyewaan sepeda, tetapi juga kecepatan angin yang berpotensi memperkuat atau memperlemah hubungan tersebut.

Untuk mengeksplorasi hubungan ini, digunakan bubble plot, yaitu bentuk visualisasi bivariate yang diperluas dengan menambahkan variabel ketiga melalui ukuran gelembung. Dalam visualisasi ini, suhu (temp) ditampilkan pada sumbu horizontal, jumlah penyewaan sepeda (cnt) pada sumbu vertikal, dan kecepatan angin (windspeed) direpresentasikan melalui ukuran gelembung. Visualisasi ini memungkinkan analisis simultan mengenai bagaimana suhu memengaruhi jumlah penyewaan sepeda, serta bagaimana kecepatan angin berperan dalam hubungan tersebut.

Bubble plot menunjukkan hubungan antara suhu (temp) dan jumlah penyewaan sepeda (cnt), dengan ukuran gelembung merepresentasikan kecepatan angin (windspeed). Secara umum, terlihat adanya hubungan positif antara suhu dan jumlah penyewaan sepeda, di mana jumlah penyewaan sepeda cenderung meningkat seiring dengan meningkatnya suhu.

Pada kisaran suhu rendah (sekitar 0.1 hingga 0.3), jumlah penyewaan sepeda cenderung berada pada tingkat yang lebih rendah, dengan sebagian besar observasi berada di bawah 3.000 penyewaan per hari. Hal ini menunjukkan bahwa kondisi suhu yang lebih dingin kurang mendukung aktivitas bersepeda, sehingga tingkat penyewaan sepeda relatif rendah. Seiring dengan meningkatnya suhu ke kisaran menengah hingga tinggi (sekitar 0.4 hingga 0.7), terlihat peningkatan yang signifikan dalam jumlah penyewaan sepeda, dengan banyak observasi berada pada kisaran 4.000 hingga 8.000 penyewaan per hari. Hal ini menunjukkan bahwa suhu yang lebih hangat mendorong peningkatan penggunaan sepeda, kemungkinan karena kondisi lingkungan yang lebih nyaman untuk beraktivitas di luar ruangan.

Jika dilihat dari ukuran gelembung, yang merepresentasikan kecepatan angin, terlihat bahwa gelembung yang lebih besar (menunjukkan kecepatan angin yang lebih tinggi) cenderung lebih sering muncul pada tingkat penyewaan sepeda yang lebih rendah dibandingkan gelembung yang lebih kecil pada kisaran suhu yang sama. Sebaliknya, pada tingkat penyewaan sepeda yang tinggi, gelembung yang muncul cenderung lebih kecil, yang menunjukkan bahwa kondisi angin yang lebih tenang lebih sering berkaitan dengan tingkat penyewaan sepeda yang tinggi.

Selain itu, meskipun suhu tinggi secara umum berkaitan dengan jumlah penyewaan sepeda yang tinggi, kehadiran gelembung yang lebih besar pada beberapa titik menunjukkan bahwa kecepatan angin yang tinggi dapat membatasi peningkatan jumlah penyewaan sepeda, bahkan pada kondisi suhu yang mendukung. Hal ini menunjukkan bahwa kecepatan angin dapat berperan sebagai faktor moderasi dalam hubungan antara suhu dan jumlah penyewaan sepeda.

Secara keseluruhan, visualisasi ini menunjukkan bahwa suhu memiliki hubungan positif yang kuat dengan jumlah penyewaan sepeda, sementara kecepatan angin menunjukkan kecenderungan hubungan negatif. Kombinasi kedua faktor ini menunjukkan bahwa kondisi lingkungan yang paling mendukung tingkat penyewaan sepeda yang tinggi adalah suhu yang hangat dan kecepatan angin yang rendah. Visualisasi ini memberikan pemahaman yang lebih komprehensif mengenai bagaimana beberapa faktor lingkungan secara simultan memengaruhi perilaku penggunaan sepeda.

Kesimpulan

Berdasarkan seluruh visualisasi bivariate, terlihat bahwa jumlah penyewaan sepeda memiliki keterkaitan dengan beberapa faktor lingkungan, meskipun kekuatan hubungannya berbeda-beda. Suhu menunjukkan hubungan positif yang paling konsisten, di mana peningkatan suhu cenderung diikuti oleh peningkatan jumlah penyewaan sepeda. Hal ini menunjukkan bahwa kondisi suhu yang lebih hangat lebih mendukung aktivitas bersepeda.

Sebaliknya, kecepatan angin menunjukkan kecenderungan hubungan negatif. Visualisasi menunjukkan bahwa jumlah penyewaan sepeda cenderung lebih tinggi pada kondisi angin rendah hingga sedang, dan menurun ketika kecepatan angin meningkat. Hal ini mengindikasikan bahwa angin yang lebih kencang dapat mengurangi kenyamanan bersepeda sehingga berdampak pada penurunan penggunaan sepeda.

Kelembaban menunjukkan hubungan yang lebih lemah dibandingkan faktor lainnya. Meskipun sebagian besar penyewaan sepeda terkonsentrasi pada tingkat kelembaban menengah, tidak terlihat pola hubungan linear yang kuat. Hal ini menunjukkan bahwa kelembaban bukan faktor utama yang secara langsung menentukan jumlah penyewaan sepeda, melainkan kemungkinan berinteraksi dengan faktor lain.

Selain faktor lingkungan, visualisasi juga menunjukkan adanya variasi jumlah penyewaan sepeda antar periode waktu, yang mengindikasikan adanya pengaruh faktor musiman atau temporal. Secara keseluruhan, hasil visualisasi menunjukkan bahwa jumlah penyewaan sepeda dipengaruhi oleh kombinasi beberapa faktor, dengan suhu sebagai faktor yang paling dominan, diikuti oleh kecepatan angin dan faktor lainnya. Temuan ini memberikan dasar yang kuat untuk analisis lanjutan menggunakan metode statistik, seperti korelasi atau regresi, guna mengukur secara kuantitatif kekuatan dan arah hubungan antarvariabel.