Dataset ini berasal dari sistem Capital Bikeshare di Washington, D.C., dan diperoleh dari UCI Machine Learning Repository. Data yang digunakan merupakan data harian (day dataset) yang mencatat aktivitas penyewaan sepeda setiap hari selama dua tahun, yaitu dari 1 Januari 2011 hingga 31 Desember 2012, dengan total sekitar 731 observasi. Setiap baris data merepresentasikan satu hari operasional sistem, sehingga memungkinkan analisis pola penggunaan sepeda dari waktu ke waktu. Data ini dikumpulkan dalam berbagai kondisi, seperti perbedaan musim, variasi cuaca, serta jenis hari (hari kerja, akhir pekan, atau hari libur). Oleh karena itu, dataset ini sangat penting untuk mengidentifikasi pola, tren, dan kemungkinan pengaruh faktor-faktor tertentu terhadap jumlah penyewaan sepeda.
## [1] "instant" "dteday" "season" "yr" "mnth"
## [6] "holiday" "weekday" "workingday" "weathersit" "temp"
## [11] "atemp" "hum" "windspeed" "casual" "registered"
## [16] "cnt"
## [1] "No" "Variabel Numerik" "Keterangan"
| Deskripsi Data | ||
| No | Variabel Numerik | Keterangan |
|---|---|---|
| 1 | temp | Suhu dalam skala Celsius |
| 2 | atemp | Suhu yang dirasakan |
| 3 | hum | Kelembapan |
| 4 | windspeed | Kecepatan angin |
| 5 | casual | Jumlah penyewaan sepeda oleh pengguna kasual |
| 6 | registered | Jumlah penyewaan sepeda oleh pengguna terdaftar |
| 7 | cnt | Total jumlah penyewaan sepeda (casual + registered) |
Grafik histogram ini digunakan untuk melihat pola sebaran total penyewaan, yaitu bagaimana variasi jumlah penyewaan muncul dari waktu ke waktu. Semakin tinggi batang pada grafik, semakin sering jumlah penyewaan tersebut terjadi. Terlihat bahwa data paling banyak berkumpul pada rentang nilai menengah, sekitar 4.000 hingga 5.000 penyewaan. Hal ini menunjukkan bahwa pada sebagian besar kondisi, aktivitas penyewaan berada pada tingkat yang relatif stabil. Sebaliknya, jumlah penyewaan yang sangat kecil maupun sangat besar jarang muncul, sehingga dapat dianggap sebagai kejadian tidak umum. Jika dikaitkan dengan variabel lain seperti hari, musim, atau kondisi eksternal, grafik ini mengindikasikan bahwa perubahan faktor-faktor tersebut umumnya hanya menyebabkan fluktuasi ringan di sekitar nilai rata-rata.
Visualisasi ini menggambarkan pola sebaran suhu berdasarkan tingkat kepadatan data. Grafik menunjukkan bahwa suhu tidak tersebar secara acak, melainkan terkonsentrasi pada nilai-nilai tertentu yang muncul lebih sering. Terlihat bahwa sebagian besar nilai suhu berada pada rentang menengah, dengan dua puncak kepadatan. Pola ini mengindikasikan bahwa terdapat dua kondisi suhu yang cukup dominan, misalnya suhu yang cenderung sejuk dan suhu yang lebih hangat. Suhu ekstrem (sangat rendah atau sangat tinggi) relatif jarang terjadi.
Grafik ini menunjukkan bahwa total penyewaan sepeda berbeda antar musim. Terlihat bahwa musim dengan kondisi cuaca yang cenderung lebih nyaman, seperti Summer dan Fall, memiliki jumlah penyewaan yang lebih tinggi dan relatif konsisten. Sebaliknya, pada Spring, jumlah penyewaan cenderung lebih rendah, yang dapat dipengaruhi oleh kondisi cuaca yang masih tidak stabil. Musim Winter menunjukkan penyewaan yang cukup bervariasi, menandakan bahwa meskipun cuaca kurang mendukung, aktivitas penyewaan tetap terjadi pada kondisi tertentu. Secara keseluruhan, grafik ini menegaskan bahwa musim merupakan variabel yang berpengaruh terhadap tingkat penyewaan, dengan pola peningkatan pada musim hangat dan penurunan pada musim yang kurang mendukung.
##Violin Plot
Grafik ini menunjukkan bahwa jumlah pengguna terdaftar tertinggi terjadi saat cuaca cerah, menurun pada kondisi berawan, dan paling rendah saat hujan ringan. Bentuk violin menunjukkan kepadatan data, sementara kotak di dalamnya merepresentasikan nilai median dan sebaran utama. Terlihat bahwa kondisi Clear memiliki median jumlah pengguna terdaftar tertinggi, diikuti oleh Cloudy, sedangkan Light Rain menunjukkan jumlah pengguna yang paling rendah. Hal ini mengindikasikan bahwa semakin baik kondisi cuaca, semakin tinggi partisipasi pengguna terdaftar dalam menggunakan layanan.
Scatter plot menggambarkan hubungan antara kecepatan angin dan total penyewaan sepeda. Setiap titik mewakili satu observasi, dengan sumbu horizontal menunjukkan kecepatan angin dan sumbu vertikal menunjukkan jumlah total penyewaan. Secara umum, titik-titik data tersebar cukup luas dan tidak membentuk pola linier yang kuat. Namun, terlihat kecenderungan bahwa pada kecepatan angin yang lebih rendah hingga sedang, jumlah penyewaan cenderung lebih tinggi. Sebaliknya, ketika kecepatan angin meningkat, jumlah penyewaan relatif menurun dan lebih jarang mencapai nilai tinggi. Hal ini menunjukkan bahwa kecepatan angin memiliki pengaruh negatif yang lemah terhadap total penyewaan, di mana angin yang lebih kencang cenderung mengurangi minat masyarakat untuk bersepeda, meskipun bukan merupakan faktor penentu utama.
Dari grafik terlihat bahwa kondisi suhu yang lebih hangat dan nyaman berkaitan dengan peningkatan jumlah pengguna terdaftar. Pada suhu yang terlalu rendah, kepadatan data berkurang, menunjukkan aktivitas pengguna yang lebih sedikit. Secara keseluruhan, grafik ini menunjukkan bahwa suhu terasa merupakan faktor penting yang memengaruhi jumlah pengguna terdaftar, meskipun bukan satu-satunya faktor penentu.
Grafik ini memperlihatkan adanya hubungan positif antara suhu dan total penyewaan, di mana peningkatan suhu umumnya diikuti oleh peningkatan jumlah penyewaan. Pola ini paling jelas terlihat pada musim Summer dan Fall, yang didominasi oleh suhu yang lebih tinggi dan jumlah penyewaan yang besar. Sebaliknya, pada musim Spring, penyewaan cenderung lebih rendah dan berada pada suhu yang lebih rendah pula sementara Spring cenderung memiliki penyewaan lebih rendah. Selain itu, titik-titik berukuran besar (angin lebih kencang) relatif lebih jarang berada pada nilai penyewaan yang sangat tinggi.