Analisis Hubungan Curah Hujan dan Hasil Panen Padi di Pulau Jawa
Practicum ~ Week 4
1 Pendahuluan
Pertanian merupakan salah satu sektor penting dalam perekonomian Indonesia. Salah satu faktor utama yang memengaruhi hasil panen adalah curah hujan. Curah hujan yang terlalu rendah dapat menyebabkan kekeringan, sedangkan curah hujan berlebih bisa menimbulkan banjir dan merusak tanaman.
Pada analisis ini, digunakan data simulasi berdasarkan referensi data curah hujan bulanan dari Badan Meteorologi, Klimatologi, dan Geofisika (BMKG). Tujuan utama penelitian ini adalah untuk melihat hubungan antara curah hujan dan hasil panen padi di beberapa daerah di Indonesia.
2 Persiapan Data
Pada tahap ini dilakukan pemuatan pustaka, pembuatan data simulasi (berdasarkan pola umum dari data BMKG), serta penjelasan sumber data dan konteks kasus.
Sumber referensi data:
- BMKG. (2025). Data Curah Hujan Bulanan Indonesia. Diakses dari: https://data.bmkg.go.id/
- FAO. (2024). Climate and Crop Production Statistics in Southeast Asia.
2.1 Penjelasan Data
Dataset ini berisi tiga variabel utama:
- Bulan → periode pengamatan (Januari–Desember)
- Daerah → provinsi atau wilayah pengamatan (contoh: Jawa Barat, Jawa Tengah, Jawa Timur)
- Curah_Hujan → rata-rata curah hujan per bulan (dalam mm)
- Hasil_Panen → hasil panen padi rata-rata per hektar (ton/ha)
2.2 Menampilkan data
3 Visualisasi
Visualisasi bertujuan untuk memahami pola hubungan antara curah hujan dan hasil panen padi.
3.1 Histogram
Histogram digunakan untuk menampilkan distribusi frekuensi dari suatu variabel numerik. Grafik ini membagi data menjadi interval (bin) dan menampilkan berapa banyak nilai yang jatuh dalam setiap interval tersebut.
Aturan Penggunaan:
- Digunakan untuk data kuantitatif (numerik).
- Cocok untuk melihat pola distribusi: apakah data menyebar normal, miring (skewed), atau memiliki outlier.
Kelebihan:
- Memberikan gambaran cepat tentang sebaran data.
- Mudah dibaca dan dipahami.
Kekurangan:
- Tidak bisa digunakan untuk membandingkan lebih dari satu variabel
sekaligus (tanpa overlay).
- Hasil bisa berbeda tergantung pada ukuran binwidth (lebar interval).
3.2 Bar Chart
Bar chart digunakan untuk menampilkan perbandingan nilai antar kategori.
Aturan Penggunaan:
- Gunakan ketika ingin membandingkan nilai rata-rata antar daerah atau bulan.
Kelebihan:
- Mudah dibaca dan dipahami.
- Efektif untuk membandingkan antar kategori.
Kekurangan:
- Tidak menunjukkan tren waktu.
- Kurang cocok untuk data numerik kontinu.
3.3 Line Chart
Line chart (diagram garis) digunakan untuk menunjukkan perubahan data secara berurutan, misalnya tren bulanan hasil panen.
Aturan Penggunaan:
- Cocok untuk data time series atau urutan bulan.
Kelebihan:
- Menunjukkan tren perubahan dengan jelas.
- Bisa membandingkan antar kategori.
Kekurangan:
- Kurang cocok untuk data kategori yang tidak berurutan.
3.4 Pie Chart
Pie chart (diagram lingkaran) digunakan untuk menunjukkan
proporsi atau persentase dari suatu total.
Setiap potongan (slice) mewakili bagian dari keseluruhan nilai.
Aturan Penggunaan:
- Cocok untuk membandingkan bagian terhadap
keseluruhan (misalnya, persentase hasil panen dari tiap
daerah).
- Sebaiknya digunakan hanya jika jumlah kategori sedikit (≤6) agar mudah dibaca.
Kelebihan:
- Mudah dipahami secara visual oleh pembaca umum.
- Efektif untuk menunjukkan dominasi satu kategori.
Kekurangan:
- Sulit membandingkan potongan dengan ukuran mirip.
- Tidak menunjukkan nilai aktual dengan jelas seperti bar chart.
3.5 Scatter Plot
Scatter plot digunakan untuk melihat hubungan antara dua variabel numerik, misal curah hujan dan hasil panen.
Aturan Penggunaan:
- Cocok untuk analisis korelasi atau tren antar variabel numerik.
Kelebihan:
- Menunjukkan pola hubungan (linier atau non-linier).
- Menampilkan penyebaran data antar kelompok.
Kekurangan:
- Tidak cocok untuk data kategori.
3.6 Density Plot
Density plot menampilkan distribusi kepadatan data numerik, memberikan gambaran seberapa padat nilai tertentu muncul dalam dataset.
Aturan Penggunaan:
- Gunakan ketika ingin membandingkan sebaran hasil panen antar daerah atau kelompok, terutama untuk data kontinu.
Kelebihan:
- Memberikan visualisasi distribusi yang halus dibanding
histogram.
- Mudah membandingkan beberapa kelompok sekaligus.
Kekurangan:
- Tidak menunjukkan nilai absolut frekuensi seperti histogram.
3.7 Box Plot
Boxplot digunakan untuk menampilkan penyebaran data
numerik dan mendeteksi outlier (nilai
pencilan).
Grafik ini menunjukkan nilai minimum, kuartil pertama (Q1),
median, kuartil ketiga (Q3), dan maksimum dalam satu
tampilan.
Aturan Penggunaan:
- Gunakan untuk melihat variasi data antar kelompok (misalnya antar
daerah).
- Cocok untuk data kuantitatif (angka).
Kelebihan:
- Dapat menampilkan penyebaran data dan pencilan dengan cepat.
- Mudah membandingkan persebaran antar kategori.
Kekurangan:
- Tidak menunjukkan distribusi detail (seperti bentuk kepadatan
data).
- Kurang cocok untuk dataset kecil.
3.8 Ridgeline Plot
Ridgeline plot adalah jenis visualisasi yang menampilkan distribusi dari beberapa kelompok (kategori) secara tumpang tindih dalam bentuk kurva. Setiap garis (ridge) menunjukkan distribusi dari satu kelompok, sehingga memudahkan kita membandingkan bentuk distribusi antar daerah atau kategori.
Aturan Penggunaan:
- Gunakan ketika ingin membandingkan distribusi data numerik
antar kategori.
- Cocok untuk dataset dengan banyak kelompok (misalnya beberapa
daerah, waktu, atau jenis produk).
- Kurang cocok untuk dataset kecil atau hanya berisi sedikit kategori.
Kelebihan:
- Visual menarik dan informatif untuk melihat perbandingan
distribusi.
- Menunjukkan pola dan perbedaan antar kategori dengan jelas.
Kekurangan:
- Bisa sulit dibaca jika terlalu banyak kategori atau tumpang tindih
terlalu rapat.
- Tidak menampilkan nilai eksak (lebih ke bentuk distribusi).
3.9 Facet Plot
Facet Plot adalah teknik visualisasi pada ggplot2 yang
digunakan untuk membagi data menjadi beberapa panel
(sub-plot) berdasarkan kategori tertentu.
Setiap panel menampilkan subset data sehingga pola perbandingan antar
kategori menjadi lebih mudah terlihat.
Aturan Penggunaan:
- Gunakan ketika kamu ingin membandingkan pola antar grup atau
kategori dalam dataset yang sama.
- Cocok untuk dataset dengan variabel kategorik seperti daerah, jenis produk, atau waktu.
Kelebihan:
- Memudahkan analisis perbandingan antar grup secara visual.
- Tampilan tetap rapi meskipun banyak data.
Kekurangan:
- Tidak efisien untuk kategori yang sangat banyak.
- Membutuhkan ruang visual yang lebih besar agar tidak tampak padat.
4 Kesimpulan
Secara keseluruhan, hasil visualisasi menunjukkan bahwa curah
hujan memiliki pengaruh signifikan terhadap hasil panen padi,
namun pengaruh tersebut juga bergantung pada pola hujan musiman,
kondisi geografis, serta pengelolaan pertanian di tiap
daerah.
Dengan demikian, pengaturan irigasi dan sistem pertanian adaptif
terhadap iklim sangat penting untuk menjaga stabilitas hasil
panen di masa depan, terutama menghadapi perubahan iklim yang
semakin dinamis.
Berdasarkan hasil analisis visualisasi data yang telah dilakukan, diperoleh beberapa kesimpulan penting sebagai berikut:
Hubungan antara Curah Hujan dan Hasil Panen
Dari scatter plot, terlihat bahwa terdapat korelasi positif moderat antara curah hujan dan hasil panen. Artinya, semakin tinggi curah hujan (hingga batas optimal), umumnya hasil panen padi juga meningkat. Namun, pada beberapa daerah dengan curah hujan sangat tinggi, hasil panen justru sedikit menurun — kemungkinan akibat kelebihan air atau banjir.
Perbandingan Antar Daerah
Berdasarkan bar chart dan boxplot, daerah Jawa Timur cenderung memiliki rata-rata hasil panen paling tinggi, diikuti oleh Jawa Barat dan Jawa Tengah. Hal ini bisa disebabkan oleh perbedaan kondisi tanah, intensitas hujan yang lebih seimbang, serta efisiensi sistem irigasi.
Pola Musiman
Dari line chart, pola panen menunjukkan peningkatan hasil pada bulan Maret hingga Mei, yang bertepatan dengan akhir musim hujan. Sebaliknya, hasil menurun pada bulan Agustus hingga Oktober saat curah hujan rendah.
Distribusi Data
Berdasarkan density plot dan ridgeline plot, distribusi hasil panen antar daerah relatif seragam, namun daerah dengan curah hujan lebih stabil (seperti Jawa Timur) menunjukkan sebaran hasil yang lebih terkonsentrasi (stabil) dibanding daerah lain yang lebih fluktuatif.
Proporsi Total Hasil Panen Nasional
Dari pie chart, kontribusi terbesar terhadap total hasil panen berasal dari Jawa Timur, diikuti oleh Jawa Barat, dan yang paling sedikit Jawa Tengah.