Analisis Faktor Risiko Stunting Berbasis Data: Perspektif Inferensial dan Prediktif

1. Deskripsi Masalah

Stunting merupakan kondisi gagal tumbuh pada anak balita akibat kekurangan gizi kronis yang ditandai dengan tinggi badan menurut umur berada di bawah standar. Di Indonesia, stunting masih menjadi masalah kesehatan masyarakat yang serius, terutama di daerah dengan tingkat kemiskinan tinggi, akses sanitasi buruk, serta keterbatasan layanan kesehatan ibu dan anak.

Fenomena stunting tidak hanya berdampak pada kondisi fisik anak, tetapi juga pada perkembangan kognitif, produktivitas di masa depan, serta risiko penyakit kronis saat dewasa. Anak yang mengalami stunting cenderung memiliki kemampuan belajar yang lebih rendah, berisiko putus sekolah, dan pada akhirnya memengaruhi kualitas sumber daya manusia suatu negara.

Kelompok yang terdampak utama adalah balita usia 0–59 bulan, terutama yang berasal dari keluarga dengan status sosial ekonomi rendah, ibu dengan pendidikan rendah, serta daerah dengan akses air bersih dan sanitasi terbatas. Masalah ini penting dianalisis karena intervensi pencegahan stunting memerlukan kebijakan berbasis data yang tepat sasaran. Tanpa pemahaman faktor risiko yang jelas, program intervensi seperti pemberian makanan tambahan, edukasi ibu, atau perbaikan sanitasi bisa tidak efektif atau tidak efisien.

2. Tujuan Analisis

Dalam kasus ini, tujuan analisis yang dipilih adalah memahami hubungan antar variabel yang memengaruhi kejadian stunting, bukan semata-mata memprediksi.

Alasan pemilihan tujuan ini adalah karena kebijakan kesehatan masyarakat membutuhkan pemahaman faktor penyebab (determinant analysis). Pemerintah tidak hanya ingin mengetahui anak mana yang berisiko stunting, tetapi juga ingin mengetahui mengapa risiko tersebut muncul. Informasi ini penting untuk merancang intervensi berbasis bukti, misalnya apakah faktor dominan berasal dari pendidikan ibu, status ekonomi, riwayat anemia ibu hamil, berat badan lahir rendah, atau faktor lingkungan seperti sanitasi.

Karena fokusnya adalah pemahaman hubungan dan interpretasi faktor risiko, maka pendekatan metodologis yang dipilih harus mampu memberikan interpretasi yang jelas.

3. Jika Menggunakan Statistik Klasik

Pendekatan statistik klasik yang dapat digunakan dalam kasus ini antara lain:

Regresi logistik (karena variabel dependen berupa status stunting: ya/tidak)
Regresi multivariat untuk mengontrol variabel perancu
Uji chi-square untuk analisis awal hubungan kategorik
Analisis stratifikasi atau interaksi untuk melihat efek modifikasi

Kelebihan Pendekatan Statistik

1. Interpretabilitas Tinggi

Regresi logistik menghasilkan odds ratio yang mudah dipahami oleh pembuat kebijakan. Misalnya, “balita dari ibu dengan pendidikan rendah memiliki risiko 2,3 kali lebih besar mengalami stunting.” Hal ini sangat berguna dalam komunikasi kebijakan publik.

2. Kemampuan Mengontrol Confounding

Statistik klasik memungkinkan kontrol terhadap variabel perancu sehingga hubungan yang dihasilkan lebih mendekati hubungan kausal.

3. Cocok untuk Data Survei Kesehatan

Data kesehatan masyarakat sering berasal dari survei (misalnya Riskesdas), yang memang dirancang untuk analisis inferensial statistik.

4. Mendukung Generalisasi Populasi

Dengan desain sampling yang benar, hasilnya dapat digeneralisasi ke populasi yang lebih luas.

Keterbatasan Statistik Klasik

Sensitif terhadap asumsi model (linearitas logit, multikolinearitas).
Kurang optimal jika jumlah variabel sangat banyak atau terdapat hubungan non-linear kompleks.
Fokus pada estimasi parameter, bukan optimasi akurasi prediksi.

4. Jika Menggunakan Machine Learning

Pendekatan machine learning yang mungkin digunakan antara lain:

Decision Tree
Random Forest
Gradient Boosting
Support Vector Machine
Neural Network (untuk data besar)

Potensi Manfaat Machine Learning

1. Menangani Pola Non-Linear dan Interaksi Kompleks

Machine learning dapat menangkap hubungan kompleks antar variabel tanpa perlu spesifikasi model yang ketat.

2. Akurasi Prediksi Lebih Tinggi

Jika tujuan utamanya adalah mengidentifikasi anak berisiko tinggi untuk intervensi cepat, model seperti Random Forest dapat memberikan akurasi yang lebih baik dibanding regresi logistik.

3. Feature Importance

Beberapa algoritma dapat menunjukkan variabel yang paling berpengaruh dalam prediksi.

Risiko atau Keterbatasan Machine Learning

Kurang interpretatif (bersifat black box).
Tidak otomatis memberikan makna kausal.
Berisiko overfitting jika data terbatas.
Kurang sesuai untuk data survei kompleks (tidak mempertimbangkan weight dan cluster).

5. Kesimpulan Kritis

Dalam kasus analisis faktor risiko stunting dengan tujuan memahami hubungan variabel, pendekatan statistik klasik lebih tepat secara metodologis.

Alasannya adalah:

Tujuan analisis adalah inferensi dan pemahaman determinan.
Hasil perlu diinterpretasikan secara jelas untuk kebijakan publik.
Odds ratio dan interval kepercayaan lebih informatif bagi pengambil keputusan dibanding sekadar skor akurasi.

Namun, statistik dan machine learning tidak harus diposisikan sebagai dua pendekatan yang saling menggantikan. Keduanya dapat dikombinasikan, misalnya:

Menggunakan machine learning untuk eksplorasi awal dan seleksi variabel penting.
Menggunakan regresi logistik untuk analisis inferensial akhir.
Menggunakan ML untuk membuat sistem skrining risiko, sementara statistik digunakan untuk evaluasi kebijakan.

Dengan demikian, machine learning bukan solusi untuk semua masalah, dan statistik tetap sangat relevan dalam konteks kesehatan masyarakat. Pemilihan metode harus selalu didasarkan pada tujuan analisis: apakah ingin memahami hubungan dan inferensi, atau mengoptimalkan prediksi.

Kemampuan berpikir metodologis—menentukan tujuan, memahami jenis data, mempertimbangkan interpretasi, dan menyadari keterbatasan model—jauh lebih penting daripada sekadar menggunakan algoritma yang lebih “canggih”.

Tugas 1 Machine Learning

Kiki Amelia

2026-03-01