Klasifikasi Gangguan Tidur Berdasarkan Gaya Hidup Menggunakan Algoritma Decision Tree

Fachrizal Wisnu Pratama, Pramesyaila Hendri, Frizazki Al Fath

Kelompok 15

Latar Belakang Masalah

  • Gangguan Tidur Semakin Banyak Dialami Masyarakat.
  • Faktor (Gaya Hidup) Sangat Berpengaruh dalam Gangguan Tidur.
  • Analisis data dapat membantu memahami hubungan gaya hidup vs gangguan tidur.
  • Diperlukan model klasifikasi gangguan tidur berbasis gaya hidup.

Rumusan Masalah

  1. Faktor gaya hidup apa saja yang paling berpengaruh terhadap munculnya gangguan tidur?
  2. Bagaimana penerapan algoritma Decision Tree dapat digunakan untuk mmengklasifikasi gangguan tidur berdasarkan data gaya hidup seseorang?

Tujuan Penelitian

  1. Menganalisis hubungan antara gaya hidup dan gangguan tidur.
  2. Membangun model klasifikasi gangguan tidur menggunakan algoritma Decision Tree.
  3. Memberikan hasil analisis yang dapat digunakan untuk meningkatkan kesadaran masyarakat tentang pentingnya gaya hidup sehat terhadap kualitas tidur.

Sumber & Karakteristik Data

  • Sumber: Dataset publik Kaggle: Sleep Health and Lifestyle Dataset. Tahun 2024
  • Ukuran Data: 374 observasi, 13 variables.
  • Tipe Data: Kombinasi numerik dan kategorikal.

Metodologi

Proyek ini menggunakan pendekatan CRISP-DM (Cross Industry Standard Process for Data Mining) dalam pelaksanaan proses analisis data yang meliputi:

  1. Business Understanding
    • Mengidentifikasi pengaruh gaya hidup terhadap gangguan tidur.
    • Membangun model klasifikasi gangguan tidur berbasis gaya hidup.
    • Memberikan insight untuk meningkatkan kesadaran kesehatan tidur.
  2. Data Understanding
    • Identifikasi jenis data (numerik, kategorikal).
    • Analisis distribusi tiap variabel (misal: rata-rata durasi tidur, sebaran stres).
    • Melihat korelasi awal antar variabel dengan heatmap.

Metodologi

  1. Data Preparation
    • Penanganan nilai hilang (missing values).
    • Transformasi data (encoding).
    • Pemisahan data menjadi set pelatihan dan pengujian.
  2. Modeling
    • Menerapkan Algoritma Decision Tree Classifier.
    • Visualisasi struktur pohon keputusan.
  3. Evaluation
    • Evaluasi menggunakan metrik Accuracy, Precision, Recall, F1-Score
    • Mengidentifikasi kesalahan klasifikasi dengan Confusion Matrix

Teknik & Algoritma

Pendekatan dalam supervised learning bertujuan untuk memperkirakan atau memprediksi suatu kondisi

  • Fungsi Minor:

    1. Data Cleaning

    2. Data Transformation

    3. Data Splitting

    4. Feature Selection

Teknik & Algoritma

  • Fungsi Mayor:

    • Decision Tree Classification: yang bertujuan untuk membangun model klasifikasi dan mengidentifikasi pola hubungan antara faktor-faktor gaya hidup dengan kemungkinan terjadinya gangguan tidur.

Rencana Implementasi

  • Alat: Bahasa R (versi 4.x) dan RStudio.
  • Pustaka (Packages) Utama:
    • tidyverse: untuk manipulasi dan eksplorasi data.
    • ggplot2: untuk visualisasi data dan pembuatan grafik seperti heatmap.
    • caret: untuk proses data splitting, training, dan evaluasi model.
    • rpart: untuk membangun model Decision Tree.
    • rpart.plot: untuk visualisasi struktur pohon keputusan.
    • dplyr: untuk transformasi dan seleksi fitur.
    • readr: untuk membaca dataset dari file eksternal (CSV, Excel, dll.).

Tabel Variabel

Nama Variabel Jenis Data Deskripsi
Gender Kategorikal Jenis kelamin responden
Age Numerik Usia responden dalam tahun
Occupation Kategorikal Jenis pekerjaan responden
Sleep Duration Numerik Lama tidur dalam jam
Quality of Sleep Skala 1–10 Penilaian kualitas tidur
Physical Activity Level Numerik Durasi aktivitas fisik harian (menit)
Stress Level Numerik (skala 1–10) Tingkat stres harian responden

Tabel Variabel

Nama Variabel Jenis Data Deskripsi
BMI Category Kategorikal Kategori berat badan (Underweight, Normal, Overweight, Obese)
Blood Pressure Numerik Tekanan darah, misalnya 120/80
Heart Rate Numerik Detak jantung per menit
Daily Steps Numerik Jumlah langkah kaki per hari
Sleep Disorder Kategorikal Status gangguan tidur (None, Insomnia, Sleep Apnea)

Hasil yang Diharapkan

  • Model Decision Tree yang mampu mengklasifikasikan jenis gangguan tidur
  • Identifikasi faktor gaya hidup yang paling berpengaruh dalam menentukan kategori gangguan tidur.
  • Visualisasi struktur pohon keputusan (Decision Tree) yang menunjukkan alur pengambilan keputusan dari faktor-faktor tertentu hingga menghasilkan kelas gangguan tidur.
  • Insight bagi individu untuk memperbaiki pola hidup agar tidur lebih berkualitas

Dampak Proyek

  • Peningkatan kesadaran kesehatan tentang pentingnya gaya hidup seimbang
  • Membantu masyarakat memahami hubungan antara gaya hidup dan gangguan tidur
  • Dasar pengembangan aplikasi kesehatan untuk deteksi dini gangguan tidur

Kesimpulan

  • Gaya hidup memiliki pengaruh signifikan terhadap risiko gangguan tidur
  • Penelitian ini akan membangun Model Decision Tree yang mampu mengklasifikasikan gangguan tidur berdasarkan data gaya hidup.
  • Model yang dihasilkan nantinya akan dievaluasi menggunakan metrik seperti Accuracy, Precision, Recall, dan F1-Score.
  • Hasil penelitian ini diharapkan memberikan wawasan awal mengenai faktor gaya hidup yang berpotensi meningkatkan risiko gangguan tidur serta mendukung upaya pencegahan sejak dini.

Terima Kasih!