Proyek ini menggunakan pendekatan CRISP-DM (Cross Industry Standard Process for Data Mining) dalam pelaksanaan proses analisis data yang meliputi:
Pendekatan dalam supervised learning bertujuan untuk memperkirakan atau memprediksi suatu kondisi
Fungsi Minor:
Data Cleaning
Data Transformation
Data Splitting
Feature Selection
Fungsi Mayor:
tidyverse: untuk manipulasi dan eksplorasi data.ggplot2: untuk visualisasi data dan pembuatan grafik
seperti heatmap.caret: untuk proses data splitting, training, dan
evaluasi model.rpart: untuk membangun model Decision Tree.rpart.plot: untuk visualisasi struktur pohon
keputusan.dplyr: untuk transformasi dan seleksi fitur.readr: untuk membaca dataset dari file eksternal (CSV,
Excel, dll.).| Nama Variabel | Jenis Data | Deskripsi |
|---|---|---|
| Gender | Kategorikal | Jenis kelamin responden |
| Age | Numerik | Usia responden dalam tahun |
| Occupation | Kategorikal | Jenis pekerjaan responden |
| Sleep Duration | Numerik | Lama tidur dalam jam |
| Quality of Sleep | Skala 1–10 | Penilaian kualitas tidur |
| Physical Activity Level | Numerik | Durasi aktivitas fisik harian (menit) |
| Stress Level | Numerik (skala 1–10) | Tingkat stres harian responden |
| Nama Variabel | Jenis Data | Deskripsi |
|---|---|---|
| BMI Category | Kategorikal | Kategori berat badan (Underweight, Normal, Overweight, Obese) |
| Blood Pressure | Numerik | Tekanan darah, misalnya 120/80 |
| Heart Rate | Numerik | Detak jantung per menit |
| Daily Steps | Numerik | Jumlah langkah kaki per hari |
| Sleep Disorder | Kategorikal | Status gangguan tidur (None, Insomnia, Sleep Apnea) |