File ini berisi template untuk menjawab pertanyaan saat briefing Capstone Machine Learning sebagai langkah awal sebelum membuat model. Silakan Bapak/Ibu mengisi jawaban di bawah.

File ini tidak akan dinilai namun Bapak/Ibu WAJIB disubmit ke dalam classroom pada hari H briefing Capstone Machine Learning.

Case

Case yang dipilih adalah: SMS Spam

Import Data

data_train <- read.csv("data-train.csv", stringsAsFactors = T)
head(data_train)
data_test <- read.csv("data-test.csv", stringsAsFactors = T) 
head(data_test)

Data Preprocessing

Tentukan langkah-langkah yang akan dilakukan dalam Data Preprocessing:

  • Ubah format data

  • Membersihkan data

  • Melakukan analisis EDA

  • Membuat dictionary kata2 sebagai penanda