Library Yang di perlukan untuk membuat analisis menggunakan Naive Bayes

library(readxl)
## Warning: package 'readxl' was built under R version 4.0.5
library(e1071) #library untuk Naive Bayes
## Warning: package 'e1071' was built under R version 4.0.5
library(caret) #library untuk mengetahui apakah metode naive bayes baik untuk data kita apa tidak
## Warning: package 'caret' was built under R version 4.0.5
## Loading required package: lattice
## Loading required package: ggplot2
## Warning: package 'ggplot2' was built under R version 4.0.5

CARA INPUT DATA (1. Siapkan data Excell, kemudian copy cell range yang akan di olah menggunakan metode naive bayes, dan script di bawah ini, untuk mempaste isi datanya)

dataku=read_excel("D:/1. kuliah s2/materi Bu Sri Statistika Bayesian/naive_bayes/PPDP_2020-2021.xlsx")

Cara menampilkan data

View(dataku)

membagi data menjadi 2 bagian yaitu data training dan data testing

sampel=sample(1:nrow(dataku),0.75*nrow(dataku),replace=TRUE)
training=data.frame(dataku)[sampel,]
testing=data.frame(dataku)[-sampel,]

Membuat Metode naive bayes

modelNB=naiveBayes(KETERANGAN.BAYAR~.,data=training)

melakukan prediksi dari data excell

prediksi=predict(modelNB,testing)
hasil=confusionMatrix(table(prediksi,testing$KETERANGAN.BAYAR))
hasil
## Confusion Matrix and Statistics
## 
##            
## prediksi    TEPAT TERLAMBAT
##   TEPAT        11        11
##   TERLAMBAT     5         2
##                                           
##                Accuracy : 0.4483          
##                  95% CI : (0.2645, 0.6431)
##     No Information Rate : 0.5517          
##     P-Value [Acc > NIR] : 0.9040          
##                                           
##                   Kappa : -0.1658         
##                                           
##  Mcnemar's Test P-Value : 0.2113          
##                                           
##             Sensitivity : 0.6875          
##             Specificity : 0.1538          
##          Pos Pred Value : 0.5000          
##          Neg Pred Value : 0.2857          
##              Prevalence : 0.5517          
##          Detection Rate : 0.3793          
##    Detection Prevalence : 0.7586          
##       Balanced Accuracy : 0.4207          
##                                           
##        'Positive' Class : TEPAT           
##