Library Yang di perlukan untuk membuat analisis menggunakan Naive Bayes
library(readxl)
## Warning: package 'readxl' was built under R version 4.0.5
library(e1071) #library untuk Naive Bayes
## Warning: package 'e1071' was built under R version 4.0.5
library(caret) #library untuk mengetahui apakah metode naive bayes baik untuk data kita apa tidak
## Warning: package 'caret' was built under R version 4.0.5
## Loading required package: lattice
## Loading required package: ggplot2
## Warning: package 'ggplot2' was built under R version 4.0.5
CARA INPUT DATA (1. Siapkan data Excell, kemudian copy cell range yang akan di olah menggunakan metode naive bayes, dan script di bawah ini, untuk mempaste isi datanya)
dataku=read_excel("D:/1. kuliah s2/materi Bu Sri Statistika Bayesian/naive_bayes/PPDP_2020-2021.xlsx")
Cara menampilkan data
View(dataku)
membagi data menjadi 2 bagian yaitu data training dan data testing
sampel=sample(1:nrow(dataku),0.75*nrow(dataku),replace=TRUE)
training=data.frame(dataku)[sampel,]
testing=data.frame(dataku)[-sampel,]
Membuat Metode naive bayes
modelNB=naiveBayes(KETERANGAN.BAYAR~.,data=training)
melakukan prediksi dari data excell
prediksi=predict(modelNB,testing)
hasil=confusionMatrix(table(prediksi,testing$KETERANGAN.BAYAR))
hasil
## Confusion Matrix and Statistics
##
##
## prediksi TEPAT TERLAMBAT
## TEPAT 11 11
## TERLAMBAT 5 2
##
## Accuracy : 0.4483
## 95% CI : (0.2645, 0.6431)
## No Information Rate : 0.5517
## P-Value [Acc > NIR] : 0.9040
##
## Kappa : -0.1658
##
## Mcnemar's Test P-Value : 0.2113
##
## Sensitivity : 0.6875
## Specificity : 0.1538
## Pos Pred Value : 0.5000
## Neg Pred Value : 0.2857
## Prevalence : 0.5517
## Detection Rate : 0.3793
## Detection Prevalence : 0.7586
## Balanced Accuracy : 0.4207
##
## 'Positive' Class : TEPAT
##