Data Mining Week 10 Neural Network

Pengertian Neural Network

Neural network (jaringan saraf tiruan) adalah salah satu metode dalam pembelajaran mesin (machine learning)yang terinspirasi dari cara kerja otak manusia. Tujuannya adalah untuk mengenali pola dalam data danmembuat prediksi berdasarkan pola tersebut.

Iris Dataset

Dataset iris merupakan salah satu dataset paling terkenal dalam pembelajaran mesin dan statistik,diperkenalkan oleh Ronald Fisher pada tahun 1936. Dataset ini berisi pengukuran morfologis dari tiga spesiesbunga iris: Iris setosa, Iris versicolor, dan Iris virginica.

Setiap baris dalam dataset menggambarkan satusampel bunga dengan empat fitur numerik:

– Sepal.Length: panjang kelopak bunga (cm)

– Sepal.Width: lebar kelopak bunga (cm)

– Petal.Length: panjang mahkota bunga (cm)

– Petal.Width: lebar mahkota bunga (cm)

Tujuan dari analisis ini adalah membangun sebuah model neural network yang dapat mengklasifikasikan spesies bunga iris berdasarkan keempat fitur tersebut.

Praktikum Neural Network

library(nnet)

## Warning: package 'nnet' was built under R version 4.4.3

library(caret)

## Warning: package 'caret' was built under R version 4.4.3

## Loading required package: ggplot2

## Warning: package 'ggplot2' was built under R version 4.4.3

## Loading required package: lattice

library(NeuralNetTools)

## Warning: package 'NeuralNetTools' was built under R version 4.4.3

# 1. Load dataset
data(iris)
# 2. Preprocessing: Normalisasi dan ubah target jadi faktor
iris$Species <- as.factor(iris$Species)
# 3. Bagi data menjadi training dan testing
set.seed(123) # biar hasil konsisten
index <- createDataPartition(iris$Species, p = 0.7, list = FALSE)
train_data <- iris[index, ]
test_data <- iris[-index, ]
binary_data <- subset(train_data, Species != "virginica")
binary_data$Species <- factor(binary_data$Species)
# 4. Latih model neural network
# size = jumlah neuron di hidden layer, decay = regularisasi
nn_model <- nnet(Species ~ ., data = train_data, size = 5, decay = 0.01, maxit = 200)

## # weights:  43
## initial  value 120.360750 
## iter  10 value 51.984377
## iter  20 value 45.083133
## iter  30 value 23.080317
## iter  40 value 8.534328
## iter  50 value 7.295741
## iter  60 value 6.745967
## iter  70 value 6.547466
## iter  80 value 6.492817
## iter  90 value 6.466873
## iter 100 value 6.400929
## iter 110 value 6.355214
## iter 120 value 6.332091
## iter 130 value 6.329752
## iter 140 value 6.328830
## iter 150 value 6.328617
## final  value 6.328607 
## converged

plotnet(nn_model)

# 5. Prediksi
predictions <- predict(nn_model, newdata = test_data, type = "class")
# 6. Evaluasi performa
predictions <- as.factor(predictions)
actual <- as.factor(test_data$Species)
confusionMatrix(predictions, actual)

## Confusion Matrix and Statistics
## 
##             Reference
## Prediction   setosa versicolor virginica
##   setosa         15          0         0
##   versicolor      0         15         1
##   virginica       0          0        14
## 
## Overall Statistics
##                                           
##                Accuracy : 0.9778          
##                  95% CI : (0.8823, 0.9994)
##     No Information Rate : 0.3333          
##     P-Value [Acc > NIR] : < 2.2e-16       
##                                           
##                   Kappa : 0.9667          
##                                           
##  Mcnemar's Test P-Value : NA              
## 
## Statistics by Class:
## 
##                      Class: setosa Class: versicolor Class: virginica
## Sensitivity                 1.0000            1.0000           0.9333
## Specificity                 1.0000            0.9667           1.0000
## Pos Pred Value              1.0000            0.9375           1.0000
## Neg Pred Value              1.0000            1.0000           0.9677
## Prevalence                  0.3333            0.3333           0.3333
## Detection Rate              0.3333            0.3333           0.3111
## Detection Prevalence        0.3333            0.3556           0.3111
## Balanced Accuracy           1.0000            0.9833           0.9667

Interpretasi Hasil:

– Model berhasil mengklasifikasikan bunga dengan akurasi 97,78%, yang menunjukkan performa yang sangat baik.

– Semua bunga setosa diklasifikasikan dengan benar (100% akurasi untuk kelas ini).

– Hanya terjadi 2 kesalahan klasifikasi: satu versicolor diprediksi sebagai virginica, dan sebaliknya.

– Ini menunjukkan bahwa versicolor dan virginica memiliki ciri-ciri morfologis yang lebih mirip dan lebih sulit dibedakan oleh model.

Data Mining Week 10 Neural Network

Fransiska Fista Mardhanianti

2025-04-23

Pengertian Neural Network

Iris Dataset

Praktikum Neural Network