R Markdown

Hirarki Cluster adalah suatu metode pengelompokkan data yang dimulai dengan mengelompokkan dua atau lebih obyek yang memiliki kesamaan paling dekat, dari yang paling mirip sampai yang paling tidak mirip. Dalam tutorial ini peneliti menggunaka 5 metode agglomerative clustering dengan kasus data Iris.

data("iris")
summary(iris[,1:5])

uji asumsi multikolinearitas

install.packages("car")
library("car")
multikol<-cor(iris[,1:4])
multikol

perhitungan jarak antar satu data ke data lainnya

jarak=dist(iris[,1:4])
jarak

analisis cluster dengan metode average

hierarkiave<-hclust(dist(scale(iris[,1:4])), method="ave")
hierarkiave
plot(hierarkiave, iris$Species)

DENDOGRAM

rect.hclust(hierarkiave,3)
anggotaave<-data.frame(id=iris$Species, cutree(hierarkiave,k=3))
View(anggotaave)
cophenetic(hierarkiave)

korelasi cophenetic

d1 <- dist(iris[,1:4])
hc <- hclust(d1,"ave")
d2 <- cophenetic(hc)
corave=cor(d1,d2)
corave

analisis cluster dengan metode Complete

hierarkicomp<-hclust(dist(scale(iris[,1:4])), method = "complete")
hierarkicomp
plot(hierarkicomp, iris$Species)

dendogram

rect.hclust(hierarkicomp,3)
anggotacomp<-data.frame(id=iris$Species, cutree(hierarkicomp,k=3))
anggotacomp
cophenetic(hierarkicomp)

korelasi cophenetic

d1 <- dist(iris[,1:4])
hc <- hclust(d1, "complete")
d2 <- cophenetic(hc)
corcomp=cor(d1,d2)
corcomp

analisis cluster dengan metode Single

hierarkising <- hclust(dist(scale(iris[,1:4])),method = "single")
hierarkising
plot(hierarkising, iris$Species)

DENDROGAM

rect.hclust(hierarkising,3)
anggotasing <- data.frame(id=iris$Species, cutree(hierarkising,k=3))
anggotasing
cophenetic(hierarkising)

korelasi cophenetic

d1 <- dist(iris[,1:4])
hc <- hclust(d1,"single")
d2 <- cophenetic(hc)
corsing=cor(d1,d2)
corsing

analisis cluster dengan metode Ward

hierarkiward <- hclust(dist(scale(iris[,1:4])),method = "ward.D")
hierarkiward
plot(hierarkiward, iris$Species)

DENDROGAM

rect.hclust(hierarkiward,3)
anggotaward <- data.frame(id=iris$Species, cutree(hierarkiward,k=3))
anggotaward
cophenetic(hierarkiward)

korelasi cophenetic

d1 <- dist(iris[,1:4])
hc <- hclust(d1,"ward.D")
d2 <- cophenetic(hc)
corward=cor(d1,d2)
corward

analisis cluster dengan metode centroid

hierarkicent <- hclust(dist(scale(iris[,1:4])),method = "centroid")
hierarkicent
plot(hierarkicent, iris$Species)

DENDOGRAM

rect.hclust(hierarkicent,3)
anggotacent <- data.frame(id=iris$Species, cutree(hierarkicent,k=3))
anggotacent
cophenetic(hierarkicent)

korelasi cophenetic

d1 <- dist(iris[,1:4])
hc <- hclust(d1,"centroid")
d2 <- cophenetic(hc)
corcent=cor(d1,d2)
corcent

semakin mendekati angka 1 maka solusi yang dihasilkan oleh proses klustering semakin baik.

metode.terbaik<-data.frame(corave, corcomp, corsing, corward, corcent)
metode.terbaik