Sử dụng dataset iris

data(iris)

Tách các biến numeric và chuyển thành dạng martrix

ma <- as.matrix(iris[, 1:4]) # Tách 4 cột biết numeric từ dataset iris
dis <- dist(ma) # Dùng hàm dist tính khoảng cách bằng phương pháp khoản cách Euclidean (Ơ-clit)
hc <- hclust(dis) # Dùng hảm hclust để tạo dữ liệu phân cụm theo phương pháp liên kết mặc định
plot(hc) # Trực quan bằng biểu đồ cây phân cụm

Trực quan mức độ tương đồng giữa các cá thể (và các biến) bằng biểu đồ nhiệt

heatmap(ma, 
        scale = "column", 
        RowSideColors = rainbow(3)[iris$Species] ) # Giá trị trong maxtix được mã hoá thành các màu tương ứng

Biểu diễn đầy đủ thông tin của biểu đồ nhiệt với packages pheatmap

library(pheatmap)
ma <- as.matrix(iris[, 1:4])     # Chuyển đổi thành dạng ma trận
row.names(ma) <- row.names(iris) # Gắn tên hàng trong ma trận mới theo hàng trong dataset iris
pheatmap(ma, 
         scale = "column", 
         clustering_method = "average", # Phương pháp liên kết  trung bình
         annotation_row = iris[, 5, drop=FALSE], # Cột thứ 5 của datast iris được biểu diễn dạng color bar. Để ngăn R tự động chuyển đổi khung dữ liệu một cột thành vectơ, chúng tôi đã sử dụng tùy chọn drop = FALSE
         show_rownames = FALSE)

- Biểu đồ trên cung cấp cho chúng ta một số thông tin như sau:

————————————————————————–Hết——————————————————————————-
——————————————————————–Ngoc Nguyen————————————————————————