MULTIFACTOR ANALYSIS (cont)

Nguyen tac chuan hoa dam may du lieu: 1-Khi chuẩn hóa đám mây dữ liệu sẽ co lại nhưng sẽ không thay đổi về bản chất !!!

data_MFA_Wine = read.csv("C:/Users/DELL/Downloads/Documents/CAOHOC/MANOVA/Tieets_11_MFA/data_MFA_WineJurys.csv", sep = ';',header = TRUE,encoding="latin1")
data_MFA_Wine = as.data.frame(data_MFA_Wine)
rownames(data_MFA_Wine) <- data_MFA_Wine[,1]
data_MFA_Wine <- data_MFA_Wine[,-1]
data_MFA_Wine[,"Grade.variety"] = as.factor(data_MFA_Wine[,"Grade.variety"])
res.mfa.raw = MFA(data_MFA_Wine[,1:58], group=c(1,27,15,15), type=c("n",rep("s",3)), ncp=5, name.group=c("Grade-var","Expert","Student","Customer"), num.group.sup=c(1))

Cách làm tiếp theo: Tách từng block ra vẽ Cho ta thấy đánh giá của từng block trên 1 đối tượng Càng hội tụ gần trung bình thì đánh giá của các block càng gần nhau. Nếu càng xa thì có nghĩa các block càng khác nhau: Do định nghĩa về ngọt,… của các nhóm

Partial axes Dim1 Student gần với trung bình nhất \ Một điều đáng lưu ý là việc chọn nhóm rất quan trọng, ví dụ trong Wine vừa rồi vì đo trên cùng một đối tượng người nên góc ~ 90. –> song song vs mp MFA !*

Putting MFS into practice

  1. Define the structure of dataset (group composition)
  2. Define the active group and supplementary elements
  3. Standardize the var or not
  4. Run the MFA
  5. Choose the number of dimensions to interpret
  6. simultaneously analysis of the individual and variable plot
  7. Group Study
  8. Partial analyses
  9. Use indices to enrich the interpretation

Bài tập hôm nay:

Đề thứ 2 Better Life: liên quan đến kinh tế và chỉ dùng PCA nên ta không làm \ Ta sẽ khảo sát MFA ở đề thứ nhất Orange: \ ## Bài tập Orange

data_MFA_Orange = read.csv2("C:/Users/DELL/Downloads/Documents/CAOHOC/MANOVA/Tieets_11_MFA/Orange5.csv",header = TRUE,encoding="latin1")
data_MFA_Orange = as.data.frame(data_MFA_Orange)
rownames(data_MFA_Orange) <- data_MFA_Orange[,1]
data_MFA_Orange <- data_MFA_Orange[,-1]
#data_MFA_Orange[,19:114] = as.factor(data_MFA_Orange[,19:114])

res.mfa.oran = MFA(data_MFA_Orange, group=c(1,1,8,8,96), type=c("n","n",rep("s",3)), ncp=5, name.group=c("Origin","Type","Chemical","Sensory","Judge"), num.group.sup=c(1,2,5))

res.mfa.oran$eig
##        eigenvalue percentage of variance cumulative percentage of variance
## comp 1  1.8068522              65.555612                          65.55561
## comp 2  0.3374185              12.242105                          77.79772
## comp 3  0.2704769               9.813353                          87.61107
## comp 4  0.1922609               6.975547                          94.58662
## comp 5  0.1492043               5.413382                         100.00000