comparaison.R

robin — Feb 12, 2013, 10:28 AM

#--------------- LOAD DATA -------------------
setwd("~/Dropbox/ParisGeo/4 - TransMonDyn/998 - Comparaison_stats/NEW")
data <- read.csv("IDF_1300.csv")

# Chargement des packages
library(ade4)
Attaching package: 'ade4'
The following object(s) are masked from 'package:base':

within
library(FactoClass)
Loading required package: xtable
# Calcul de l'AFC
myAFC <- dudi.coa(df=data[2:11], scannf=FALSE, nf=11)
# Creation de la matrice de distance chi2
myDistMat <- dist.dudi(myAFC, amongrow=TRUE)
# Exécution de la CAH (Ward) pondérée
myCAH <- ward.cluster(myDistMat, peso = apply(X=data[2:11], MARGIN=1, FUN=sum) , plots = FALSE, h.clust = 1)
# (l'argument peso est le poids, ici, la somme des lignes)
# Découpage de la CAH
data$FactoClass <- cutree(tree=myCAH, k=5)
# Comparaison avec les classes de SAS
table(data$SAS5, data$FactoClass)

      1   2   3   4   5
  1   0   0   0 677   0
  2   0   0   0   0 371
  3 216   0   0   0   0
  4   0   0  27   0   0
  5   0   9   0   0   0
# Comparaison avec les classes de SPAD
table(data$SPAD5, data$FactoClass)

      1   2   3   4   5
  1 216   0   0   0   0
  2   0   9   0   0   0
  3   0   0  27   0   0
  4   0   0   0 677   0
  5   0   0   0   0 371