Variables
merged2 <- merged %>%
remove_rownames %>%
column_to_rownames(var="Nom_Barri") %>%
select("n.tot","pc.esp","pc.ue27-esp","pc.20.34","2019-2014","n.esp.V1419",#"var20192014","pc.ext",
"hotel2019","rest1614",
"RFD.2017",
"tot_ann","pmedio","pmedio.V1519","pm_ent.V1519","pm_priv.V1519","pm_sha.V1519",
#"pc.ent","pc.priv","pc.shared","pc.hotel","pm_ent","pm_priv","pm_sha","pm_hot",
#"alq.mq",
"alq.num","alq.pmq","alq.pmq.V1519","alq.num.V1519",
"tot.comp","tot.eurm2","perc.nou.comp","perc.usat.comp","tot.comp.V1519",
"nou.eurm2.V1519","usat.eurm2.V1519",
#"perc.prot.comp",
#"tot.m2","nou.m2","prot.m2","usat.m2",
#"tot.eur","nou.eur","usat.eur",
#"nou.eurm2","usat.eurm2",
)
Standardizar los datos
df <- scale(merged2)
Optimal K Elbow
#elbow (1 option)
set.seed(123)
wss <- function(k) {
kmeans(df, k, nstart = 100 )$tot.withinss
}
k.values <- 1:15
wss_values <- map_dbl(k.values, wss)
plot(k.values, wss_values,
type="b", pch = 19, frame = FALSE,
xlab="Number of clusters K",
ylab="Total within-clusters sum of squares")
#elbow (2 option)
set.seed(123)
fviz_nbclust(df, kmeans, method = "wss")
#Optimal K Average Silhouette Method
avg_sil <- function(k) {
km.res <- kmeans(df, centers = k, nstart = 100)
ss <- silhouette(km.res$cluster, dist(df))
mean(ss[, 3])
}
k.values <- 2:15
avg_sil_values <- map_dbl(k.values, avg_sil)
plot(k.values, avg_sil_values,
type = "b", pch = 19, frame = FALSE,
xlab = "Number of clusters K",
ylab = "Average Silhouettes")
# Silhouette Method 2
fviz_nbclust(df, kmeans, method = "silhouette")
#Optimal K Gap Statistic Method
set.seed(123)
gap_stat <- clusGap(df, FUN = kmeans, nstart = 100, K.max = 10, B = 50)
print(gap_stat, method = "firstmax")
## Clustering Gap statistic ["clusGap"] from call:
## clusGap(x = df, FUNcluster = kmeans, K.max = 10, B = 50, nstart = 100)
## B=50 simulated reference sets, k = 1..10; spaceH0="scaledPCA"
## --> Number of clusters (method 'firstmax'): 10
## logW E.logW gap SE.sim
## [1,] 4.792610 5.386550 0.5939400 0.01514645
## [2,] 4.695379 5.299690 0.6043113 0.01440520
## [3,] 4.623713 5.236688 0.6129746 0.01426198
## [4,] 4.561594 5.184830 0.6232359 0.01504632
## [5,] 4.510327 5.140375 0.6300482 0.01546476
## [6,] 4.463756 5.100580 0.6368242 0.01580959
## [7,] 4.417219 5.064284 0.6470645 0.01560492
## [8,] 4.368165 5.030391 0.6622264 0.01534010
## [9,] 4.313087 4.997905 0.6848177 0.01524854
## [10,] 4.268143 4.966543 0.6984003 0.01556232
#Optimal K Gap Statistic Method 2
fviz_gap_stat(gap_stat)
#Examinar a los numeros de cluster
k3 <- kmeans(df, centers = 3, nstart = 100)
k4 <- kmeans(df, centers = 4, nstart = 100)
k5 <- kmeans(df, centers = 5, nstart = 100)
k6 <- kmeans(df, centers = 6, nstart = 100)
k7 <- kmeans(df, centers = 7, nstart = 100)
k8 <- kmeans(df, centers = 8, nstart = 100)
k9 <- kmeans(df, centers = 9, nstart = 100)
# plots to compare
p3 <- fviz_cluster(k3, geom = "point", data = df) + ggtitle("k = 3")
p4 <- fviz_cluster(k4, geom = "point", data = df) + ggtitle("k = 4")
p5 <- fviz_cluster(k5, geom = "point", data = df) + ggtitle("k = 5")
p6 <- fviz_cluster(k6, geom = "point", data = df) + ggtitle("k = 6")
p7 <- fviz_cluster(k7, geom = "point", data = df) + ggtitle("k = 7")
p8 <- fviz_cluster(k8, geom = "point", data = df) + ggtitle("k = 8")
p9 <- fviz_cluster(k9, geom = "point", data = df) + ggtitle("k = 9")
grid.arrange(p3, nrow = 1)
grid.arrange(p4, p5, nrow = 1)
grid.arrange(p6, p7, nrow = 1)
grid.arrange(p8, p9, nrow = 1)
K means
for (i in 3:5)
{
finalK <- kmeans(df, centers = i, nstart = 100)
#print
print(finalK)
}
## K-means clustering with 3 clusters of sizes 8, 39, 26
##
## Cluster means:
## n.tot pc.esp pc.ue27-esp pc.20.34 2019-2014 n.esp.V1419
## 1 0.8768693 -1.9752753 2.18466386 2.1086441 -0.65824555 -1.02104321
## 2 -0.4741977 0.2564815 -0.48157429 -0.3565978 -0.08509845 0.22702179
## 3 0.4414906 0.2230547 0.05015717 -0.1139168 0.33018477 -0.02636555
## hotel2019 rest1614 RFD.2017 tot_ann pmedio pmedio.V1519
## 1 1.96630902 -1.33577046 0.3120777 2.28593032 0.4097535 0.3004681
## 2 -0.46886013 0.01129264 -0.5559155 -0.50220221 -0.4826514 -0.4364362
## 3 0.09827203 0.39406734 0.7378494 0.04994014 0.5978991 0.5622026
## pm_ent.V1519 pm_priv.V1519 pm_sha.V1519 alq.num alq.pmq alq.pmq.V1519
## 1 -0.1298137 0.3289735 1.12151196 1.3829965 0.6500880 0.02080231
## 2 -0.3467390 -0.2527357 -0.18814510 -0.5909579 -0.4600032 -0.11216886
## 3 0.5600511 0.2778809 -0.06286296 0.4608995 0.4899777 0.16185257
## alq.num.V1519 tot.comp tot.eurm2 perc.nou.comp perc.usat.comp
## 1 -0.2498313 0.9715621 0.7411340 0.06473588 -0.05753939
## 2 -0.2730738 -0.3179964 -0.5756479 0.12172794 -0.10826048
## 3 0.4864819 0.1780524 0.6354307 -0.20251065 0.18009514
## tot.comp.V1519 nou.eurm2.V1519 usat.eurm2.V1519
## 1 -0.5525881 0.64332683 -0.10265448
## 2 0.4298039 0.09893395 0.09275975
## 3 -0.4746787 -0.34634764 -0.10755363
##
## Clustering vector:
## el Raval
## 1
## el Barri Gòtic
## 1
## la Barceloneta
## 1
## Sant Pere, Santa Caterina i la Ribera
## 1
## el Fort Pienc
## 3
## la Sagrada Família
## 3
## la Dreta de l'Eixample
## 1
## l'Antiga Esquerra de l'Eixample
## 1
## la Nova Esquerra de l'Eixample
## 3
## Sant Antoni
## 3
## el Poble Sec
## 1
## la Marina del Prat Vermell
## 3
## la Marina de Port
## 2
## la Font de la Guatlla
## 2
## Hostafrancs
## 3
## la Bordeta
## 2
## Sants - Badal
## 3
## Sants
## 3
## les Corts
## 3
## la Maternitat i Sant Ramon
## 3
## Pedralbes
## 3
## Vallvidrera, el Tibidabo i les Planes
## 3
## Sarrià
## 3
## les Tres Torres
## 3
## Sant Gervasi - la Bonanova
## 3
## Sant Gervasi - Galvany
## 3
## el Putxet i el Farró
## 3
## Vallcarca i els Penitents
## 2
## el Coll
## 2
## la Salut
## 2
## la Vila de Gràcia
## 1
## el Camp d'en Grassot i Gràcia Nova
## 3
## el Baix Guinardó
## 3
## Can Baró
## 2
## el Guinardó
## 2
## la Font d'en Fargues
## 2
## el Carmel
## 2
## la Teixonera
## 2
## Sant Genís dels Agudells
## 2
## Montbau
## 2
## la Vall d'Hebron
## 2
## la Clota
## 2
## Horta
## 2
## Vilapicina i la Torre Llobeta
## 2
## Porta
## 2
## el Turó de la Peira
## 2
## Can Peguera
## 2
## la Guineueta
## 2
## Canyelles
## 2
## les Roquetes
## 2
## Verdun
## 2
## la Prosperitat
## 2
## la Trinitat Nova
## 2
## Torre Baró
## 2
## Ciutat Meridiana
## 2
## Vallbona
## 2
## la Trinitat Vella
## 2
## Baró de Viver
## 2
## el Bon Pastor
## 2
## Sant Andreu
## 3
## la Sagrera
## 2
## el Congrés i els Indians
## 2
## Navas
## 2
## el Camp de l'Arpa del Clot
## 3
## el Clot
## 3
## el Parc i la Llacuna del Poblenou
## 3
## la Vila Olímpica del Poblenou
## 3
## el Poblenou
## 3
## Diagonal Mar i el Front Marítim del Poblenou
## 3
## el Besòs i el Maresme
## 2
## Provençals del Poblenou
## 2
## Sant Martí de Provençals
## 2
## la Verneda i la Pau
## 2
##
## Within cluster sum of squares by cluster:
## [1] 251.3707 646.6317 481.8466
## (between_SS / total_SS = 26.3 %)
##
## Available components:
##
## [1] "cluster" "centers" "totss" "withinss" "tot.withinss"
## [6] "betweenss" "size" "iter" "ifault"
## K-means clustering with 4 clusters of sizes 12, 8, 24, 29
##
## Cluster means:
## n.tot pc.esp pc.ue27-esp pc.20.34 2019-2014 n.esp.V1419
## 1 -0.4813801 0.3414739 -0.39857588 -0.3501026 -0.04810179 0.732615145
## 2 0.8768693 -1.9752753 2.18466386 2.1086441 -0.65824555 -1.021043208
## 3 0.4634585 0.2226765 0.07705416 -0.1274920 0.37877515 -0.018626555
## 4 -0.4262551 0.2193200 -0.50150690 -0.3313143 -0.11197992 -0.006068923
## hotel2019 rest1614 RFD.2017 tot_ann pmedio pmedio.V1519
## 1 -0.4985165 -0.02007431 -0.2605859 -0.46772581 -0.4803683 -0.4811563
## 2 1.9663090 -1.33577046 0.3120777 2.28593032 0.4097535 0.3004681
## 3 0.1295041 0.39247449 0.8133290 0.07491278 0.6770688 0.6098247
## 4 -0.4433232 0.05198854 -0.6513616 -0.49905654 -0.4745951 -0.3884711
## pm_ent.V1519 pm_priv.V1519 pm_sha.V1519 alq.num alq.pmq alq.pmq.V1519
## 1 -0.4340199 -0.3500613 -0.19049830 -0.5447242 -0.2199042 0.09648529
## 2 -0.1298137 0.3289735 1.12151196 1.3829965 0.6500880 0.02080231
## 3 0.6175758 0.3066841 -0.16603670 0.4845802 0.4973901 0.14770800
## 4 -0.2956921 -0.1997059 -0.09314604 -0.5571450 -0.4999730 -0.16790462
## alq.num.V1519 tot.comp tot.eurm2 perc.nou.comp perc.usat.comp
## 1 0.005718211 -0.2146745 -0.3755417 1.77715327 -1.78280018
## 2 -0.249831270 0.9715621 0.7411340 0.06473588 -0.05753939
## 3 0.524763519 0.1730634 0.6899466 -0.16318394 0.13679541
## 4 -0.367734235 -0.3224112 -0.6200444 -0.61818316 0.64037336
## tot.comp.V1519 nou.eurm2.V1519 usat.eurm2.V1519
## 1 0.4541385 0.9609776 -0.1226219
## 2 -0.5525881 0.6433268 -0.1026545
## 3 -0.5108471 -0.2356634 -0.1065787
## 4 0.3872887 -0.3800836 0.1672617
##
## Clustering vector:
## el Raval
## 2
## el Barri Gòtic
## 2
## la Barceloneta
## 2
## Sant Pere, Santa Caterina i la Ribera
## 2
## el Fort Pienc
## 3
## la Sagrada Família
## 3
## la Dreta de l'Eixample
## 2
## l'Antiga Esquerra de l'Eixample
## 2
## la Nova Esquerra de l'Eixample
## 3
## Sant Antoni
## 3
## el Poble Sec
## 2
## la Marina del Prat Vermell
## 3
## la Marina de Port
## 4
## la Font de la Guatlla
## 4
## Hostafrancs
## 3
## la Bordeta
## 4
## Sants - Badal
## 4
## Sants
## 3
## les Corts
## 3
## la Maternitat i Sant Ramon
## 3
## Pedralbes
## 3
## Vallvidrera, el Tibidabo i les Planes
## 3
## Sarrià
## 3
## les Tres Torres
## 3
## Sant Gervasi - la Bonanova
## 3
## Sant Gervasi - Galvany
## 3
## el Putxet i el Farró
## 3
## Vallcarca i els Penitents
## 1
## el Coll
## 1
## la Salut
## 4
## la Vila de Gràcia
## 2
## el Camp d'en Grassot i Gràcia Nova
## 3
## el Baix Guinardó
## 4
## Can Baró
## 4
## el Guinardó
## 4
## la Font d'en Fargues
## 4
## el Carmel
## 1
## la Teixonera
## 1
## Sant Genís dels Agudells
## 1
## Montbau
## 1
## la Vall d'Hebron
## 1
## la Clota
## 1
## Horta
## 1
## Vilapicina i la Torre Llobeta
## 4
## Porta
## 4
## el Turó de la Peira
## 4
## Can Peguera
## 4
## la Guineueta
## 4
## Canyelles
## 4
## les Roquetes
## 4
## Verdun
## 4
## la Prosperitat
## 4
## la Trinitat Nova
## 4
## Torre Baró
## 4
## Ciutat Meridiana
## 4
## Vallbona
## 4
## la Trinitat Vella
## 4
## Baró de Viver
## 4
## el Bon Pastor
## 4
## Sant Andreu
## 3
## la Sagrera
## 4
## el Congrés i els Indians
## 4
## Navas
## 4
## el Camp de l'Arpa del Clot
## 3
## el Clot
## 3
## el Parc i la Llacuna del Poblenou
## 3
## la Vila Olímpica del Poblenou
## 3
## el Poblenou
## 3
## Diagonal Mar i el Front Marítim del Poblenou
## 3
## el Besòs i el Maresme
## 1
## Provençals del Poblenou
## 1
## Sant Martí de Provençals
## 1
## la Verneda i la Pau
## 4
##
## Within cluster sum of squares by cluster:
## [1] 178.0770 251.3707 456.2350 371.6182
## (between_SS / total_SS = 32.8 %)
##
## Available components:
##
## [1] "cluster" "centers" "totss" "withinss" "tot.withinss"
## [6] "betweenss" "size" "iter" "ifault"
## K-means clustering with 5 clusters of sizes 14, 14, 12, 4, 29
##
## Cluster means:
## n.tot pc.esp pc.ue27-esp pc.20.34 2019-2014 n.esp.V1419
## 1 1.5145209 -0.1281003 0.27208882 0.4054501 0.23681306 -0.34381682
## 2 -0.3789849 0.3656733 0.08959361 -0.4284627 0.48488120 0.14203745
## 3 -0.4813801 0.3414739 -0.39857588 -0.3501026 -0.04810179 0.73261515
## 4 0.2607690 -3.2011136 3.47560459 3.2600005 -1.65214794 -1.37468295
## 5 -0.3849662 0.1855430 -0.48907110 -0.2936756 -0.10061746 -0.01612892
## hotel2019 rest1614 RFD.2017 tot_ann pmedio pmedio.V1519
## 1 1.3702341 -0.04009874 0.4803229 1.0973426 0.4075564 0.5222185
## 2 -0.3264887 0.51421393 1.1379174 -0.3007498 1.1512772 0.8683403
## 3 -0.4985165 -0.02007431 -0.2605859 -0.4677258 -0.4803683 -0.4811563
## 4 0.9698396 -1.95698293 -0.1076155 2.1538382 -0.1232834 -0.4163330
## 5 -0.4313654 0.04935209 -0.6585473 -0.4881015 -0.5367627 -0.4147799
## pm_ent.V1519 pm_priv.V1519 pm_sha.V1519 alq.num alq.pmq alq.pmq.V1519
## 1 0.2049215 0.2336032 0.55373911 1.5952597 0.4739647 0.28009123
## 2 1.0438260 0.2046480 -0.21453457 -0.2132406 0.5247005 -0.01906831
## 3 -0.4340199 -0.3500613 -0.19049830 -0.5447242 -0.2199042 0.09648529
## 4 -0.5152180 0.4062477 -0.10866604 0.6463580 0.7270048 -0.25260728
## 5 -0.3521847 -0.1227508 -0.06993861 -0.5309313 -0.4913959 -0.13109363
## alq.num.V1519 tot.comp tot.eurm2 perc.nou.comp perc.usat.comp
## 1 0.089938095 0.9651847 0.5983042 -0.08655484 0.09269992
## 2 0.803958967 -0.5336247 0.7960080 -0.19142312 0.14039774
## 3 0.005718211 -0.2146745 -0.3755417 1.77715327 -1.78280018
## 4 -0.529150450 0.6792846 0.6042360 0.14813806 -0.11650487
## 5 -0.360916400 -0.2132029 -0.6010626 -0.62161035 0.64125015
## tot.comp.V1519 nou.eurm2.V1519 usat.eurm2.V1519
## 1 -0.4160785 0.2068436 -0.1067327
## 2 -0.5840036 -0.5488445 -0.1038875
## 3 0.4541385 0.9609776 -0.1226219
## 4 -0.6374699 0.9842633 -0.1081724
## 5 0.3828058 -0.3683025 0.1673391
##
## Clustering vector:
## el Raval
## 4
## el Barri Gòtic
## 4
## la Barceloneta
## 4
## Sant Pere, Santa Caterina i la Ribera
## 4
## el Fort Pienc
## 1
## la Sagrada Família
## 1
## la Dreta de l'Eixample
## 1
## l'Antiga Esquerra de l'Eixample
## 1
## la Nova Esquerra de l'Eixample
## 1
## Sant Antoni
## 1
## el Poble Sec
## 1
## la Marina del Prat Vermell
## 2
## la Marina de Port
## 5
## la Font de la Guatlla
## 5
## Hostafrancs
## 2
## la Bordeta
## 5
## Sants - Badal
## 5
## Sants
## 1
## les Corts
## 1
## la Maternitat i Sant Ramon
## 2
## Pedralbes
## 2
## Vallvidrera, el Tibidabo i les Planes
## 2
## Sarrià
## 2
## les Tres Torres
## 2
## Sant Gervasi - la Bonanova
## 2
## Sant Gervasi - Galvany
## 1
## el Putxet i el Farró
## 2
## Vallcarca i els Penitents
## 3
## el Coll
## 3
## la Salut
## 5
## la Vila de Gràcia
## 1
## el Camp d'en Grassot i Gràcia Nova
## 1
## el Baix Guinardó
## 5
## Can Baró
## 5
## el Guinardó
## 5
## la Font d'en Fargues
## 2
## el Carmel
## 3
## la Teixonera
## 3
## Sant Genís dels Agudells
## 3
## Montbau
## 3
## la Vall d'Hebron
## 3
## la Clota
## 3
## Horta
## 3
## Vilapicina i la Torre Llobeta
## 5
## Porta
## 5
## el Turó de la Peira
## 5
## Can Peguera
## 5
## la Guineueta
## 5
## Canyelles
## 5
## les Roquetes
## 5
## Verdun
## 5
## la Prosperitat
## 5
## la Trinitat Nova
## 5
## Torre Baró
## 5
## Ciutat Meridiana
## 5
## Vallbona
## 5
## la Trinitat Vella
## 5
## Baró de Viver
## 5
## el Bon Pastor
## 5
## Sant Andreu
## 1
## la Sagrera
## 5
## el Congrés i els Indians
## 5
## Navas
## 5
## el Camp de l'Arpa del Clot
## 1
## el Clot
## 5
## el Parc i la Llacuna del Poblenou
## 2
## la Vila Olímpica del Poblenou
## 2
## el Poblenou
## 2
## Diagonal Mar i el Front Marítim del Poblenou
## 2
## el Besòs i el Maresme
## 3
## Provençals del Poblenou
## 3
## Sant Martí de Provençals
## 3
## la Verneda i la Pau
## 5
##
## Within cluster sum of squares by cluster:
## [1] 243.77926 280.15225 178.07698 72.28507 371.04160
## (between_SS / total_SS = 38.8 %)
##
## Available components:
##
## [1] "cluster" "centers" "totss" "withinss" "tot.withinss"
## [6] "betweenss" "size" "iter" "ifault"
Plot
final3 <- kmeans(df, centers = 3, nstart = 100)
final4 <- kmeans(df, centers = 4, nstart = 100)
final5 <- kmeans(df, centers = 5, nstart = 100)
fviz_cluster(final3, data = df)
fviz_cluster(final4, data = df)
fviz_cluster(final5, data = df)
kkk <- merged2 %>% mutate(Cluster = final3$cluster) %>% group_by(Cluster) %>% summarise_all(“mean”)
z_cluster(finalK, data = df)
for (i in 3:9) { finalK <- kmeans(df, centers = i, nstart = 100) #plot x <- fviz_cluster(finalK, data = df) x }
Descriptive Statistic
kkk <- merged %>% mutate(Cluster = finalK$cluster) %>% group_by(Nom_Barri) #%>% #summarise_all(“mean”)
k.1 <- kkk %>% filter(Cluster == 1)
k.1$Nom_Barri
k.2 <- kkk %>% filter(Cluster == 2)
k.2$Nom_Barri
k.3 <- kkk %>% filter(Cluster == 3)
k.3$Nom_Barri