Variables
merged2 <- merged %>%
remove_rownames %>%
column_to_rownames(var="Nom_Barri") %>%
select("n.tot","pc.esp","pc.ue27-esp","pc.20.34","2019-2014","n.esp.V1419",#"var20192014","pc.ext",
"hotel2019","rest1614",
"RFD.2017",
"tot_ann","pmedio","pmedio.V1519","pm_ent.V1519","pm_priv.V1519","pm_sha.V1519",
#"pc.ent","pc.priv","pc.shared","pc.hotel","pm_ent","pm_priv","pm_sha","pm_hot",
#"alq.mq",
"alq.num","alq.pm","alq.pm.V1519","alq.num.V1519",
"tot.comp","tot.eur","perc.nou.comp","perc.prot.comp","tot.comp.V1519",
"nou.eur.V1519","usat.eur.V1519",
#"perc.prot.comp",
#"tot.m2","nou.m2","prot.m2","usat.m2",
#"tot.eur","nou.eur","usat.eur",
#"nou.eurm2","usat.eurm2",
)
Standardizar los datos
df <- scale(merged2)
Optimal K Elbow
#elbow (1 option)
set.seed(123)
wss <- function(k) {
kmeans(df, k, nstart = 100 )$tot.withinss
}
k.values <- 1:15
wss_values <- map_dbl(k.values, wss)
plot(k.values, wss_values,
type="b", pch = 19, frame = FALSE,
xlab="Number of clusters K",
ylab="Total within-clusters sum of squares")
#elbow (2 option)
set.seed(123)
fviz_nbclust(df, kmeans, method = "wss")
#Optimal K Average Silhouette Method
avg_sil <- function(k) {
km.res <- kmeans(df, centers = k, nstart = 100)
ss <- silhouette(km.res$cluster, dist(df))
mean(ss[, 3])
}
k.values <- 2:15
avg_sil_values <- map_dbl(k.values, avg_sil)
plot(k.values, avg_sil_values,
type = "b", pch = 19, frame = FALSE,
xlab = "Number of clusters K",
ylab = "Average Silhouettes")
# Silhouette Method 2
fviz_nbclust(df, kmeans, method = "silhouette")
#Optimal K Gap Statistic Method
set.seed(123)
gap_stat <- clusGap(df, FUN = kmeans, nstart = 100, K.max = 10, B = 50)
print(gap_stat, method = "firstmax")
## Clustering Gap statistic ["clusGap"] from call:
## clusGap(x = df, FUNcluster = kmeans, K.max = 10, B = 50, nstart = 100)
## B=50 simulated reference sets, k = 1..10; spaceH0="scaledPCA"
## --> Number of clusters (method 'firstmax'): 1
## logW E.logW gap SE.sim
## [1,] 4.789550 5.410767 0.6212174 0.01716271
## [2,] 4.690447 5.299430 0.6089830 0.01589602
## [3,] 4.614029 5.230439 0.6164105 0.01639886
## [4,] 4.559919 5.174324 0.6144046 0.01663022
## [5,] 4.504544 5.128600 0.6240555 0.01616470
## [6,] 4.449369 5.087539 0.6381701 0.01545578
## [7,] 4.404151 5.050245 0.6460943 0.01507339
## [8,] 4.362969 5.015098 0.6521291 0.01557848
## [9,] 4.321997 4.981851 0.6598537 0.01575576
## [10,] 4.286247 4.950492 0.6642445 0.01591362
#Optimal K Gap Statistic Method 2
fviz_gap_stat(gap_stat)
#Examinar a los numeros de cluster
k3 <- kmeans(df, centers = 3, nstart = 100)
k4 <- kmeans(df, centers = 4, nstart = 100)
k5 <- kmeans(df, centers = 5, nstart = 100)
k6 <- kmeans(df, centers = 6, nstart = 100)
k7 <- kmeans(df, centers = 7, nstart = 100)
k8 <- kmeans(df, centers = 8, nstart = 100)
k9 <- kmeans(df, centers = 9, nstart = 100)
# plots to compare
p3 <- fviz_cluster(k3, geom = "point", data = df) + ggtitle("k = 3")
p4 <- fviz_cluster(k4, geom = "point", data = df) + ggtitle("k = 4")
p5 <- fviz_cluster(k5, geom = "point", data = df) + ggtitle("k = 5")
p6 <- fviz_cluster(k6, geom = "point", data = df) + ggtitle("k = 6")
p7 <- fviz_cluster(k7, geom = "point", data = df) + ggtitle("k = 7")
p8 <- fviz_cluster(k8, geom = "point", data = df) + ggtitle("k = 8")
p9 <- fviz_cluster(k9, geom = "point", data = df) + ggtitle("k = 9")
grid.arrange(p3, nrow = 1)
grid.arrange(p4, p5, nrow = 1)
grid.arrange(p6, p7, nrow = 1)
grid.arrange(p8, p9, nrow = 1)
K means
for (i in 3:5)
{
finalK <- kmeans(df, centers = i, nstart = 100)
#print
print(finalK)
}
## K-means clustering with 3 clusters of sizes 12, 49, 12
##
## Cluster means:
## n.tot pc.esp pc.ue27-esp pc.20.34 2019-2014 n.esp.V1419
## 1 1.1004743 -1.4450855 1.57683618 1.6243319 -0.47827831 -0.8661741
## 2 -0.2328318 0.2414119 -0.40162150 -0.2652612 -0.02021224 0.1697135
## 3 -0.1497443 0.4593203 0.06311829 -0.5411819 0.56081162 0.1731772
## hotel2019 rest1614 RFD.2017 tot_ann pmedio pmedio.V1519
## 1 1.7074173 -0.8228720 0.3017366 1.9786542 0.4344530 0.4546716
## 2 -0.3692840 0.1393410 -0.4408447 -0.4147188 -0.3955518 -0.3203563
## 3 -0.1995077 0.2538963 1.4983791 -0.2852190 1.1807169 0.8534501
## pm_ent.V1519 pm_priv.V1519 pm_sha.V1519 alq.num alq.pm alq.pm.V1519
## 1 0.05460288 0.2454344 0.6884755 1.51283752 0.4721942 0.498524508
## 2 -0.25282888 -0.1440159 -0.1150861 -0.37889693 -0.3826076 -0.120557045
## 3 0.97778170 0.3426305 -0.2185406 0.03432497 1.0901202 -0.006249909
## alq.num.V1519 tot.comp tot.eur perc.nou.comp perc.prot.comp
## 1 -0.09197558 0.63323897 0.2698400 -0.10594879 -0.1104054
## 2 -0.22525878 -0.05904988 -0.4155495 0.04535528 -0.1157865
## 3 1.01178229 -0.39211863 1.4269871 -0.07925192 0.5832003
## tot.comp.V1519 nou.eur.V1519 usat.eur.V1519
## 1 -0.5528028 0.74133198 0.36261110
## 2 0.3141121 -0.08668115 0.01182563
## 3 -0.7298218 -0.38738395 -0.41089911
##
## Clustering vector:
## el Raval
## 1
## el Barri Gòtic
## 1
## la Barceloneta
## 1
## Sant Pere, Santa Caterina i la Ribera
## 1
## el Fort Pienc
## 1
## la Sagrada Família
## 1
## la Dreta de l'Eixample
## 1
## l'Antiga Esquerra de l'Eixample
## 1
## la Nova Esquerra de l'Eixample
## 1
## Sant Antoni
## 1
## el Poble Sec
## 1
## la Marina del Prat Vermell
## 3
## la Marina de Port
## 2
## la Font de la Guatlla
## 2
## Hostafrancs
## 2
## la Bordeta
## 2
## Sants - Badal
## 2
## Sants
## 2
## les Corts
## 2
## la Maternitat i Sant Ramon
## 3
## Pedralbes
## 3
## Vallvidrera, el Tibidabo i les Planes
## 3
## Sarrià
## 3
## les Tres Torres
## 3
## Sant Gervasi - la Bonanova
## 3
## Sant Gervasi - Galvany
## 3
## el Putxet i el Farró
## 3
## Vallcarca i els Penitents
## 2
## el Coll
## 2
## la Salut
## 2
## la Vila de Gràcia
## 1
## el Camp d'en Grassot i Gràcia Nova
## 2
## el Baix Guinardó
## 2
## Can Baró
## 2
## el Guinardó
## 2
## la Font d'en Fargues
## 2
## el Carmel
## 2
## la Teixonera
## 2
## Sant Genís dels Agudells
## 2
## Montbau
## 2
## la Vall d'Hebron
## 2
## la Clota
## 2
## Horta
## 2
## Vilapicina i la Torre Llobeta
## 2
## Porta
## 2
## el Turó de la Peira
## 2
## Can Peguera
## 2
## la Guineueta
## 2
## Canyelles
## 2
## les Roquetes
## 2
## Verdun
## 2
## la Prosperitat
## 2
## la Trinitat Nova
## 2
## Torre Baró
## 2
## Ciutat Meridiana
## 2
## Vallbona
## 2
## la Trinitat Vella
## 2
## Baró de Viver
## 2
## el Bon Pastor
## 2
## Sant Andreu
## 2
## la Sagrera
## 2
## el Congrés i els Indians
## 2
## Navas
## 2
## el Camp de l'Arpa del Clot
## 2
## el Clot
## 2
## el Parc i la Llacuna del Poblenou
## 2
## la Vila Olímpica del Poblenou
## 3
## el Poblenou
## 3
## Diagonal Mar i el Front Marítim del Poblenou
## 3
## el Besòs i el Maresme
## 2
## Provençals del Poblenou
## 2
## Sant Martí de Provençals
## 2
## la Verneda i la Pau
## 2
##
## Within cluster sum of squares by cluster:
## [1] 354.8483 667.3048 344.4209
## (between_SS / total_SS = 27.0 %)
##
## Available components:
##
## [1] "cluster" "centers" "totss" "withinss" "tot.withinss"
## [6] "betweenss" "size" "iter" "ifault"
## K-means clustering with 4 clusters of sizes 45, 21, 6, 1
##
## Cluster means:
## n.tot pc.esp pc.ue27-esp pc.20.34 2019-2014 n.esp.V1419
## 1 -0.4432263 0.2245688 -0.3993674 -0.30313940 -0.06374593 0.1900760
## 2 0.8207409 0.1758273 0.1423463 -0.09467904 0.46909432 -0.1155296
## 3 0.6934459 -2.4530754 2.6355754 2.50324479 -1.11179880 -1.1630498
## 4 -1.4510511 0.9204820 -0.8311897 0.61006378 -0.31162126 0.8510014
## hotel2019 rest1614 RFD.2017 tot_ann pmedio pmedio.V1519
## 1 -0.4419445 0.08186825 -0.46198401 -0.4649845 -0.4211666 -3.766507e-01
## 2 0.6232098 0.39133674 1.07113220 0.4350177 0.5873949 6.803022e-01
## 3 1.2204018 -2.03981126 -0.07464098 2.0646502 0.1161776 -2.994381e-05
## 4 -0.5223148 0.33672465 -1.25664987 -0.5989730 5.9201381 2.663116e+00
## pm_ent.V1519 pm_priv.V1519 pm_sha.V1519 alq.num alq.pm alq.pm.V1519
## 1 -0.3044430 -0.1917495 -0.1165433 -0.5423508 -0.4098762 -0.2182988
## 2 0.5609496 0.1010076 -0.0729745 0.9008793 0.9189856 0.3723334
## 3 -0.3005115 0.3050610 1.1612349 1.0845715 0.2573791 0.7021496
## 4 3.7230618 4.6772014 -0.1904983 -1.0201100 -2.3985435 -2.2084508
## alq.num.V1519 tot.comp tot.eur perc.nou.comp perc.prot.comp
## 1 -0.1702167 -0.2633406 -0.44164170 0.04696926 -0.1151152
## 2 0.4014222 0.3837583 0.99862329 -0.06904550 -0.1182516
## 3 -0.4693833 0.8308983 0.01766572 0.01278945 -0.1262490
## 4 2.0461843 -1.1939865 -1.20320672 -0.74039785 8.4209625
## tot.comp.V1519 nou.eur.V1519 usat.eur.V1519
## 1 0.3569822 -0.10830179 -0.02605316
## 2 -0.5603536 0.05982742 -0.16390847
## 3 -0.5842477 0.64064118 0.72428972
## 4 -0.7912879 -0.22664209 0.26873179
##
## Clustering vector:
## el Raval
## 3
## el Barri Gòtic
## 3
## la Barceloneta
## 3
## Sant Pere, Santa Caterina i la Ribera
## 3
## el Fort Pienc
## 2
## la Sagrada Família
## 2
## la Dreta de l'Eixample
## 2
## l'Antiga Esquerra de l'Eixample
## 2
## la Nova Esquerra de l'Eixample
## 2
## Sant Antoni
## 2
## el Poble Sec
## 3
## la Marina del Prat Vermell
## 4
## la Marina de Port
## 1
## la Font de la Guatlla
## 1
## Hostafrancs
## 1
## la Bordeta
## 1
## Sants - Badal
## 1
## Sants
## 2
## les Corts
## 2
## la Maternitat i Sant Ramon
## 2
## Pedralbes
## 2
## Vallvidrera, el Tibidabo i les Planes
## 1
## Sarrià
## 2
## les Tres Torres
## 2
## Sant Gervasi - la Bonanova
## 2
## Sant Gervasi - Galvany
## 2
## el Putxet i el Farró
## 2
## Vallcarca i els Penitents
## 1
## el Coll
## 1
## la Salut
## 1
## la Vila de Gràcia
## 3
## el Camp d'en Grassot i Gràcia Nova
## 2
## el Baix Guinardó
## 1
## Can Baró
## 1
## el Guinardó
## 1
## la Font d'en Fargues
## 1
## el Carmel
## 1
## la Teixonera
## 1
## Sant Genís dels Agudells
## 1
## Montbau
## 1
## la Vall d'Hebron
## 1
## la Clota
## 1
## Horta
## 1
## Vilapicina i la Torre Llobeta
## 1
## Porta
## 1
## el Turó de la Peira
## 1
## Can Peguera
## 1
## la Guineueta
## 1
## Canyelles
## 1
## les Roquetes
## 1
## Verdun
## 1
## la Prosperitat
## 1
## la Trinitat Nova
## 1
## Torre Baró
## 1
## Ciutat Meridiana
## 1
## Vallbona
## 1
## la Trinitat Vella
## 1
## Baró de Viver
## 1
## el Bon Pastor
## 1
## Sant Andreu
## 2
## la Sagrera
## 1
## el Congrés i els Indians
## 1
## Navas
## 1
## el Camp de l'Arpa del Clot
## 2
## el Clot
## 1
## el Parc i la Llacuna del Poblenou
## 1
## la Vila Olímpica del Poblenou
## 2
## el Poblenou
## 2
## Diagonal Mar i el Front Marítim del Poblenou
## 2
## el Besòs i el Maresme
## 1
## Provençals del Poblenou
## 1
## Sant Martí de Provençals
## 1
## la Verneda i la Pau
## 1
##
## Within cluster sum of squares by cluster:
## [1] 604.3294 411.5688 180.8952 0.0000
## (between_SS / total_SS = 36.1 %)
##
## Available components:
##
## [1] "cluster" "centers" "totss" "withinss" "tot.withinss"
## [6] "betweenss" "size" "iter" "ifault"
## K-means clustering with 5 clusters of sizes 16, 8, 4, 1, 44
##
## Cluster means:
## n.tot pc.esp pc.ue27-esp pc.20.34 2019-2014 n.esp.V1419
## 1 1.4049717 -0.08442882 0.2771441 0.3118180 0.3564191 -0.28484215
## 2 -0.4172896 0.43884363 0.1323621 -0.7616790 0.5133311 0.09674519
## 3 0.2607690 -3.20111357 3.4756046 3.2600005 -1.6521479 -1.37468295
## 4 -1.4510511 0.92048205 -0.8311897 0.6100638 -0.3116213 0.85100145
## 5 -0.4257558 0.22100192 -0.4219189 -0.2851300 -0.0656623 0.19161916
## hotel2019 rest1614 RFD.2017 tot_ann pmedio pmedio.V1519
## 1 1.1698729 -0.04794922 0.5039249 0.9827528 0.5063425 0.6870490
## 2 -0.3300584 0.53264551 1.9492907 -0.4209725 0.7066039 0.5399194
## 3 0.9698396 -1.95698293 -0.1076155 2.1538382 -0.1232834 -0.4163330
## 4 -0.5223148 0.33672465 -1.2566499 -0.5989730 5.9201381 2.6631159
## 5 -0.4416941 0.09084615 -0.4993184 -0.4630146 -0.4359390 -0.3706800
## pm_ent.V1519 pm_priv.V1519 pm_sha.V1519 alq.num alq.pm alq.pm.V1519
## 1 0.3542079 0.17455688 0.4501936 1.4941205 0.5132125 0.3732249
## 2 0.7185407 0.04363677 -0.2115300 -0.2481317 1.6090905 0.1309249
## 3 -0.5152180 0.40624772 -0.1086660 0.6463580 0.2873644 0.7247174
## 4 3.7230618 4.67720137 -0.1904983 -1.0201100 -2.3985435 -2.2084508
## 5 -0.2972237 -0.21464083 -0.1110385 -0.5337772 -0.4507963 -0.1752140
## alq.num.V1519 tot.comp tot.eur perc.nou.comp perc.prot.comp
## 1 0.07333838 0.8936495 0.43961896 0.01627208 -0.1147917
## 2 1.20432056 -0.6296467 1.90476816 -0.37081528 -0.1293235
## 3 -0.52915045 0.6792846 -0.09378548 0.14813806 -0.1247117
## 4 2.04618431 -1.1939865 -1.20320672 -0.74039785 8.4209625
## 5 -0.24403548 -0.2450993 -0.47031137 0.06486397 -0.1147923
## tot.comp.V1519 nou.eur.V1519 usat.eur.V1519
## 1 -0.4209204 0.3970645 0.252223919
## 2 -0.7785240 -0.7518100 -0.564612516
## 3 -0.6374699 1.1337574 -0.011071497
## 4 -0.7912879 -0.2266421 0.268731787
## 5 0.3705474 -0.1056122 0.005837991
##
## Clustering vector:
## el Raval
## 3
## el Barri Gòtic
## 3
## la Barceloneta
## 3
## Sant Pere, Santa Caterina i la Ribera
## 3
## el Fort Pienc
## 1
## la Sagrada Família
## 1
## la Dreta de l'Eixample
## 1
## l'Antiga Esquerra de l'Eixample
## 1
## la Nova Esquerra de l'Eixample
## 1
## Sant Antoni
## 1
## el Poble Sec
## 1
## la Marina del Prat Vermell
## 4
## la Marina de Port
## 5
## la Font de la Guatlla
## 5
## Hostafrancs
## 5
## la Bordeta
## 5
## Sants - Badal
## 5
## Sants
## 1
## les Corts
## 1
## la Maternitat i Sant Ramon
## 2
## Pedralbes
## 2
## Vallvidrera, el Tibidabo i les Planes
## 2
## Sarrià
## 2
## les Tres Torres
## 2
## Sant Gervasi - la Bonanova
## 2
## Sant Gervasi - Galvany
## 1
## el Putxet i el Farró
## 1
## Vallcarca i els Penitents
## 5
## el Coll
## 5
## la Salut
## 5
## la Vila de Gràcia
## 1
## el Camp d'en Grassot i Gràcia Nova
## 1
## el Baix Guinardó
## 5
## Can Baró
## 5
## el Guinardó
## 5
## la Font d'en Fargues
## 5
## el Carmel
## 5
## la Teixonera
## 5
## Sant Genís dels Agudells
## 5
## Montbau
## 5
## la Vall d'Hebron
## 5
## la Clota
## 5
## Horta
## 5
## Vilapicina i la Torre Llobeta
## 5
## Porta
## 5
## el Turó de la Peira
## 5
## Can Peguera
## 5
## la Guineueta
## 5
## Canyelles
## 5
## les Roquetes
## 5
## Verdun
## 5
## la Prosperitat
## 5
## la Trinitat Nova
## 5
## Torre Baró
## 5
## Ciutat Meridiana
## 5
## Vallbona
## 5
## la Trinitat Vella
## 5
## Baró de Viver
## 5
## el Bon Pastor
## 5
## Sant Andreu
## 1
## la Sagrera
## 5
## el Congrés i els Indians
## 5
## Navas
## 5
## el Camp de l'Arpa del Clot
## 1
## el Clot
## 5
## el Parc i la Llacuna del Poblenou
## 5
## la Vila Olímpica del Poblenou
## 2
## el Poblenou
## 1
## Diagonal Mar i el Front Marítim del Poblenou
## 2
## el Besòs i el Maresme
## 5
## Provençals del Poblenou
## 5
## Sant Martí de Provençals
## 5
## la Verneda i la Pau
## 5
##
## Within cluster sum of squares by cluster:
## [1] 310.71814 121.83223 70.44476 0.00000 574.16923
## (between_SS / total_SS = 42.5 %)
##
## Available components:
##
## [1] "cluster" "centers" "totss" "withinss" "tot.withinss"
## [6] "betweenss" "size" "iter" "ifault"
Plot
final3 <- kmeans(df, centers = 3, nstart = 100)
final4 <- kmeans(df, centers = 4, nstart = 100)
final5 <- kmeans(df, centers = 5, nstart = 100)
fviz_cluster(final3, data = df)
fviz_cluster(final4, data = df)
fviz_cluster(final5, data = df)
kkk <- merged2 %>% mutate(Cluster = final3$cluster) %>% group_by(Cluster) %>% summarise_all(“mean”)
z_cluster(finalK, data = df)
for (i in 3:9) { finalK <- kmeans(df, centers = i, nstart = 100) #plot x <- fviz_cluster(finalK, data = df) x }
Descriptive Statistic
kkk <- merged %>% mutate(Cluster = finalK$cluster) %>% group_by(Nom_Barri) #%>% #summarise_all(“mean”)
k.1 <- kkk %>% filter(Cluster == 1)
k.1$Nom_Barri
k.2 <- kkk %>% filter(Cluster == 2)
k.2$Nom_Barri
k.3 <- kkk %>% filter(Cluster == 3)
k.3$Nom_Barri