Variables
merged2 <- merged %>%
remove_rownames %>%
column_to_rownames(var="Nom_Barri") %>%
select("n.tot","pc.esp","pc.ue27-esp","pc.20.34","2019-2014","n.esp.V1419",#"var20192014","pc.ext",
"hotel2019","rest1614",
"RFD.2017",
"tot_ann","pmedio","pmedio.V1519","pm_ent.V1519","pm_priv.V1519","pm_sha.V1519",
#"pc.ent","pc.priv","pc.shared","pc.hotel","pm_ent","pm_priv","pm_sha","pm_hot",
#"alq.mq",
"alq.num","alq.pmq","alq.pmq.V1519","alq.num.V1519",
"tot.comp","tot.eurm2","perc.nou.comp","perc.prot.comp","tot.comp.V1519",
"nou.eurm2.V1519","usat.eurm2.V1519",
#"perc.prot.comp",
#"tot.m2","nou.m2","prot.m2","usat.m2",
#"tot.eur","nou.eur","usat.eur",
#"nou.eurm2","usat.eurm2",
)
Standardizar los datos
df <- scale(merged2)
Optimal K Elbow
#elbow (1 option)
set.seed(123)
wss <- function(k) {
kmeans(df, k, nstart = 100 )$tot.withinss
}
k.values <- 1:15
wss_values <- map_dbl(k.values, wss)
plot(k.values, wss_values,
type="b", pch = 19, frame = FALSE,
xlab="Number of clusters K",
ylab="Total within-clusters sum of squares")
#elbow (2 option)
set.seed(123)
fviz_nbclust(df, kmeans, method = "wss")
#Optimal K Average Silhouette Method
avg_sil <- function(k) {
km.res <- kmeans(df, centers = k, nstart = 100)
ss <- silhouette(km.res$cluster, dist(df))
mean(ss[, 3])
}
k.values <- 2:15
avg_sil_values <- map_dbl(k.values, avg_sil)
plot(k.values, avg_sil_values,
type = "b", pch = 19, frame = FALSE,
xlab = "Number of clusters K",
ylab = "Average Silhouettes")
# Silhouette Method 2
fviz_nbclust(df, kmeans, method = "silhouette")
#Optimal K Gap Statistic Method
set.seed(123)
gap_stat <- clusGap(df, FUN = kmeans, nstart = 100, K.max = 10, B = 50)
print(gap_stat, method = "firstmax")
## Clustering Gap statistic ["clusGap"] from call:
## clusGap(x = df, FUNcluster = kmeans, K.max = 10, B = 50, nstart = 100)
## B=50 simulated reference sets, k = 1..10; spaceH0="scaledPCA"
## --> Number of clusters (method 'firstmax'): 2
## logW E.logW gap SE.sim
## [1,] 4.771269 5.422868 0.6515991 0.01699269
## [2,] 4.663431 5.319210 0.6557783 0.01447341
## [3,] 4.602974 5.253420 0.6504460 0.01421653
## [4,] 4.522552 5.199480 0.6769272 0.01602721
## [5,] 4.460272 5.154069 0.6937972 0.01605158
## [6,] 4.407117 5.112331 0.7052143 0.01647874
## [7,] 4.360433 5.074070 0.7136374 0.01676805
## [8,] 4.312338 5.038206 0.7258684 0.01622555
## [9,] 4.270556 5.004328 0.7337716 0.01622440
## [10,] 4.214441 4.972248 0.7578069 0.01620062
#Optimal K Gap Statistic Method 2
fviz_gap_stat(gap_stat)
#Examinar a los numeros de cluster
k3 <- kmeans(df, centers = 3, nstart = 100)
k4 <- kmeans(df, centers = 4, nstart = 100)
k5 <- kmeans(df, centers = 5, nstart = 100)
k6 <- kmeans(df, centers = 6, nstart = 100)
k7 <- kmeans(df, centers = 7, nstart = 100)
k8 <- kmeans(df, centers = 8, nstart = 100)
k9 <- kmeans(df, centers = 9, nstart = 100)
# plots to compare
p3 <- fviz_cluster(k3, geom = "point", data = df) + ggtitle("k = 3")
p4 <- fviz_cluster(k4, geom = "point", data = df) + ggtitle("k = 4")
p5 <- fviz_cluster(k5, geom = "point", data = df) + ggtitle("k = 5")
p6 <- fviz_cluster(k6, geom = "point", data = df) + ggtitle("k = 6")
p7 <- fviz_cluster(k7, geom = "point", data = df) + ggtitle("k = 7")
p8 <- fviz_cluster(k8, geom = "point", data = df) + ggtitle("k = 8")
p9 <- fviz_cluster(k9, geom = "point", data = df) + ggtitle("k = 9")
grid.arrange(p3, nrow = 1)
grid.arrange(p4, p5, nrow = 1)
grid.arrange(p6, p7, nrow = 1)
grid.arrange(p8, p9, nrow = 1)
K means
for (i in 3:5)
{
finalK <- kmeans(df, centers = i, nstart = 100)
#print
print(finalK)
}
## K-means clustering with 3 clusters of sizes 59, 13, 1
##
## Cluster means:
## n.tot pc.esp pc.ue27-esp pc.20.34 2019-2014 n.esp.V1419
## 1 -0.228319 0.2674996 -0.3050084 -0.3352279 0.09328087 0.1584048
## 2 1.147836 -1.2848429 1.4482065 1.4744909 -0.39938078 -0.7843759
## 3 -1.451051 0.9204820 -0.8311897 0.6100638 -0.31162126 0.8510014
## hotel2019 rest1614 RFD.2017 tot_ann pmedio pmedio.V1519
## 1 -0.3593338 0.1844588 -0.07913194 -0.3953857 -0.1920935 -0.2400272
## 2 1.6710007 -0.8630609 0.45580265 1.8405175 0.4164139 1.1238451
## 3 -0.5223148 0.3367247 -1.25664987 -0.5989730 5.9201381 -0.4483805
## pm_ent.V1519 pm_priv.V1519 pm_sha.V1519 alq.num alq.pmq alq.pmq.V1519
## 1 -0.1354181 -0.12223594 -0.07764182 -0.3216731 -0.08099854 0.0114467
## 2 0.4115488 -0.08599066 0.37895468 1.5383708 0.59384300 0.1222159
## 3 2.6395313 8.32979891 -0.34554332 -1.0201100 -2.94104491 -2.2641626
## alq.num.V1519 tot.comp tot.eurm2 perc.nou.comp perc.prot.comp
## 1 -0.02523450 -0.1210985 -0.1284305 0.0123391091 -0.1180809
## 2 -0.04287301 0.6414460 0.7307628 0.0009531086 -0.1118607
## 3 2.04618431 -1.1939865 -1.9225176 -0.7403978475 8.4209625
## tot.comp.V1519 nou.eurm2.V1519 usat.eurm2.V1519
## 1 0.1398928 -0.09774982 0.02550978
## 2 -0.5740297 0.45926125 -0.10455331
## 3 -0.7912879 -0.20315664 -0.14588419
##
## Clustering vector:
## el Raval
## 2
## el Barri Gòtic
## 2
## la Barceloneta
## 2
## Sant Pere, Santa Caterina i la Ribera
## 2
## el Fort Pienc
## 2
## la Sagrada Família
## 2
## la Dreta de l'Eixample
## 2
## l'Antiga Esquerra de l'Eixample
## 2
## la Nova Esquerra de l'Eixample
## 2
## Sant Antoni
## 2
## el Poble Sec
## 2
## la Marina del Prat Vermell
## 3
## la Marina de Port
## 1
## la Font de la Guatlla
## 1
## Hostafrancs
## 1
## la Bordeta
## 1
## Sants - Badal
## 1
## Sants
## 1
## les Corts
## 1
## la Maternitat i Sant Ramon
## 1
## Pedralbes
## 1
## Vallvidrera, el Tibidabo i les Planes
## 1
## Sarrià
## 1
## les Tres Torres
## 1
## Sant Gervasi - la Bonanova
## 1
## Sant Gervasi - Galvany
## 2
## el Putxet i el Farró
## 1
## Vallcarca i els Penitents
## 1
## el Coll
## 1
## la Salut
## 1
## la Vila de Gràcia
## 2
## el Camp d'en Grassot i Gràcia Nova
## 1
## el Baix Guinardó
## 1
## Can Baró
## 1
## el Guinardó
## 1
## la Font d'en Fargues
## 1
## el Carmel
## 1
## la Teixonera
## 1
## Sant Genís dels Agudells
## 1
## Montbau
## 1
## la Vall d'Hebron
## 1
## la Clota
## 1
## Horta
## 1
## Vilapicina i la Torre Llobeta
## 1
## Porta
## 1
## el Turó de la Peira
## 1
## Can Peguera
## 1
## la Guineueta
## 1
## Canyelles
## 1
## les Roquetes
## 1
## Verdun
## 1
## la Prosperitat
## 1
## la Trinitat Nova
## 1
## Torre Baró
## 1
## Ciutat Meridiana
## 1
## Vallbona
## 1
## la Trinitat Vella
## 1
## Baró de Viver
## 1
## el Bon Pastor
## 1
## Sant Andreu
## 1
## la Sagrera
## 1
## el Congrés i els Indians
## 1
## Navas
## 1
## el Camp de l'Arpa del Clot
## 1
## el Clot
## 1
## el Parc i la Llacuna del Poblenou
## 1
## la Vila Olímpica del Poblenou
## 1
## el Poblenou
## 1
## Diagonal Mar i el Front Marítim del Poblenou
## 1
## el Besòs i el Maresme
## 1
## Provençals del Poblenou
## 1
## Sant Martí de Provençals
## 1
## la Verneda i la Pau
## 1
##
## Within cluster sum of squares by cluster:
## [1] 1006.7159 315.7006 0.0000
## (between_SS / total_SS = 29.4 %)
##
## Available components:
##
## [1] "cluster" "centers" "totss" "withinss" "tot.withinss"
## [6] "betweenss" "size" "iter" "ifault"
## K-means clustering with 4 clusters of sizes 11, 1, 28, 33
##
## Cluster means:
## n.tot pc.esp pc.ue27-esp pc.20.34 2019-2014 n.esp.V1419
## 1 1.1386455 -1.5181943 1.660406024 1.7162454 -0.5504116 -0.89498136
## 2 -1.4510511 0.9204820 -0.831189715 0.6100638 -0.3116213 0.85100145
## 3 0.2801561 0.2319474 0.006533345 -0.2456410 0.4565990 0.02036288
## 4 -0.5732855 0.2813675 -0.533824552 -0.3821459 -0.1945038 0.25526160
## hotel2019 rest1614 RFD.2017 tot_ann pmedio pmedio.V1519
## 1 1.8131344 -0.9178639 0.3018607 2.1038076 0.4606381 1.3381717
## 2 -0.5223148 0.3367247 -1.2566499 -0.5989730 5.9201381 -0.4483805
## 3 -0.1256357 0.2862085 0.6832707 -0.1731238 0.2043823 -0.2529761
## 4 -0.4819504 0.0529073 -0.6422848 -0.5362256 -0.5063594 -0.2178236
## pm_ent.V1519 pm_priv.V1519 pm_sha.V1519 alq.num alq.pmq alq.pmq.V1519
## 1 0.5161363 -0.08301709 0.4382081 1.5831839 0.5912009 0.0866056
## 2 2.6395313 8.32979891 -0.3455433 -1.0201100 -2.9410449 -2.2641626
## 3 0.2105526 -0.06892328 0.2474351 0.1958036 0.5517826 0.2648264
## 4 -0.4306819 -0.16626543 -0.3455433 -0.6629519 -0.5761236 -0.1849587
## alq.num.V1519 tot.comp tot.eurm2 perc.nou.comp perc.prot.comp
## 1 -0.1211656 0.6566191 0.6618772 -0.099133956 -0.1108358
## 2 2.0461843 -1.1939865 -1.9225176 -0.740397847 8.4209625
## 3 0.3003252 0.3026570 0.6447657 0.003044029 -0.1249634
## 4 -0.2764385 -0.4394915 -0.7094415 0.052898138 -0.1122059
## tot.comp.V1519 nou.eurm2.V1519 usat.eurm2.V1519
## 1 -0.5384559 0.36955298 -0.1045704
## 2 -0.7912879 -0.20315664 -0.1458842
## 3 -0.4707658 -0.23491648 -0.1071381
## 4 0.6029013 0.08229501 0.1301826
##
## Clustering vector:
## el Raval
## 1
## el Barri Gòtic
## 1
## la Barceloneta
## 1
## Sant Pere, Santa Caterina i la Ribera
## 1
## el Fort Pienc
## 3
## la Sagrada Família
## 1
## la Dreta de l'Eixample
## 1
## l'Antiga Esquerra de l'Eixample
## 1
## la Nova Esquerra de l'Eixample
## 1
## Sant Antoni
## 1
## el Poble Sec
## 1
## la Marina del Prat Vermell
## 2
## la Marina de Port
## 4
## la Font de la Guatlla
## 4
## Hostafrancs
## 3
## la Bordeta
## 4
## Sants - Badal
## 3
## Sants
## 3
## les Corts
## 3
## la Maternitat i Sant Ramon
## 3
## Pedralbes
## 3
## Vallvidrera, el Tibidabo i les Planes
## 3
## Sarrià
## 3
## les Tres Torres
## 3
## Sant Gervasi - la Bonanova
## 3
## Sant Gervasi - Galvany
## 3
## el Putxet i el Farró
## 3
## Vallcarca i els Penitents
## 3
## el Coll
## 4
## la Salut
## 3
## la Vila de Gràcia
## 1
## el Camp d'en Grassot i Gràcia Nova
## 3
## el Baix Guinardó
## 3
## Can Baró
## 4
## el Guinardó
## 3
## la Font d'en Fargues
## 4
## el Carmel
## 4
## la Teixonera
## 4
## Sant Genís dels Agudells
## 4
## Montbau
## 4
## la Vall d'Hebron
## 4
## la Clota
## 4
## Horta
## 4
## Vilapicina i la Torre Llobeta
## 4
## Porta
## 4
## el Turó de la Peira
## 4
## Can Peguera
## 4
## la Guineueta
## 4
## Canyelles
## 4
## les Roquetes
## 4
## Verdun
## 4
## la Prosperitat
## 4
## la Trinitat Nova
## 4
## Torre Baró
## 4
## Ciutat Meridiana
## 4
## Vallbona
## 4
## la Trinitat Vella
## 4
## Baró de Viver
## 4
## el Bon Pastor
## 4
## Sant Andreu
## 3
## la Sagrera
## 3
## el Congrés i els Indians
## 4
## Navas
## 4
## el Camp de l'Arpa del Clot
## 3
## el Clot
## 3
## el Parc i la Llacuna del Poblenou
## 3
## la Vila Olímpica del Poblenou
## 3
## el Poblenou
## 3
## Diagonal Mar i el Front Marítim del Poblenou
## 3
## el Besòs i el Maresme
## 3
## Provençals del Poblenou
## 3
## Sant Martí de Provençals
## 4
## la Verneda i la Pau
## 4
##
## Within cluster sum of squares by cluster:
## [1] 277.9343 0.0000 380.8497 495.9683
## (between_SS / total_SS = 38.3 %)
##
## Available components:
##
## [1] "cluster" "centers" "totss" "withinss" "tot.withinss"
## [6] "betweenss" "size" "iter" "ifault"
## K-means clustering with 5 clusters of sizes 1, 6, 39, 16, 11
##
## Cluster means:
## n.tot pc.esp pc.ue27-esp pc.20.34 2019-2014 n.esp.V1419
## 1 -1.4510511 0.9204820 -0.8311897 0.6100638 -0.31162126 0.851001449
## 2 -1.3430005 0.6792670 -0.7024074 -0.4735496 -0.34528822 1.290480095
## 3 -0.1717533 0.1869216 -0.4030547 -0.2757674 -0.02177393 0.006807408
## 4 0.2301457 0.2758818 0.1562689 -0.3682836 0.58044136 0.061589003
## 5 1.1386455 -1.5181943 1.6604060 1.7162454 -0.55041163 -0.894981363
## hotel2019 rest1614 RFD.2017 tot_ann pmedio pmedio.V1519
## 1 -0.52231480 0.33672465 -1.2566499 -0.5989730 5.9201381 -0.4483805
## 2 -0.47539813 -0.03281713 -0.8137380 -0.6260110 -0.7944977 0.7286381
## 3 -0.39422233 0.08872977 -0.4589582 -0.4323539 -0.3663237 -0.4132274
## 4 -0.07469399 0.40601374 1.2948738 -0.1203151 0.5041534 -0.1579668
## 5 1.81313440 -0.91786389 0.3018607 2.1038076 0.4606381 1.3381717
## pm_ent.V1519 pm_priv.V1519 pm_sha.V1519 alq.num alq.pmq alq.pmq.V1519
## 1 2.6395313 8.32979891 -0.3455433 -1.0201100 -2.94104491 -2.2641626
## 2 -0.4432369 -0.23193991 -0.3455433 -1.0222042 -2.56785484 -2.2641626
## 3 -0.3645788 -0.13725352 -0.2171900 -0.4039288 -0.02085505 0.2757523
## 4 0.5350604 -0.04200527 0.3793077 0.3432210 0.79114445 0.2588836
## 5 0.5161363 -0.08301709 0.4382081 1.5831839 0.59120087 0.0866056
## alq.num.V1519 tot.comp tot.eurm2 perc.nou.comp perc.prot.comp
## 1 2.04618431 -1.19398646 -1.9225176 -0.74039785 8.4209625
## 2 0.09755623 -1.16703292 -0.9250291 0.06219793 -0.1293235
## 3 -0.34950092 0.05658871 -0.4244522 0.09422941 -0.1126530
## 4 0.77073974 -0.07709913 1.0466049 -0.13857895 -0.1270225
## 5 -0.12116561 0.65661913 0.6618772 -0.09913396 -0.1108358
## tot.comp.V1519 nou.eurm2.V1519 usat.eurm2.V1519
## 1 -0.7912879 -0.20315664 -0.1458842
## 2 0.1969736 0.02942733 1.2909018
## 3 0.4046005 0.02267958 -0.1237257
## 4 -0.6404350 -0.30768711 -0.1014968
## 5 -0.5384559 0.36955298 -0.1045704
##
## Clustering vector:
## el Raval
## 5
## el Barri Gòtic
## 5
## la Barceloneta
## 5
## Sant Pere, Santa Caterina i la Ribera
## 5
## el Fort Pienc
## 4
## la Sagrada Família
## 5
## la Dreta de l'Eixample
## 5
## l'Antiga Esquerra de l'Eixample
## 5
## la Nova Esquerra de l'Eixample
## 5
## Sant Antoni
## 5
## el Poble Sec
## 5
## la Marina del Prat Vermell
## 1
## la Marina de Port
## 3
## la Font de la Guatlla
## 3
## Hostafrancs
## 3
## la Bordeta
## 3
## Sants - Badal
## 3
## Sants
## 4
## les Corts
## 4
## la Maternitat i Sant Ramon
## 4
## Pedralbes
## 4
## Vallvidrera, el Tibidabo i les Planes
## 4
## Sarrià
## 4
## les Tres Torres
## 4
## Sant Gervasi - la Bonanova
## 4
## Sant Gervasi - Galvany
## 4
## el Putxet i el Farró
## 4
## Vallcarca i els Penitents
## 3
## el Coll
## 3
## la Salut
## 3
## la Vila de Gràcia
## 5
## el Camp d'en Grassot i Gràcia Nova
## 4
## el Baix Guinardó
## 3
## Can Baró
## 3
## el Guinardó
## 3
## la Font d'en Fargues
## 3
## el Carmel
## 3
## la Teixonera
## 3
## Sant Genís dels Agudells
## 3
## Montbau
## 3
## la Vall d'Hebron
## 3
## la Clota
## 2
## Horta
## 3
## Vilapicina i la Torre Llobeta
## 3
## Porta
## 3
## el Turó de la Peira
## 3
## Can Peguera
## 2
## la Guineueta
## 3
## Canyelles
## 2
## les Roquetes
## 3
## Verdun
## 3
## la Prosperitat
## 3
## la Trinitat Nova
## 3
## Torre Baró
## 2
## Ciutat Meridiana
## 3
## Vallbona
## 2
## la Trinitat Vella
## 3
## Baró de Viver
## 2
## el Bon Pastor
## 3
## Sant Andreu
## 3
## la Sagrera
## 3
## el Congrés i els Indians
## 3
## Navas
## 3
## el Camp de l'Arpa del Clot
## 3
## el Clot
## 3
## el Parc i la Llacuna del Poblenou
## 4
## la Vila Olímpica del Poblenou
## 4
## el Poblenou
## 4
## Diagonal Mar i el Front Marítim del Poblenou
## 4
## el Besòs i el Maresme
## 3
## Provençals del Poblenou
## 3
## Sant Martí de Provençals
## 3
## la Verneda i la Pau
## 3
##
## Within cluster sum of squares by cluster:
## [1] 0.0000 201.1831 334.6603 231.6313 277.9343
## (between_SS / total_SS = 44.2 %)
##
## Available components:
##
## [1] "cluster" "centers" "totss" "withinss" "tot.withinss"
## [6] "betweenss" "size" "iter" "ifault"
Plot
final3 <- kmeans(df, centers = 3, nstart = 100)
final4 <- kmeans(df, centers = 4, nstart = 100)
final5 <- kmeans(df, centers = 5, nstart = 100)
fviz_cluster(final3, data = df)
fviz_cluster(final4, data = df)
fviz_cluster(final5, data = df)
kkk <- merged2 %>% mutate(Cluster = final3$cluster) %>% group_by(Cluster) %>% summarise_all(“mean”)
z_cluster(finalK, data = df)
for (i in 3:9) { finalK <- kmeans(df, centers = i, nstart = 100) #plot x <- fviz_cluster(finalK, data = df) x }
Descriptive Statistic
kkk <- merged %>% mutate(Cluster = finalK$cluster) %>% group_by(Nom_Barri) #%>% #summarise_all(“mean”)
k.1 <- kkk %>% filter(Cluster == 1)
k.1$Nom_Barri
k.2 <- kkk %>% filter(Cluster == 2)
k.2$Nom_Barri
k.3 <- kkk %>% filter(Cluster == 3)
k.3$Nom_Barri