library(factoextra)
## Warning: package 'factoextra' was built under R version 4.5.3
## Loading required package: ggplot2
## Welcome to factoextra!
## Want to learn more? See two factoextra-related books at https://www.datanovia.com/en/product/practical-guide-to-principal-component-methods-in-r/
library(cluster)
## Warning: package 'cluster' was built under R version 4.5.3
library(flexclust)
## Warning: package 'flexclust' was built under R version 4.5.3
library(e1071)
## Warning: package 'e1071' was built under R version 4.5.3
##
## Attaching package: 'e1071'
## The following object is masked from 'package:flexclust':
##
## bclust
## The following object is masked from 'package:ggplot2':
##
## element
library(dbscan)
## Warning: package 'dbscan' was built under R version 4.5.3
##
## Attaching package: 'dbscan'
## The following object is masked from 'package:stats':
##
## as.dendrogram
library(meanShiftR)
library(corrplot)
## Warning: package 'corrplot' was built under R version 4.5.3
## corrplot 0.95 loaded
library(psych)
##
## Attaching package: 'psych'
## The following objects are masked from 'package:ggplot2':
##
## %+%, alpha
data <- read.csv("C:/Users/User/Downloads/usa_housing_kaggle.csv")
data
## Price Bedrooms Bathrooms SquareFeet YearBuilt GarageSpaces LotSize ZipCode
## 1 221958 1 1.9 4827 1979 2 1.45 82240
## 2 771155 2 2.0 1035 1987 2 1.75 74315
## 3 231932 1 3.0 2769 1982 1 1.46 79249
## 4 465838 3 3.3 2708 1907 3 1.62 80587
## 5 359178 4 3.4 1175 1994 2 0.74 20756
## 6 744167 1 3.4 4330 1920 0 1.65 78011
## 7 210268 1 1.3 3435 1980 2 0.25 46378
## 8 832180 2 2.5 2370 1986 0 1.80 14255
## 9 154886 2 1.2 3360 2000 1 1.14 24484
## 10 237337 3 2.6 4191 2017 0 1.65 66549
## 11 621430 4 2.3 3765 1979 2 0.96 44503
## 12 187498 2 3.7 4443 1969 2 1.32 83794
## 13 999159 1 2.1 4650 1971 2 1.10 55113
## 14 275203 4 1.4 1672 1924 1 1.49 84069
## 15 291335 4 1.4 2052 1981 1 0.26 15249
## 16 378167 1 3.3 2114 1988 3 0.21 29201
## 17 141090 2 2.9 3698 1911 2 0.57 68576
## 18 429365 1 1.3 877 1914 0 0.40 19686
## 19 164820 4 1.3 3421 1958 1 1.76 63363
## 20 887201 5 3.1 1400 1925 2 0.52 10661
## 21 421879 5 1.2 1865 2004 2 1.95 54843
## 22 818315 3 3.5 2936 2008 1 0.74 70963
## 23 427069 1 3.1 3249 1925 3 0.45 52828
## 24 876997 1 1.2 3143 1946 1 1.60 58604
## 25 299041 3 1.3 2663 1931 1 1.35 20526
## 26 891743 3 4.0 2118 1909 0 1.05 78910
## 27 203355 3 2.1 4397 1915 0 1.16 35592
## 28 335796 4 2.1 4562 1970 3 1.47 38982
## 29 314176 1 3.4 2990 1916 2 0.53 10207
## 30 284779 4 3.8 1792 1922 1 1.99 98733
## 31 447449 3 4.0 3512 1925 3 1.95 78619
## 32 521909 1 3.3 2992 1984 0 1.34 39328
## 33 358795 4 2.1 2048 1985 1 0.48 56479
## 34 586232 4 1.3 3854 2021 2 1.39 30103
## 35 600186 3 3.3 4833 1906 0 0.24 49891
## 36 256730 1 2.7 2797 1913 0 0.16 20754
## 37 970910 3 2.3 4487 1978 0 0.59 91437
## 38 484681 1 3.7 2951 2016 3 0.98 82982
## 39 249503 5 1.3 4818 1906 2 1.75 65922
## 40 754811 2 2.5 3910 1908 1 1.48 58231
## 41 627035 2 1.0 2770 2014 3 1.51 39301
## 42 748143 2 2.4 997 1947 3 0.91 72711
## 43 552366 3 1.2 3426 1971 3 0.76 51323
## 44 165725 5 1.4 2002 2013 0 0.80 28752
## 45 229981 1 1.4 2835 1958 2 1.98 92205
## 46 184654 4 2.9 1277 1986 3 0.18 23395
## 47 691723 1 3.2 2054 1992 1 1.75 95957
## 48 419030 4 2.8 1722 1981 2 1.20 66273
## 49 428947 1 3.9 1219 1994 1 0.93 14895
## 50 655839 5 2.1 3004 1993 2 1.48 86559
## 51 373538 4 1.9 3397 2015 1 1.02 20699
## 52 431236 3 3.6 1920 1938 0 1.76 75061
## 53 628178 1 1.7 3868 1998 3 1.81 19715
## 54 665894 1 3.9 1750 1917 1 0.90 29169
## 55 589492 4 1.0 3136 1958 2 0.63 26163
## 56 356840 3 3.9 3043 2005 3 1.23 15782
## 57 573254 3 1.1 3445 2002 3 1.83 98177
## 58 449457 5 3.7 2657 1916 2 0.50 94328
## 59 765987 3 2.6 2665 1913 1 1.28 45585
## 60 370936 3 4.0 3712 1930 0 1.30 40682
## 61 339931 3 1.2 3653 1923 0 1.49 57864
## 62 339629 2 2.7 4028 1998 1 0.35 94416
## 63 305041 5 3.9 4519 2007 3 1.46 65114
## 64 798361 1 2.6 4028 1959 3 1.83 48067
## 65 831912 4 2.9 3171 1944 3 0.44 52685
## 66 517113 1 3.1 3691 1997 3 0.55 28073
## 67 168148 5 2.4 4556 1902 1 1.95 46035
## 68 877089 4 2.9 894 1936 3 0.44 74977
## 69 748531 5 2.8 3474 1942 2 1.72 93362
## 70 351995 3 3.7 2755 1939 3 1.04 75450
## 71 778843 4 1.1 1593 1989 0 0.57 20382
## 72 672843 3 1.8 2634 1954 3 1.75 14437
## 73 356508 1 3.9 2916 1986 1 0.95 80971
## 74 903591 1 3.7 4906 2007 0 1.08 74612
## 75 996942 4 2.4 4125 1938 1 0.78 71929
## 76 206530 4 2.9 3719 1914 1 1.23 22329
## 77 704365 5 1.8 3397 2019 0 0.41 35169
## 78 922352 5 1.6 4005 2012 1 0.84 97468
## 79 560337 3 2.4 1614 1903 1 1.94 44594
## 80 824839 4 2.1 1145 1992 3 0.59 86957
## 81 905889 1 2.8 3149 1985 2 1.35 70631
## 82 559773 5 1.2 1162 1924 1 0.72 55033
## 83 308261 5 3.9 3243 1912 1 1.57 73133
## 84 864469 1 4.0 3065 1981 1 0.35 83165
## 85 441097 5 3.1 2988 1932 3 1.94 83861
## 86 415139 3 2.6 3805 1915 2 0.96 62290
## 87 271829 4 1.9 4081 2008 0 0.55 41750
## 88 371836 1 3.4 1784 1941 3 0.24 50461
## 89 538974 4 3.1 2439 2007 3 0.42 83800
## 90 302283 5 1.5 1627 1965 2 1.09 88222
## 91 296769 5 3.7 3530 1954 2 0.74 34226
## 92 661353 1 3.5 4331 1998 3 1.67 16721
## 93 323165 3 3.8 3735 1941 0 0.92 66154
## 94 723587 2 3.2 4676 1933 3 0.57 30609
## 95 635822 1 2.8 926 1929 2 1.27 62130
## 96 587879 2 2.3 3977 2022 0 1.44 82909
## 97 664685 2 3.8 3856 2018 2 0.42 65249
## 98 882038 3 3.6 1403 1912 0 0.42 58895
## 99 453531 2 1.1 4249 1912 1 0.17 15656
## 100 363160 2 1.1 4946 1917 2 1.50 84520
## 101 679879 3 2.1 4333 1931 2 1.36 73740
## 102 320884 2 3.4 4167 1995 3 1.00 74309
## 103 123247 2 4.0 4168 1998 2 1.70 39984
## 104 124300 2 1.5 4597 2022 2 1.63 83822
## 105 567281 1 2.8 2592 1938 1 1.21 15901
## 106 707086 1 2.1 3661 1945 2 1.75 41552
## 107 633556 1 3.9 4276 2015 1 0.49 41055
## 108 448951 3 3.5 4217 1928 1 0.31 47685
## 109 374329 5 3.5 2445 1961 1 0.61 83965
## 110 819064 2 2.4 2005 2012 1 0.21 24716
## 111 842139 2 2.2 3830 1992 0 1.11 21138
## 112 532315 3 1.8 3672 1961 3 1.88 45298
## 113 616588 2 1.2 3872 2016 0 0.17 61112
## 114 336584 1 3.6 2654 2007 2 0.33 33429
## 115 662332 5 3.4 4821 1956 0 0.96 60200
## 116 937646 4 4.0 3508 1915 0 1.87 81308
## 117 476896 2 4.0 4302 1955 2 0.70 58244
## 118 148984 1 2.7 2132 2007 2 1.06 27347
## 119 402918 4 3.3 1001 2010 2 0.18 26920
## 120 364712 5 3.8 4307 2020 0 0.38 41822
## 121 220151 4 3.5 1374 1909 0 1.97 56659
## 122 555808 1 1.7 1336 1929 2 1.93 50108
## 123 233767 4 2.4 2425 1924 3 0.11 99099
## 124 748663 3 1.4 2922 2002 3 1.91 17967
## 125 803550 4 3.9 1185 1983 1 1.31 21871
## 126 236330 2 2.8 4081 1904 2 1.75 87452
## 127 580754 2 1.7 1274 1964 1 0.96 84270
## 128 401648 3 3.0 1217 1993 3 1.08 43613
## 129 788519 1 2.9 4400 1948 1 1.03 38179
## 130 113986 2 2.1 1754 1902 2 1.37 62188
## 131 686146 5 1.3 2005 1944 2 0.37 65099
## 132 229312 2 3.0 4920 1913 2 0.16 45262
## 133 112666 2 2.6 2790 2019 0 0.69 88213
## 134 400804 1 3.3 4372 1929 1 1.44 28268
## 135 234633 4 2.6 4958 2013 3 0.48 87866
## 136 388998 2 3.6 3513 1967 3 1.38 96269
## 137 950937 3 2.7 3003 1917 3 1.94 70545
## 138 728776 4 2.7 3920 1961 0 0.28 82146
## 139 807611 5 3.6 1766 1936 0 1.38 81966
## 140 384806 1 2.2 4232 1924 2 0.94 49922
## 141 894824 5 1.4 1488 1947 3 1.75 89364
## 142 130535 4 1.1 4501 1964 0 0.44 52913
## 143 475713 4 3.3 1141 1952 2 1.42 65677
## 144 938688 4 2.9 2524 2009 3 1.69 59841
## 145 451279 5 3.1 2592 1978 1 1.89 56332
## 146 921654 4 1.6 2559 1972 2 1.40 35032
## 147 701661 5 1.4 4012 1914 0 1.04 47846
## 148 747972 4 1.0 1789 1948 0 1.27 69474
## 149 589570 3 2.1 3062 2020 2 1.75 54936
## 150 556551 4 2.8 3282 1987 2 1.18 39794
## 151 373109 5 2.2 1751 1967 0 0.16 71588
## 152 124538 2 2.3 1522 1911 1 1.87 80984
## 153 994498 4 3.7 4189 1958 3 1.41 60331
## 154 301664 2 2.0 2879 2021 1 1.39 38141
## 155 591234 3 2.5 3517 1936 2 0.51 19074
## 156 999684 1 3.4 3132 1960 1 1.35 16406
## 157 239182 3 2.2 4176 2000 0 0.85 33291
## 158 572525 4 2.9 2300 1942 2 1.34 51568
## 159 258338 2 3.6 1085 1969 3 0.30 56851
## 160 284064 2 3.8 4295 1938 0 1.35 64823
## 161 314020 5 1.4 2865 1955 0 2.00 33312
## 162 723094 2 3.8 1568 1962 3 0.19 53108
## 163 997421 5 2.5 3857 1945 3 1.96 76918
## 164 715270 1 1.8 2961 1987 1 0.87 44171
## 165 745914 4 2.4 4093 1910 2 1.75 51779
## 166 219176 5 3.9 1746 1961 3 1.59 78828
## 167 318126 1 2.5 4135 1976 3 1.18 22411
## 168 318969 2 2.0 4950 1997 2 1.50 67009
## 169 222409 2 2.9 2281 1924 3 1.77 25422
## 170 647707 1 1.7 2701 1970 3 0.87 52468
## 171 353618 2 1.2 4251 1951 1 0.72 42371
## 172 869598 1 1.4 4864 1903 0 1.37 67022
## 173 150015 5 1.4 854 1958 0 1.63 81229
## 174 872838 5 1.5 2623 1971 0 1.55 61196
## 175 222096 1 1.4 4262 1919 0 1.62 90354
## 176 731347 5 2.9 3879 1992 3 0.93 36715
## 177 285340 5 1.5 1632 1962 2 1.65 37605
## 178 210687 5 2.0 3606 1953 2 0.33 41174
## 179 974371 3 3.7 3290 2016 1 1.13 19956
## 180 511357 4 2.4 1127 2014 1 0.11 86373
## 181 835716 2 3.0 4110 2008 3 0.72 79252
## 182 205878 3 1.5 4100 2009 2 0.80 71949
## 183 827270 5 1.6 4475 1973 2 0.85 72646
## 184 298286 1 1.1 3854 2006 0 1.42 80017
## 185 873290 5 1.5 2943 1997 3 0.84 73037
## 186 874684 4 1.8 2111 1956 3 0.95 99818
## 187 264899 5 1.5 3991 1989 0 0.55 16548
## 188 424767 1 1.3 3338 1940 3 0.81 83294
## 189 961882 4 1.4 4783 2012 3 0.53 33177
## 190 979858 5 2.4 964 2021 1 0.24 34022
## 191 479989 4 1.6 1622 1902 2 1.25 15542
## 192 515515 2 2.1 1743 2019 3 1.37 70428
## 193 143585 2 2.5 1574 1905 1 1.28 32740
## 194 471369 5 3.1 2998 1904 2 0.98 69353
## 195 164044 4 1.1 3956 1904 0 0.82 66532
## 196 542296 1 3.4 4495 1953 1 1.74 26052
## 197 209556 5 2.9 4252 1946 1 1.09 57076
## 198 626981 2 1.2 1714 1986 2 1.01 63420
## 199 981691 2 3.6 2108 1948 0 0.15 10671
## 200 867595 5 3.8 4977 1908 1 0.75 10163
## 201 300235 4 1.2 1313 1998 3 0.82 51424
## 202 125939 2 1.8 2720 1919 3 0.86 63744
## 203 252906 4 3.4 4394 2021 3 1.20 80331
## 204 642335 2 3.2 2209 2012 0 1.11 20634
## 205 388249 2 1.6 3990 1960 1 1.26 14798
## 206 175766 3 1.6 2355 2022 3 1.55 32420
## 207 508923 2 2.1 1604 2005 0 1.64 39300
## 208 515192 1 2.5 2079 1934 3 1.46 99881
## 209 668550 5 2.9 4377 1949 2 1.92 20749
## 210 487261 5 2.1 3701 1981 1 0.13 35121
## 211 910208 4 2.4 2187 1961 1 0.47 47487
## 212 785440 2 3.2 3561 1916 0 0.11 43361
## 213 752664 1 1.1 3479 1987 0 1.33 31223
## 214 554589 4 1.8 2906 1902 1 1.81 82930
## 215 237848 3 3.1 3568 1931 3 0.56 24056
## 216 717075 4 3.7 4753 1998 3 1.86 38380
## 217 227948 4 2.5 3986 2001 2 0.21 36035
## 218 679304 2 2.6 4080 1912 3 1.88 40620
## 219 502690 3 1.3 3373 2019 0 0.77 29877
## 220 599046 4 2.3 3399 2010 0 0.29 65316
## 221 551269 1 2.6 4833 1988 3 1.02 74041
## 222 121959 1 1.7 1036 1972 0 0.59 63352
## 223 760890 5 1.8 2104 1967 1 0.64 40911
## 224 850216 3 2.1 4230 1913 1 0.68 42784
## 225 890180 3 1.1 2101 2000 3 1.63 13191
## 226 328576 5 2.0 3341 1997 1 1.12 43160
## 227 637833 4 1.6 2851 1910 1 0.69 74641
## 228 265838 3 2.0 1241 2004 2 1.26 59723
## 229 435674 1 1.4 2876 1955 2 1.46 13631
## 230 979989 1 3.7 3980 1966 1 0.62 16172
## 231 161087 2 2.8 3457 2022 3 0.89 52080
## 232 693128 3 3.0 4598 1991 2 0.33 99097
## 233 218451 4 3.4 1604 1928 0 0.44 30281
## 234 547600 5 2.5 874 1908 0 1.39 38671
## 235 937437 5 1.3 2975 1966 0 0.44 61431
## 236 539792 4 2.6 4724 1924 3 1.10 38602
## 237 139353 2 2.8 2889 1997 1 1.45 98789
## 238 293075 5 3.2 840 1975 0 0.30 61399
## 239 314283 3 2.3 2881 1941 3 1.18 33472
## 240 414877 2 1.4 2422 1908 2 0.59 59230
## 241 165318 3 1.9 1141 1978 1 1.93 83616
## 242 865313 1 2.1 4852 1939 2 1.02 17099
## 243 582690 2 2.9 2874 1924 3 1.63 35431
## 244 516880 5 2.7 1445 1904 0 1.15 66492
## 245 691460 2 2.1 1409 1910 0 0.18 57684
## 246 840976 2 4.0 1254 1958 3 1.30 40111
## 247 881239 2 2.8 3753 1997 0 1.91 73936
## 248 193264 2 1.7 2508 1987 1 1.24 32614
## 249 870746 3 1.3 4272 1978 3 1.66 51991
## 250 913168 1 1.5 3769 1937 2 1.78 80476
## 251 325281 4 1.7 3828 1971 3 0.53 70920
## 252 737147 2 1.5 3481 2022 1 0.50 73530
## 253 998613 5 1.6 4429 1904 1 1.26 46224
## 254 494070 2 1.9 3867 1947 3 0.88 17788
## 255 452228 5 1.5 2186 1989 3 1.70 38082
## 256 531839 3 3.7 4576 1917 0 1.81 99570
## 257 369536 5 1.2 3666 1969 1 0.77 86816
## 258 417824 4 2.6 4163 1936 3 0.55 93588
## 259 357426 1 2.2 4924 1959 3 1.58 26531
## 260 277789 5 3.9 948 1947 1 0.62 98340
## 261 613153 5 1.3 4650 1976 3 1.66 54857
## 262 842452 1 2.2 2858 1927 0 0.91 20142
## 263 937291 4 3.9 1936 1968 1 1.37 58355
## 264 225657 2 3.6 986 1976 0 0.28 19866
## 265 335167 5 3.5 3654 1980 0 1.29 80067
## 266 781669 1 1.8 2050 2013 0 0.96 74027
## 267 580671 3 1.5 2133 1939 0 1.21 67906
## 268 819094 1 3.0 4993 1944 1 0.42 38138
## 269 170467 3 3.8 4950 1995 0 1.50 39956
## 270 283734 4 2.7 3511 1961 0 1.74 86295
## 271 722794 2 2.7 2585 1992 3 0.51 15439
## 272 209751 1 1.8 1550 2014 1 0.28 57241
## 273 481050 5 3.3 2562 1957 1 0.14 52533
## 274 911774 4 1.6 4720 1966 2 1.32 38270
## 275 792517 1 2.0 1281 1955 1 1.25 88815
## 276 561079 5 2.3 953 1939 1 1.14 49279
## 277 468452 1 2.5 2324 1997 2 0.54 33888
## 278 206081 3 1.7 2920 1939 1 0.84 27630
## 279 713333 1 1.3 3143 1990 1 1.23 71063
## 280 658986 1 2.8 2040 1976 1 1.04 45144
## 281 210078 1 1.9 860 2008 1 1.98 62161
## 282 967055 4 2.7 1738 1932 2 0.36 87360
## 283 122671 1 1.5 2439 1905 1 1.42 60979
## 284 518400 5 2.4 4920 1987 1 0.87 16979
## 285 455528 3 2.6 4369 1918 2 0.91 36189
## 286 710490 3 1.2 2052 1979 3 1.46 52600
## 287 151663 1 2.0 971 1939 0 1.42 69560
## 288 115708 4 1.4 2258 1991 3 1.98 88040
## 289 978338 4 1.2 4349 1996 2 0.34 71558
## 290 411955 5 4.0 4997 1958 0 0.30 96205
## 291 233883 1 2.0 3122 1958 2 1.48 16910
## 292 418394 3 3.4 2436 1947 2 1.20 67713
## 293 212547 4 1.8 3915 1940 1 0.62 56857
## 294 659042 1 3.0 4890 1912 0 0.25 44964
## 295 851102 4 3.3 3804 2006 1 0.26 95667
## 296 862002 4 2.8 1129 1944 0 1.80 35227
## 297 242483 3 2.4 4440 1988 2 0.46 15978
## 298 758271 2 2.2 4694 1952 2 0.71 97527
## 299 314835 5 2.0 4907 1941 3 0.53 27153
## 300 501896 5 3.8 2141 1999 0 0.77 69765
## CrimeRate SchoolRating
## 1 48.60 5
## 2 92.03 9
## 3 52.08 3
## 4 61.65 1
## 5 15.66 4
## 6 4.37 9
## 7 11.08 4
## 8 59.85 2
## 9 9.50 5
## 10 37.60 3
## 11 55.01 9
## 12 38.87 4
## 13 16.37 6
## 14 27.38 2
## 15 92.83 6
## 16 67.60 3
## 17 49.60 9
## 18 1.27 2
## 19 99.24 9
## 20 67.15 5
## 21 31.69 8
## 22 87.93 2
## 23 25.84 6
## 24 54.40 3
## 25 63.61 5
## 26 22.11 8
## 27 97.84 1
## 28 74.82 5
## 29 55.78 3
## 30 18.06 4
## 31 5.39 2
## 32 32.01 9
## 33 75.32 3
## 34 26.93 2
## 35 53.96 9
## 36 72.79 7
## 37 10.79 6
## 38 68.53 1
## 39 9.19 5
## 40 96.51 3
## 41 48.84 1
## 42 15.07 4
## 43 34.24 2
## 44 41.34 2
## 45 75.82 3
## 46 74.34 8
## 47 61.19 8
## 48 10.59 7
## 49 15.16 6
## 50 9.38 9
## 51 57.72 4
## 52 87.71 1
## 53 43.38 8
## 54 16.08 7
## 55 55.80 7
## 56 81.18 3
## 57 74.17 4
## 58 88.15 9
## 59 27.79 6
## 60 19.40 5
## 61 87.98 3
## 62 65.76 9
## 63 31.09 5
## 64 74.23 5
## 65 81.51 4
## 66 61.50 4
## 67 68.79 1
## 68 37.53 7
## 69 53.87 9
## 70 52.42 3
## 71 84.80 2
## 72 84.00 3
## 73 83.27 1
## 74 1.10 6
## 75 74.95 7
## 76 75.87 2
## 77 67.84 8
## 78 75.63 6
## 79 84.20 4
## 80 47.03 5
## 81 50.21 8
## 82 12.47 3
## 83 38.54 3
## 84 64.34 4
## 85 78.04 1
## 86 21.72 9
## 87 13.78 8
## 88 66.30 8
## 89 0.19 6
## 90 17.84 7
## 91 2.91 6
## 92 16.69 9
## 93 18.13 3
## 94 38.77 3
## 95 40.23 3
## 96 87.43 3
## 97 51.01 9
## 98 72.34 4
## 99 10.41 7
## 100 22.54 9
## 101 70.29 7
## 102 5.28 9
## 103 48.66 3
## 104 59.94 4
## 105 60.21 8
## 106 2.29 6
## 107 32.21 5
## 108 63.65 4
## 109 14.90 8
## 110 69.54 1
## 111 74.59 9
## 112 98.20 1
## 113 20.98 8
## 114 82.51 4
## 115 52.03 9
## 116 37.35 5
## 117 12.24 3
## 118 73.55 9
## 119 23.59 9
## 120 37.14 4
## 121 6.25 4
## 122 80.14 8
## 123 76.66 2
## 124 73.36 9
## 125 29.94 6
## 126 17.35 9
## 127 63.76 8
## 128 49.62 7
## 129 17.83 1
## 130 68.59 3
## 131 99.11 2
## 132 74.72 5
## 133 74.00 5
## 134 95.03 5
## 135 20.29 4
## 136 56.55 5
## 137 97.96 3
## 138 16.53 1
## 139 70.03 5
## 140 58.58 9
## 141 58.65 9
## 142 69.77 4
## 143 92.96 3
## 144 78.26 1
## 145 5.61 2
## 146 85.27 8
## 147 22.55 1
## 148 37.69 8
## 149 46.17 7
## 150 48.09 8
## 151 43.52 6
## 152 93.74 9
## 153 70.60 3
## 154 63.12 4
## 155 4.98 6
## 156 90.39 8
## 157 90.94 5
## 158 78.02 3
## 159 0.70 6
## 160 5.73 4
## 161 22.52 9
## 162 13.13 3
## 163 39.88 4
## 164 92.26 7
## 165 47.21 7
## 166 1.34 4
## 167 28.27 6
## 168 4.46 3
## 169 3.63 6
## 170 27.57 2
## 171 27.56 8
## 172 78.71 2
## 173 97.48 7
## 174 37.12 9
## 175 42.89 1
## 176 84.48 8
## 177 26.81 7
## 178 15.64 6
## 179 85.31 6
## 180 4.65 6
## 181 61.97 9
## 182 56.20 2
## 183 34.59 1
## 184 31.52 6
## 185 77.19 8
## 186 8.64 3
## 187 23.68 1
## 188 73.24 9
## 189 54.83 1
## 190 12.80 3
## 191 88.21 8
## 192 39.34 3
## 193 82.79 4
## 194 78.77 8
## 195 62.44 1
## 196 49.45 6
## 197 97.96 1
## 198 14.50 1
## 199 72.52 8
## 200 19.12 4
## 201 33.83 1
## 202 30.87 7
## 203 94.70 5
## 204 96.74 5
## 205 18.30 1
## 206 2.20 6
## 207 72.00 9
## 208 41.80 9
## 209 8.88 8
## 210 68.38 5
## 211 54.51 1
## 212 98.05 9
## 213 22.74 1
## 214 40.40 8
## 215 54.25 5
## 216 79.17 3
## 217 54.88 7
## 218 61.29 7
## 219 22.61 9
## 220 84.69 7
## 221 42.86 3
## 222 14.10 1
## 223 66.42 8
## 224 21.61 3
## 225 9.76 8
## 226 86.20 8
## 227 46.02 5
## 228 74.93 1
## 229 29.06 7
## 230 78.70 5
## 231 11.19 8
## 232 35.60 9
## 233 97.81 7
## 234 79.40 7
## 235 49.73 1
## 236 33.98 4
## 237 87.21 2
## 238 54.48 2
## 239 75.84 2
## 240 75.41 4
## 241 1.79 1
## 242 12.63 4
## 243 65.96 2
## 244 16.16 5
## 245 25.55 3
## 246 94.66 8
## 247 56.02 4
## 248 75.07 1
## 249 55.80 1
## 250 55.25 3
## 251 9.42 9
## 252 34.37 7
## 253 28.24 2
## 254 39.07 9
## 255 79.83 2
## 256 37.19 3
## 257 45.17 2
## 258 39.74 3
## 259 9.34 6
## 260 44.11 9
## 261 19.56 9
## 262 18.67 7
## 263 9.40 3
## 264 35.67 4
## 265 75.75 6
## 266 27.64 5
## 267 31.23 2
## 268 64.27 6
## 269 19.58 3
## 270 89.70 8
## 271 52.02 2
## 272 44.76 1
## 273 55.78 9
## 274 16.60 3
## 275 61.35 1
## 276 36.31 7
## 277 89.72 5
## 278 16.89 5
## 279 50.71 1
## 280 59.81 9
## 281 3.34 7
## 282 36.37 8
## 283 73.26 9
## 284 82.04 6
## 285 31.32 5
## 286 79.86 6
## 287 96.78 2
## 288 85.69 4
## 289 11.76 3
## 290 73.97 7
## 291 31.97 9
## 292 98.84 5
## 293 48.54 6
## 294 12.24 2
## 295 72.52 3
## 296 32.30 3
## 297 99.71 9
## 298 97.98 7
## 299 65.61 8
## 300 12.98 9
Pre-Processing
data_num <- data[, sapply(data, is.numeric)]
colSums(is.na(data_num))
## Price Bedrooms Bathrooms SquareFeet YearBuilt GarageSpaces
## 0 0 0 0 0 0
## LotSize ZipCode CrimeRate SchoolRating
## 0 0 0 0
data_num <- na.omit(data_num)
var_cols <- apply(data_num, 2, var)
data_num <- data_num[, var_cols > 0]
dim(data_num)
## [1] 300 10
data_num <- data_num[, !colnames(data_num) %in% c("ZipCode")]
str(data_num)
## 'data.frame': 300 obs. of 9 variables:
## $ Price : int 221958 771155 231932 465838 359178 744167 210268 832180 154886 237337 ...
## $ Bedrooms : int 1 2 1 3 4 1 1 2 2 3 ...
## $ Bathrooms : num 1.9 2 3 3.3 3.4 3.4 1.3 2.5 1.2 2.6 ...
## $ SquareFeet : int 4827 1035 2769 2708 1175 4330 3435 2370 3360 4191 ...
## $ YearBuilt : int 1979 1987 1982 1907 1994 1920 1980 1986 2000 2017 ...
## $ GarageSpaces: int 2 2 1 3 2 0 2 0 1 0 ...
## $ LotSize : num 1.45 1.75 1.46 1.62 0.74 1.65 0.25 1.8 1.14 1.65 ...
## $ CrimeRate : num 48.6 92 52.1 61.6 15.7 ...
## $ SchoolRating: int 5 9 3 1 4 9 4 2 5 3 ...
describe(data_num)
## vars n mean sd median trimmed mad
## Price 1 300 522761.92 256922.35 505806.50 515993.47 322515.91
## Bedrooms 2 300 2.97 1.45 3.00 2.96 1.48
## Bathrooms 3 300 2.46 0.89 2.40 2.45 1.19
## SquareFeet 4 300 3052.75 1194.97 3127.00 3080.76 1504.10
## YearBuilt 5 300 1962.62 36.01 1961.00 1962.73 45.96
## GarageSpaces 6 300 1.51 1.12 1.00 1.52 1.48
## LotSize 7 300 1.06 0.54 1.08 1.06 0.69
## CrimeRate 8 300 49.32 28.83 49.97 49.13 37.12
## SchoolRating 9 300 5.10 2.67 5.00 5.12 2.97
## min max range skew kurtosis se
## Price 112666.00 999684.00 887018.00 0.19 -1.19 14833.42
## Bedrooms 1.00 5.00 4.00 0.01 -1.38 0.08
## Bathrooms 1.00 4.00 3.00 0.11 -1.21 0.05
## SquareFeet 840.00 4997.00 4157.00 -0.19 -1.14 68.99
## YearBuilt 1902.00 2022.00 120.00 -0.04 -1.24 2.08
## GarageSpaces 0.00 3.00 3.00 0.00 -1.36 0.06
## LotSize 0.11 2.00 1.89 -0.04 -1.18 0.03
## CrimeRate 0.19 99.71 99.52 0.01 -1.24 1.66
## SchoolRating 1.00 9.00 8.00 0.02 -1.31 0.15
hist(data_num$Price, main="Distribusi Harga", xlab="Price")

boxplot(data_num, main="Boxplot Variabel")

cor_matrix <- cor(data_num)
corrplot(cor_matrix,
method = "color",
type = "upper",
tl.cex = 0.6,
tl.srt = 45)

data_scaled <- scale(data_num)
fviz_nbclust(data_scaled, kmeans, method = "wss")

fviz_nbclust(data_scaled, kmeans, method = "silhouette")

K-Means
set.seed(123)
km <- kmeans(data_scaled, centers = 3, nstart = 50)
km
## K-means clustering with 3 clusters of sizes 107, 102, 91
##
## Cluster means:
## Price Bedrooms Bathrooms SquareFeet YearBuilt GarageSpaces
## 1 0.0875971 -0.08651278 -0.1513156 0.38770527 0.15262928 0.9629487
## 2 0.3254890 -0.05810032 0.6690065 -0.01123581 0.05611899 -0.4771902
## 3 -0.4678327 0.16684725 -0.5719549 -0.44327925 -0.24236779 -0.5973858
## LotSize CrimeRate SchoolRating
## 1 0.3576586 -0.188817628 0.1176249
## 2 -0.6960388 -0.004696176 0.3194693
## 3 0.3596318 0.227280178 -0.4963926
##
## Clustering vector:
## 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20
## 1 1 3 1 2 2 1 3 3 3 1 1 1 3 3 2 2 3 3 2
## 21 22 23 24 25 26 27 28 29 30 31 32 33 34 35 36 37 38 39 40
## 1 2 1 3 3 2 3 1 2 3 1 2 3 1 2 2 2 1 1 3
## 41 42 43 44 45 46 47 48 49 50 51 52 53 54 55 56 57 58 59 60
## 1 1 1 3 3 2 2 1 2 1 3 3 1 2 1 1 1 2 2 2
## 61 62 63 64 65 66 67 68 69 70 71 72 73 74 75 76 77 78 79 80
## 3 2 1 1 2 1 3 2 1 1 3 1 2 2 2 3 2 2 3 1
## 81 82 83 84 85 86 87 88 89 90 91 92 93 94 95 96 97 98 99 100
## 1 3 3 2 1 1 2 2 1 3 2 1 2 1 3 3 2 2 2 1
## 101 102 103 104 105 106 107 108 109 110 111 112 113 114 115 116 117 118 119 120
## 1 1 1 1 2 1 2 2 2 2 2 1 2 2 2 2 2 1 2 2
## 121 122 123 124 125 126 127 128 129 130 131 132 133 134 135 136 137 138 139 140
## 3 3 3 1 2 1 3 1 2 3 3 2 3 2 1 1 1 2 2 1
## 141 142 143 144 145 146 147 148 149 150 151 152 153 154 155 156 157 158 159 160
## 1 3 3 1 3 1 3 3 1 1 2 3 1 3 2 2 3 3 2 2
## 161 162 163 164 165 166 167 168 169 170 171 172 173 174 175 176 177 178 179 180
## 3 2 1 2 1 1 1 1 1 1 1 3 3 3 3 1 3 1 2 2
## 181 182 183 184 185 186 187 188 189 190 191 192 193 194 195 196 197 198 199 200
## 1 1 1 3 1 1 3 1 1 2 3 1 3 2 3 1 3 3 2 2
## 201 202 203 204 205 206 207 208 209 210 211 212 213 214 215 216 217 218 219 220
## 3 1 1 2 3 1 3 1 1 2 2 2 3 3 1 1 2 1 2 2
## 221 222 223 224 225 226 227 228 229 230 231 232 233 234 235 236 237 238 239 240
## 1 3 2 2 1 3 3 3 1 2 1 2 2 3 3 1 3 3 1 3
## 241 242 243 244 245 246 247 248 249 250 251 252 253 254 255 256 257 258 259 260
## 3 1 1 3 2 2 2 3 1 1 1 2 3 1 3 3 3 1 1 2
## 261 262 263 264 265 266 267 268 269 270 271 272 273 274 275 276 277 278 279 280
## 1 2 2 2 2 2 3 2 2 3 1 3 2 1 3 3 2 3 3 2
## 281 282 283 284 285 286 287 288 289 290 291 292 293 294 295 296 297 298 299 300
## 3 2 3 2 1 1 3 3 1 2 1 2 3 2 2 3 2 1 1 2
##
## Within cluster sum of squares by cluster:
## [1] 753.0814 805.3876 704.6765
## (between_SS / total_SS = 15.9 %)
##
## Available components:
##
## [1] "cluster" "centers" "totss" "withinss" "tot.withinss"
## [6] "betweenss" "size" "iter" "ifault"
fviz_cluster(km, data_scaled, geom = "point", main="K-Means Clustering")

sil_km <- silhouette(km$cluster, dist(data_scaled))
sil_km_value <- mean(sil_km[,3])
sil_km_value
## [1] 0.08554808
Fuzzy C-Means
fcm <- cmeans(data_scaled, centers = 3, m = 2)
plot(data_scaled[,1:2],
col = fcm$cluster,
pch = 19,
main="Fuzzy C-Means",
xlab="Feature 1",
ylab="Feature 2")

fcm
## Fuzzy c-means clustering with 3 clusters
##
## Cluster centers:
## Price Bedrooms Bathrooms SquareFeet YearBuilt
## 1 1.855231e-05 8.992080e-05 -4.367796e-05 -2.569603e-05 8.310543e-05
## 2 2.103416e-05 -9.272960e-05 4.169216e-05 6.822930e-05 7.195509e-05
## 3 -3.958825e-05 2.810648e-06 1.985963e-06 -4.253293e-05 -1.550625e-04
## GarageSpaces LotSize CrimeRate SchoolRating
## 1 2.672085e-06 -6.356466e-05 2.024324e-06 8.174105e-05
## 2 4.379147e-05 -3.565382e-05 -4.079184e-05 3.030891e-05
## 3 -4.646364e-05 9.921979e-05 3.877014e-05 -1.120485e-04
##
## Memberships:
## 1 2 3
## 1 0.3333171 0.3333534 0.3333295
## 2 0.3333408 0.3333304 0.3333288
## 3 0.3333038 0.3333430 0.3333531
## 4 0.3333067 0.3333226 0.3333707
## 5 0.3333444 0.3333329 0.3333227
## 6 0.3333220 0.3333423 0.3333357
## 7 0.3333337 0.3333481 0.3333182
## 8 0.3333201 0.3333281 0.3333518
## 9 0.3333367 0.3333414 0.3333219
## 10 0.3333284 0.3333373 0.3333343
## 11 0.3333762 0.3333461 0.3332777
## 12 0.3333093 0.3333537 0.3333370
## 13 0.3333287 0.3333580 0.3333134
## 14 0.3333244 0.3333050 0.3333705
## 15 0.3333558 0.3333197 0.3333245
## 16 0.3333295 0.3333486 0.3333220
## 17 0.3333282 0.3333397 0.3333321
## 18 0.3333267 0.3333275 0.3333457
## 19 0.3333403 0.3333197 0.3333400
## 20 0.3333431 0.3333178 0.3333391
## 21 0.3333509 0.3333233 0.3333258
## 22 0.3333353 0.3333389 0.3333258
## 23 0.3333199 0.3333536 0.3333265
## 24 0.3333161 0.3333317 0.3333522
## 25 0.3333239 0.3332974 0.3333787
## 26 0.3333296 0.3333307 0.3333397
## 27 0.3333176 0.3333195 0.3333630
## 28 0.3333342 0.3333330 0.3333328
## 29 0.3333062 0.3333406 0.3333533
## 30 0.3333186 0.3333190 0.3333623
## 31 0.3333133 0.3333356 0.3333511
## 32 0.3333307 0.3333503 0.3333190
## 33 0.3333532 0.3333129 0.3333338
## 34 0.3333427 0.3333368 0.3333205
## 35 0.3333339 0.3333369 0.3333292
## 36 0.3333271 0.3333327 0.3333402
## 37 0.3333423 0.3333461 0.3333116
## 38 0.3333226 0.3333504 0.3333270
## 39 0.3333288 0.3333238 0.3333475
## 40 0.3333088 0.3333239 0.3333673
## 41 0.3333314 0.3333380 0.3333306
## 42 0.3333293 0.3333361 0.3333345
## 43 0.3333357 0.3333382 0.3333261
## 44 0.3333462 0.3333198 0.3333340
## 45 0.3333140 0.3333280 0.3333580
## 46 0.3333512 0.3333325 0.3333163
## 47 0.3333290 0.3333446 0.3333264
## 48 0.3333540 0.3333318 0.3333142
## 49 0.3333300 0.3333467 0.3333233
## 50 0.3333580 0.3333345 0.3333075
## 51 0.3333615 0.3333296 0.3333090
## 52 0.3333147 0.3333162 0.3333691
## 53 0.3333327 0.3333529 0.3333143
## 54 0.3333206 0.3333401 0.3333393
## 55 0.3333672 0.3333228 0.3333100
## 56 0.3333284 0.3333427 0.3333289
## 57 0.3333363 0.3333333 0.3333304
## 58 0.3333424 0.3333243 0.3333333
## 59 0.3333176 0.3333181 0.3333644
## 60 0.3333148 0.3333330 0.3333521
## 61 0.3333207 0.3333117 0.3333676
## 62 0.3333502 0.3333553 0.3332945
## 63 0.3333372 0.3333423 0.3333205
## 64 0.3333150 0.3333475 0.3333375
## 65 0.3333395 0.3333324 0.3333281
## 66 0.3333275 0.3333661 0.3333064
## 67 0.3333191 0.3333166 0.3333642
## 68 0.3333455 0.3333297 0.3333248
## 69 0.3333439 0.3333241 0.3333320
## 70 0.3333110 0.3333345 0.3333545
## 71 0.3333452 0.3333186 0.3333362
## 72 0.3333227 0.3333209 0.3333564
## 73 0.3333148 0.3333413 0.3333439
## 74 0.3333300 0.3333528 0.3333173
## 75 0.3333442 0.3333300 0.3333258
## 76 0.3333120 0.3333107 0.3333773
## 77 0.3333626 0.3333318 0.3333056
## 78 0.3333584 0.3333321 0.3333095
## 79 0.3333154 0.3333070 0.3333777
## 80 0.3333562 0.3333319 0.3333119
## 81 0.3333328 0.3333605 0.3333066
## 82 0.3333406 0.3333118 0.3333477
## 83 0.3333182 0.3333164 0.3333654
## 84 0.3333275 0.3333518 0.3333207
## 85 0.3333211 0.3333177 0.3333612
## 86 0.3333324 0.3333395 0.3333281
## 87 0.3333541 0.3333398 0.3333061
## 88 0.3333326 0.3333438 0.3333236
## 89 0.3333520 0.3333481 0.3332999
## 90 0.3333563 0.3333161 0.3333277
## 91 0.3333400 0.3333363 0.3333237
## 92 0.3333301 0.3333576 0.3333123
## 93 0.3333153 0.3333343 0.3333504
## 94 0.3333168 0.3333533 0.3333299
## 95 0.3333104 0.3333294 0.3333603
## 96 0.3333303 0.3333387 0.3333310
## 97 0.3333466 0.3333609 0.3332924
## 98 0.3333293 0.3333231 0.3333476
## 99 0.3333344 0.3333378 0.3333278
## 100 0.3333284 0.3333378 0.3333339
## 101 0.3333261 0.3333325 0.3333414
## 102 0.3333371 0.3333588 0.3333041
## 103 0.3333169 0.3333462 0.3333370
## 104 0.3333310 0.3333430 0.3333260
## 105 0.3333158 0.3333424 0.3333418
## 106 0.3333158 0.3333486 0.3333356
## 107 0.3333313 0.3333627 0.3333060
## 108 0.3333214 0.3333372 0.3333414
## 109 0.3333523 0.3333297 0.3333180
## 110 0.3333384 0.3333389 0.3333227
## 111 0.3333451 0.3333438 0.3333111
## 112 0.3333204 0.3333260 0.3333536
## 113 0.3333502 0.3333465 0.3333033
## 114 0.3333315 0.3333507 0.3333178
## 115 0.3333447 0.3333334 0.3333218
## 116 0.3333223 0.3333265 0.3333513
## 117 0.3333150 0.3333562 0.3333288
## 118 0.3333395 0.3333458 0.3333147
## 119 0.3333549 0.3333388 0.3333063
## 120 0.3333442 0.3333387 0.3333171
## 121 0.3333221 0.3333188 0.3333590
## 122 0.3333250 0.3333257 0.3333493
## 123 0.3333329 0.3333230 0.3333441
## 124 0.3333455 0.3333366 0.3333180
## 125 0.3333413 0.3333300 0.3333287
## 126 0.3333194 0.3333371 0.3333435
## 127 0.3333494 0.3333243 0.3333262
## 128 0.3333486 0.3333386 0.3333127
## 129 0.3333084 0.3333490 0.3333426
## 130 0.3333119 0.3333153 0.3333728
## 131 0.3333431 0.3333150 0.3333418
## 132 0.3333231 0.3333406 0.3333363
## 133 0.3333394 0.3333381 0.3333225
## 134 0.3333072 0.3333376 0.3333552
## 135 0.3333428 0.3333495 0.3333077
## 136 0.3333104 0.3333568 0.3333328
## 137 0.3333202 0.3333256 0.3333542
## 138 0.3333337 0.3333333 0.3333330
## 139 0.3333344 0.3333124 0.3333532
## 140 0.3333238 0.3333480 0.3333282
## 141 0.3333459 0.3333218 0.3333323
## 142 0.3333404 0.3333246 0.3333349
## 143 0.3333276 0.3333113 0.3333611
## 144 0.3333332 0.3333322 0.3333345
## 145 0.3333289 0.3333224 0.3333488
## 146 0.3333532 0.3333239 0.3333229
## 147 0.3333293 0.3333173 0.3333534
## 148 0.3333493 0.3333146 0.3333361
## 149 0.3333511 0.3333466 0.3333022
## 150 0.3333791 0.3333489 0.3332719
## 151 0.3333570 0.3333172 0.3333259
## 152 0.3333264 0.3333205 0.3333531
## 153 0.3333269 0.3333378 0.3333353
## 154 0.3333351 0.3333406 0.3333244
## 155 0.3333369 0.3333493 0.3333138
## 156 0.3333278 0.3333428 0.3333294
## 157 0.3333404 0.3333329 0.3333267
## 158 0.3333186 0.3332980 0.3333834
## 159 0.3333354 0.3333429 0.3333217
## 160 0.3333127 0.3333401 0.3333473
## 161 0.3333419 0.3333187 0.3333393
## 162 0.3333309 0.3333449 0.3333242
## 163 0.3333312 0.3333285 0.3333403
## 164 0.3333401 0.3333443 0.3333156
## 165 0.3333249 0.3333232 0.3333519
## 166 0.3333314 0.3333289 0.3333397
## 167 0.3333203 0.3333661 0.3333136
## 168 0.3333233 0.3333511 0.3333256
## 169 0.3333175 0.3333349 0.3333476
## 170 0.3333214 0.3333493 0.3333293
## 171 0.3333400 0.3333438 0.3333163
## 172 0.3333173 0.3333302 0.3333525
## 173 0.3333413 0.3333118 0.3333469
## 174 0.3333521 0.3333212 0.3333267
## 175 0.3333112 0.3333279 0.3333608
## 176 0.3333553 0.3333383 0.3333064
## 177 0.3333481 0.3333128 0.3333391
## 178 0.3333515 0.3333298 0.3333187
## 179 0.3333415 0.3333441 0.3333144
## 180 0.3333553 0.3333357 0.3333090
## 181 0.3333466 0.3333603 0.3332931
## 182 0.3333380 0.3333401 0.3333219
## 183 0.3333397 0.3333306 0.3333297
## 184 0.3333328 0.3333422 0.3333249
## 185 0.3333601 0.3333321 0.3333078
## 186 0.3333397 0.3333303 0.3333299
## 187 0.3333408 0.3333258 0.3333334
## 188 0.3333351 0.3333422 0.3333227
## 189 0.3333413 0.3333408 0.3333179
## 190 0.3333492 0.3333318 0.3333190
## 191 0.3333381 0.3333092 0.3333527
## 192 0.3333351 0.3333437 0.3333212
## 193 0.3333141 0.3333131 0.3333728
## 194 0.3333385 0.3333150 0.3333465
## 195 0.3333255 0.3333157 0.3333588
## 196 0.3333048 0.3333522 0.3333430
## 197 0.3333263 0.3333180 0.3333557
## 198 0.3333311 0.3333339 0.3333350
## 199 0.3333385 0.3333371 0.3333244
## 200 0.3333290 0.3333329 0.3333381
## 201 0.3333415 0.3333259 0.3333326
## 202 0.3333277 0.3333343 0.3333380
## 203 0.3333389 0.3333415 0.3333196
## 204 0.3333362 0.3333354 0.3333284
## 205 0.3333111 0.3333358 0.3333531
## 206 0.3333418 0.3333399 0.3333182
## 207 0.3333432 0.3333305 0.3333263
## 208 0.3333252 0.3333422 0.3333327
## 209 0.3333362 0.3333336 0.3333302
## 210 0.3333626 0.3333266 0.3333108
## 211 0.3333383 0.3333216 0.3333401
## 212 0.3333350 0.3333349 0.3333301
## 213 0.3333240 0.3333375 0.3333386
## 214 0.3333298 0.3333107 0.3333594
## 215 0.3333241 0.3333400 0.3333359
## 216 0.3333282 0.3333400 0.3333318
## 217 0.3333598 0.3333462 0.3332940
## 218 0.3333150 0.3333372 0.3333478
## 219 0.3333568 0.3333415 0.3333018
## 220 0.3333596 0.3333341 0.3333063
## 221 0.3333180 0.3333649 0.3333171
## 222 0.3333276 0.3333303 0.3333421
## 223 0.3333694 0.3333155 0.3333152
## 224 0.3333219 0.3333329 0.3333452
## 225 0.3333458 0.3333385 0.3333156
## 226 0.3333618 0.3333210 0.3333171
## 227 0.3333388 0.3333029 0.3333583
## 228 0.3333330 0.3333220 0.3333451
## 229 0.3333233 0.3333444 0.3333323
## 230 0.3333254 0.3333507 0.3333238
## 231 0.3333422 0.3333559 0.3333019
## 232 0.3333535 0.3333613 0.3332852
## 233 0.3333377 0.3333185 0.3333438
## 234 0.3333371 0.3333063 0.3333565
## 235 0.3333428 0.3333212 0.3333360
## 236 0.3333218 0.3333362 0.3333421
## 237 0.3333192 0.3333308 0.3333500
## 238 0.3333410 0.3333187 0.3333403
## 239 0.3333131 0.3333200 0.3333669
## 240 0.3333229 0.3333190 0.3333582
## 241 0.3333256 0.3333234 0.3333511
## 242 0.3333174 0.3333533 0.3333293
## 243 0.3333004 0.3333294 0.3333702
## 244 0.3333329 0.3333094 0.3333577
## 245 0.3333283 0.3333252 0.3333465
## 246 0.3333325 0.3333364 0.3333311
## 247 0.3333235 0.3333397 0.3333368
## 248 0.3333215 0.3333239 0.3333546
## 249 0.3333270 0.3333357 0.3333374
## 250 0.3333131 0.3333365 0.3333504
## 251 0.3333533 0.3333434 0.3333033
## 252 0.3333566 0.3333552 0.3332882
## 253 0.3333290 0.3333222 0.3333488
## 254 0.3333399 0.3333542 0.3333059
## 255 0.3333390 0.3333172 0.3333438
## 256 0.3333091 0.3333290 0.3333618
## 257 0.3333453 0.3333145 0.3333403
## 258 0.3333289 0.3333362 0.3333349
## 259 0.3333192 0.3333537 0.3333271
## 260 0.3333455 0.3333236 0.3333309
## 261 0.3333466 0.3333359 0.3333175
## 262 0.3333256 0.3333394 0.3333351
## 263 0.3333303 0.3333316 0.3333381
## 264 0.3333328 0.3333332 0.3333340
## 265 0.3333413 0.3333216 0.3333371
## 266 0.3333389 0.3333440 0.3333171
## 267 0.3333223 0.3333084 0.3333693
## 268 0.3333247 0.3333539 0.3333214
## 269 0.3333232 0.3333411 0.3333357
## 270 0.3333358 0.3333186 0.3333456
## 271 0.3333327 0.3333527 0.3333146
## 272 0.3333335 0.3333376 0.3333289
## 273 0.3333578 0.3333287 0.3333135
## 274 0.3333343 0.3333376 0.3333281
## 275 0.3333168 0.3333264 0.3333568
## 276 0.3333513 0.3333038 0.3333449
## 277 0.3333365 0.3333488 0.3333147
## 278 0.3333310 0.3333211 0.3333479
## 279 0.3333211 0.3333394 0.3333395
## 280 0.3333388 0.3333491 0.3333121
## 281 0.3333325 0.3333354 0.3333321
## 282 0.3333496 0.3333304 0.3333200
## 283 0.3333251 0.3333256 0.3333493
## 284 0.3333531 0.3333312 0.3333157
## 285 0.3333093 0.3333406 0.3333501
## 286 0.3333451 0.3333266 0.3333283
## 287 0.3333203 0.3333201 0.3333596
## 288 0.3333353 0.3333219 0.3333428
## 289 0.3333460 0.3333416 0.3333124
## 290 0.3333403 0.3333340 0.3333257
## 291 0.3333272 0.3333469 0.3333259
## 292 0.3333213 0.3333206 0.3333580
## 293 0.3333456 0.3333185 0.3333359
## 294 0.3333189 0.3333418 0.3333393
## 295 0.3333459 0.3333416 0.3333125
## 296 0.3333276 0.3333147 0.3333577
## 297 0.3333477 0.3333426 0.3333097
## 298 0.3333346 0.3333457 0.3333196
## 299 0.3333468 0.3333331 0.3333201
## 300 0.3333510 0.3333338 0.3333153
##
## Closest hard clustering:
## 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20
## 2 1 3 3 1 2 2 3 2 2 1 2 2 3 1 2 2 3 1 1
## 21 22 23 24 25 26 27 28 29 30 31 32 33 34 35 36 37 38 39 40
## 1 2 2 3 3 3 3 1 3 3 3 2 1 1 2 3 2 2 3 3
## 41 42 43 44 45 46 47 48 49 50 51 52 53 54 55 56 57 58 59 60
## 2 2 2 1 3 1 2 1 2 1 1 3 2 2 1 2 1 1 3 3
## 61 62 63 64 65 66 67 68 69 70 71 72 73 74 75 76 77 78 79 80
## 3 2 2 2 1 2 3 1 1 3 1 3 3 2 1 3 1 1 3 1
## 81 82 83 84 85 86 87 88 89 90 91 92 93 94 95 96 97 98 99 100
## 2 3 3 2 3 2 1 2 1 1 1 2 3 2 3 2 2 3 2 2
## 101 102 103 104 105 106 107 108 109 110 111 112 113 114 115 116 117 118 119 120
## 3 2 2 2 2 2 2 3 1 2 1 3 1 2 1 3 2 2 1 1
## 121 122 123 124 125 126 127 128 129 130 131 132 133 134 135 136 137 138 139 140
## 3 3 3 1 1 3 1 1 2 3 1 2 1 3 2 2 3 1 3 2
## 141 142 143 144 145 146 147 148 149 150 151 152 153 154 155 156 157 158 159 160
## 1 1 3 3 3 1 3 1 1 1 1 3 2 2 2 2 1 3 2 3
## 161 162 163 164 165 166 167 168 169 170 171 172 173 174 175 176 177 178 179 180
## 1 2 3 2 3 3 2 2 3 2 2 3 3 1 3 1 1 1 2 1
## 181 182 183 184 185 186 187 188 189 190 191 192 193 194 195 196 197 198 199 200
## 2 2 1 2 1 1 1 2 1 1 3 2 3 3 3 2 3 3 1 3
## 201 202 203 204 205 206 207 208 209 210 211 212 213 214 215 216 217 218 219 220
## 1 3 2 1 3 1 1 2 1 1 3 1 3 3 2 2 1 3 1 1
## 221 222 223 224 225 226 227 228 229 230 231 232 233 234 235 236 237 238 239 240
## 2 3 1 3 1 1 3 3 2 2 2 2 3 3 1 3 3 1 3 3
## 241 242 243 244 245 246 247 248 249 250 251 252 253 254 255 256 257 258 259 260
## 3 2 3 3 3 2 2 3 3 3 1 1 3 2 3 3 1 2 2 1
## 261 262 263 264 265 266 267 268 269 270 271 272 273 274 275 276 277 278 279 280
## 1 2 3 3 1 2 3 2 2 3 2 2 1 2 3 1 2 3 3 2
## 281 282 283 284 285 286 287 288 289 290 291 292 293 294 295 296 297 298 299 300
## 2 1 3 1 3 1 3 3 1 1 2 3 1 2 1 3 1 2 1 1
##
## Available components:
## [1] "centers" "size" "cluster" "membership" "iter"
## [6] "withinerror" "call"
Mean shift
ms <- meanShift(as.matrix(data_scaled))
table(ms$assignment)
##
## 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20
## 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1
## 21 22 23 24 25 26 27 28 29 30 31 32 33 34 35 36 37 38 39 40
## 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1
## 41 42 43 44 45 46 47 48 49 50 51 52 53 54 55 56 57 58 59 60
## 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1
## 61 62 63 64 65 66 67 68 69 70 71 72 73 74 75 76 77 78 79 80
## 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1
## 81 82 83 84 85 86 87 88 89 90 91 92 93 94 95 96 97 98 99 100
## 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1
## 101 102 103 104 105 106 107 108 109 110 111 112 113 114 115 116 117 118 119 120
## 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1
## 121 122 123 124 125 126 127 128 129 130 131 132 133 134 135 136 137 138 139 140
## 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1
## 141 142 143 144 145 146 147 148 149 150 151 152 153 154 155 156 157 158 159 160
## 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1
## 161 162 163 164 165 166 167 168 169 170 171 172 173 174 175 176 177 178 179 180
## 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1
## 181 182 183 184 185 186 187 188 189 190 191 192 193 194 195 196 197 198 199 200
## 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1
## 201 202 203 204 205 206 207 208 209 210 211 212 213 214 215 216 217 218 219 220
## 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1
## 221 222 223 224 225 226 227 228 229 230 231 232 233 234 235 236 237 238 239 240
## 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1
## 241 242 243 244 245 246 247 248 249 250 251 252 253 254 255 256 257 258 259 260
## 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1
## 261 262 263 264 265 266 267 268 269 270 271 272 273 274 275 276 277 278 279 280
## 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1
## 281 282 283 284 285 286 287 288 289 290 291 292 293 294 295 296 297 298 299 300
## 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1
plot(data_scaled[,1:2],
col = "blue",
pch = 19,
main = "Mean Shift (1 Cluster)")

DBSCAN
kNNdistplot(data_scaled, k = 5)
abline(h = 2, col = "red")

db <- dbscan(data_scaled, eps = 2.2, minPts = 5)
table(db$cluster)
##
## 0 1 2 3 4
## 75 210 4 5 6
length(unique(db$cluster))
## [1] 5
plot(data_scaled[,1:2],
col = db$cluster + 1,
pch = 19,
main = "DBSCAN Clustering")
