Cluster

We have categorical (binomial) and quantitative data. Initially, I tried to use the dayse function with a Gower distribution. However, this function compares pairs one by one, and with 160,000 rows, we don’t have sufficient memory.

So, one of the easier and faster solutions is to run MCA for categorical data and PCA for quantitative data. Afterwards, we can run a clara analysis (which handles large datasets) for clustering. See above

use_data %>% 
  mutate(equipamento_pc=case_when(pc_pra_aluno_numeric == 0 ~ 0,
                                  pc_pra_aluno_numeric >= 1 ~ 1),
         equipamento_pc=as.factor(equipamento_pc)) %>% 
  select(-pc_pra_aluno_numeric) %>%
  glimpse->cluster_analyse_full_data
## Rows: 151,997
## Columns: 50
## $ Código.INEP                               <fct> 21132461, 21132461, 21132461…
## $ Localização                               <chr> "Rural", "Rural", "Rural", "…
## $ Porte.da.Escola                           <chr> "Até 50 matrículas de escola…
## $ Etapas.e.Modalidade.de.Ensino.Oferecidas  <chr> "Educação Infantil, Ensino F…
## $ Outras.Ofertas.Educacionais               <chr> "", "", "", "", "", "", "", …
## $ Latitude                                  <dbl> -3.141373, -3.141373, -3.141…
## $ Longitude                                 <dbl> -42.23489, -42.23489, -42.23…
## $ ano                                       <fct> 2016, 2007, 2017, 2011, 2009…
## $ sigla_uf                                  <chr> "MA", "MA", "MA", "MA", "MA"…
## $ id_municipio                              <fct> 2100907, 2100907, 2100907, 2…
## $ rede                                      <fct> 3, 3, 3, 3, 3, 3, 3, 3, 3, 3…
## $ tipo_localizacao                          <fct> 2, 2, 2, 2, 2, 2, 2, 2, 2, 2…
## $ tipo_localizacao_diferenciada             <fct> 0, 0, 0, 0, 0, 0, 0, 0, 0, 0…
## $ tipo_situacao_funcionamento               <fct> 1, 1, 1, 1, 1, 1, 1, 1, 1, 1…
## $ name_muni                                 <chr> "Araioses", "Araioses", "Ara…
## $ code_state                                <chr> "21", "21", "21", "21", "21"…
## $ geom                                      <MULTIPOLYGON [°]> MULTIPOLYGON ((…
## $ local_funcionamento_predio_escolar        <fct> 1, 1, 1, 1, 1, 1, 1, 1, 1, 1…
## $ agua_inexistente                          <fct> 0, 0, 0, 0, 0, 0, 1, 0, 0, 0…
## $ energia_inexistente                       <fct> 0, 0, 0, 0, 0, 0, 0, 0, 0, 0…
## $ esgoto_inexistente                        <fct> 0, 0, 0, 0, 0, 0, 0, 0, 0, 0…
## $ biblioteca_sala_leitura                   <fct> 0, 1, 0, 0, 0, 0, 0, 0, 0, 1…
## $ laboratorio_ciencias                      <fct> 0, 0, 0, 0, 0, 0, 0, 0, 0, 0…
## $ laboratorio_informatica                   <fct> 1, 0, 0, 1, 0, 1, 1, 0, 0, 0…
## $ equipamento_dvd                           <fct> 1, 0, 1, 0, 0, 1, 1, 1, 1, 0…
## $ equipamento_tv                            <fct> 1, 0, 1, 0, 0, 1, 1, 1, 1, 0…
## $ internet                                  <fct> 1, 0, 0, 0, 0, 0, 0, 0, 0, 0…
## $ alimentacao                               <fct> 1, 0, 1, 1, 1, 1, 1, 1, 1, 1…
## $ educacao_indigena                         <fct> 0, 0, 0, 0, 0, 0, 0, 0, 0, 0…
## $ quantidade_matricula_educacao_basica      <int> 62, 97, 58, 62, 64, 42, 43, …
## $ quantidade_matricula_infantil             <int> 15, 30, 9, 13, 17, 16, 9, 24…
## $ quantidade_matricula_fundamental          <int> 47, 67, 49, 49, 47, 26, 34, …
## $ quantidade_matricula_medio                <int> 0, 0, 0, 0, 0, 0, 0, 0, 0, 0…
## $ quantidade_matricula_profissional         <int> 0, 0, 0, 0, 0, 0, 0, 0, 0, 0…
## $ quantidade_matricula_eja                  <int> 0, 0, 0, 0, 0, 0, 0, 0, 0, 0…
## $ quantidade_matricula_especial             <int> 0, 0, 0, 0, 0, 0, 0, 0, 0, 0…
## $ quantidade_matricula_infantil_integral    <int> 0, 0, 0, 0, 0, 0, 0, 0, 0, 0…
## $ quantidade_matricula_fundamental_integral <int> 0, 0, 0, 0, 0, 0, 0, 0, 0, 0…
## $ quantidade_matricula_medio_integral       <int> 0, 0, 0, 0, 0, 0, 0, 0, 0, 0…
## $ quantidade_matricula_feminino             <int> 35, 42, 27, 28, 28, 21, 18, …
## $ quantidade_matricula_masculino            <int> 27, 55, 31, 34, 36, 21, 25, …
## $ quantidade_matricula_nao_declarada        <int> 3, 24, 4, 6, 11, 1, 3, 2, 0,…
## $ quantidade_matricula_branca               <int> 2, 1, 1, 0, 0, 0, 1, 9, 9, 2…
## $ quantidade_matricula_preta                <int> 0, 1, 0, 1, 0, 0, 0, 0, 0, 1…
## $ quantidade_matricula_parda                <int> 56, 71, 52, 55, 53, 41, 39, …
## $ quantidade_matricula_amarela              <int> 1, 0, 1, 0, 0, 0, 0, 0, 0, 0…
## $ quantidade_matricula_indigena             <int> 0, 0, 0, 0, 0, 0, 0, 0, 0, 0…
## $ banheiro_full                             <fct> 1, 1, 1, 1, 1, 1, 1, 0, 1, 1…
## $ agua_pot_ou_filtrada                      <fct> 1, 1, 1, 1, 1, 1, 1, 1, 1, 1…
## $ equipamento_pc                            <fct> 1, 0, 0, 1, 0, 1, 1, 0, 0, 0…
cluster_analyse_full_data %>% 
  select(30:47) %>%
  glimpse -> quant_vars
## Rows: 151,997
## Columns: 18
## $ quantidade_matricula_educacao_basica      <int> 62, 97, 58, 62, 64, 42, 43, …
## $ quantidade_matricula_infantil             <int> 15, 30, 9, 13, 17, 16, 9, 24…
## $ quantidade_matricula_fundamental          <int> 47, 67, 49, 49, 47, 26, 34, …
## $ quantidade_matricula_medio                <int> 0, 0, 0, 0, 0, 0, 0, 0, 0, 0…
## $ quantidade_matricula_profissional         <int> 0, 0, 0, 0, 0, 0, 0, 0, 0, 0…
## $ quantidade_matricula_eja                  <int> 0, 0, 0, 0, 0, 0, 0, 0, 0, 0…
## $ quantidade_matricula_especial             <int> 0, 0, 0, 0, 0, 0, 0, 0, 0, 0…
## $ quantidade_matricula_infantil_integral    <int> 0, 0, 0, 0, 0, 0, 0, 0, 0, 0…
## $ quantidade_matricula_fundamental_integral <int> 0, 0, 0, 0, 0, 0, 0, 0, 0, 0…
## $ quantidade_matricula_medio_integral       <int> 0, 0, 0, 0, 0, 0, 0, 0, 0, 0…
## $ quantidade_matricula_feminino             <int> 35, 42, 27, 28, 28, 21, 18, …
## $ quantidade_matricula_masculino            <int> 27, 55, 31, 34, 36, 21, 25, …
## $ quantidade_matricula_nao_declarada        <int> 3, 24, 4, 6, 11, 1, 3, 2, 0,…
## $ quantidade_matricula_branca               <int> 2, 1, 1, 0, 0, 0, 1, 9, 9, 2…
## $ quantidade_matricula_preta                <int> 0, 1, 0, 1, 0, 0, 0, 0, 0, 1…
## $ quantidade_matricula_parda                <int> 56, 71, 52, 55, 53, 41, 39, …
## $ quantidade_matricula_amarela              <int> 1, 0, 1, 0, 0, 0, 0, 0, 0, 0…
## $ quantidade_matricula_indigena             <int> 0, 0, 0, 0, 0, 0, 0, 0, 0, 0…
cluster_analyse_full_data %>% 
  select(18:29, 48:50) %>%
  glimpse -> categ_vars
## Rows: 151,997
## Columns: 15
## $ local_funcionamento_predio_escolar <fct> 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1,…
## $ agua_inexistente                   <fct> 0, 0, 0, 0, 0, 0, 1, 0, 0, 0, 0, 1,…
## $ energia_inexistente                <fct> 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0,…
## $ esgoto_inexistente                 <fct> 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0,…
## $ biblioteca_sala_leitura            <fct> 0, 1, 0, 0, 0, 0, 0, 0, 0, 1, 0, 0,…
## $ laboratorio_ciencias               <fct> 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0,…
## $ laboratorio_informatica            <fct> 1, 0, 0, 1, 0, 1, 1, 0, 0, 0, 1, 1,…
## $ equipamento_dvd                    <fct> 1, 0, 1, 0, 0, 1, 1, 1, 1, 0, 1, 1,…
## $ equipamento_tv                     <fct> 1, 0, 1, 0, 0, 1, 1, 1, 1, 0, 1, 1,…
## $ internet                           <fct> 1, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0,…
## $ alimentacao                        <fct> 1, 0, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1,…
## $ educacao_indigena                  <fct> 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0,…
## $ banheiro_full                      <fct> 1, 1, 1, 1, 1, 1, 1, 0, 1, 1, 1, 1,…
## $ agua_pot_ou_filtrada               <fct> 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1,…
## $ equipamento_pc                     <fct> 1, 0, 0, 1, 0, 1, 1, 0, 0, 0, 1, 1,…
library(stats)
library(FactoMineR)

scaled_data<-scale(quant_vars)
PCA(scaled_data, graph = T, ncp = 10)->pca_result_01

pca_result_01$eig #  eigenvalues are numerical values that represent the amount of variance captured by each principal component.
##           eigenvalue percentage of variance cumulative percentage of variance
## comp 1  6.635642e+00           3.686468e+01                          36.86468
## comp 2  1.840402e+00           1.022446e+01                          47.08913
## comp 3  1.250523e+00           6.947347e+00                          54.03648
## comp 4  1.148891e+00           6.382729e+00                          60.41921
## comp 5  1.001878e+00           5.565991e+00                          65.98520
## comp 6  9.880568e-01           5.489204e+00                          71.47441
## comp 7  8.741977e-01           4.856654e+00                          76.33106
## comp 8  7.266084e-01           4.036713e+00                          80.36777
## comp 9  7.021847e-01           3.901026e+00                          84.26880
## comp 10 6.666290e-01           3.703494e+00                          87.97229
## comp 11 6.570533e-01           3.650296e+00                          91.62259
## comp 12 5.607917e-01           3.115510e+00                          94.73810
## comp 13 5.111443e-01           2.839690e+00                          97.57779
## comp 14 4.079201e-01           2.266223e+00                          99.84401
## comp 15 2.463202e-02           1.368445e-01                          99.98086
## comp 16 3.445780e-03           1.914322e-02                         100.00000
## comp 17 7.610079e-26           4.227822e-25                         100.00000
## comp 18 4.090867e-29           2.272704e-28                         100.00000
pca_result_01$var$cor #ocrrelações das dimensões our vars
##                                                Dim.1       Dim.2        Dim.3
## quantidade_matricula_educacao_basica      0.98880964  0.01142900 -0.041113389
## quantidade_matricula_infantil             0.40968602 -0.29438789  0.618458973
## quantidade_matricula_fundamental          0.89329142 -0.22645314 -0.158568373
## quantidade_matricula_medio                0.32182970  0.68585357 -0.002571557
## quantidade_matricula_profissional         0.19178770  0.73368023  0.179640479
## quantidade_matricula_eja                  0.53799743  0.02348049 -0.208599900
## quantidade_matricula_especial             0.54989578 -0.20398370  0.005061336
## quantidade_matricula_infantil_integral    0.02319807 -0.11827182  0.792045447
## quantidade_matricula_fundamental_integral 0.42943180 -0.24337556  0.091210760
## quantidade_matricula_medio_integral       0.13367706  0.75160691  0.212483366
## quantidade_matricula_feminino             0.98079720  0.03482355 -0.039674457
## quantidade_matricula_masculino            0.98321298 -0.01059651 -0.041914612
## quantidade_matricula_nao_declarada        0.69684226  0.05831258 -0.197130582
## quantidade_matricula_branca               0.65326188 -0.00232998  0.140464469
## quantidade_matricula_preta                0.42049391  0.05978938 -0.096528018
## quantidade_matricula_parda                0.81624973 -0.05391086  0.089239311
## quantidade_matricula_amarela              0.25208960  0.04354178  0.021720018
## quantidade_matricula_indigena             0.09717793  0.01559314  0.070004531
##                                                 Dim.4         Dim.5       Dim.6
## quantidade_matricula_educacao_basica       0.10387397  2.515367e-03 -0.05770768
## quantidade_matricula_infantil              0.12473215  5.943929e-02 -0.10440798
## quantidade_matricula_fundamental           0.01932612 -4.081025e-02 -0.10116651
## quantidade_matricula_medio                 0.07659421 -9.036877e-03  0.03991153
## quantidade_matricula_profissional         -0.08259888 -8.542133e-02 -0.04584170
## quantidade_matricula_eja                   0.25597928  1.533920e-01  0.17525354
## quantidade_matricula_especial             -0.23419441 -2.365494e-01  0.11935521
## quantidade_matricula_infantil_integral     0.23864208  1.879215e-01 -0.04604638
## quantidade_matricula_fundamental_integral -0.39371770 -3.827270e-01  0.14713704
## quantidade_matricula_medio_integral       -0.13722631 -1.326780e-01 -0.01692932
## quantidade_matricula_feminino              0.10921996  5.225702e-03 -0.05737552
## quantidade_matricula_masculino             0.09750047 -5.212848e-05 -0.05725441
## quantidade_matricula_nao_declarada         0.45397730  4.923611e-02 -0.34360414
## quantidade_matricula_branca               -0.35043217 -1.241112e-01  0.01502882
## quantidade_matricula_preta                -0.17240005  4.450417e-01  0.24482702
## quantidade_matricula_parda                -0.25354747 -2.536599e-02  0.05737178
## quantidade_matricula_amarela              -0.26194447  6.319885e-01  0.33338686
## quantidade_matricula_indigena              0.49533521 -3.073147e-01  0.76918307
##                                                  Dim.7       Dim.8       Dim.9
## quantidade_matricula_educacao_basica       0.028671928 -0.02765366 -0.02357278
## quantidade_matricula_infantil              0.066825973 -0.26163834 -0.18742458
## quantidade_matricula_fundamental           0.144220438  0.03850403 -0.13973496
## quantidade_matricula_medio                -0.159152756 -0.05957969  0.03425278
## quantidade_matricula_profissional          0.112835462  0.10065299 -0.07595246
## quantidade_matricula_eja                  -0.324550953 -0.02580444  0.57516362
## quantidade_matricula_especial              0.011846715  0.20493242 -0.03287588
## quantidade_matricula_infantil_integral    -0.174647588  0.28843794  0.17794890
## quantidade_matricula_fundamental_integral -0.024292460  0.46185648  0.12516722
## quantidade_matricula_medio_integral        0.064756143  0.06132980  0.01166322
## quantidade_matricula_feminino              0.018561552 -0.02930943 -0.02683044
## quantidade_matricula_masculino             0.037745752 -0.02573945 -0.02021480
## quantidade_matricula_nao_declarada         0.190707179  0.27486350 -0.06486051
## quantidade_matricula_branca               -0.004856413 -0.35094476  0.10575208
## quantidade_matricula_preta                -0.527383433  0.16030517 -0.44209685
## quantidade_matricula_parda                -0.122483053 -0.24892482  0.08012348
## quantidade_matricula_amarela               0.565670184  0.08599125  0.13944739
## quantidade_matricula_indigena              0.134200442 -0.06327545 -0.15111776
##                                                 Dim.10
## quantidade_matricula_educacao_basica      -0.038825645
## quantidade_matricula_infantil              0.171215715
## quantidade_matricula_fundamental          -0.056954441
## quantidade_matricula_medio                -0.447319629
## quantidade_matricula_profissional          0.269598323
## quantidade_matricula_eja                   0.279781192
## quantidade_matricula_especial              0.383801689
## quantidade_matricula_infantil_integral    -0.134701432
## quantidade_matricula_fundamental_integral -0.232371846
## quantidade_matricula_medio_integral        0.194082449
## quantidade_matricula_feminino             -0.058964209
## quantidade_matricula_masculino            -0.019481894
## quantidade_matricula_nao_declarada        -0.005537506
## quantidade_matricula_branca               -0.115548112
## quantidade_matricula_preta                 0.054047216
## quantidade_matricula_parda                -0.029683161
## quantidade_matricula_amarela              -0.049445303
## quantidade_matricula_indigena             -0.030150543
pca_result_01$var$contrib #contribuição das variaveis pra cada dimensão
##                                                  Dim.1        Dim.2
## quantidade_matricula_educacao_basica      14.734738241 7.097472e-03
## quantidade_matricula_infantil              2.529410539 4.708983e+00
## quantidade_matricula_fundamental          12.025506221 2.786403e+00
## quantidade_matricula_medio                 1.560879129 2.555937e+01
## quantidade_matricula_profissional          0.554317431 2.924832e+01
## quantidade_matricula_eja                   4.361917458 2.995722e-02
## quantidade_matricula_especial              4.556987226 2.260884e+00
## quantidade_matricula_infantil_integral     0.008109997 7.600634e-01
## quantidade_matricula_fundamental_integral  2.779108167 3.218409e+00
## quantidade_matricula_medio_integral        0.269296567 3.069508e+01
## quantidade_matricula_feminino             14.496911296 6.589209e-02
## quantidade_matricula_masculino            14.568413202 6.101165e-03
## quantidade_matricula_nao_declarada         7.317892083 1.847616e-01
## quantidade_matricula_branca                6.431194958 2.949793e-04
## quantidade_matricula_preta                 2.664627224 1.942385e-01
## quantidade_matricula_parda                10.040680441 1.579210e-01
## quantidade_matricula_amarela               0.957694280 1.030148e-01
## quantidade_matricula_indigena              0.142315540 1.321158e-02
##                                                  Dim.3       Dim.4        Dim.5
## quantidade_matricula_educacao_basica      1.351684e-01  0.93914913 6.315208e-04
## quantidade_matricula_infantil             3.058653e+01  1.35418465 3.526405e-01
## quantidade_matricula_fundamental          2.010674e+00  0.03250952 1.662354e-01
## quantidade_matricula_medio                5.288113e-04  0.51063785 8.151204e-03
## quantidade_matricula_profissional         2.580577e+00  0.59384000 7.283124e-01
## quantidade_matricula_eja                  3.479659e+00  5.70335902 2.348499e+00
## quantidade_matricula_especial             2.048514e-03  4.77390909 5.585069e+00
## quantidade_matricula_infantil_integral    5.016591e+01  4.95695700 3.524829e+00
## quantidade_matricula_fundamental_integral 6.652741e-01 13.49245458 1.462054e+01
## quantidade_matricula_medio_integral       3.610425e+00  1.63906383 1.757045e+00
## quantidade_matricula_feminino             1.258724e-01  1.03830534 2.725676e-03
## quantidade_matricula_masculino            1.404880e-01  0.82743622 2.712284e-07
## quantidade_matricula_nao_declarada        3.107538e+00 17.93863409 2.419650e-01
## quantidade_matricula_branca               1.577762e+00 10.68880184 1.537471e+00
## quantidade_matricula_preta                7.451012e-01  2.58699654 1.976908e+01
## quantidade_matricula_parda                6.368262e-01  5.59550978 6.422270e-02
## quantidade_matricula_amarela              3.772497e-02  5.97227174 3.986606e+01
## quantidade_matricula_indigena             3.918869e-01 21.35597978 9.426529e+00
##                                                 Dim.6        Dim.7       Dim.8
## quantidade_matricula_educacao_basica       0.33704303  0.094038165  0.10524579
## quantidade_matricula_infantil              1.10327936  0.510835342  9.42111675
## quantidade_matricula_fundamental           1.03583759  2.379271331  0.20403846
## quantidade_matricula_medio                 0.16121847  2.897468214  0.48853550
## quantidade_matricula_profissional          0.21268630  1.456403022  1.39428947
## quantidade_matricula_eja                   3.10850581 12.049142146  0.09164070
## quantidade_matricula_especial              1.44178610  0.016054109  5.77990824
## quantidade_matricula_infantil_integral     0.21458976  3.489117005 11.44997101
## quantidade_matricula_fundamental_integral  2.19109979  0.067504593 29.35713701
## quantidade_matricula_medio_integral        0.02900663  0.479680757  0.51765765
## quantidade_matricula_feminino              0.33317423  0.039411135  0.11822636
## quantidade_matricula_masculino             0.33176909  0.162977077  0.09117968
## quantidade_matricula_nao_declarada        11.94909132  4.160297958 10.39761549
## quantidade_matricula_branca                0.02285955  0.002697873 16.95028993
## quantidade_matricula_preta                 6.06648032 31.815834402  3.53667120
## quantidade_matricula_parda                 0.33313074  1.716099062  8.52778056
## quantidade_matricula_amarela              11.24902971 36.603020635  1.01767267
## quantidade_matricula_indigena             59.87941218  2.060147172  0.55102352
##                                                 Dim.9       Dim.10
## quantidade_matricula_educacao_basica       0.07913530  0.226127383
## quantidade_matricula_infantil              5.00266871  4.397471622
## quantidade_matricula_fundamental           2.78073005  0.486598746
## quantidade_matricula_medio                 0.16708605 30.015923355
## quantidade_matricula_profissional          0.82154688 10.903104365
## quantidade_matricula_eja                  47.11199213 11.742290672
## quantidade_matricula_especial              0.15392297 22.096808831
## quantidade_matricula_infantil_integral     4.50961278  2.721825146
## quantidade_matricula_fundamental_integral  2.23115565  8.099958819
## quantidade_matricula_medio_integral        0.01937249  5.650518765
## quantidade_matricula_feminino              0.10251898  0.521546149
## quantidade_matricula_masculino             0.05819525  0.056934845
## quantidade_matricula_nao_declarada         0.59911381  0.004599855
## quantidade_matricula_branca                1.59267259  2.002818077
## quantidade_matricula_preta                27.83450498  0.438189990
## quantidade_matricula_parda                 0.91425703  0.132170970
## quantidade_matricula_amarela               2.76929635  0.366746421
## quantidade_matricula_indigena              3.25221800  0.136365988
pca_result_01$call$col.w #"weights for the variables"
##  [1] 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1
# MCA

mca_result <- MCA(categ_vars, graph = T, ncp = 10)

mca_result$eig
##        eigenvalue percentage of variance cumulative percentage of variance
## dim 1  0.21652462              21.652462                          21.65246
## dim 2  0.09963857               9.963857                          31.61632
## dim 3  0.07595347               7.595347                          39.21167
## dim 4  0.07255432               7.255432                          46.46710
## dim 5  0.06739459               6.739459                          53.20656
## dim 6  0.06557811               6.557811                          59.76437
## dim 7  0.06303101               6.303101                          66.06747
## dim 8  0.06006353               6.006353                          72.07382
## dim 9  0.05919294               5.919294                          77.99312
## dim 10 0.05417068               5.417068                          83.41018
## dim 11 0.05042710               5.042710                          88.45289
## dim 12 0.04303177               4.303177                          92.75607
## dim 13 0.04215673               4.215673                          96.97174
## dim 14 0.01730555               1.730555                          98.70230
## dim 15 0.01297702               1.297702                         100.00000
mca_result$var$contrib
##                                             Dim 1        Dim 2        Dim 3
## local_funcionamento_predio_escolar_0 8.676734e-01 1.119475e+01 2.888472e+00
## local_funcionamento_predio_escolar_1 1.882088e-02 2.428276e-01 6.265443e-02
## agua_inexistente_0                   1.381858e-02 1.603762e-01 3.051135e-01
## agua_inexistente_1                   1.418114e-01 1.645841e+00 3.131189e+00
## energia_inexistente_0                1.703704e-01 3.703164e-01 2.455957e-01
## energia_inexistente_1                3.435783e+00 7.468004e+00 4.952819e+00
## esgoto_inexistente_0                 6.350153e-02 1.395982e+00 1.145246e-01
## esgoto_inexistente_1                 1.397601e+00 3.072406e+01 2.520564e+00
## biblioteca_sala_leitura_0            1.756424e+00 3.017514e-01 1.387892e+00
## biblioteca_sala_leitura_1            7.651922e+00 1.314590e+00 6.046400e+00
## laboratorio_ciencias_0               7.405823e-03 1.385830e-02 1.752292e-01
## laboratorio_ciencias_1               1.028163e+00 1.923971e+00 2.432736e+01
## laboratorio_informatica_0            3.821638e+00 8.102311e-01 1.223244e+00
## laboratorio_informatica_1            1.256188e+01 2.663262e+00 4.020852e+00
## equipamento_dvd_0                    9.433680e+00 3.975609e-02 8.499946e+00
## equipamento_dvd_1                    8.294067e+00 3.495345e-02 7.473130e+00
## equipamento_tv_0                     1.035740e+01 1.219113e-01 9.358823e+00
## equipamento_tv_1                     7.209901e+00 8.486383e-02 6.514781e+00
## internet_0                           2.661145e+00 3.817853e-01 5.382647e-01
## internet_1                           9.415588e+00 1.350822e+00 1.904473e+00
## alimentacao_0                        1.562255e-01 5.946892e-04 6.062311e+00
## alimentacao_1                        1.089844e-03 4.148610e-06 4.229127e-02
## educacao_indigena_0                  2.495838e-04 2.635261e-03 3.923282e-04
## educacao_indigena_1                  2.897691e-02 3.059563e-01 4.554967e-02
## banheiro_full_0                      1.291949e+00 3.105251e+01 1.528619e+00
## banheiro_full_1                      3.069997e-02 7.378865e-01 3.632387e-02
## agua_pot_ou_filtrada_0               2.389777e-01 2.728785e+00 4.248184e+00
## agua_pot_ou_filtrada_1               1.536815e-02 1.754824e-01 2.731917e-01
## equipamento_pc_0                     5.882700e+00 9.030919e-01 6.798264e-01
## equipamento_pc_1                     1.204517e+01 1.849134e+00 1.391985e+00
##                                             Dim 4        Dim 5        Dim 6
## local_funcionamento_predio_escolar_0 1.138357e+01 4.234858e-01  3.124857811
## local_funcionamento_predio_escolar_1 2.469233e-01 9.185915e-03  0.067781919
## agua_inexistente_0                   3.759488e+00 2.469345e-01  0.067065753
## agua_inexistente_1                   3.858127e+01 2.534134e+00  0.688253844
## energia_inexistente_0                6.446083e-02 1.712971e-01  0.081670182
## energia_inexistente_1                1.299953e+00 3.454472e+00  1.647005858
## esgoto_inexistente_0                 1.900255e-03 4.680879e-03  0.003753715
## esgoto_inexistente_1                 4.182257e-02 1.030211e-01  0.082615254
## biblioteca_sala_leitura_0            5.832583e-02 3.297779e-03  0.087187374
## biblioteca_sala_leitura_1            2.540984e-01 1.436689e-02  0.379834734
## laboratorio_ciencias_0               1.529892e-04 2.343933e-02  0.017574750
## laboratorio_ciencias_1               2.123974e-02 3.254120e+00  2.439931517
## laboratorio_informatica_0            5.497231e-01 2.192589e-01  0.060903219
## laboratorio_informatica_1            1.806962e+00 7.207129e-01  0.200191311
## equipamento_dvd_0                    9.215169e-01 4.952874e-04  0.761535998
## equipamento_dvd_1                    8.101952e-01 4.354554e-04  0.669540446
## equipamento_tv_0                     1.351677e+00 4.425160e-02  0.981587463
## equipamento_tv_1                     9.409176e-01 3.080403e-02  0.683293970
## internet_0                           3.920174e-02 3.815635e-02  0.124314462
## internet_1                           1.387025e-01 1.350037e-01  0.439845968
## alimentacao_0                        5.050621e+00 3.471227e+01 24.124256730
## alimentacao_1                        3.523362e-02 2.421562e-01  0.168293157
## educacao_indigena_0                  1.102565e-01 1.769260e-01  0.531296320
## educacao_indigena_1                  1.280089e+01 2.054128e+01 61.683993939
## banheiro_full_0                      3.705172e+00 3.576353e-01  0.327900675
## banheiro_full_1                      8.804430e-02 8.498323e-03  0.007791752
## agua_pot_ou_filtrada_0               1.279571e+01 2.999562e+01  0.226313304
## agua_pot_ou_filtrada_1               8.228652e-01 1.928955e+00  0.014553727
## equipamento_pc_0                     7.609728e-01 1.985546e-01  0.100688734
## equipamento_pc_1                     1.558137e+00 4.065523e-01  0.206166113
##                                             Dim 7        Dim 8        Dim 9
## local_funcionamento_predio_escolar_0 2.294782e+00 8.837356e-01 4.911158e+01
## local_funcionamento_predio_escolar_1 4.977658e-02 1.916929e-02 1.065289e+00
## agua_inexistente_0                   4.722179e-01 3.171544e+00 2.984581e-01
## agua_inexistente_1                   4.846077e+00 3.254757e+01 3.062888e+00
## energia_inexistente_0                2.733416e-01 1.224384e-01 5.631045e-01
## energia_inexistente_1                5.512357e+00 2.469161e+00 1.135588e+01
## esgoto_inexistente_0                 2.268566e-02 4.904214e-03 3.281066e-01
## esgoto_inexistente_1                 4.992871e-01 1.079365e-01 7.221275e+00
## biblioteca_sala_leitura_0            1.010209e-01 5.185759e-02 8.930606e-03
## biblioteca_sala_leitura_1            4.401009e-01 2.259193e-01 3.890649e-02
## laboratorio_ciencias_0               2.367883e-01 1.476287e-01 2.312201e-02
## laboratorio_ciencias_1               3.287371e+01 2.049553e+01 3.210067e+00
## laboratorio_informatica_0            7.639323e-01 4.618432e-01 1.208410e+00
## laboratorio_informatica_1            2.511076e+00 1.518097e+00 3.972091e+00
## equipamento_dvd_0                    1.822779e-02 1.084091e+00 2.919810e+00
## equipamento_dvd_1                    1.602583e-02 9.531302e-01 2.567089e+00
## equipamento_tv_0                     1.253201e-03 1.324027e+00 3.555912e+00
## equipamento_tv_1                     8.723670e-04 9.216699e-01 2.475310e+00
## internet_0                           8.022879e-03 1.889962e-01 1.880020e-04
## internet_1                           2.838633e-02 6.687010e-01 6.651834e-04
## alimentacao_0                        2.902597e+01 2.844160e-02 2.996615e-02
## alimentacao_1                        2.024880e-01 1.984114e-04 2.090467e-04
## educacao_indigena_0                  6.082075e-03 1.264724e-02 6.481837e-04
## educacao_indigena_1                  7.061345e-01 1.468357e+00 7.525473e-02
## banheiro_full_0                      4.893549e-04 2.097200e-03 2.150337e+00
## banheiro_full_1                      1.162831e-05 4.983479e-05 5.109747e-02
## agua_pot_ou_filtrada_0               1.456426e+01 2.709672e+01 2.126202e-02
## agua_pot_ou_filtrada_1               9.365964e-01 1.742533e+00 1.367315e-03
## equipamento_pc_0                     1.177345e+00 7.484683e-01 1.536567e+00
## equipamento_pc_1                     2.410683e+00 1.532533e+00 3.146212e+00
##                                            Dim 10
## local_funcionamento_predio_escolar_0 1.459482e+01
## local_funcionamento_predio_escolar_1 3.165793e-01
## agua_inexistente_0                   5.288576e-02
## agua_inexistente_1                   5.427335e-01
## energia_inexistente_0                2.472526e+00
## energia_inexistente_1                4.986233e+01
## esgoto_inexistente_0                 2.759424e-01
## esgoto_inexistente_1                 6.073198e+00
## biblioteca_sala_leitura_0            3.508211e-01
## biblioteca_sala_leitura_1            1.528364e+00
## laboratorio_ciencias_0               7.031050e-04
## laboratorio_ciencias_1               9.761322e-02
## laboratorio_informatica_0            4.232848e-01
## laboratorio_informatica_1            1.391354e+00
## equipamento_dvd_0                    2.145680e+00
## equipamento_dvd_1                    1.886476e+00
## equipamento_tv_0                     1.806616e+00
## equipamento_tv_1                     1.257605e+00
## internet_0                           2.028795e-02
## internet_1                           7.178224e-02
## alimentacao_0                        2.778419e-02
## alimentacao_1                        1.938252e-04
## educacao_indigena_0                  1.218186e-04
## educacao_indigena_1                  1.414325e-02
## banheiro_full_0                      1.092669e+01
## banheiro_full_1                      2.596458e-01
## agua_pot_ou_filtrada_0               1.647470e+00
## agua_pot_ou_filtrada_1               1.059453e-01
## equipamento_pc_0                     6.058621e-01
## equipamento_pc_1                     1.240538e+00
#daisy/clara
data.frame(pca_result_01$ind$coord) %>% 
  rename_with(~ tolower(gsub("Dim", "PCA_dim", .x, fixed = TRUE))) %>% 
  select(1:5) %>% 
  glimpse->result_pca_data
## Rows: 151,997
## Columns: 5
## $ pca_dim.1 <dbl> -1.03464473, -0.44591801, -1.13419619, -1.09353831, -1.06371…
## $ pca_dim.2 <dbl> 0.06005562, -0.12092885, 0.11217081, 0.06261655, 0.02761769,…
## $ pca_dim.3 <dbl> 0.019444359, 0.263022167, -0.136816442, -0.070457643, 0.0214…
## $ pca_dim.4 <dbl> -0.19074372, 0.15714311, -0.19653674, -0.04376091, 0.0336988…
## $ pca_dim.5 <dbl> 0.25053701, 0.02103774, 0.24135566, -0.01766859, -0.05002493…
data.frame(mca_result$ind$coord) %>% 
  rename_with(~ tolower(gsub("Dim", "MCA_dim", .x, fixed = TRUE))) %>% 
  select(1:5) %>% 
  glimpse->result_mca_data
## Rows: 151,997
## Columns: 5
## $ mca_dim.1 <dbl> 0.692798838, -0.361739341, -0.003642798, 0.038441357, -0.441…
## $ mca_dim.2 <dbl> 0.07141577, -0.10095876, -0.21559629, 0.02743127, -0.1775841…
## $ mca_dim.3 <dbl> 0.04050818, 1.08991548, -0.27581701, 0.35908593, 0.14012157,…
## $ mca_dim.4 <dbl> -0.0001189937, 0.7425608442, 0.1510753171, -0.1739652005, 0.…
## $ mca_dim.5 <dbl> -0.146447929, 1.797103498, -0.018556922, -0.136484621, -0.03…
cbind(result_mca_data, result_pca_data)->result_only

library(cluster)

#daisy(result_only, metric = "euclidean")->daisy_result  #não rodar 
clara_result<-clara(result_only, k=5, metric = "euclidean")

library(factoextra)
fviz_cluster(clara_result)

#plot(clara_result$clustering)   #não rodar 

By the way, do you like my modern art graph?