We have categorical (binomial) and quantitative data. Initially, I tried to use the dayse function with a Gower distribution. However, this function compares pairs one by one, and with 160,000 rows, we don’t have sufficient memory.
So, one of the easier and faster solutions is to run MCA for categorical data and PCA for quantitative data. Afterwards, we can run a clara analysis (which handles large datasets) for clustering. See above
use_data %>%
mutate(equipamento_pc=case_when(pc_pra_aluno_numeric == 0 ~ 0,
pc_pra_aluno_numeric >= 1 ~ 1),
equipamento_pc=as.factor(equipamento_pc)) %>%
select(-pc_pra_aluno_numeric) %>%
glimpse->cluster_analyse_full_data
## Rows: 151,997
## Columns: 50
## $ Código.INEP <fct> 21132461, 21132461, 21132461…
## $ Localização <chr> "Rural", "Rural", "Rural", "…
## $ Porte.da.Escola <chr> "Até 50 matrículas de escola…
## $ Etapas.e.Modalidade.de.Ensino.Oferecidas <chr> "Educação Infantil, Ensino F…
## $ Outras.Ofertas.Educacionais <chr> "", "", "", "", "", "", "", …
## $ Latitude <dbl> -3.141373, -3.141373, -3.141…
## $ Longitude <dbl> -42.23489, -42.23489, -42.23…
## $ ano <fct> 2016, 2007, 2017, 2011, 2009…
## $ sigla_uf <chr> "MA", "MA", "MA", "MA", "MA"…
## $ id_municipio <fct> 2100907, 2100907, 2100907, 2…
## $ rede <fct> 3, 3, 3, 3, 3, 3, 3, 3, 3, 3…
## $ tipo_localizacao <fct> 2, 2, 2, 2, 2, 2, 2, 2, 2, 2…
## $ tipo_localizacao_diferenciada <fct> 0, 0, 0, 0, 0, 0, 0, 0, 0, 0…
## $ tipo_situacao_funcionamento <fct> 1, 1, 1, 1, 1, 1, 1, 1, 1, 1…
## $ name_muni <chr> "Araioses", "Araioses", "Ara…
## $ code_state <chr> "21", "21", "21", "21", "21"…
## $ geom <MULTIPOLYGON [°]> MULTIPOLYGON ((…
## $ local_funcionamento_predio_escolar <fct> 1, 1, 1, 1, 1, 1, 1, 1, 1, 1…
## $ agua_inexistente <fct> 0, 0, 0, 0, 0, 0, 1, 0, 0, 0…
## $ energia_inexistente <fct> 0, 0, 0, 0, 0, 0, 0, 0, 0, 0…
## $ esgoto_inexistente <fct> 0, 0, 0, 0, 0, 0, 0, 0, 0, 0…
## $ biblioteca_sala_leitura <fct> 0, 1, 0, 0, 0, 0, 0, 0, 0, 1…
## $ laboratorio_ciencias <fct> 0, 0, 0, 0, 0, 0, 0, 0, 0, 0…
## $ laboratorio_informatica <fct> 1, 0, 0, 1, 0, 1, 1, 0, 0, 0…
## $ equipamento_dvd <fct> 1, 0, 1, 0, 0, 1, 1, 1, 1, 0…
## $ equipamento_tv <fct> 1, 0, 1, 0, 0, 1, 1, 1, 1, 0…
## $ internet <fct> 1, 0, 0, 0, 0, 0, 0, 0, 0, 0…
## $ alimentacao <fct> 1, 0, 1, 1, 1, 1, 1, 1, 1, 1…
## $ educacao_indigena <fct> 0, 0, 0, 0, 0, 0, 0, 0, 0, 0…
## $ quantidade_matricula_educacao_basica <int> 62, 97, 58, 62, 64, 42, 43, …
## $ quantidade_matricula_infantil <int> 15, 30, 9, 13, 17, 16, 9, 24…
## $ quantidade_matricula_fundamental <int> 47, 67, 49, 49, 47, 26, 34, …
## $ quantidade_matricula_medio <int> 0, 0, 0, 0, 0, 0, 0, 0, 0, 0…
## $ quantidade_matricula_profissional <int> 0, 0, 0, 0, 0, 0, 0, 0, 0, 0…
## $ quantidade_matricula_eja <int> 0, 0, 0, 0, 0, 0, 0, 0, 0, 0…
## $ quantidade_matricula_especial <int> 0, 0, 0, 0, 0, 0, 0, 0, 0, 0…
## $ quantidade_matricula_infantil_integral <int> 0, 0, 0, 0, 0, 0, 0, 0, 0, 0…
## $ quantidade_matricula_fundamental_integral <int> 0, 0, 0, 0, 0, 0, 0, 0, 0, 0…
## $ quantidade_matricula_medio_integral <int> 0, 0, 0, 0, 0, 0, 0, 0, 0, 0…
## $ quantidade_matricula_feminino <int> 35, 42, 27, 28, 28, 21, 18, …
## $ quantidade_matricula_masculino <int> 27, 55, 31, 34, 36, 21, 25, …
## $ quantidade_matricula_nao_declarada <int> 3, 24, 4, 6, 11, 1, 3, 2, 0,…
## $ quantidade_matricula_branca <int> 2, 1, 1, 0, 0, 0, 1, 9, 9, 2…
## $ quantidade_matricula_preta <int> 0, 1, 0, 1, 0, 0, 0, 0, 0, 1…
## $ quantidade_matricula_parda <int> 56, 71, 52, 55, 53, 41, 39, …
## $ quantidade_matricula_amarela <int> 1, 0, 1, 0, 0, 0, 0, 0, 0, 0…
## $ quantidade_matricula_indigena <int> 0, 0, 0, 0, 0, 0, 0, 0, 0, 0…
## $ banheiro_full <fct> 1, 1, 1, 1, 1, 1, 1, 0, 1, 1…
## $ agua_pot_ou_filtrada <fct> 1, 1, 1, 1, 1, 1, 1, 1, 1, 1…
## $ equipamento_pc <fct> 1, 0, 0, 1, 0, 1, 1, 0, 0, 0…
cluster_analyse_full_data %>%
select(30:47) %>%
glimpse -> quant_vars
## Rows: 151,997
## Columns: 18
## $ quantidade_matricula_educacao_basica <int> 62, 97, 58, 62, 64, 42, 43, …
## $ quantidade_matricula_infantil <int> 15, 30, 9, 13, 17, 16, 9, 24…
## $ quantidade_matricula_fundamental <int> 47, 67, 49, 49, 47, 26, 34, …
## $ quantidade_matricula_medio <int> 0, 0, 0, 0, 0, 0, 0, 0, 0, 0…
## $ quantidade_matricula_profissional <int> 0, 0, 0, 0, 0, 0, 0, 0, 0, 0…
## $ quantidade_matricula_eja <int> 0, 0, 0, 0, 0, 0, 0, 0, 0, 0…
## $ quantidade_matricula_especial <int> 0, 0, 0, 0, 0, 0, 0, 0, 0, 0…
## $ quantidade_matricula_infantil_integral <int> 0, 0, 0, 0, 0, 0, 0, 0, 0, 0…
## $ quantidade_matricula_fundamental_integral <int> 0, 0, 0, 0, 0, 0, 0, 0, 0, 0…
## $ quantidade_matricula_medio_integral <int> 0, 0, 0, 0, 0, 0, 0, 0, 0, 0…
## $ quantidade_matricula_feminino <int> 35, 42, 27, 28, 28, 21, 18, …
## $ quantidade_matricula_masculino <int> 27, 55, 31, 34, 36, 21, 25, …
## $ quantidade_matricula_nao_declarada <int> 3, 24, 4, 6, 11, 1, 3, 2, 0,…
## $ quantidade_matricula_branca <int> 2, 1, 1, 0, 0, 0, 1, 9, 9, 2…
## $ quantidade_matricula_preta <int> 0, 1, 0, 1, 0, 0, 0, 0, 0, 1…
## $ quantidade_matricula_parda <int> 56, 71, 52, 55, 53, 41, 39, …
## $ quantidade_matricula_amarela <int> 1, 0, 1, 0, 0, 0, 0, 0, 0, 0…
## $ quantidade_matricula_indigena <int> 0, 0, 0, 0, 0, 0, 0, 0, 0, 0…
cluster_analyse_full_data %>%
select(18:29, 48:50) %>%
glimpse -> categ_vars
## Rows: 151,997
## Columns: 15
## $ local_funcionamento_predio_escolar <fct> 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1,…
## $ agua_inexistente <fct> 0, 0, 0, 0, 0, 0, 1, 0, 0, 0, 0, 1,…
## $ energia_inexistente <fct> 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0,…
## $ esgoto_inexistente <fct> 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0,…
## $ biblioteca_sala_leitura <fct> 0, 1, 0, 0, 0, 0, 0, 0, 0, 1, 0, 0,…
## $ laboratorio_ciencias <fct> 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0,…
## $ laboratorio_informatica <fct> 1, 0, 0, 1, 0, 1, 1, 0, 0, 0, 1, 1,…
## $ equipamento_dvd <fct> 1, 0, 1, 0, 0, 1, 1, 1, 1, 0, 1, 1,…
## $ equipamento_tv <fct> 1, 0, 1, 0, 0, 1, 1, 1, 1, 0, 1, 1,…
## $ internet <fct> 1, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0,…
## $ alimentacao <fct> 1, 0, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1,…
## $ educacao_indigena <fct> 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0,…
## $ banheiro_full <fct> 1, 1, 1, 1, 1, 1, 1, 0, 1, 1, 1, 1,…
## $ agua_pot_ou_filtrada <fct> 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1,…
## $ equipamento_pc <fct> 1, 0, 0, 1, 0, 1, 1, 0, 0, 0, 1, 1,…
library(stats)
library(FactoMineR)
scaled_data<-scale(quant_vars)
PCA(scaled_data, graph = T, ncp = 10)->pca_result_01
pca_result_01$eig # eigenvalues are numerical values that represent the amount of variance captured by each principal component.
## eigenvalue percentage of variance cumulative percentage of variance
## comp 1 6.635642e+00 3.686468e+01 36.86468
## comp 2 1.840402e+00 1.022446e+01 47.08913
## comp 3 1.250523e+00 6.947347e+00 54.03648
## comp 4 1.148891e+00 6.382729e+00 60.41921
## comp 5 1.001878e+00 5.565991e+00 65.98520
## comp 6 9.880568e-01 5.489204e+00 71.47441
## comp 7 8.741977e-01 4.856654e+00 76.33106
## comp 8 7.266084e-01 4.036713e+00 80.36777
## comp 9 7.021847e-01 3.901026e+00 84.26880
## comp 10 6.666290e-01 3.703494e+00 87.97229
## comp 11 6.570533e-01 3.650296e+00 91.62259
## comp 12 5.607917e-01 3.115510e+00 94.73810
## comp 13 5.111443e-01 2.839690e+00 97.57779
## comp 14 4.079201e-01 2.266223e+00 99.84401
## comp 15 2.463202e-02 1.368445e-01 99.98086
## comp 16 3.445780e-03 1.914322e-02 100.00000
## comp 17 7.610079e-26 4.227822e-25 100.00000
## comp 18 4.090867e-29 2.272704e-28 100.00000
pca_result_01$var$cor #ocrrelações das dimensões our vars
## Dim.1 Dim.2 Dim.3
## quantidade_matricula_educacao_basica 0.98880964 0.01142900 -0.041113389
## quantidade_matricula_infantil 0.40968602 -0.29438789 0.618458973
## quantidade_matricula_fundamental 0.89329142 -0.22645314 -0.158568373
## quantidade_matricula_medio 0.32182970 0.68585357 -0.002571557
## quantidade_matricula_profissional 0.19178770 0.73368023 0.179640479
## quantidade_matricula_eja 0.53799743 0.02348049 -0.208599900
## quantidade_matricula_especial 0.54989578 -0.20398370 0.005061336
## quantidade_matricula_infantil_integral 0.02319807 -0.11827182 0.792045447
## quantidade_matricula_fundamental_integral 0.42943180 -0.24337556 0.091210760
## quantidade_matricula_medio_integral 0.13367706 0.75160691 0.212483366
## quantidade_matricula_feminino 0.98079720 0.03482355 -0.039674457
## quantidade_matricula_masculino 0.98321298 -0.01059651 -0.041914612
## quantidade_matricula_nao_declarada 0.69684226 0.05831258 -0.197130582
## quantidade_matricula_branca 0.65326188 -0.00232998 0.140464469
## quantidade_matricula_preta 0.42049391 0.05978938 -0.096528018
## quantidade_matricula_parda 0.81624973 -0.05391086 0.089239311
## quantidade_matricula_amarela 0.25208960 0.04354178 0.021720018
## quantidade_matricula_indigena 0.09717793 0.01559314 0.070004531
## Dim.4 Dim.5 Dim.6
## quantidade_matricula_educacao_basica 0.10387397 2.515367e-03 -0.05770768
## quantidade_matricula_infantil 0.12473215 5.943929e-02 -0.10440798
## quantidade_matricula_fundamental 0.01932612 -4.081025e-02 -0.10116651
## quantidade_matricula_medio 0.07659421 -9.036877e-03 0.03991153
## quantidade_matricula_profissional -0.08259888 -8.542133e-02 -0.04584170
## quantidade_matricula_eja 0.25597928 1.533920e-01 0.17525354
## quantidade_matricula_especial -0.23419441 -2.365494e-01 0.11935521
## quantidade_matricula_infantil_integral 0.23864208 1.879215e-01 -0.04604638
## quantidade_matricula_fundamental_integral -0.39371770 -3.827270e-01 0.14713704
## quantidade_matricula_medio_integral -0.13722631 -1.326780e-01 -0.01692932
## quantidade_matricula_feminino 0.10921996 5.225702e-03 -0.05737552
## quantidade_matricula_masculino 0.09750047 -5.212848e-05 -0.05725441
## quantidade_matricula_nao_declarada 0.45397730 4.923611e-02 -0.34360414
## quantidade_matricula_branca -0.35043217 -1.241112e-01 0.01502882
## quantidade_matricula_preta -0.17240005 4.450417e-01 0.24482702
## quantidade_matricula_parda -0.25354747 -2.536599e-02 0.05737178
## quantidade_matricula_amarela -0.26194447 6.319885e-01 0.33338686
## quantidade_matricula_indigena 0.49533521 -3.073147e-01 0.76918307
## Dim.7 Dim.8 Dim.9
## quantidade_matricula_educacao_basica 0.028671928 -0.02765366 -0.02357278
## quantidade_matricula_infantil 0.066825973 -0.26163834 -0.18742458
## quantidade_matricula_fundamental 0.144220438 0.03850403 -0.13973496
## quantidade_matricula_medio -0.159152756 -0.05957969 0.03425278
## quantidade_matricula_profissional 0.112835462 0.10065299 -0.07595246
## quantidade_matricula_eja -0.324550953 -0.02580444 0.57516362
## quantidade_matricula_especial 0.011846715 0.20493242 -0.03287588
## quantidade_matricula_infantil_integral -0.174647588 0.28843794 0.17794890
## quantidade_matricula_fundamental_integral -0.024292460 0.46185648 0.12516722
## quantidade_matricula_medio_integral 0.064756143 0.06132980 0.01166322
## quantidade_matricula_feminino 0.018561552 -0.02930943 -0.02683044
## quantidade_matricula_masculino 0.037745752 -0.02573945 -0.02021480
## quantidade_matricula_nao_declarada 0.190707179 0.27486350 -0.06486051
## quantidade_matricula_branca -0.004856413 -0.35094476 0.10575208
## quantidade_matricula_preta -0.527383433 0.16030517 -0.44209685
## quantidade_matricula_parda -0.122483053 -0.24892482 0.08012348
## quantidade_matricula_amarela 0.565670184 0.08599125 0.13944739
## quantidade_matricula_indigena 0.134200442 -0.06327545 -0.15111776
## Dim.10
## quantidade_matricula_educacao_basica -0.038825645
## quantidade_matricula_infantil 0.171215715
## quantidade_matricula_fundamental -0.056954441
## quantidade_matricula_medio -0.447319629
## quantidade_matricula_profissional 0.269598323
## quantidade_matricula_eja 0.279781192
## quantidade_matricula_especial 0.383801689
## quantidade_matricula_infantil_integral -0.134701432
## quantidade_matricula_fundamental_integral -0.232371846
## quantidade_matricula_medio_integral 0.194082449
## quantidade_matricula_feminino -0.058964209
## quantidade_matricula_masculino -0.019481894
## quantidade_matricula_nao_declarada -0.005537506
## quantidade_matricula_branca -0.115548112
## quantidade_matricula_preta 0.054047216
## quantidade_matricula_parda -0.029683161
## quantidade_matricula_amarela -0.049445303
## quantidade_matricula_indigena -0.030150543
pca_result_01$var$contrib #contribuição das variaveis pra cada dimensão
## Dim.1 Dim.2
## quantidade_matricula_educacao_basica 14.734738241 7.097472e-03
## quantidade_matricula_infantil 2.529410539 4.708983e+00
## quantidade_matricula_fundamental 12.025506221 2.786403e+00
## quantidade_matricula_medio 1.560879129 2.555937e+01
## quantidade_matricula_profissional 0.554317431 2.924832e+01
## quantidade_matricula_eja 4.361917458 2.995722e-02
## quantidade_matricula_especial 4.556987226 2.260884e+00
## quantidade_matricula_infantil_integral 0.008109997 7.600634e-01
## quantidade_matricula_fundamental_integral 2.779108167 3.218409e+00
## quantidade_matricula_medio_integral 0.269296567 3.069508e+01
## quantidade_matricula_feminino 14.496911296 6.589209e-02
## quantidade_matricula_masculino 14.568413202 6.101165e-03
## quantidade_matricula_nao_declarada 7.317892083 1.847616e-01
## quantidade_matricula_branca 6.431194958 2.949793e-04
## quantidade_matricula_preta 2.664627224 1.942385e-01
## quantidade_matricula_parda 10.040680441 1.579210e-01
## quantidade_matricula_amarela 0.957694280 1.030148e-01
## quantidade_matricula_indigena 0.142315540 1.321158e-02
## Dim.3 Dim.4 Dim.5
## quantidade_matricula_educacao_basica 1.351684e-01 0.93914913 6.315208e-04
## quantidade_matricula_infantil 3.058653e+01 1.35418465 3.526405e-01
## quantidade_matricula_fundamental 2.010674e+00 0.03250952 1.662354e-01
## quantidade_matricula_medio 5.288113e-04 0.51063785 8.151204e-03
## quantidade_matricula_profissional 2.580577e+00 0.59384000 7.283124e-01
## quantidade_matricula_eja 3.479659e+00 5.70335902 2.348499e+00
## quantidade_matricula_especial 2.048514e-03 4.77390909 5.585069e+00
## quantidade_matricula_infantil_integral 5.016591e+01 4.95695700 3.524829e+00
## quantidade_matricula_fundamental_integral 6.652741e-01 13.49245458 1.462054e+01
## quantidade_matricula_medio_integral 3.610425e+00 1.63906383 1.757045e+00
## quantidade_matricula_feminino 1.258724e-01 1.03830534 2.725676e-03
## quantidade_matricula_masculino 1.404880e-01 0.82743622 2.712284e-07
## quantidade_matricula_nao_declarada 3.107538e+00 17.93863409 2.419650e-01
## quantidade_matricula_branca 1.577762e+00 10.68880184 1.537471e+00
## quantidade_matricula_preta 7.451012e-01 2.58699654 1.976908e+01
## quantidade_matricula_parda 6.368262e-01 5.59550978 6.422270e-02
## quantidade_matricula_amarela 3.772497e-02 5.97227174 3.986606e+01
## quantidade_matricula_indigena 3.918869e-01 21.35597978 9.426529e+00
## Dim.6 Dim.7 Dim.8
## quantidade_matricula_educacao_basica 0.33704303 0.094038165 0.10524579
## quantidade_matricula_infantil 1.10327936 0.510835342 9.42111675
## quantidade_matricula_fundamental 1.03583759 2.379271331 0.20403846
## quantidade_matricula_medio 0.16121847 2.897468214 0.48853550
## quantidade_matricula_profissional 0.21268630 1.456403022 1.39428947
## quantidade_matricula_eja 3.10850581 12.049142146 0.09164070
## quantidade_matricula_especial 1.44178610 0.016054109 5.77990824
## quantidade_matricula_infantil_integral 0.21458976 3.489117005 11.44997101
## quantidade_matricula_fundamental_integral 2.19109979 0.067504593 29.35713701
## quantidade_matricula_medio_integral 0.02900663 0.479680757 0.51765765
## quantidade_matricula_feminino 0.33317423 0.039411135 0.11822636
## quantidade_matricula_masculino 0.33176909 0.162977077 0.09117968
## quantidade_matricula_nao_declarada 11.94909132 4.160297958 10.39761549
## quantidade_matricula_branca 0.02285955 0.002697873 16.95028993
## quantidade_matricula_preta 6.06648032 31.815834402 3.53667120
## quantidade_matricula_parda 0.33313074 1.716099062 8.52778056
## quantidade_matricula_amarela 11.24902971 36.603020635 1.01767267
## quantidade_matricula_indigena 59.87941218 2.060147172 0.55102352
## Dim.9 Dim.10
## quantidade_matricula_educacao_basica 0.07913530 0.226127383
## quantidade_matricula_infantil 5.00266871 4.397471622
## quantidade_matricula_fundamental 2.78073005 0.486598746
## quantidade_matricula_medio 0.16708605 30.015923355
## quantidade_matricula_profissional 0.82154688 10.903104365
## quantidade_matricula_eja 47.11199213 11.742290672
## quantidade_matricula_especial 0.15392297 22.096808831
## quantidade_matricula_infantil_integral 4.50961278 2.721825146
## quantidade_matricula_fundamental_integral 2.23115565 8.099958819
## quantidade_matricula_medio_integral 0.01937249 5.650518765
## quantidade_matricula_feminino 0.10251898 0.521546149
## quantidade_matricula_masculino 0.05819525 0.056934845
## quantidade_matricula_nao_declarada 0.59911381 0.004599855
## quantidade_matricula_branca 1.59267259 2.002818077
## quantidade_matricula_preta 27.83450498 0.438189990
## quantidade_matricula_parda 0.91425703 0.132170970
## quantidade_matricula_amarela 2.76929635 0.366746421
## quantidade_matricula_indigena 3.25221800 0.136365988
pca_result_01$call$col.w #"weights for the variables"
## [1] 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1
# MCA
mca_result <- MCA(categ_vars, graph = T, ncp = 10)
mca_result$eig
## eigenvalue percentage of variance cumulative percentage of variance
## dim 1 0.21652462 21.652462 21.65246
## dim 2 0.09963857 9.963857 31.61632
## dim 3 0.07595347 7.595347 39.21167
## dim 4 0.07255432 7.255432 46.46710
## dim 5 0.06739459 6.739459 53.20656
## dim 6 0.06557811 6.557811 59.76437
## dim 7 0.06303101 6.303101 66.06747
## dim 8 0.06006353 6.006353 72.07382
## dim 9 0.05919294 5.919294 77.99312
## dim 10 0.05417068 5.417068 83.41018
## dim 11 0.05042710 5.042710 88.45289
## dim 12 0.04303177 4.303177 92.75607
## dim 13 0.04215673 4.215673 96.97174
## dim 14 0.01730555 1.730555 98.70230
## dim 15 0.01297702 1.297702 100.00000
mca_result$var$contrib
## Dim 1 Dim 2 Dim 3
## local_funcionamento_predio_escolar_0 8.676734e-01 1.119475e+01 2.888472e+00
## local_funcionamento_predio_escolar_1 1.882088e-02 2.428276e-01 6.265443e-02
## agua_inexistente_0 1.381858e-02 1.603762e-01 3.051135e-01
## agua_inexistente_1 1.418114e-01 1.645841e+00 3.131189e+00
## energia_inexistente_0 1.703704e-01 3.703164e-01 2.455957e-01
## energia_inexistente_1 3.435783e+00 7.468004e+00 4.952819e+00
## esgoto_inexistente_0 6.350153e-02 1.395982e+00 1.145246e-01
## esgoto_inexistente_1 1.397601e+00 3.072406e+01 2.520564e+00
## biblioteca_sala_leitura_0 1.756424e+00 3.017514e-01 1.387892e+00
## biblioteca_sala_leitura_1 7.651922e+00 1.314590e+00 6.046400e+00
## laboratorio_ciencias_0 7.405823e-03 1.385830e-02 1.752292e-01
## laboratorio_ciencias_1 1.028163e+00 1.923971e+00 2.432736e+01
## laboratorio_informatica_0 3.821638e+00 8.102311e-01 1.223244e+00
## laboratorio_informatica_1 1.256188e+01 2.663262e+00 4.020852e+00
## equipamento_dvd_0 9.433680e+00 3.975609e-02 8.499946e+00
## equipamento_dvd_1 8.294067e+00 3.495345e-02 7.473130e+00
## equipamento_tv_0 1.035740e+01 1.219113e-01 9.358823e+00
## equipamento_tv_1 7.209901e+00 8.486383e-02 6.514781e+00
## internet_0 2.661145e+00 3.817853e-01 5.382647e-01
## internet_1 9.415588e+00 1.350822e+00 1.904473e+00
## alimentacao_0 1.562255e-01 5.946892e-04 6.062311e+00
## alimentacao_1 1.089844e-03 4.148610e-06 4.229127e-02
## educacao_indigena_0 2.495838e-04 2.635261e-03 3.923282e-04
## educacao_indigena_1 2.897691e-02 3.059563e-01 4.554967e-02
## banheiro_full_0 1.291949e+00 3.105251e+01 1.528619e+00
## banheiro_full_1 3.069997e-02 7.378865e-01 3.632387e-02
## agua_pot_ou_filtrada_0 2.389777e-01 2.728785e+00 4.248184e+00
## agua_pot_ou_filtrada_1 1.536815e-02 1.754824e-01 2.731917e-01
## equipamento_pc_0 5.882700e+00 9.030919e-01 6.798264e-01
## equipamento_pc_1 1.204517e+01 1.849134e+00 1.391985e+00
## Dim 4 Dim 5 Dim 6
## local_funcionamento_predio_escolar_0 1.138357e+01 4.234858e-01 3.124857811
## local_funcionamento_predio_escolar_1 2.469233e-01 9.185915e-03 0.067781919
## agua_inexistente_0 3.759488e+00 2.469345e-01 0.067065753
## agua_inexistente_1 3.858127e+01 2.534134e+00 0.688253844
## energia_inexistente_0 6.446083e-02 1.712971e-01 0.081670182
## energia_inexistente_1 1.299953e+00 3.454472e+00 1.647005858
## esgoto_inexistente_0 1.900255e-03 4.680879e-03 0.003753715
## esgoto_inexistente_1 4.182257e-02 1.030211e-01 0.082615254
## biblioteca_sala_leitura_0 5.832583e-02 3.297779e-03 0.087187374
## biblioteca_sala_leitura_1 2.540984e-01 1.436689e-02 0.379834734
## laboratorio_ciencias_0 1.529892e-04 2.343933e-02 0.017574750
## laboratorio_ciencias_1 2.123974e-02 3.254120e+00 2.439931517
## laboratorio_informatica_0 5.497231e-01 2.192589e-01 0.060903219
## laboratorio_informatica_1 1.806962e+00 7.207129e-01 0.200191311
## equipamento_dvd_0 9.215169e-01 4.952874e-04 0.761535998
## equipamento_dvd_1 8.101952e-01 4.354554e-04 0.669540446
## equipamento_tv_0 1.351677e+00 4.425160e-02 0.981587463
## equipamento_tv_1 9.409176e-01 3.080403e-02 0.683293970
## internet_0 3.920174e-02 3.815635e-02 0.124314462
## internet_1 1.387025e-01 1.350037e-01 0.439845968
## alimentacao_0 5.050621e+00 3.471227e+01 24.124256730
## alimentacao_1 3.523362e-02 2.421562e-01 0.168293157
## educacao_indigena_0 1.102565e-01 1.769260e-01 0.531296320
## educacao_indigena_1 1.280089e+01 2.054128e+01 61.683993939
## banheiro_full_0 3.705172e+00 3.576353e-01 0.327900675
## banheiro_full_1 8.804430e-02 8.498323e-03 0.007791752
## agua_pot_ou_filtrada_0 1.279571e+01 2.999562e+01 0.226313304
## agua_pot_ou_filtrada_1 8.228652e-01 1.928955e+00 0.014553727
## equipamento_pc_0 7.609728e-01 1.985546e-01 0.100688734
## equipamento_pc_1 1.558137e+00 4.065523e-01 0.206166113
## Dim 7 Dim 8 Dim 9
## local_funcionamento_predio_escolar_0 2.294782e+00 8.837356e-01 4.911158e+01
## local_funcionamento_predio_escolar_1 4.977658e-02 1.916929e-02 1.065289e+00
## agua_inexistente_0 4.722179e-01 3.171544e+00 2.984581e-01
## agua_inexistente_1 4.846077e+00 3.254757e+01 3.062888e+00
## energia_inexistente_0 2.733416e-01 1.224384e-01 5.631045e-01
## energia_inexistente_1 5.512357e+00 2.469161e+00 1.135588e+01
## esgoto_inexistente_0 2.268566e-02 4.904214e-03 3.281066e-01
## esgoto_inexistente_1 4.992871e-01 1.079365e-01 7.221275e+00
## biblioteca_sala_leitura_0 1.010209e-01 5.185759e-02 8.930606e-03
## biblioteca_sala_leitura_1 4.401009e-01 2.259193e-01 3.890649e-02
## laboratorio_ciencias_0 2.367883e-01 1.476287e-01 2.312201e-02
## laboratorio_ciencias_1 3.287371e+01 2.049553e+01 3.210067e+00
## laboratorio_informatica_0 7.639323e-01 4.618432e-01 1.208410e+00
## laboratorio_informatica_1 2.511076e+00 1.518097e+00 3.972091e+00
## equipamento_dvd_0 1.822779e-02 1.084091e+00 2.919810e+00
## equipamento_dvd_1 1.602583e-02 9.531302e-01 2.567089e+00
## equipamento_tv_0 1.253201e-03 1.324027e+00 3.555912e+00
## equipamento_tv_1 8.723670e-04 9.216699e-01 2.475310e+00
## internet_0 8.022879e-03 1.889962e-01 1.880020e-04
## internet_1 2.838633e-02 6.687010e-01 6.651834e-04
## alimentacao_0 2.902597e+01 2.844160e-02 2.996615e-02
## alimentacao_1 2.024880e-01 1.984114e-04 2.090467e-04
## educacao_indigena_0 6.082075e-03 1.264724e-02 6.481837e-04
## educacao_indigena_1 7.061345e-01 1.468357e+00 7.525473e-02
## banheiro_full_0 4.893549e-04 2.097200e-03 2.150337e+00
## banheiro_full_1 1.162831e-05 4.983479e-05 5.109747e-02
## agua_pot_ou_filtrada_0 1.456426e+01 2.709672e+01 2.126202e-02
## agua_pot_ou_filtrada_1 9.365964e-01 1.742533e+00 1.367315e-03
## equipamento_pc_0 1.177345e+00 7.484683e-01 1.536567e+00
## equipamento_pc_1 2.410683e+00 1.532533e+00 3.146212e+00
## Dim 10
## local_funcionamento_predio_escolar_0 1.459482e+01
## local_funcionamento_predio_escolar_1 3.165793e-01
## agua_inexistente_0 5.288576e-02
## agua_inexistente_1 5.427335e-01
## energia_inexistente_0 2.472526e+00
## energia_inexistente_1 4.986233e+01
## esgoto_inexistente_0 2.759424e-01
## esgoto_inexistente_1 6.073198e+00
## biblioteca_sala_leitura_0 3.508211e-01
## biblioteca_sala_leitura_1 1.528364e+00
## laboratorio_ciencias_0 7.031050e-04
## laboratorio_ciencias_1 9.761322e-02
## laboratorio_informatica_0 4.232848e-01
## laboratorio_informatica_1 1.391354e+00
## equipamento_dvd_0 2.145680e+00
## equipamento_dvd_1 1.886476e+00
## equipamento_tv_0 1.806616e+00
## equipamento_tv_1 1.257605e+00
## internet_0 2.028795e-02
## internet_1 7.178224e-02
## alimentacao_0 2.778419e-02
## alimentacao_1 1.938252e-04
## educacao_indigena_0 1.218186e-04
## educacao_indigena_1 1.414325e-02
## banheiro_full_0 1.092669e+01
## banheiro_full_1 2.596458e-01
## agua_pot_ou_filtrada_0 1.647470e+00
## agua_pot_ou_filtrada_1 1.059453e-01
## equipamento_pc_0 6.058621e-01
## equipamento_pc_1 1.240538e+00
#daisy/clara
data.frame(pca_result_01$ind$coord) %>%
rename_with(~ tolower(gsub("Dim", "PCA_dim", .x, fixed = TRUE))) %>%
select(1:5) %>%
glimpse->result_pca_data
## Rows: 151,997
## Columns: 5
## $ pca_dim.1 <dbl> -1.03464473, -0.44591801, -1.13419619, -1.09353831, -1.06371…
## $ pca_dim.2 <dbl> 0.06005562, -0.12092885, 0.11217081, 0.06261655, 0.02761769,…
## $ pca_dim.3 <dbl> 0.019444359, 0.263022167, -0.136816442, -0.070457643, 0.0214…
## $ pca_dim.4 <dbl> -0.19074372, 0.15714311, -0.19653674, -0.04376091, 0.0336988…
## $ pca_dim.5 <dbl> 0.25053701, 0.02103774, 0.24135566, -0.01766859, -0.05002493…
data.frame(mca_result$ind$coord) %>%
rename_with(~ tolower(gsub("Dim", "MCA_dim", .x, fixed = TRUE))) %>%
select(1:5) %>%
glimpse->result_mca_data
## Rows: 151,997
## Columns: 5
## $ mca_dim.1 <dbl> 0.692798838, -0.361739341, -0.003642798, 0.038441357, -0.441…
## $ mca_dim.2 <dbl> 0.07141577, -0.10095876, -0.21559629, 0.02743127, -0.1775841…
## $ mca_dim.3 <dbl> 0.04050818, 1.08991548, -0.27581701, 0.35908593, 0.14012157,…
## $ mca_dim.4 <dbl> -0.0001189937, 0.7425608442, 0.1510753171, -0.1739652005, 0.…
## $ mca_dim.5 <dbl> -0.146447929, 1.797103498, -0.018556922, -0.136484621, -0.03…
cbind(result_mca_data, result_pca_data)->result_only
library(cluster)
#daisy(result_only, metric = "euclidean")->daisy_result #não rodar
clara_result<-clara(result_only, k=5, metric = "euclidean")
library(factoextra)
fviz_cluster(clara_result)
#plot(clara_result$clustering) #não rodar