Selecionando CEPs que ficaram sem correspondente, gerando
NaN
cep_campinas_missing <- read.csv("ceps_cadunico_missing.csv") %>%
select(cep)
Removendo CEPs fora do padrão oficial (8 Digitos)
cep_campinas_missing <- cep_campinas_missing %>%
filter(nchar(cep) == 8)
Transformando em Data Frame
cep_campinas_missing <- as.data.frame(cep_campinas_missing)
Transformando em lista (Requerimento do cepR para buscar
informações sobre os CEPs)
cep_campinas_missing_list <- apply(cep_campinas_missing, 1, as.list)
Realizando a busca na base de dados do CEP Aberto sobre
os CEPs sem correspondência
cep_campinas_missing_coords <- busca_multi(lista_ceps = cep_campinas_missing_list, token = 'b8f114aa7492d9158dac7297024b2cfd')
Primeiras linhas de cep_campinas_missing_coords
head(cep_campinas_missing_coords)
## # A tibble: 6 × 10
## estado cidade bairro cep logra…¹ latit…² longi…³ altit…⁴ ddd cod_I…⁵
## <chr> <chr> <chr> <chr> <chr> <dbl> <dbl> <dbl> <dbl> <chr>
## 1 SP Campinas Jardim Mo… 1304… Avenid… -22.9 -47.1 703. 19 3509502
## 2 SP Campinas Jardim Ca… 1305… Rua Um -22.9 -47.1 703. 19 3509502
## 3 SP Campinas Jardim da… 1305… Rodovi… -22.9 -47.1 703. 19 3509502
## 4 SP Campinas Jardim Mo… 1304… Rua Lu… -22.9 -47.1 703. 19 3509502
## 5 SP Campinas Jardim Co… 1305… Rua Lu… -22.9 -47.1 703. 19 3509502
## 6 SP Campinas Jardim Sa… 1305… Rua Ma… -23.0 -47.1 610 19 3509502
## # … with abbreviated variable names ¹logradouro, ²latitude, ³longitude,
## # ⁴altitude, ⁵cod_IBGE
O resultado é satisfatório, encontramos a maioria dos CEPs que não
possuíam informações e agora podemos completar o banco de
dadosceps_cadunico_left. Contudo, ainda temo
NA neste banco de dados. Nos próximos passos temos como
objetivo identificar os últimos CEPs que não foram encontrados
registros.
Realizando um Anti Join de cep_campinas_missing_coords
em cep_campinas_missing e descobrindo CEPs sem
informações
cep_campinas_missing <- cep_campinas_missing %>%
mutate(cep = as.integer(cep))
cep_campinas_missing_coords <- cep_campinas_missing_coords %>%
mutate(cep = as.integer(cep))
cep_campinas_missing_last <- cep_campinas_missing %>%
anti_join(cep_campinas_missing_coords)
## Joining with `by = join_by(cep)`
O cep_campinas_missing_last traz informação sobre os
últimos 23 CEPs do banco de dados do CadUnico que ficaram sem
informações após o trabalho com a base.
cep_campinas_missing_last
## cep
## 1 13100010
## 2 13056539
## 3 13067541
## 4 13056542
## 5 13057201
## 6 13057205
## 7 13056543
## 8 13064863
## 9 13100236
## 10 13064861
## 11 13056538
## 12 13056544
## 13 13053144
## 14 13045106
## 15 13071144
## 16 13095000
## 17 13098231
## 18 13060899
## 19 13084616
## 20 13082460
## 21 13057204
## 22 13058850
## 23 13064862