Selecionando CEPs que ficaram sem correspondente, gerando NaN

cep_campinas_missing <- read.csv("ceps_cadunico_missing.csv") %>%
  select(cep)

Removendo CEPs fora do padrão oficial (8 Digitos)

cep_campinas_missing <- cep_campinas_missing %>%
  filter(nchar(cep) == 8)

Transformando em Data Frame

cep_campinas_missing <- as.data.frame(cep_campinas_missing)

Transformando em lista (Requerimento do cepR para buscar informações sobre os CEPs)

cep_campinas_missing_list <- apply(cep_campinas_missing, 1, as.list)

Realizando a busca na base de dados do CEP Aberto sobre os CEPs sem correspondência

cep_campinas_missing_coords <- busca_multi(lista_ceps = cep_campinas_missing_list, token = 'b8f114aa7492d9158dac7297024b2cfd')

Primeiras linhas de cep_campinas_missing_coords

head(cep_campinas_missing_coords)
## # A tibble: 6 × 10
##   estado cidade   bairro     cep   logra…¹ latit…² longi…³ altit…⁴   ddd cod_I…⁵
##   <chr>  <chr>    <chr>      <chr> <chr>     <dbl>   <dbl>   <dbl> <dbl> <chr>  
## 1 SP     Campinas Jardim Mo… 1304… Avenid…   -22.9   -47.1    703.    19 3509502
## 2 SP     Campinas Jardim Ca… 1305… Rua Um    -22.9   -47.1    703.    19 3509502
## 3 SP     Campinas Jardim da… 1305… Rodovi…   -22.9   -47.1    703.    19 3509502
## 4 SP     Campinas Jardim Mo… 1304… Rua Lu…   -22.9   -47.1    703.    19 3509502
## 5 SP     Campinas Jardim Co… 1305… Rua Lu…   -22.9   -47.1    703.    19 3509502
## 6 SP     Campinas Jardim Sa… 1305… Rua Ma…   -23.0   -47.1    610     19 3509502
## # … with abbreviated variable names ¹​logradouro, ²​latitude, ³​longitude,
## #   ⁴​altitude, ⁵​cod_IBGE

O resultado é satisfatório, encontramos a maioria dos CEPs que não possuíam informações e agora podemos completar o banco de dadosceps_cadunico_left. Contudo, ainda temo NA neste banco de dados. Nos próximos passos temos como objetivo identificar os últimos CEPs que não foram encontrados registros.

Realizando um Anti Join de cep_campinas_missing_coords em cep_campinas_missing e descobrindo CEPs sem informações

cep_campinas_missing <- cep_campinas_missing %>%
  mutate(cep = as.integer(cep))
cep_campinas_missing_coords <- cep_campinas_missing_coords %>%
  mutate(cep = as.integer(cep))
cep_campinas_missing_last <- cep_campinas_missing %>%
  anti_join(cep_campinas_missing_coords)
## Joining with `by = join_by(cep)`

O cep_campinas_missing_last traz informação sobre os últimos 23 CEPs do banco de dados do CadUnico que ficaram sem informações após o trabalho com a base.

cep_campinas_missing_last
##         cep
## 1  13100010
## 2  13056539
## 3  13067541
## 4  13056542
## 5  13057201
## 6  13057205
## 7  13056543
## 8  13064863
## 9  13100236
## 10 13064861
## 11 13056538
## 12 13056544
## 13 13053144
## 14 13045106
## 15 13071144
## 16 13095000
## 17 13098231
## 18 13060899
## 19 13084616
## 20 13082460
## 21 13057204
## 22 13058850
## 23 13064862