library(tidyverse)
library(janitor)
devtools::load_all()

No relatório preliminar 01, mostramos como a base de dados foi baixada e o conteúdo da base depois após a fase de arrumação de dados. Neste documento, apresentaremos análises preliminares sobre duas quantidades de interesse na pesquisa: i) perfil dos condenados do CNC e ii) valores envolvidos nos processos (desagregado por divesos critérios).

1 Perfil dos condenados

A Tabela 1.1 mostra a quantidade de pessoas e processos por tipo de pessoa. Podemos observar que é bem maior a quantidade de pessoas físicas na base.

tidy_cnc %>% 
  mutate(tipo_pessoa = if_else(tipo_pessoa == 'F', 'Física', 'Jurídica')) %>% 
  group_by(tipo_pessoa) %>% 
  summarise(n_pessoas = n_distinct(id_pessoa), 
            n_processos = n_distinct(id_processo)) %>% 
  janitor::add_totals_row() %>% 
  knitr::kable(booktabs = TRUE, 
               caption = 'Quantidade de pessoas jurídicas e físicas e processos envolvidos.')
Table 1.1: Quantidade de pessoas jurídicas e físicas e processos envolvidos.
tipo_pessoa n_pessoas n_processos
Física 29679 26767
Jurídica 862 772
Total 30541 27539

Agora vamos estudar a distribuição geográfica das pessoas. A Figura 1.1 mostra o volume de pessoas por estado. Obsevamos uma concentração maior em São Paulo, Minas Gerais e nos estados da região sul, além de Rondônia. Exceto por Rondônia, o resultado é esperado, já que grande parte da população fica nos estados citados.

data(br_uf_map, package = 'abjutils')
p <- tidy_cnc %>% 
  distinct(id_pessoa, .keep_all = TRUE) %>% 
  count(id = uf) %>% 
  mutate(n = cut(n, c(0, 100, 200, 300, 800, max(n)), dig.lab=5)) %>% 
  inner_join(br_uf_map) %>% {
    ggplot(.) +
      geom_map(aes(x = long, y = lat, map_id = id, fill = n),
               colour = 'gray30', size = .1, alpha = .8,
               map = ., data = .) +
      coord_equal() +
      scale_fill_brewer(palette = 'PuRd') +
      theme_void()
  }
p
Volume de pessoas por Unidade Federativa.

Figure 1.1: Volume de pessoas por Unidade Federativa.

A Figura 1.2 mostra a taxa de pessoas por cem mil habitantes em cada estado. O resultado é surpreendente. Destacam-se o estados do Acre e Rondônia, concentrando 17 e 24 pessoas por cem mil habitantes, respectivamente. Outros estados com alta taxa são Roraima, Amapá, Tocantins, Rio Grande do Norte, Sergipe, Espírito Santo, Distrito Federal e Santa Catarina.

data(pnud_uf, package = 'abjutils')
data(cadmun, package = 'abjutils')
cadmun %<>% distinct(cod, uf) %>% mutate_all(as.character)
pnud_uf %<>% filter(ano == 2010) %>% select(uf, popt) %>% 
  mutate(uf = as.character(uf)) %>% 
  inner_join(cadmun, c('uf' = 'cod')) %>% 
  select(id = uf.y, popt)
p <- tidy_cnc %>% 
  distinct(id_pessoa, .keep_all = TRUE) %>% 
  count(id = uf) %>% 
  inner_join(pnud_uf, 'id') %>%
  mutate(tx = n / popt * 100000) %>% 
  mutate(tx = cut(tx, c(0, 1, 3, 5, 10, max(tx)), dig.lab = 3,
                  ordered_result = TRUE)) %>% 
  inner_join(br_uf_map) %>% {
    ggplot(.) +
      geom_map(aes(x = long, y = lat, map_id = id, fill = tx),
               colour = 'gray30', size = .1, alpha = .8,
               map = ., data = .) +
      scale_fill_brewer(palette = 'PuRd') +
      coord_equal() +
      theme_void()
  }
p
Pessoas por cem mil habitantes em cada Unidade Federativa.

Figure 1.2: Pessoas por cem mil habitantes em cada Unidade Federativa.

2 Valores envolvidos

Na base de dados temos três variáveis sobre valores: i) pagamento de multas, ii) ressarcimento integral do dano e iii) perda de bens ou valores acrescidos ilicitamente ao patrimônio. Vamos analisar cada um desses valores separadamente.

2.1 Pagamento de multas

A Tabela 2.1 mostra a proporção de condenações em que houve multa. Obseve que tivemos multas em aproximadamente um terço dos casos. No entanto, somente 9.817 casos possuem valores de multa maiores ou iguais a zero ou menores que um bilhão.

tidy_cnc %>% 
  replace_na(list(teve_multa = 'não')) %>% 
  janitor::tabyl(teve_multa, sort = TRUE) %>% 
  janitor::add_totals_row() %>% 
  mutate(percent = scales::percent(percent)) %>% 
  knitr::kable(booktabs = TRUE,
               caption = 'Proporção de multas na base.')
Table 2.1: Proporção de multas na base.
teve_multa n percent
não 24269 67.5%
sim 11708 32.5%
Total 35977 100.0%

Como o valor é uma variável bastante assimétrica, é necessário elaborar algumas estatísticas especiais para comparação de valores. A Figura 2.1 compara os percentis1 dos valores das multas para pessoas físicas e jurídicas. É possível observar que os valores envolvidos para pessoas jurídicas é sistematicamente maior que os valores envolvidos para pessoas físicas. No futuro, vamos realizar esse tipo de comparação para diversas subpopulações da base de dados.

p <- tidy_cnc %>% 
  filter(teve_multa == 'sim', vl_multa < 1e9, vl_multa > 10) %>% 
  group_by(tipo_pessoa) %>% 
  do(n = nrow(.),
     r = quantile(.$vl_multa, probs = 0:100 / 100)) %>% 
  unnest(n) %>% 
  unnest(r) %>% 
  group_by(tipo_pessoa) %>% 
  mutate(id = 1:n()) %>% 
  ungroup() %>% 
  mutate(tipo_pessoa = if_else(tipo_pessoa == 'F', paste0('Física (n = ', n, ')'),
                               paste0('Jurídica (n = ', n, ')'))) %>% 
  select(-n) %>% 
  spread(tipo_pessoa, r) %>% 
  ggplot(aes_(x = as.name(names(.)[2]), y = as.name(names(.)[3]))) +
  geom_point() +
  geom_abline(slope = 1, intercept = 0) +
  scale_x_log10(labels = scales::dollar) +
  scale_y_log10(labels = scales::dollar) +
  theme_bw()

plotly::ggplotly(p)

Figure 2.1: Gráfico quantil-quantil do valor da multa por tipo de pessoa (escala log).

A Tabela 2.2 mostra as 20 pessoas com maior quantidade de multas. Observe que apesar de observarmos pessoas com pelo menos 12 multas cada, 97% do valor de multas está concentrado nas multas restantes.

tidy_cnc %>% 
  filter(teve_multa == 'sim', vl_multa < 1e9) %>% 
  mutate(nome = sprintf('%06s / %s', id_pessoa, toupper(nm_pessoa))) %>% 
  mutate(nome = forcats::fct_infreq(nome),
         nome = forcats::fct_lump(nome, n = 20)) %>% 
  group_by(nome) %>% 
  summarise(n_multas = n(), vl_total = sum(vl_multa)) %>%
  mutate(`% total` = n_multas / sum(n_multas)) %>% 
  mutate(`% valor total` = vl_total / sum(vl_total)) %>% 
  # arrange(desc(n_multas)) %>% 
  add_totals_row() %>% 
  mutate(`% valor total` = scales::percent(`% valor total`)) %>% 
  mutate(`% total` = scales::percent(`% total`)) %>% 
  mutate(vl_total = scales::dollar(vl_total)) %>% 
  knitr::kable(booktabs = TRUE, 
               caption = 'Pessoas com maiores quantidade de multas, valor agregado e proporção do total.')
Table 2.2: Pessoas com maiores quantidade de multas, valor agregado e proporção do total.
nome n_multas vl_total % total % valor total
510 / MARCOS PEREZ 35 $2,237,100 0.3% 0.1%
518 / JOÃO TADEU SAAB 28 $85,895 0.2% 0.0%
760 / NELSON NICACIO DE LIMA 25 $5,387,138 0.2% 0.3%
2716 / RAIMUNDO JOÃO PIRES SALDANHA NETO 22 $1,545,760 0.2% 0.1%
1917 / SÉRGIO PINAFFI 21 $90,310 0.2% 0.0%
5342 / RILDO ALAOR TEIXEIRA DA SILVA 20 $268,530 0.2% 0.0%
562 / ANTONIO NUNES DA SILVA 20 $1,118,895 0.2% 0.1%
5945 / LUIZ ANTONIO TREVISAN VEDOIN 20 $1,541,755 0.2% 0.1%
147 / MÁRIO LUCIO LUCATELLI 19 $1,892,315 0.2% 0.1%
5943 / DARCI JOSE VEDOIN 18 $971,955 0.2% 0.1%
3895 / GILBERTO CARVALHO 17 $56,870 0.1% 0.0%
6433 / NAURO SERGIO MUNIZ MENDES 17 $4,468,886 0.1% 0.2%
295 / VALTERCIDES MONTEIRO 14 $297,227 0.1% 0.0%
1050 / CARLOS SIQUEIRA RIBEIRO 13 $431,255 0.1% 0.0%
274 / GILSON DE ASSUNÇÃO 13 $2,079,740 0.1% 0.1%
53 / RUBENS MASSUCIO RUBINHO 13 $18,751,080 0.1% 1.0%
1029 / CLEBEL ÂNGELO MÁRCIO PEREIRA 12 $166,429 0.1% 0.0%
142 / JOSÉ CARLOS MOREIRA 12 $5,787,396 0.1% 0.3%
2218 / JOSÉ PAULO NOVAES 12 $425,433 0.1% 0.0%
2219 / AUREA CEREZINE DE SOUZA VILLAS BOAS 12 $410,533 0.1% 0.0%
Other 11344 $1,760,828,013 96.9% 97.3%
Total 11707 $1,808,842,516 100.0% 100.0%

A Tabela 2.3 mostra os 20 casos com maior valor de multas. Observe que somente esses casos concentram quase metade do valor total das multas.

tidy_cnc %>% 
  filter(teve_multa == 'sim', vl_multa < 1e9) %>% 
  select(nome = nm_pessoa, tipo_pessoa, vl_multa) %>% 
  mutate(nome = toupper(nome)) %>% 
  arrange(desc(vl_multa)) %>% 
  mutate(`% acu. vl total` = cumsum(vl_multa) / sum(vl_multa)) %>% 
  # mutate(nome = forcats::fct_reorder(nome, fun = sum, vl_multa),
  #        nome = forcats::fct_lump(nome, n = 20)) %>% 
  unite(aux, nome, tipo_pessoa) %>% 
  add_totals_row() %>% 
  separate(aux, c('nome', 'tipo_pessoa'), sep = '_', fill = 'right') %>% 
  mutate(`% acu. vl total` = if_else(nome == 'Total', NA_real_, `% acu. vl total`)) %>% 
  mutate(`% acu. vl total` = scales::percent(`% acu. vl total`)) %>% 
  mutate(vl_multa = scales::dollar(vl_multa)) %>% 
  slice(c(1:20, nrow(.))) %>%
  replace_na(list(tipo_pessoa = '')) %>% 
  mutate(`% acu. vl total` = if_else(`% acu. vl total` == 'NA%', '', `% acu. vl total`)) %>% 
  knitr::kable(booktabs = TRUE, 
               caption = 'Condenações com multas de maior valor com informação do tipo de pessoa e proporção acumulada da soma dos valores.')
Table 2.3: Condenações com multas de maior valor com informação do tipo de pessoa e proporção acumulada da soma dos valores.
nome tipo_pessoa vl_multa % acu. vl total
PROJETO FILIPENSES MANUTENÇÃO DE RESULTADOS J $101,947,537 5.6%
VALMIR FELIX TEIXEIRA F $100,731,322 11.2%
LINKNET TECNOLOGIA E TELECOMUNICAÇÕES LTDA J $70,225,149 15.1%
ALEXANDRE AUGUSTO DE SOUZA F $70,225,149 19.0%
SERGIO HENRIQUE DE SOUZA F $70,225,149 22.9%
LIMIRIO MARTINS PARREIRA F $54,662,281 25.9%
JOSÉ MAURY ALVES MARTINS F $54,642,412 28.9%
AÍLTON DE OLIVEIRA F $43,708,242 31.3%
VANDERLE ANTONIO RIBEIRO F $32,606,320 33.1%
CLAUDIO MIGUEL JOSE F $31,442,916 34.9%
MARCELO GONÇALVES MAIA DE CARVALHO F $26,442,699 36.3%
ANTONIO FIGUEIREDO DE OLIVEIRA F $25,387,527 37.7%
DURVAL BARBOSA RODRIGUES F $24,166,087 39.1%
RICARDO LIMA ESPINDOLA F $24,166,087 40.4%
JOSE GOMES PINHEIRO NETO F $24,166,087 41.7%
LAZARO SEVERO ROCHA F $24,166,087 43.1%
INSTITUTO CANDANGO DE SOLIDARIEDADE-ICS J $24,166,087 44.4%
JAIR THOMAZ F $21,033,869 45.6%
JAMIL ADIB ANTONIO F $17,171,007 46.5%
RAFAEL TOBIAS DOS SANTOS CARVALHO F $17,171,007 47.5%
Total $1,808,842,516

2.1.1 Multas por UF, assunto e origem

A Tabela 2.4 mostra os 20 assuntos com maior valor agregado. Note que dano ao erário soma mais de 1 bilhão de reais. Tambem temos alguns assuntos genéricos que deveriam ser filtrados.

tidy_cnc %>% 
  filter(teve_multa == 'sim', vl_multa < 1e9) %>% 
  select(starts_with('assunto_nm'), vl_multa) %>% 
  gather(key, val, -vl_multa) %>% 
  filter(!is.na(val)) %>% 
  group_by(val) %>% 
  summarise(soma = sum(vl_multa)) %>% 
  arrange(desc(soma)) %>% 
  mutate(soma = scales::dollar(soma)) %>% 
  head(20) %>% 
  knitr::kable(booktabs = TRUE, 
               caption = 'Assuntos com maior valor de multas agregado (valores de multas em processos com mais de um assunto foram contados duas vezes)')
Table 2.4: Assuntos com maior valor de multas agregado (valores de multas em processos com mais de um assunto foram contados duas vezes)
val soma
Dano ao Erário $1,085,882,421
Violação aos Princípios Administrativos $645,980,937
Enriquecimento ilícito $381,834,999
DIREITO ADMINISTRATIVO E OUTRAS MATÉRIAS DE DIREITO PÚBLICO $250,957,269
Improbidade Administrativa $86,199,748
Atos Administrativos $20,165,343
Tráfico de Drogas e Condutas Afins $3,086,688
Organização Político-administrativa / Administração Pública $1,948,051
Agentes Políticos $1,765,245
Associação para a Produção e Tráfico e Condutas Afins $779,098
Estelionato Majorado $726,077
Crimes contra a Ordem Tributária $561,199
DIREITO ELEITORAL $541,688
Demissão ou Exoneração $371,697
Servidor Público Civil $327,811
Crimes Previstos na Legislação Extravagante $207,001
Impedimento, perturbação ou fraude de concorrência $197,875
Crimes de Tráfico Ilícito e Uso Indevido de Drogas $170,003
DIREITO PENAL $157,158
Falsidade ideológica $152,976

A Figura 2.2 mostra as UFs com maior soma de multas por habitante. Acre e Distrito Federal estão no topo com mais de 30 reais por habitante, seguidos por Rondônia e Maranhão, com mais de 10 reais por habitante.

data(pnud_uf, package = 'abjutils')
data(cadmun, package = 'abjutils')
cadmun %<>% distinct(cod, uf) %>% mutate_all(as.character)
pnud_uf %<>% filter(ano == 2010) %>% select(uf, popt) %>% 
  mutate(uf = as.character(uf)) %>% 
  inner_join(cadmun, c('uf' = 'cod')) %>% 
  select(id = uf.y, popt)
p <- tidy_cnc %>% 
  filter(teve_multa == 'sim', vl_multa < 1e9) %>% 
  mutate(id = uf) %>% 
  group_by(id) %>% 
  summarise(soma = sum(vl_multa)) %>% 
  inner_join(pnud_uf, 'id') %>%
  mutate(tx = soma / popt) %>% 
  mutate(tx = cut(tx, c(0, 1, 5, 10, 20, 30, max(tx)), dig.lab = 3,
                  ordered_result = TRUE)) %>% 
  inner_join(br_uf_map) %>% {
    ggplot(.) +
      geom_map(aes(x = long, y = lat, map_id = id, fill = tx),
               colour = 'gray30', size = .1, alpha = .8,
               map = ., data = .) +
      scale_fill_brewer(palette = 'PuRd') +
      coord_equal() +
      theme_void()
  }
p
Valor somado de multas por habitante em cada Unidade Federativa.

Figure 2.2: Valor somado de multas por habitante em cada Unidade Federativa.

A Tabela 2.5 mostra estatísticas descritivas dos valores das multas por esfera. Observe que a mediana da esfera estadual é menor que a da federal, mas a média é maior.

dol <- scales::dollar
tidy_cnc %>% 
  filter(teve_multa == 'sim', vl_multa < 1e9) %>% 
  group_by(esfera_processo) %>% 
  summarise(n = n(),
            media = mean(vl_multa), 
            mediana = median(vl_multa),
            soma = sum(vl_multa)) %>% 
  mutate_if(is_double, funs(dol(.))) %>% 
  knitr::kable(booktabs = TRUE, 
               caption = 'Estatísticas descritivas dos valores das multas por esfera do processo.')
Table 2.5: Estatísticas descritivas dos valores das multas por esfera do processo.
esfera_processo n media mediana soma
Estadual 8564 $187,187 $5,000 $1,603,070,960
Federal 3143 $65,470 $10,000 $205,771,556

2.2 Distribuição geográfica dos processos

Podemos identificar a comarca somente dos processos estaduais de primeiro grau. A Tabela 2.6 mostra as 30 comarcas com maior taxa de processos por 100 mil habitantes.

# data(cadmun, package = 'abjutils')
data(pnud_muni, package = 'abjutils')
pnud_muni %<>% 
  as_tibble() %>% 
  filter(ano == 2010) %>% 
  select(ufn, municipio, popt) %>% 
  mutate(municipio = toupper(abjutils::rm_accent(municipio)))

# pnud_muni %>% 
  # filter(stringr::str_detect(municipio, 'TRES RIOS'))

# a %>% 
#   count(tribunal, comarca_secao) %>% 
#   anti_join(pnud_muni, c('tribunal' = 'ufn', 'comarca_secao' = 'municipio')) %>% 
#   arrange(desc(n))

tr <- 'Tribunal de Justiça d[eo]|Estado d[eoa]|e dos Territórios'
tidy_cnc_coma <- tidy_cnc %>% 
  filter(esfera_processo == 'Estadual', instancia == '1 grau') %>%
  mutate(tribunal = stringr::str_replace_all(tribunal, tr, ''),
         tribunal = stringr::str_trim(tribunal),
         comarca_secao = toupper(abjutils::rm_accent(comarca_secao))) %>% 
  mutate(comarca_secao = with(., case_when(
    comarca_secao == 'CAPITAL' ~ 'RIO DE JANEIRO',
    comarca_secao == 'GAMA' ~ 'BRASILIA',
    comarca_secao == 'TRES RIOS/AREAL/LEVY GASPARIAN' ~ 'TRES RIOS',
    comarca_secao == 'CAMPO GRANDE' & tribunal == 'Rio Grande do Norte' ~ 'AUGUSTO SEVERO',
    comarca_secao == 'MOJI-MIRIM' ~ 'MOJI MIRIM',
    comarca_secao == 'SANTO ANTONIO DE PADUA/APERIBE' ~ 'SANTO ANTONIO DE PADUA',
    comarca_secao == 'ELDORADO PAULISTA' & tribunal == 'São Paulo' ~ 'ELDORADO',
    comarca_secao == 'CAMBUCI/SAO JOSE DE UBA' ~ 'CAMBUCI',
    comarca_secao == 'AREZ' ~ 'ARES',
    comarca_secao == 'NATIVIDADE/VARRE-SAI' ~ 'NATIVIDADE',
    comarca_secao == 'CARAPEBUS/QUISSAMA' ~ 'CARAPEBUS',
    comarca_secao == 'EMBU DAS ARTES' ~ 'EMBU',
    comarca_secao == 'NOVA IGUACU/MESQUITA' ~ 'NOVA IGUACU',
    comarca_secao == 'JABUTICATUBAS' ~ 'JABOTICATUBAS',
    comarca_secao == 'IPAUCU' ~ 'IPAUSSU',
    comarca_secao == 'NUCLEO BANDEIRANTE' ~ 'BRASILIA',
    comarca_secao == 'ITAPAJE' ~ 'ITAPAGE',
    comarca_secao == 'PORTO REAL / QUATIS' ~ 'PORTO REAL',
    comarca_secao == 'CEILANDIA' ~ 'BRASILIA',
    is.na(comarca_secao) ~ NA_character_,
    TRUE ~ comarca_secao
  ))) %>% 
  filter(!is.na(comarca_secao)) %>% 
  inner_join(pnud_muni, c('tribunal' = 'ufn', 'comarca_secao' = 'municipio')) %>% 
  distinct(arq_processo, .keep_all = TRUE) %>% 
  group_by(tribunal, comarca_secao) %>% 
  summarise(nprocs = n(), pop = first(popt)) 

tidy_cnc_coma %>% 
  ungroup() %>% 
  mutate(tx = nprocs / pop * 100000) %>%
  # filter(pop > 100000) %>% 
  arrange(desc(tx)) %>% 
  mutate(tx = round(tx, 2)) %>% 
  head(30) %>% 
  knitr::kable(booktabs = TRUE, 
               caption = '30 comarcas com maior taxa de processos por 100 mil habitantes.')
Table 2.6: 30 comarcas com maior taxa de processos por 100 mil habitantes.
tribunal comarca_secao nprocs pop tx
Minas Gerais SILVIANOPOLIS 52 5982 869.27
Minas Gerais JACINTO 79 11857 666.27
Amapá AMAPA 34 7784 436.79
São Paulo TEODORO SAMPAIO 88 21135 416.37
São Paulo QUATA 46 12684 362.66
Minas Gerais MANHUMIRIM 69 21194 325.56
Paraná PARANACITY 30 10220 293.54
São Paulo MIRANTE DO PARANAPANEMA 48 16718 287.12
Paraná MATELANDIA 44 15327 287.08
São Paulo PIRAPOZINHO 68 24559 276.88
Santa Catarina LAGUNA 138 51334 268.83
Minas Gerais BONFINOPOLIS DE MINAS 15 5716 262.42
Minas Gerais ANDRADAS 97 37150 261.10
Rondônia SANTA LUZIA D’OESTE 21 8674 242.10
Minas Gerais PATOS DE MINAS 329 137776 238.79
Minas Gerais IPATINGA 522 237968 219.36
Paraná XAMBRE 13 5952 218.41
São Paulo URANIA 19 8803 215.84
Paraná FORMOSA DO OESTE 16 7501 213.30
Paraná PEROLA 21 10125 207.41
Maranhão SAO FRANCISCO DO MARANHAO 23 11478 200.38
Paraná CRUZEIRO DO OESTE 40 20264 197.39
Rio Grande do Sul SAO VALENTIM 7 3601 194.39
São Paulo GENERAL SALGADO 20 10616 188.39
Paraná PARAISO DO NORTE 22 11703 187.99
Paraná JOAQUIM TAVORA 20 10665 187.53
Minas Gerais PIRAPETINGA 19 10331 183.91
São Paulo PIRAJUI 35 19560 178.94
Espírito Santo PRESIDENTE KENNEDY 17 10112 168.12
Minas Gerais AIURUOCA 10 6047 165.37

A Tabela 2.7 mostra as 30 comarcas com mais de 100 mil habitantes com as maiores taxas. Podemos notar uma grande concentração de comarcas do Paraná.

tidy_cnc_coma %>% 
  ungroup() %>% 
  mutate(tx = nprocs / pop * 100000) %>%
  # filter(pop > 100000) %>% 
  arrange(desc(tx)) %>% 
  mutate(tx = round(tx, 2)) %>% 
  filter(pop > 100000) %>% 
  head(30) %>% 
  knitr::kable(booktabs = TRUE, 
               caption = '30 comarcas com mais de 100 mil habitantes e maiores taxa de processos por 100 mil habitantes.')
Table 2.7: 30 comarcas com mais de 100 mil habitantes e maiores taxa de processos por 100 mil habitantes.
tribunal comarca_secao nprocs pop tx
Minas Gerais PATOS DE MINAS 329 137776 238.79
Minas Gerais IPATINGA 522 237968 219.36
Paraná FOZ DO IGUACU 268 254233 105.42
Paraná PONTA GROSSA 197 309586 63.63
Minas Gerais POUSO ALEGRE 78 129564 60.20
Paraná CURITIBA 1040 1740627 59.75
Paraná MARINGA 205 354512 57.83
Paraná CASCAVEL 151 281585 53.63
Paraná CAMPO LARGO 59 111600 52.87
Paraná ARAPONGAS 53 103925 51.00
Paraná GUARAPUAVA 84 165631 50.72
Paraná LONDRINA 251 503258 49.88
Paraná TOLEDO 57 118869 47.95
Paraná APUCARANA 49 120427 40.69
Paraná COLOMBO 66 212395 31.07
Paraná ARAUCARIA 36 118997 30.25
Paraná PARANAGUA 41 139774 29.33
Paraná SAO JOSE DOS PINHAIS 61 263146 23.18
Paraná ALMIRANTE TAMANDARE 23 102996 22.33
Rondônia PORTO VELHO 89 419354 21.22
São Paulo TATUI 22 106912 20.58
Minas Gerais TEOFILO OTONI 27 131628 20.51
São Paulo BIRIGUI 22 108239 20.33
Paraná PINHAIS 22 116153 18.94
São Paulo SAO CARLOS 37 220666 16.77
São Paulo JAU 21 130243 16.12
São Paulo PRESIDENTE PRUDENTE 32 205525 15.57
Maranhão PACO DO LUMIAR 16 103331 15.48
São Paulo CATANDUVA 14 112201 12.48
Minas Gerais CONSELHEIRO LAFAIETE 14 115971 12.07

A Tabela 2.8 mostra as duas comarcas com maior taxa de processos por 100 mil habitantes em cada estado.

tidy_cnc_coma %>% 
  ungroup() %>% 
  mutate(tx = nprocs / pop * 100000) %>%
  # filter(pop > 100000) %>% 
  arrange(desc(tx)) %>% 
  mutate(tx = round(tx, 2)) %>% 
  filter(nprocs >= 5) %>% 
  group_by(tribunal) %>% 
  slice(1:2) %>% 
  arrange(tribunal, desc(tx)) %>% 
  knitr::kable(booktabs = TRUE, 
               caption = 'Comarcas com maiores taxa de processos por 100 mil habitantes em cada estado (somente comarcas com 5 processos ou mais).')
Table 2.8: Comarcas com maiores taxa de processos por 100 mil habitantes em cada estado (somente comarcas com 5 processos ou mais).
tribunal comarca_secao nprocs pop tx
Acre CRUZEIRO DO SUL 15 73535 20.40
Acre TARAUACA 6 31613 18.98
Alagoas MACEIO 10 921284 1.09
Amapá AMAPA 34 7784 436.79
Amapá OIAPOQUE 23 17939 128.21
Ceará FRECHEIRINHA 5 12723 39.30
Ceará SABOEIRO 6 15504 38.70
Distrito Federal BRASILIA 104 2541714 4.09
Espírito Santo PRESIDENTE KENNEDY 17 10112 168.12
Espírito Santo APIACA 7 7443 94.05
Goiás VIANOPOLIS 11 12445 88.39
Goiás URUANA 9 13708 65.66
Maranhão SAO FRANCISCO DO MARANHAO 23 11478 200.38
Maranhão BACURI 19 15893 119.55
Mato Grosso ALTO ARAGUAIA 5 15416 32.43
Mato Grosso NOVA XAVANTINA 5 19358 25.83
Mato Grosso do Sul CHAPADAO DO SUL 16 19384 82.54
Mato Grosso do Sul DEODAPOLIS 5 12077 41.40
Minas Gerais SILVIANOPOLIS 52 5982 869.27
Minas Gerais JACINTO 79 11857 666.27
Pará SAO GERALDO DO ARAGUAIA 15 24339 61.63
Pará CURRALINHO 9 26525 33.93
Paraíba SERRARIA 5 6127 81.61
Paraíba SOLEDADE 7 13633 51.35
Paraná PARANACITY 30 10220 293.54
Paraná MATELANDIA 44 15327 287.08
Pernambuco IBIRAJUBA 5 7395 67.61
Rio de Janeiro ENGENHEIRO PAULO DE FRONTIN 5 13087 38.21
Rio de Janeiro CANTAGALO 6 19765 30.36
Rio Grande do Norte AUGUSTO SEVERO 13 9041 143.79
Rio Grande do Norte SAO JOAO DO SABUGI 5 5900 84.75
Rio Grande do Sul SAO VALENTIM 7 3601 194.39
Rio Grande do Sul HERVAL 10 6594 151.65
Rondônia SANTA LUZIA D’OESTE 21 8674 242.10
Rondônia CEREJEIRAS 27 16815 160.57
Santa Catarina LAGUNA 138 51334 268.83
Santa Catarina ITAIOPOLIS 29 19965 145.25
São Paulo TEODORO SAMPAIO 88 21135 416.37
São Paulo QUATA 46 12684 362.66
Sergipe LARANJEIRAS 13 26609 48.86
Sergipe GARARU 5 10849 46.09
Tocantins ARAPOEMA 7 6702 104.45
Tocantins ITAGUATINS 6 5751 104.33

  1. um percentil de \(x\)% é uma quantidade que faz com que \(x\)% das observações da amostra esteja abaixo desse valor.