Esta análise refere-se aos candidatos do pleito de 2022 que tiveram suas candidaturas cassadas. O link para acessar esta base de dados encontra aqui

Base cassados

Existem 2000 registros na base de dados de candidaturas cassadas e 12 variáveis, que são:

## [1] 2000   12
##  [1] "DT_GERACAO"         "HH_GERACAO"         "ANO_ELEICAO"       
##  [4] "CD_TIPO_ELEICAO"    "NM_TIPO_ELEICAO"    "CD_ELEICAO"        
##  [7] "DS_ELEICAO"         "SG_UF"              "SG_UE"             
## [10] "NM_UE"              "SQ_CANDIDATO"       "DS_MOTIVO_CASSACAO"

Como não possuíamos as informações sócio-econômicas, é necessário baixar a base de dados com as informações das candidaturas e realizar a união dessas duas bases de dados.

No total houveram 1.879 candidatos cassados. O maior número de cassações por candidato foi 3, e o menor 1.

Base candidaturas

Esta base possui 28.274 candidaturas, com 71 variáveis. Entretanto quando realizamos a união das duas bases o número aumentou pois na base da cassação existem mais de um registro para o mesmo candidato, tendo em vista que é possível ser cassado por diferentes motivos, que aliás foram:

## base$DS_MOTIVO_CASSACAO : 
##                                           Frequency   %(NA+)   %(NA-)
## <NA>                                          26536     93.5      0.0
## Ausência de requisito de registro              1365      4.8     73.9
## Indeferimento de partido ou coligação.          304      1.1     16.5
## Ficha limpa (LC 64/90)                          162      0.6      8.8
## Partido Invalidado                                7      0.0      0.4
## Abuso de poder (LC 64/90)                         6      0.0      0.3
## Gasto ilícito de recursos (Lei 9.504/97).         2      0.0      0.1
## Compra de voto (Lei 9.504/97).                    1      0.0      0.1
## Conduta vedada (Lei 9.504/97).                    1      0.0      0.1
##   Total                                       28384    100.0    100.0

A maior parte dos candidatos não possuem motivo de cassação, pois foram aqueles que não tiveram suas candidaturas cassadas (n=26.536; 93,5%). Dessa forma, vamos primeiro dividir em microbase de dados por cada motivo

Após essa divisão realizamos uma contagem entre cada subconjunto por motivo de cassação para contar quantos candidatos foram cassados por um motivo específico e sua respectiva UF, cargo, gênero, escolaridade, partido, raça e nome. Para ficar mais fácil de consultar e ter fontes para entrevistas:

Cassados por abuso de poder

Cassados por ausência de registro

Cassados por compra de voto

Cassados por conduta vedada

Cassados por ficha limpa

Cassados por gasto ilícito

Cassados por indeferimento do partido

Cassados por partido inválido

Cassados e não cassados

Desta forma, nós reorganizamos a base de dados para gerar um indicador se foi ou não cassado depois de reagrupar cada grupo. Perceba que a proporção de não cassados ainda é a mesma, pelo fato de serem poucas as possíveis repetições.

## analise$desfecho : 
##             Frequency Percent Cum. percent
## nao cassado     26510    93.5         93.5
## cassado          1847     6.5        100.0
##   Total         28357   100.0        100.0

Cassados por UF

Fizemos uma tabela contando a quantidade bruta de candidaturas cassadas em cada UF e suas proporções:

E existem estados que a proporção de cassados alcançou o valor mínimo de 1,2%, que foi o caso de Santa Catarina. Apesar da média de cassação por estado ter sido de 6,6%, existem estados que tiveram um percentual de cassação de pelo menos de 8,1% são eles: Alagoas, Amapá, Bahia, Ceará, Paraíba, Pernambuco, Piauí e São Paulo. Essas variações podem ser visualizadas no summary e gráfico abaixo:

##    Min. 1st Qu.  Median    Mean 3rd Qu.    Max. 
##   1.200   4.700   6.600   6.559   8.100  11.600
## Cassados por cargo Existem cargos que a proporção de cassado alcançou o valor mínimo de 0%, foram eles presidente, e vice-presidente. Apesar da média de cassação por cargo ter sido de 6,5%, existem cargos que tiveram um percentual de cassaação de pelo menos 8,4% são eles: 1ºsuplente, 2ºsuplente, governador e vice-governador
##    Min. 1st Qu.  Median    Mean 3rd Qu.    Max. 
##   0.000   4.550   7.450   6.450   8.375  12.800
## Cassados por gênero Os candidatos do gênero não divulgável tiveram 100% de cassacao, o o que pode refletir a não divulgação de dados. Entretanto entre os gêneros divulgados, os masculinos tiveram 1,1% a mais de candidatos cassados.
##    Min. 1st Qu.  Median    Mean 3rd Qu.    Max. 
##    5.70    6.25    6.80   37.50   53.40  100.00

Cassados por escolaridade

Candidatos de escolaridade não divulgável tiveram 100% de cassacao, o o que pode refletir a não divulgação de dados. Entretanto, entre as escolaridades divulgadas, os candidatos com ensino superior completo tiveram a menor proporção de 4,7%. Enquanto os candidatos com ensino fundamental incompleto tiveram a maior proporção de 12,6%
##    Min. 1st Qu.  Median    Mean 3rd Qu.    Max. 
##    4.70    7.10    8.50   19.76   10.80  100.00

Cassados por partidos

A média de cassação por partido foi de 8,4%, porém os candidatos do NOVO tiveram a menor proporção de 0,2. Enquanto os candidatos do PCO tiveram a maior proporção sendo de 68,6%.
##    Min. 1st Qu.  Median    Mean 3rd Qu.    Max. 
##   0.200   3.275   4.900   8.412   8.950  68.600

Cassados por raça

A média de cassação por raça foi de 19,8%, porém esse número é puxado pra cima pela proporção de 100% dos não divulgáveis, dessa forma é melhor trabalhar com a mediana, que significa que 50% das raças tiveram proporção de cassação de até 7,4. Os candidatos raça não informado tiveram a menor proporção de 3,3% seguidos pelos candidatos brancos com 5,4%. Já os candidatos pretos apresentaram a maior proporção de cassação com 7,7%
##    Min. 1st Qu.  Median    Mean 3rd Qu.    Max. 
##    3.30    6.20    7.40   19.76    7.60  100.00

Análise de risco para ser cassado

Quando temos muitas variáveis com diferentes categorias entre si, podemos fazer uma anaálise para calcular quais variáveis possuem mais associação com a contagem/predição de ser cassado. Para tanto, precisaremos excluir da base, os candidatos que possuem informações como “não informado” ou “não divulgado”, pois computacionalnamente isso é entendido como uma categoria de associação Sendo assim, foram excluídas: 24 linhas que possuíam BR como estado, que são os candidatos a presidência e vice - presidência que não tinham também nenhum registro de ser cassado. Houve uma redução de 188 linhas.

analise <- subset(analise, uf!="BR")

13 linhas que possuíam “não divulgável” no gênero

analise <- subset(analise, genero!="NÃO DIVULGÁVEL")

151 linhas que possuíam “não informado” na raça

analise <- subset(analise, raça!="NÃO INFORMADO")

A base para análise de risco ficou com 28169 registros. Desses 28.169 candidatos, 26.340 não foram cassados, uma proporção de 93,5%

## 
## nao cassado     cassado 
##       26340        1829
## 
## nao cassado     cassado 
##        93.5         6.5

A proporção dos motivos da cassação, entre aqueles que a possuI, foi de 4,8% para a “ausência de requisito de registro”, seguido de “indeferimento de partido ou coligação” com 1,1% e “ficha limpa” com 0,6%.

## analise$motivo : 
##                                           Frequency   %(NA+)   %(NA-)
## <NA>                                          26340     93.5      0.0
## Ausência de requisito de registro              1353      4.8     74.0
## Indeferimento de partido ou coligação.          298      1.1     16.3
## Ficha limpa (LC 64/90)                          162      0.6      8.9
## Abuso de poder (LC 64/90)                         6      0.0      0.3
## Partido Invalidado                                6      0.0      0.3
## Gasto ilícito de recursos (Lei 9.504/97).         2      0.0      0.1
## Compra de voto (Lei 9.504/97).                    1      0.0      0.1
## Conduta vedada (Lei 9.504/97).                    1      0.0      0.1
##   Total                                       28169    100.0    100.0

Para a análise de risco, a última alteração necessária foi classificar os estados por região, pois esta variável possuía muitos extratos e, isso prejudicaria o modelo matemático

## 
## Row percent 
##               analise$desfecho
## analise$regiao  nao cassado  cassado  Total
##   CENTRO OESTE         2917      187   3104
##                        (94)      (6)  (100)
##   NORDESTE             6701      625   7326
##                      (91.5)    (8.5)  (100)
##   NORTE                4079      293   4372
##                      (93.3)    (6.7)  (100)
##   SUDESTE              8881      606   9487
##                      (93.6)    (6.4)  (100)
##   SUL                  3762      118   3880
##                        (97)      (3)  (100)

Da mesma forma que fizemos uma redução de categorias para os estados, os partidos tambem podem ser classificados entre esquerda e direita para facilitar:

## 
## Row percent 
##                analise$desfecho
## analise$posicao  nao cassado  cassado  Total
##        CENTRO           5222      371   5593
##                       (93.4)    (6.6)  (100)
##        DIREITA         14678     1115  15793
##                       (92.9)    (7.1)  (100)
##        ESQUERDA         4995      290   5285
##                       (94.5)    (5.5)  (100)

Em uma ordem decrescente do mais associado para o menos temos a escolaridade, o cargo, a região, a raça, posição e gênero

Se olharmos visualmente como está distribuído o desfecho entre cada variável teremos

Entre os candidatos cassados há uma maior proporção significante naqueles com ensino fundamental incompleto (+2,5%), fundamental completo (+2,8%) e principalmente com ensino médio completo (+10,9%) quando comparados com os candidatos não cassados:

## 
## Row percent 
##                 analise$escolaridade
## analise$desfecho  ENSINO FUNDAMENTAL COMPLETO  ENSINO FUNDAMENTAL INCOMPLETO
##      nao cassado                         1158                            626
##                                         (4.4)                          (2.4)
##      cassado                              132                             90
##                                         (7.2)                          (4.9)
##                 analise$escolaridade
## analise$desfecho  ENSINO MÉDIO COMPLETO  ENSINO MÉDIO INCOMPLETO  LÊ E ESCREVE
##      nao cassado                   6511                      635           194
##                                  (24.7)                    (2.4)         (0.7)
##      cassado                        652                       51            17
##                                  (35.6)                    (2.8)         (0.9)
##                 analise$escolaridade
## analise$desfecho  SUPERIOR COMPLETO  SUPERIOR INCOMPLETO  Total
##      nao cassado              14767                 2449  26340
##                              (56.1)                (9.3)  (100)
##      cassado                    726                  161   1829
##                              (39.7)                (8.8)  (100)

Já entre os cargos as diferenças proporcionais são mais sutis. A única diferença mais significativa é entre os candidatos para o cargo de deputado federal aonde os cassados foram 2,3% a mais do que os não cassados

## 
## Row percent 
##                 analise$cargo
## analise$desfecho  1º SUPLENTE  2º SUPLENTE  DEPUTADO DISTRITAL
##      nao cassado          211          217                 550
##                         (0.8)        (0.8)               (2.1)
##      cassado               29           22                  24
##                         (1.6)        (1.2)               (1.3)
##                 analise$cargo
## analise$desfecho  DEPUTADO ESTADUAL  DEPUTADO FEDERAL  GOVERNADOR  SENADOR
##      nao cassado              15208              9520         209      218
##                              (57.7)            (36.1)       (0.8)    (0.8)
##      cassado                    998               702          19       17
##                              (54.6)            (38.4)         (1)    (0.9)
##                 analise$cargo
## analise$desfecho  VICE-GOVERNADOR  Total
##      nao cassado              207  26340
##                             (0.8)  (100)
##      cassado                   18   1829
##                               (1)  (100)

Já pelas regiões, a região Nordeste apresenta uma proporção maior entre os candidatos que foram cassados, com 8,8% a mais do ocorrido.

## 
## Row percent 
##                 analise$regiao
## analise$desfecho  CENTRO OESTE  NORDESTE   NORTE  SUDESTE     SUL  Total
##      nao cassado          2917      6701    4079     8881    3762  26340
##                         (11.1)    (25.4)  (15.5)   (33.7)  (14.3)  (100)
##      cassado               187       625     293      606     118   1829
##                         (10.2)    (34.2)    (16)   (33.1)   (6.5)  (100)

Pelas raças, a que apresentou maior diferença proporcional entre cassados e não foi a parda com +6% e a preta com +2,8%

## 
## Row percent 
##                 analise$raça
## analise$desfecho  AMARELA  BRANCA  INDÍGENA   PARDA   PRETA  Total
##      nao cassado      106   13083       161    9352    3638  26340
##                     (0.4)  (49.7)     (0.6)  (35.5)  (13.8)  (100)
##      cassado            8     746        13     759     303   1829
##                     (0.4)  (40.8)     (0.7)  (41.5)  (16.6)  (100)

Pela posição do partido, o que apresentou maior proporção entre os cassados foram os partidos de direita com +2,7%

## 
## Row percent 
##                 analise$posicao
## analise$desfecho  CENTRO  DIREITA  ESQUERDA  Total
##      nao cassado    5222    14678      4995  24895
##                     (21)     (59)    (20.1)  (100)
##      cassado         371     1115       290   1776
##                   (20.9)   (62.8)    (16.3)  (100)

E pelo gênero há uma maior proporção de candidatos cassados entre os masculinos do que nos femininos, com +4,1%

## 
## Row percent 
##                 analise$genero
## analise$desfecho  FEMININO  MASCULINO  Total
##      nao cassado      8827      17513  26340
##                     (33.5)     (66.5)  (100)
##      cassado           537       1292   1829
##                     (29.4)     (70.6)  (100)

A seguir selecionamos os candidatos que se encaixariam nas piores categorias de proporção de cassação, a saber: Ter o ensino médio completo, concorrer a deputado federal, ser do nordeste, de um partido de direita, do gênero masculino, e de raça/cor parda TENDO SIDO CASSADO