Esta análise refere-se aos candidatos do pleito de 2022 que tiveram suas candidaturas cassadas. O link para acessar esta base de dados encontra aqui
Existem 2000 registros na base de dados de candidaturas cassadas e 12 variáveis, que são:
## [1] 2000 12
## [1] "DT_GERACAO" "HH_GERACAO" "ANO_ELEICAO"
## [4] "CD_TIPO_ELEICAO" "NM_TIPO_ELEICAO" "CD_ELEICAO"
## [7] "DS_ELEICAO" "SG_UF" "SG_UE"
## [10] "NM_UE" "SQ_CANDIDATO" "DS_MOTIVO_CASSACAO"
Como não possuíamos as informações sócio-econômicas, é necessário baixar a base de dados com as informações das candidaturas e realizar a união dessas duas bases de dados.
No total houveram 1.879 candidatos cassados. O maior número de cassações por candidato foi 3, e o menor 1.Esta base possui 28.274 candidaturas, com 71 variáveis. Entretanto quando realizamos a união das duas bases o número aumentou pois na base da cassação existem mais de um registro para o mesmo candidato, tendo em vista que é possível ser cassado por diferentes motivos, que aliás foram:
## base$DS_MOTIVO_CASSACAO :
## Frequency %(NA+) %(NA-)
## <NA> 26536 93.5 0.0
## Ausência de requisito de registro 1365 4.8 73.9
## Indeferimento de partido ou coligação. 304 1.1 16.5
## Ficha limpa (LC 64/90) 162 0.6 8.8
## Partido Invalidado 7 0.0 0.4
## Abuso de poder (LC 64/90) 6 0.0 0.3
## Gasto ilícito de recursos (Lei 9.504/97). 2 0.0 0.1
## Compra de voto (Lei 9.504/97). 1 0.0 0.1
## Conduta vedada (Lei 9.504/97). 1 0.0 0.1
## Total 28384 100.0 100.0
A maior parte dos candidatos não possuem motivo de cassação, pois foram aqueles que não tiveram suas candidaturas cassadas (n=26.536; 93,5%). Dessa forma, vamos primeiro dividir em microbase de dados por cada motivo
Após essa divisão realizamos uma contagem entre cada subconjunto por motivo de cassação para contar quantos candidatos foram cassados por um motivo específico e sua respectiva UF, cargo, gênero, escolaridade, partido, raça e nome. Para ficar mais fácil de consultar e ter fontes para entrevistas:
Desta forma, nós reorganizamos a base de dados para gerar um indicador se foi ou não cassado depois de reagrupar cada grupo. Perceba que a proporção de não cassados ainda é a mesma, pelo fato de serem poucas as possíveis repetições.
## analise$desfecho :
## Frequency Percent Cum. percent
## nao cassado 26510 93.5 93.5
## cassado 1847 6.5 100.0
## Total 28357 100.0 100.0
E existem estados que a proporção de cassados alcançou o valor mínimo de 1,2%, que foi o caso de Santa Catarina. Apesar da média de cassação por estado ter sido de 6,6%, existem estados que tiveram um percentual de cassação de pelo menos de 8,1% são eles: Alagoas, Amapá, Bahia, Ceará, Paraíba, Pernambuco, Piauí e São Paulo. Essas variações podem ser visualizadas no summary e gráfico abaixo:
## Min. 1st Qu. Median Mean 3rd Qu. Max.
## 1.200 4.700 6.600 6.559 8.100 11.600
## Min. 1st Qu. Median Mean 3rd Qu. Max.
## 0.000 4.550 7.450 6.450 8.375 12.800
## Min. 1st Qu. Median Mean 3rd Qu. Max.
## 5.70 6.25 6.80 37.50 53.40 100.00
## Min. 1st Qu. Median Mean 3rd Qu. Max.
## 4.70 7.10 8.50 19.76 10.80 100.00
## Min. 1st Qu. Median Mean 3rd Qu. Max.
## 0.200 3.275 4.900 8.412 8.950 68.600
## Min. 1st Qu. Median Mean 3rd Qu. Max.
## 3.30 6.20 7.40 19.76 7.60 100.00
Quando temos muitas variáveis com diferentes categorias entre si, podemos fazer uma anaálise para calcular quais variáveis possuem mais associação com a contagem/predição de ser cassado. Para tanto, precisaremos excluir da base, os candidatos que possuem informações como “não informado” ou “não divulgado”, pois computacionalnamente isso é entendido como uma categoria de associação Sendo assim, foram excluídas: 24 linhas que possuíam BR como estado, que são os candidatos a presidência e vice - presidência que não tinham também nenhum registro de ser cassado. Houve uma redução de 188 linhas.
analise <- subset(analise, uf!="BR")
13 linhas que possuíam “não divulgável” no gênero
analise <- subset(analise, genero!="NÃO DIVULGÁVEL")
151 linhas que possuíam “não informado” na raça
analise <- subset(analise, raça!="NÃO INFORMADO")
A base para análise de risco ficou com 28169 registros. Desses 28.169 candidatos, 26.340 não foram cassados, uma proporção de 93,5%
##
## nao cassado cassado
## 26340 1829
##
## nao cassado cassado
## 93.5 6.5
A proporção dos motivos da cassação, entre aqueles que a possuI, foi de 4,8% para a “ausência de requisito de registro”, seguido de “indeferimento de partido ou coligação” com 1,1% e “ficha limpa” com 0,6%.
## analise$motivo :
## Frequency %(NA+) %(NA-)
## <NA> 26340 93.5 0.0
## Ausência de requisito de registro 1353 4.8 74.0
## Indeferimento de partido ou coligação. 298 1.1 16.3
## Ficha limpa (LC 64/90) 162 0.6 8.9
## Abuso de poder (LC 64/90) 6 0.0 0.3
## Partido Invalidado 6 0.0 0.3
## Gasto ilícito de recursos (Lei 9.504/97). 2 0.0 0.1
## Compra de voto (Lei 9.504/97). 1 0.0 0.1
## Conduta vedada (Lei 9.504/97). 1 0.0 0.1
## Total 28169 100.0 100.0
Para a análise de risco, a última alteração necessária foi classificar os estados por região, pois esta variável possuía muitos extratos e, isso prejudicaria o modelo matemático
##
## Row percent
## analise$desfecho
## analise$regiao nao cassado cassado Total
## CENTRO OESTE 2917 187 3104
## (94) (6) (100)
## NORDESTE 6701 625 7326
## (91.5) (8.5) (100)
## NORTE 4079 293 4372
## (93.3) (6.7) (100)
## SUDESTE 8881 606 9487
## (93.6) (6.4) (100)
## SUL 3762 118 3880
## (97) (3) (100)
Da mesma forma que fizemos uma redução de categorias para os estados, os partidos tambem podem ser classificados entre esquerda e direita para facilitar:
##
## Row percent
## analise$desfecho
## analise$posicao nao cassado cassado Total
## CENTRO 5222 371 5593
## (93.4) (6.6) (100)
## DIREITA 14678 1115 15793
## (92.9) (7.1) (100)
## ESQUERDA 4995 290 5285
## (94.5) (5.5) (100)
Em uma ordem decrescente do mais associado para o menos temos a escolaridade, o cargo, a região, a raça, posição e gênero
Se olharmos visualmente como está distribuído o desfecho entre cada variável teremos
Entre os candidatos cassados há uma maior proporção significante naqueles com ensino fundamental incompleto (+2,5%), fundamental completo (+2,8%) e principalmente com ensino médio completo (+10,9%) quando comparados com os candidatos não cassados:
##
## Row percent
## analise$escolaridade
## analise$desfecho ENSINO FUNDAMENTAL COMPLETO ENSINO FUNDAMENTAL INCOMPLETO
## nao cassado 1158 626
## (4.4) (2.4)
## cassado 132 90
## (7.2) (4.9)
## analise$escolaridade
## analise$desfecho ENSINO MÉDIO COMPLETO ENSINO MÉDIO INCOMPLETO LÊ E ESCREVE
## nao cassado 6511 635 194
## (24.7) (2.4) (0.7)
## cassado 652 51 17
## (35.6) (2.8) (0.9)
## analise$escolaridade
## analise$desfecho SUPERIOR COMPLETO SUPERIOR INCOMPLETO Total
## nao cassado 14767 2449 26340
## (56.1) (9.3) (100)
## cassado 726 161 1829
## (39.7) (8.8) (100)
Já entre os cargos as diferenças proporcionais são mais sutis. A única diferença mais significativa é entre os candidatos para o cargo de deputado federal aonde os cassados foram 2,3% a mais do que os não cassados
##
## Row percent
## analise$cargo
## analise$desfecho 1º SUPLENTE 2º SUPLENTE DEPUTADO DISTRITAL
## nao cassado 211 217 550
## (0.8) (0.8) (2.1)
## cassado 29 22 24
## (1.6) (1.2) (1.3)
## analise$cargo
## analise$desfecho DEPUTADO ESTADUAL DEPUTADO FEDERAL GOVERNADOR SENADOR
## nao cassado 15208 9520 209 218
## (57.7) (36.1) (0.8) (0.8)
## cassado 998 702 19 17
## (54.6) (38.4) (1) (0.9)
## analise$cargo
## analise$desfecho VICE-GOVERNADOR Total
## nao cassado 207 26340
## (0.8) (100)
## cassado 18 1829
## (1) (100)
Já pelas regiões, a região Nordeste apresenta uma proporção maior entre os candidatos que foram cassados, com 8,8% a mais do ocorrido.
##
## Row percent
## analise$regiao
## analise$desfecho CENTRO OESTE NORDESTE NORTE SUDESTE SUL Total
## nao cassado 2917 6701 4079 8881 3762 26340
## (11.1) (25.4) (15.5) (33.7) (14.3) (100)
## cassado 187 625 293 606 118 1829
## (10.2) (34.2) (16) (33.1) (6.5) (100)
Pelas raças, a que apresentou maior diferença proporcional entre cassados e não foi a parda com +6% e a preta com +2,8%
##
## Row percent
## analise$raça
## analise$desfecho AMARELA BRANCA INDÍGENA PARDA PRETA Total
## nao cassado 106 13083 161 9352 3638 26340
## (0.4) (49.7) (0.6) (35.5) (13.8) (100)
## cassado 8 746 13 759 303 1829
## (0.4) (40.8) (0.7) (41.5) (16.6) (100)
Pela posição do partido, o que apresentou maior proporção entre os cassados foram os partidos de direita com +2,7%
##
## Row percent
## analise$posicao
## analise$desfecho CENTRO DIREITA ESQUERDA Total
## nao cassado 5222 14678 4995 24895
## (21) (59) (20.1) (100)
## cassado 371 1115 290 1776
## (20.9) (62.8) (16.3) (100)
E pelo gênero há uma maior proporção de candidatos cassados entre os masculinos do que nos femininos, com +4,1%
##
## Row percent
## analise$genero
## analise$desfecho FEMININO MASCULINO Total
## nao cassado 8827 17513 26340
## (33.5) (66.5) (100)
## cassado 537 1292 1829
## (29.4) (70.6) (100)
A seguir selecionamos os candidatos que se encaixariam nas piores categorias de proporção de cassação, a saber: Ter o ensino médio completo, concorrer a deputado federal, ser do nordeste, de um partido de direita, do gênero masculino, e de raça/cor parda TENDO SIDO CASSADO