| Ano | Eleitores aptos | Eleitores com biometria | % com biometria |
|---|---|---|---|
| 2018 | 32.738.608 | 14.762.947 | 45,09% |
| 2022 | 34.682.973 | 23.269.771 | 67,09% |
Introdução
No dia 4 de outubro de 2026, cerca de 155 milhões de eleitoras e eleitores aptos a votar no Brasil e no exterior, de acordo com dados de setembro de 2025, deverão comparecer às urnas para escolher os representantes a presidente e vice-presidente da República, a governadores e vice-governadores dos estados e do Distrito Federal, além de deputados federais e estaduais ou distritais e dois senadores por unidade da Federação [@tse2025].
Em São Paulo, maior colégio eleitoral do país, 33.422.502 eleitores estarão aptos para votar em candidatos que concorrerão aos 6 cargos supracitados. Esses eleitores estão distribuídos nos 11.047 locais de votação e 103.303 seções eleitorais em todo o estado, perfazendo as 393 zonas eleitorais [@tresp2025].
Diante da dimensão de uma eleição, os preparativos para cada pleito continuam mesmo em anos não-eleitorais, com o objetivo de avaliar eleições anteriores e com base nessas análises propor melhorias para a logística das próximas eleições. A relevância desse trabalho consiste, principalmente, em garantir ao eleitor o cumprimento do seu papel como cidadão e o exercício da democracia, e por outro lado que a escolha dos representantes por parte dos eleitores ocorra de forma pacífica e sem intercorrências [@tresp2025].
Um dos desafios na elaboração da logística das eleições e que gera impactos negativos aos eleitores é a formação de longas filas de espera nas seções eleitorais. A formação de filas nos locais de votação é um fenômeno que está associado a uma série de fatores, compreendendo desde a dinâmica das chegadas dos eleitores aos respectivos locais de votação, o tempo de votação dos eleitores, bem como o tamanho das seções eleitorais e o perfil do seu eleitorado.
Após o fechamento do cadastro eleitoral são realizados cálculos do eleitorado por urna ou seção, isto é, a Justiça Eleitoral define a quantidade de urnas a serem utilizadas nas eleições gerais [@tresp2025]. Embora o Código Eleitoral (Lei nº 4.737/1965) em seu art. 117 preveja um limite de 400 eleitores nas seções eleitorais, determinar o tamanho da seção baseado em estudos que levem em conta informações do contexto local de cada estado e a dinâmica da votação, são imprescindíveis para uma logística mais assertiva.
A investigação dos dados de tempo de votação dos pleitos anteriores pode evidenciar padrões relacionados a dinâmica de votação nas seções eleitorais. Isso pode sugerir insights para elaboração da logística das próximas eleições, de forma a otimizar o tempo de votação e consequentemente reduzir o tempo de espera nas filas. Nessa perspectiva, o presente estudo tem como objetivo realizar uma análise dos dados do tempo de votação do pleito de 2018 e 2022 com vistas a estimação do número de eleitores a serem alocados nas seções eleitorais do estado de São Paulo para o pleito de 2026.
Metodologia
Nesta seção são apresentados alguns aspectos metodológicos das abordagens utilizadas para estimação do número de eleitores aptos por seção eleitoral. Nesse sentido, são descritos de forma sucinta o modelo de calibração, análise da curva ROC e a árvore de decisão, métodos usados no presente estudo.
Modelo de calibração
O modelo de calibração possui aplicações práticas em diversas área do conhecimento. Na engenharia e na física, por exemplo, os modelos de calibração são usados para aferição de instrumentos de medição de grandezas físicas. Já na medicina, esses métodos são utilizados para calibrar instrumentos que são indicadores de saúde pública. Outras áreas de destaque de aplicação dessa classe de modelos é a biologia e a química no estudo de composição de materiais e concentração de substâncias, respectivamente [@Ramos1987; @cavalcante2013].
Para o modelo de calibração clássico, o processo de modelagem é baseado tipicamente em dois estágios. No primeiro, denominado de processo de calibração, são amostradas \(n\) pares de observações \((y_1, x_1), \ldots, (y_n, x_n)\). No segundo estágio, isto é, no experimento de calibração, observa-se \(k\) observações da variável de interesse \(y\), \((y_{01}, \ldots, y_{0k})\), associadas a uma quantidade desconhecida \(x_0\). Dessa forma, o interesse principal de aplicação do modelo de calibração reside em estimar \(x_0\).
Assumindo que a relação entre a variável de interesse \(y\) e a variável explicativa \(x\) é linear, temos o modelo de calibração usual, cujas as equações referentes ao processo de calibração e ao experimento de calibração, respectivamente, são dadas por
\[ y_{i} = \alpha + \beta x_i + \epsilon_{i}, \quad i = 1, \dots, n, \tag{1}\]
\[ y_{0i} = \alpha + \beta x_0 + \epsilon_{i}, \quad i = n + 1, \dots, n + k. \tag{2}\]
Os parâmetros do modelo de calibração são estimados, sob certas suposições, pelo método dos mínimos quadrados. Em particular, pode-se provar, que o estimador para o valor de \(x_0\), no caso em que \(k = 1\) é dado por
\[ x_0 = \frac{y_{0} - \hat{\alpha}}{\hat{\beta}} \tag{3}\]
em que \(\hat{\alpha}\) e \(\hat{\beta}\) são os valores estimados dos parâmetros da regressão entre \(y\) e \(x\).
Método da Curva característica do receptor (curva ROC)
A curva ROC (“Receiver Operating Characteristic”), em português, Curva característica do receptor, é um mapeamento das taxas de verdadeiros positivos (TPF = sensibilidade) e as taxas de falsos positivos (FPF = 1 − especificidade) para todos os valores possíveis do ponto de corte que tenta prever um desfecho binário. Cada ponto da curva corresponde a um ponto de corte de tal modo que, ao mover o corte, ganha-se em sensibilidade e perde-se em especificidade, ou vice-versa [@unal2017cutpoint].
De acordo com Gonçalves et al. [-@goncalves2014roc], a análise da curva ROC foi pioneiramente utilizada na segunda guerra mundial quando a capacidade dos operadores de radar (receptores) foi testada para determinar se um sinal na tela do radar representava um objeto ou ruído. Contudo, devido a sua utilidade, passou rapidamente a ser usada em outras áreas, dentre as quais a área de saúde, para avaliação e obtenção de testes diagnósticos em situações em que o uso de testes padrão ouro são custosos ou inexistentes. Outra grande área em que a curva ROC é utilizada é na avaliação da perfomance de métodos de aprendizado de máquina para classificação, como por exemplo, modelos de regressão logística, árvore de decisão e máquinas de vetores de suporte [@bradley1997auc].
Para medir a capacidade diagnóstica de um teste, é comum usar medidas resumidas. Conforme Zhou et al. [-@zhou2011diagnostic], a área sob a curva ROC (AUC) e/ou a área parcial sob a curva ROC (pAUC) são consideradas índices da capacidade discriminatória global de um teste. Um teste com AUC = 1 discrimina indivíduos perfeitamente como doentes ou saudáveis, por exemplo. Enquanto isso, um teste com uma AUC de 0,5 é equivalente a lançar uma moeda - um teste não informativo [@zweig1993rocplots].
A escolha de um valor de corte apropriado é de suma importância para usar um teste de forma eficaz. Embora os valores de AUC, sensibilidade e especificidade sejam úteis na avaliação de um teste, eles não especificam pontos de corte “ótimos” diretamente. Na literatura, há diversas abordagens que usam sensibilidade e especificidade para seleção de pontos de corte [@unal2017cutpoint].
Um dos métodos amplamente usados na literatura é baseado no índice \(J\), proposto por Youden [-@youden1950index] e que considera tanto sensibilidade quanto especificidade para definir o valor “ótimo”. Este método define o ponto de corte ótimo como o ponto que maximiza a função de Youden, isto é, que maximiza
\[ J(c) = Se(c) + (1 - Sp(c)) \]
sobre todos os pontos de corte \(c\); \(\hat{c}_j\) denota o ponto de corte correspondente a \(J\). Quando o valor de \(J\) é máximo, \(\hat{c}_j\) é o valor de corte “ótimo” e corresponde a um ponto na curva ROC com a maior distância vertical da linha diagonal de 45° (o ROC de um teste não informativo).
Árvore de decisão
Nesta seção, introduzimos brevemente o conceito e as principais características da árvore de decisão. Trata-se de um método não paramétrico, com o objetivo de realizar predições para uma variável de interesse (resposta), a partir de um conjunto de variáveis subjacentes (explicativas), a partir do particionamento do espaço de valores das variáveis explicativas através de um critério pré estabelecido.
Uma vez que a construção da árvore é baseada na identificação de variáveis com potencial para explicar a variável de interesse, isso indica que ela fornece evidências de quais dessas variáveis são importantes, realizando uma seleção automática, além de indicar qual a ordem de importância, já que variáveis no topo da árvore possuem maior relevância [@izbicki2020ml].
A árvore de decisão possui grande aplicabilidade prática em diversas áreas do conhecimento, tanto por sua facilidade de implementação e baixo custo computacional, quanto pela simplicidade de interpretação dos resultados.
A maioria das aplicações práticas da árvore de decisão consiste na estimação de funções de predição. Contudo, é possível usar esses métodos também para realizar análise exploratória de dados, permitindo extrair insights sobre a relação e importância das variáveis.
Vários estudos têm usado a árvore de decisão como uma estratégia para identificar pontos de cortes ótimos para variáveis de interesse. Por exemplo, Costa et al. [-@costa2022alzheimer] propõem o uso desse método para identificação de Alzheimer com base em biomarcadores do liquido cerebroespinal. Já Fiorenzato et al. [-@fiorenzato2024parkinson] usam estratégias para identificação da doença de Parkinson usando pontos de corte em relação ao Mini-Mental State Examination e Montreal Cognitive Assessment, que são instrumentos usados para triagem cognitiva.
De maneira formal, a árvore de regressão cria partições das variáveis explicativas em regiões distintas e disjuntas \(R_{1}, \ldots, R_{j}\). Para prever o valor da variável resposta \(Y\) para uma observação com variáveis explicativas \(x \in R_k\), considera-se a média das variáveis respostas correspondentes a essa mesma região, isto é,
\[ g(x) = \frac{1}{|\{i: x_i \in R_k\}|}\sum_{i: x_i \in R_k}y_i. \] Para avaliar quão razoável uma árvore \(T\) é, avaliamos o seu erro quadrático médio
\[ \mathcal{P}(T) = \sum_{R}\sum_{i:x_i \in R}\frac{(y_i - \hat{y}_R)^2}{n}, \] em que \(\hat{Y}_R\) é valor predito para a resposta de uma observação pertencente a região \(R\). Um critério para obteção de uma árvore de regressão seria encontrar \(T\) que minimizasse \(\mathcal{P}(T)\), o que é computacionalmente inviável. Nesse sentido, utiliza-se uma heurística que consiste em divisões binárias recursivas, de modo a encontrar árvores de regressão com baixo erro de predição. Para mais detalhes ver [@james2021isl].
Resultados
Nesta seção são apresentados os principais resultados dos métodos descritos anteriormente para estimação do número de eleitores aptos por seão para o pleito de 2026, com base nos dados das eleições de 2018. Como a interpretação dos resultados e as discussões da aplicação do modelo de calibração, análise da curva ROC e árvore de decisão são análogas, os resultados para o pleito de 2022 são apresentados no apêndice. Inicialmente é apresentada uma análise exploratória de dados. Em seguida, são discutidos os resultados da aplicação dos métodos supracitados.
Resultados da análise exploratória de dados
Nesta seção são apresentados resultados da análise exploratória de dados realizada para avaliar características gerais das eleições de 2018 e 2022 em relação ao tamanho das seções eleitorais e ao tempo de votação dos eleitores. Os resultados foram sumarizados através de medidas descritivas de posição e dispersão e também por meio de recursos de visualização de dados.
Na Tabela 1 são sumarizados dados gerais das eleições de 2018 e 2022. O número de eleitores aptos nos pleitos foram de 32.738.608 e 34.682.973, respectivamente. Já o percentual de eleitores com biometria foram de 45,09% em 2018 e 67,09% em 2022. Dessa forma, nota-se um percentual expressivamente maior de eleitores com biometria em 2022.
A Figura 1 apresenta as estimativas das densidades do número de eleitores aptos para os pleitos de 2018 e 2022 dentro das seções que fizeram uso ou não da identificação biométrica. Nota-se, para ambos os pleitos , uma concentração de seções com número de eleitores aptos superior a 300 nas seções com 100% de identificação biométrica e cerca de 350 nas demais. Ainda, há um número expressivo de seções com mais de 400 eleitores. Esse fato pode estar associado as agregações que são realizadas durante a eleição.
Na Tabela 4 são apresentadas, de forma complementar, algumas medidas descritivas para o eleitorado apto na votação com identificação 100% biométrica para ambas as eleições. O tamanho médio das seções em 2022 foi superior aquele observado no pleito de 2018, cujos valores foram de aproximadamente 304 e 334 eleitores, respectivamente. Ainda, o valor mediano para o pleito de 2022 foi de 341, indicando que 50% das seções eleitorais tinham número de eleitores aptos superior a esse valor. O valor mediano para a eleição de 2018 foi de 311.
| Ano | Nº seções | Média | Mediana | Desvio padrão | Máximo | Mínimo |
|---|---|---|---|---|---|---|
| 2018 | 9.411 | 303,88 | 311,00 | 66,02 | 405 | 19 |
| 2022 | 46.726 | 333,71 | 341,00 | 54,38 | 570 | 23 |
Na Figura 2 são apresentados os mapas para ambos os pleitos em relação ao tamanho médio das seções para cada uma das zonas eleitorais. O mapa indica diversas regiões com altos valores de aptos por seção. Além disso, os mapas indicam uma diferença expressiva de cenário em que as eleições foram realizadas. De fato, o número de zonas com revisão biométrica em 2022 é expressivamente maior quando comparado com o cenário do pleito de 2018.
Com os logs das urnas eletrônicas é possível apurar o tempo de atraso para o encerramento das urnas após às 17 horas, que é o horário estipulado para o fim do processo de votação. Assim, considerando o tempo de atraso no encerramento daquelas urnas eletrônicas dos pleitos de 2018 e 2022 em que o eleitor foi identificado com biometria, obtive-se as estatísticas apresentadas na Tabela 5.
Dos resultados, nota-se que o tempo médio de atraso nas seções eleitorais em 2018 foi de 4,33 minutos com um desvio padrão de 7,53 minutos. A estimativa do desvio padrão indica alta dispersão do tempo de atraso nas seções. O tempo médio foi de 2,25 minutos. Ainda, observa-se que o tempo médio na eleição de 2022 o tempo médio de atraso foi quase o dobro, também marcada por uma alta variabilidade.
Na Figura 3 podem ser vistos as distribuições dos tempos de atraso, medidos em minutos referentes às seções que utilizaram identificação com biometria para ambos os anos.
| Ano | Seções | Média | Mediana | Desvio padrão | Mínimo | Máximo |
|---|---|---|---|---|---|---|
| 2018 | 9.411 | 4,33 | 2,25 | 7,53 | 0,02 | 109,30 |
| 2022 | 46.726 | 8,61 | 3,03 | 15,64 | 0,02 | 251,23 |
Para avaliar a distribuição espacial do tempo de atendimento total médio e do tamanho das seções eleitorais em ambos os pleitos, foram construídos gráficos que sumarizam essas informações para cada uma das zonas eleitorais. Destaca-se que as regiões em cinza representam zonas em que não foram realizadas revisões biometricas. Na Figura 4 são representados os valores máximo para o tempo de atendimento total médio para cada uma das zonas eleitorais. Nota-se, para o pleito de 2022, diversas zonas eleitorais com tempo máximo de atendimento superior a 100 segundos.
Ainda com dados extraídos dos logs das urnas eletrônicas, especificamente das seções em que o voto foi totalmente habilitado biomtericamente em 2018 e 2022, é possível calcular o tempo total médio de atendimento do eleitor (TMAE) que é o tempo, medido em segundos, desde a habilitação até o encerramento da votação do eleitor. Esse tempo reflete a duração média do processo de votação do eleitor em cada seção para completar todos os votos necessários. As principais estatísticas descritivas podem ser vistas na Tabela 6.
Apesar da diferença de um candidato entre as duas eleições, nota-se que não há diferenças expressivas entre os tempos de atendimento médio total. O valor médio estimado para o ano de 2018 foi de 82,86 segundos e para 2022 a estimativa foi de 82,35 segundos.
| Ano | Seções | Média | Mediana | Desvio padrão | Máximo | Mínimo |
|---|---|---|---|---|---|---|
| 2018 | 9.411 | 82,86 | 81,21 | 10,72 | 183,27 | 53,50 |
| 2022 | 46.726 | 82,35 | 81,08 | 10,20 | 151,24 | 51,93 |
Resultado para o Modelo de Calibração
Nesta seção são apresentados os resultados da aplicação do modelo de calibração. Para isso, definiu-se como variável de interesse o tempo total médio de atendimento (\(y\)) e como variável explicativa o número de eleitores aptos (\(x\)). Nesse sentido, o objetivo é obter uma estimativa para o número de eleitores aptos para a seção eleitoral, fixado um valor plausível do tempo total médio de atendimento. Na Figura 5 é apresentado do diagrama de dispersão, que indica uma relação linear entre essas variáveis, o que configura o modelo de calibração como plausível para modelar os dados.
No primeiro estágio do modelo de calibração foram estimados os parâmetros associados ao modelo linear entre as variáveis consideradas. Com base nesses valores, realizou-se o experimento de calibração, que consiste em estimar o valor do número de eleitores \(x_0\) para um dado valor \(y_0\) para o tempo de atendimento. Para estimar o número de eleitores aptos por seção, foi considerado como valor de referência para \(y_0\) o valor mediano do tempo total médio de votação dos eleitores em seções com votação biométrica no pleito de 2018, cujo valor foi de 81,2 segundos.
Os cálculos apresentados nas equações 1 e 3 realizados para o conjunto de dados utilizados neste estudo resultaram na estimativa do número de eleitores por seção, segundo o modelo de calibração de \(x_0 =\) 323. O intervalo de confiança de 95% para a estimativa foi realizada por meio de um método de reamostragem bootstrap, considerando o modelo de calibração especificado com 1.000 replicações. A estimativa intervalar, com base no método bootstrap com nível de confiança de 95%, indica que as seções devam ter entre 321 e 325 eleitores para que o tempo total médio de votação seja de 81,2 segundos. A Figura 6 apresenta o intervalo de confiança estimado.
Para avaliar a quantidade de seções eleitorais necessárias considerando o número de eleitores aptos estimado por seção, foram realizadas algumas simulações considerando, para tanto, o eleitorado atual nos locais de votação atualizados em 16/09/2025. O saldo de seções será determinado pelo número atual de seções eleitorais nos locais de votação subtraído da quantidade necessária de seções, resultado da divisão do eleitorado do local de votação pelo número 325 (eleitorado arredondamento para o próximo inteiro subsequente). Vale destacar que os resultados do saldo serão agregados por Zona Eleitoral e que não leva em consideração a capacidade dos locais de votação comportarem novas seções eleitorais.
O resultado final indica a necessidade de criação de 8.584 seções no Estado para redistribuir os eleitores dentro de seus locais de votação com o número de 325 eleitrores/seção, como estimado pelo modelo de calibração. Isso corresponde a criação de cerca de 8,31% mais de seções no Estado (atualmente há 103.265 seções).
Nas Tabelas 7 e 8 são apresentados as 10 primeiras Zonas eleitorais com maiores saldos de seções a criar e as 10 primeiras zonas eleitorais que teriam diminuição de seções se o critério fosse adotado, respectivamente.
| Zona | Locais | Seções | Aptos | Seções necessárias | Saldo | % sobre seções atuais |
|---|---|---|---|---|---|---|
| 372 | 48 | 654 | 247.481 | 788 | 134 | 20,5% |
| 418 | 43 | 522 | 200.812 | 639 | 117 | 22,4% |
| 192 | 58 | 489 | 181.730 | 588 | 99 | 20,2% |
| 371 | 41 | 551 | 202.902 | 646 | 95 | 17,2% |
| 388 | 32 | 426 | 163.586 | 521 | 95 | 22,3% |
| 20 | 38 | 454 | 171.489 | 548 | 94 | 20,7% |
| 199 | 36 | 424 | 162.230 | 517 | 93 | 21,9% |
| 346 | 44 | 511 | 189.359 | 604 | 93 | 18,2% |
| 394 | 39 | 451 | 169.983 | 544 | 93 | 20,6% |
| 256 | 40 | 485 | 180.792 | 576 | 91 | 18,8% |
| Zona | Locais | Seções | Aptos | Seções necessárias | Saldo | % sobre seções atuais |
|---|---|---|---|---|---|---|
| 13 | 31 | 305 | 79.501 | 258 | -47 | −15,4% |
| 174 | 34 | 402 | 111.200 | 360 | -42 | −10,4% |
| 70 | 42 | 317 | 84.814 | 282 | -35 | −11,0% |
| 101 | 32 | 287 | 77.925 | 253 | -34 | −11,8% |
| 206 | 47 | 378 | 104.352 | 348 | -30 | −7,9% |
| 401 | 42 | 444 | 128.983 | 418 | -26 | −5,9% |
| 62 | 37 | 287 | 80.557 | 264 | -23 | −8,0% |
| 161 | 30 | 202 | 53.327 | 180 | -22 | −10,9% |
| 239 | 19 | 169 | 44.725 | 147 | -22 | −13,0% |
| 119 | 35 | 315 | 90.567 | 294 | -21 | −6,7% |
Resultados para a Curva ROC
Para a estimativa do número de eleitores por seção utilizou-se como variável de interesse um indicador de atraso, que foi definida como 1, se o atraso do encerramento da urna foi igual ou superior a 1 hora ou 0, caso contrário. Com essa variável classificando o atraso em cada uma das seções eleitorais nessas duas categorias e conhecendo-se o número de aptos em cada uma delas, buscou-se definir o valor de corte ótimo dessa variável que maximizasse a sensibilidade e a especificidade, ou seja, que permite a obtenção de altas probabilidades de acerto em relação ao atraso das seções eleitorais.
Para isso, são definidos uma série de pontos de cortes e para cada um deles são obtidos os valores de sensibilidade e especificidade. O ponto de corte ótimo, então, é escolhido com base no critério de Youden, discutido anteriormente. Aqui, assumimos que o número de eleitores aptos por seção aleitoral é um bom preditor ou “teste diagnóstico”, fazendo uma analogia com testes clínicos, para identificar quanto uma seção irá atrasar, com alta probabilidade de acerto. Dessa forma, esse valor pode ser tomado com referência para definição do número de aptos por seção.
A análise da Curva ROC indica que o número de corte que maximiza a capacidade de identificar atraso quando se trata de atraso, como definido no escopo desse estudo, e a capacidade de minimizar os falsos positivos foi 341 eleitores por seção. A curva ROC e o ponto de corte ótimo são apresentados na Figura 7.
Para esse ponto de corte, obtem-se um valor de sensibilidade de cerca de 80,8% e especificidade, 72,1%. Com base nesse ponto de corte, espera-se classificar seções eleitorais em atraso com um pouco mais de 80% de acerto. A área sob a curva calculada foi \(AUC = 76,8\%\), o que afasta a ideia de uma relação aleatória, representada pela linha tracejada na Figura 7 e que corrobora com o poder de discernir o atraso nas seções eleitorais com base no eleitorado apto por seção.
O intervalo de confiança bootstrap de 95% de confiança, com 2.000 replicações para o ponto de corte da curva ROC fica entre 304,5 a 383,5 eleitores por seção. O intervalo de confiança utilizado foi o não paramétrico e por isso não é simétrico em torno do ponto estimado.
A avaliação do impacto dos valores estimados de eleitores aptos por seção eleitoral com base na curva ROC no número de seções nececssárias para acomodar esses eleitores, foram conduzidas algumas simulações, considerando, novamente, o eleitorado atual nos locais de votação atualizados em 16/09/2025 e não levando em consideração a capacidade dos locais de votação comportarem novas seções eleitorais.
Como feito para o modelo de calibração, o saldo de seções será determinado pelo número atual de seções eleitorais nos locais de votação subtraído da quantidade necessária de seções, resultado da divisão do eleitorado do local de votação pelo número 341 (eleitorado arredondado para o próximo inteiro subsequente). Os resultados do saldo serão agregados por Zona Eleitoral.
O modelo considerando o tamanho de seção com 341 eleitores por seção resulta na necessidade de criação de 3.646 seções no Estado para redistribuir os eleitores dentro de seus locais de votação. Isso corresponde a criação de cerca de 3,53% mais de seções no Estado (atualmente há 103.265 seções). A Tabela 9 indica as 10 primeiras zonas eleitorais com maiores saldos de seções a criar. Já na Tabela 8 são apontas as 10 primeiras zonas eleitorais que teriam diminuição de seções se o critério fosse adotado.
| Zona | Locais | Seções | Aptos | Seções necessárias | Saldo | % sobre seções atuais |
|---|---|---|---|---|---|---|
| 372 | 48 | 654 | 247.481 | 752 | 98 | 15,0% |
| 418 | 43 | 522 | 200.812 | 614 | 92 | 17,6% |
| 192 | 58 | 489 | 181.730 | 561 | 72 | 14,7% |
| 199 | 36 | 424 | 162.230 | 495 | 71 | 16,7% |
| 388 | 32 | 426 | 163.586 | 494 | 68 | 16,0% |
| 20 | 38 | 454 | 171.489 | 521 | 67 | 14,8% |
| 394 | 39 | 451 | 169.983 | 518 | 67 | 14,9% |
| 281 | 40 | 428 | 160.768 | 492 | 64 | 15,0% |
| 346 | 44 | 511 | 189.359 | 575 | 64 | 12,5% |
| 371 | 41 | 551 | 202.902 | 615 | 64 | 11,6% |
| Zona | Locais | Seções | Aptos | Seções necessárias | Saldo | % sobre seções atuais |
|---|---|---|---|---|---|---|
| 174 | 34 | 402 | 111.200 | 341 | -61 | −15,2% |
| 13 | 31 | 305 | 79.501 | 250 | -55 | −18,0% |
| 206 | 47 | 378 | 104.352 | 329 | -49 | −13,0% |
| 70 | 42 | 317 | 84.814 | 270 | -47 | −14,8% |
| 401 | 42 | 444 | 128.983 | 400 | -44 | −9,9% |
| 101 | 32 | 287 | 77.925 | 246 | -41 | −14,3% |
| 135 | 44 | 493 | 146.273 | 452 | -41 | −8,3% |
| 62 | 37 | 287 | 80.557 | 251 | -36 | −12,5% |
| 119 | 35 | 315 | 90.567 | 283 | -32 | −10,2% |
| 161 | 30 | 202 | 53.327 | 171 | -31 | −15,3% |
De maneira análoga, foi conduzida uma simulação considerando como número de eleitores aptos por seção um valor dentro do intervalo de confiança. Assumindo o valor, então, como estimativa \(n = 380\) eleitores aptos por seção, o saldo geral de seções a serem criadas seria de - 6.651 seções (cerca de -6,6% do total de seções do Estado), ou seja, haveria a redução da quantidade de seções comparando-se à situação atual. As Tabelas 11 e 12 apresentam as 10 primeiras zonas eleitorais que teriam que criar e diminuir seções, respectivamente.
| Zona | Locais | Seções | Aptos | Seções necessárias | Saldo | % sobre seções atuais |
|---|---|---|---|---|---|---|
| 418 | 43 | 522 | 200.812 | 550 | 28 | 5,4% |
| 199 | 36 | 424 | 162.230 | 449 | 25 | 5,9% |
| 372 | 48 | 654 | 247.481 | 676 | 22 | 3,4% |
| 388 | 32 | 426 | 163.586 | 448 | 22 | 5,2% |
| 192 | 58 | 489 | 181.730 | 510 | 21 | 4,3% |
| 345 | 33 | 276 | 105.426 | 297 | 21 | 7,6% |
| 20 | 38 | 454 | 171.489 | 473 | 19 | 4,2% |
| 273 | 37 | 328 | 123.432 | 347 | 19 | 5,8% |
| 248 | 32 | 424 | 160.278 | 442 | 18 | 4,2% |
| 394 | 39 | 451 | 169.983 | 467 | 16 | 3,5% |
| Zona | Locais | Seções | Aptos | Seções necessárias | Saldo | % sobre seções atuais |
|---|---|---|---|---|---|---|
| 174 | 34 | 402 | 111.200 | 309 | -93 | −23,1% |
| 135 | 44 | 493 | 146.273 | 409 | -84 | −17,0% |
| 401 | 42 | 444 | 128.983 | 362 | -82 | −18,5% |
| 13 | 31 | 305 | 79.501 | 225 | -80 | −26,2% |
| 206 | 47 | 378 | 104.352 | 298 | -80 | −21,2% |
| 70 | 42 | 317 | 84.814 | 243 | -74 | −23,3% |
| 247 | 39 | 512 | 162.867 | 445 | -67 | −13,1% |
| 101 | 32 | 287 | 77.925 | 221 | -66 | −23,0% |
| 52 | 60 | 425 | 126.732 | 362 | -63 | −14,8% |
| 356 | 45 | 464 | 144.902 | 402 | -62 | −13,4% |
Resultados para a árvore de decisão
Para definir, com base na árvore de decisão, um ponto de corte para o tamanho da seção eleitoral, foi considerada como variável resposta o tempo de atraso das seções eleitorais. Além disso, foi fixado como profundidada máxima da árvore como 1, de modo a obter apenas uma partição da variável tamanho da seção. Na Figura 8 é apresentado o desenho da árvore obtida, em que foi definida como partição ótima um tamanho de seção de 341 eleitores, isto é, uma partição que minimiza a soma dos quadrados dos erros. Vale destacar que não foram apresentadas as tabelas dos cenários simulados para a árvore de decisão, uma vez que o valor estimado para o número de eleitores aptos por seção foi idêntico aquele obtido pela análise da curva ROC.
Referências
Apêndice A - Resultados 2022
Neste apêndice são apresentados os resultados da aplicação das metodologias apresentadas anteriormente, considerando os dados do pleito de 2022. O objetivo dessas análises é fornecer informações adicionais sobre o dimensionamento do tamanho das seções, considerando uma eleição mais recente. Embora o pleito de 2022 tenha contemplado 5 cargos, os dados sugerem que não há diferenças expressivas no tempo de votação. Contudo, para o número de aptos por seção e para o número de seções que tiveram atraso de pelo menos uma hora é possível observar valores maiores para o ano de 2022 comparativamente a eleição de 2018.
Resultados para o modelo de calibração
Para a eleiçãço de 2022, a estimativa do eleitorado apto por seção segundo o modelo de calibração foi de \(x_0 =\) 355. O respectivo intervalo de confiança de 95% foi de [354, 357] eleitores para que o tempo total médio de votação seja de 81,1 segundos. Na Figura 9 é apresentado o diagrama de dispersão entre o tempo total de votação médio e os eleitores aptos na seção.
Nas Tabelas 13 e 14 são apresentados 10 zonas eleitorais com os maiores e menores impactos, respectivamente, ao considerar o valor estimado de 355 eleitores aptos por seção. Destaca-se que nesse cenário, seriam necessárias 102.822 seções eleitorais, o que representa uma redução de aproximadamente -0,43% em relação o número de seções atuais.
| Zona | Locais | Seções | Aptos | Seções necessárias | Saldo | % sobre seções atuais |
|---|---|---|---|---|---|---|
| 372 | 48 | 654 | 247.481 | 723 | 69 | 10,6% |
| 418 | 43 | 522 | 200.812 | 585 | 63 | 12,1% |
| 20 | 38 | 454 | 171.489 | 506 | 52 | 11,5% |
| 199 | 36 | 424 | 162.230 | 476 | 52 | 12,3% |
| 192 | 58 | 489 | 181.730 | 540 | 51 | 10,4% |
| 388 | 32 | 426 | 163.586 | 477 | 51 | 12,0% |
| 394 | 39 | 451 | 169.983 | 499 | 48 | 10,6% |
| 346 | 44 | 511 | 189.359 | 557 | 46 | 9,0% |
| 371 | 41 | 551 | 202.902 | 596 | 45 | 8,2% |
| 248 | 32 | 424 | 160.278 | 467 | 43 | 10,1% |
| Zona | Locais | Seções | Aptos | Seções necessárias | Saldo | % sobre seções atuais |
|---|---|---|---|---|---|---|
| 174 | 34 | 402 | 111.200 | 331 | -71 | −17,7% |
| 13 | 31 | 305 | 79.501 | 238 | -67 | −22,0% |
| 401 | 42 | 444 | 128.983 | 381 | -63 | −14,2% |
| 135 | 44 | 493 | 146.273 | 434 | -59 | −12,0% |
| 206 | 47 | 378 | 104.352 | 319 | -59 | −15,6% |
| 70 | 42 | 317 | 84.814 | 262 | -55 | −17,4% |
| 101 | 32 | 287 | 77.925 | 239 | -48 | −16,7% |
| 119 | 35 | 315 | 90.567 | 271 | -44 | −14,0% |
| 62 | 37 | 287 | 80.557 | 246 | -41 | −14,3% |
| 33 | 32 | 365 | 109.984 | 327 | -38 | −10,4% |
Resultados para a curva ROC
A curva ROC para os dados da eleição de 2022, considerando-se as mesmas configurações do estudo anterior, apresenta ponto de corte de 365 eleitores por seção, com \(AUC =84,3\%\) . A curva pode ser vista na Figura 10.
O intervalo de confiança bootstrap de 95% de confiança, com 2.000 replicações para a o ponto de corte da curva ROC fica entre [ 357.5 , 371.5 ] eleitores por seção.
Com os dados da eleição de 2022 e o ponto de corte estimado pela curva ROC em \(n = 365\) eleitores por seção, a quantidade de seções a serem extintas seria de -3.014 unidades (redução de 2,9% com relação à quantidade de seções de 2025 103.265). As 15 e 16 representam as 10 primeiras zonas eleitorais que teriam que criar e diminuir seções, respectivamente.
| Zona | Locais | Seções | Aptos | Seções necessárias | Saldo | % sobre seções atuais |
|---|---|---|---|---|---|---|
| 418 | 43 | 522 | 200.812 | 573 | 51 | 9,8% |
| 372 | 48 | 654 | 247.481 | 703 | 49 | 7,5% |
| 192 | 58 | 489 | 181.730 | 527 | 38 | 7,8% |
| 20 | 38 | 454 | 171.489 | 491 | 37 | 8,1% |
| 199 | 36 | 424 | 162.230 | 461 | 37 | 8,7% |
| 388 | 32 | 426 | 163.586 | 463 | 37 | 8,7% |
| 281 | 40 | 428 | 160.768 | 463 | 35 | 8,2% |
| 394 | 39 | 451 | 169.983 | 486 | 35 | 7,8% |
| 256 | 40 | 485 | 180.792 | 516 | 31 | 6,4% |
| 273 | 37 | 328 | 123.432 | 359 | 31 | 9,5% |
| Zona | Locais | Seções | Aptos | Seções necessárias | Saldo | % sobre seções atuais |
|---|---|---|---|---|---|---|
| 174 | 34 | 402 | 111.200 | 321 | -81 | −20,1% |
| 401 | 42 | 444 | 128.983 | 371 | -73 | −16,4% |
| 13 | 31 | 305 | 79.501 | 234 | -71 | −23,3% |
| 135 | 44 | 493 | 146.273 | 422 | -71 | −14,4% |
| 206 | 47 | 378 | 104.352 | 313 | -65 | −17,2% |
| 70 | 42 | 317 | 84.814 | 255 | -62 | −19,6% |
| 101 | 32 | 287 | 77.925 | 232 | -55 | −19,2% |
| 119 | 35 | 315 | 90.567 | 266 | -49 | −15,6% |
| 62 | 37 | 287 | 80.557 | 239 | -48 | −16,7% |
| 52 | 60 | 425 | 126.732 | 378 | -47 | −11,1% |
Resultados para a árvore de decisão
Os resultados da árvore de decisão com os dados de 2022 são apresentados na Figura 11. O ponto de corte foi seções com \(n=369\) eleitores, resultado muito próximo do encontrado no estudo da curva ROC. Os resultados da simulação da quantidade de seções com a redistribuição hipotética dos eleitores são muito parecidos, também. Seriam extintas 4.023 seções (-3,89%) com relação ao total de seções de 2022.
As Tabelas 17 e 18 representam as 10 primeiras zonas eleitorais que teriam que criar e diminuir seções, respectivamente se utilizado esse modelo.
| Zona | Locais | Seções | Aptos | Seções necessárias | Saldo | % sobre seções atuais |
|---|---|---|---|---|---|---|
| 418 | 43 | 522 | 200.812 | 567 | 45 | 8,6% |
| 372 | 48 | 654 | 247.481 | 697 | 43 | 6,6% |
| 388 | 32 | 426 | 163.586 | 460 | 34 | 8,0% |
| 20 | 38 | 454 | 171.489 | 486 | 32 | 7,0% |
| 199 | 36 | 424 | 162.230 | 455 | 31 | 7,3% |
| 394 | 39 | 451 | 169.983 | 481 | 30 | 6,7% |
| 192 | 58 | 489 | 181.730 | 518 | 29 | 5,9% |
| 281 | 40 | 428 | 160.768 | 456 | 28 | 6,5% |
| 273 | 37 | 328 | 123.432 | 354 | 26 | 7,9% |
| 248 | 32 | 424 | 160.278 | 449 | 25 | 5,9% |
| Zona | Locais | Seções | Aptos | Seções necessárias | Saldo | % sobre seções atuais |
|---|---|---|---|---|---|---|
| 174 | 34 | 402 | 111.200 | 318 | -84 | −20,9% |
| 135 | 44 | 493 | 146.273 | 418 | -75 | −15,2% |
| 401 | 42 | 444 | 128.983 | 369 | -75 | −16,9% |
| 13 | 31 | 305 | 79.501 | 231 | -74 | −24,3% |
| 206 | 47 | 378 | 104.352 | 311 | -67 | −17,7% |
| 70 | 42 | 317 | 84.814 | 251 | -66 | −20,8% |
| 101 | 32 | 287 | 77.925 | 231 | -56 | −19,5% |
| 119 | 35 | 315 | 90.567 | 263 | -52 | −16,5% |
| 62 | 37 | 287 | 80.557 | 236 | -51 | −17,8% |
| 52 | 60 | 425 | 126.732 | 375 | -50 | −11,8% |