Introdução

No dia 4 de outubro de 2026, cerca de 155 milhões de eleitoras e eleitores aptos a votar no Brasil e no exterior, de acordo com dados de setembro de 2025, deverão comparecer às urnas para escolher os representantes a presidente e vice-presidente da República, a governadores e vice-governadores dos estados e do Distrito Federal, além de deputados federais e estaduais ou distritais e dois senadores por unidade da Federação [@tse2025].

Em São Paulo, maior colégio eleitoral do país, 33.422.502 eleitores estarão aptos para votar em candidatos que concorrerão aos 6 cargos supracitados. Esses eleitores estão distribuídos nos 11.047 locais de votação e 103.303 seções eleitorais em todo o estado, perfazendo as 393 zonas eleitorais [@tresp2025].

Diante da dimensão de uma eleição, os preparativos para cada pleito continuam mesmo em anos não-eleitorais, com o objetivo de avaliar eleições anteriores e com base nessas análises propor melhorias para a logística das próximas eleições. A relevância desse trabalho consiste, principalmente, em garantir ao eleitor o cumprimento do seu papel como cidadão e o exercício da democracia, e por outro lado que a escolha dos representantes por parte dos eleitores ocorra de forma pacífica e sem intercorrências [@tresp2025].

Um dos desafios na elaboração da logística das eleições e que gera impactos negativos aos eleitores é a formação de longas filas de espera nas seções eleitorais. A formação de filas nos locais de votação é um fenômeno que está associado a uma série de fatores, compreendendo desde a dinâmica das chegadas dos eleitores aos respectivos locais de votação, o tempo de votação dos eleitores, bem como o tamanho das seções eleitorais e o perfil do seu eleitorado.

Após o fechamento do cadastro eleitoral são realizados cálculos do eleitorado por urna ou seção, isto é, a Justiça Eleitoral define a quantidade de urnas a serem utilizadas nas eleições gerais [@tresp2025]. Embora o Código Eleitoral (Lei nº 4.737/1965) em seu art. 117 preveja um limite de 400 eleitores nas seções eleitorais, determinar o tamanho da seção baseado em estudos que levem em conta informações do contexto local de cada estado e a dinâmica da votação, são imprescindíveis para uma logística mais assertiva.

A investigação dos dados de tempo de votação dos pleitos anteriores pode evidenciar padrões relacionados a dinâmica de votação nas seções eleitorais. Isso pode sugerir insights para elaboração da logística das próximas eleições, de forma a otimizar o tempo de votação e consequentemente reduzir o tempo de espera nas filas. Nessa perspectiva, o presente estudo tem como objetivo realizar uma análise dos dados do tempo de votação do pleito de 2018 e 2022 com vistas a estimação do número de eleitores a serem alocados nas seções eleitorais do estado de São Paulo para o pleito de 2026.

Metodologia

Nesta seção são apresentados alguns aspectos metodológicos das abordagens utilizadas para estimação do número de eleitores aptos por seção eleitoral. Nesse sentido, são descritos de forma sucinta o modelo de calibração, análise da curva ROC e a árvore de decisão, métodos usados no presente estudo.

Modelo de calibração

O modelo de calibração possui aplicações práticas em diversas área do conhecimento. Na engenharia e na física, por exemplo, os modelos de calibração são usados para aferição de instrumentos de medição de grandezas físicas. Já na medicina, esses métodos são utilizados para calibrar instrumentos que são indicadores de saúde pública. Outras áreas de destaque de aplicação dessa classe de modelos é a biologia e a química no estudo de composição de materiais e concentração de substâncias, respectivamente [@Ramos1987; @cavalcante2013].

Para o modelo de calibração clássico, o processo de modelagem é baseado tipicamente em dois estágios. No primeiro, denominado de processo de calibração, são amostradas \(n\) pares de observações \((y_1, x_1), \ldots, (y_n, x_n)\). No segundo estágio, isto é, no experimento de calibração, observa-se \(k\) observações da variável de interesse \(y\), \((y_{01}, \ldots, y_{0k})\), associadas a uma quantidade desconhecida \(x_0\). Dessa forma, o interesse principal de aplicação do modelo de calibração reside em estimar \(x_0\).

Assumindo que a relação entre a variável de interesse \(y\) e a variável explicativa \(x\) é linear, temos o modelo de calibração usual, cujas as equações referentes ao processo de calibração e ao experimento de calibração, respectivamente, são dadas por

\[ y_{i} = \alpha + \beta x_i + \epsilon_{i}, \quad i = 1, \dots, n, \tag{1}\]

\[ y_{0i} = \alpha + \beta x_0 + \epsilon_{i}, \quad i = n + 1, \dots, n + k. \tag{2}\]

Os parâmetros do modelo de calibração são estimados, sob certas suposições, pelo método dos mínimos quadrados. Em particular, pode-se provar, que o estimador para o valor de \(x_0\), no caso em que \(k = 1\) é dado por

\[ x_0 = \frac{y_{0} - \hat{\alpha}}{\hat{\beta}} \tag{3}\]

em que \(\hat{\alpha}\) e \(\hat{\beta}\) são os valores estimados dos parâmetros da regressão entre \(y\) e \(x\).

Método da Curva característica do receptor (curva ROC)

A curva ROC (“Receiver Operating Characteristic”), em português, Curva característica do receptor, é um mapeamento das taxas de verdadeiros positivos (TPF = sensibilidade) e as taxas de falsos positivos (FPF = 1 − especificidade) para todos os valores possíveis do ponto de corte que tenta prever um desfecho binário. Cada ponto da curva corresponde a um ponto de corte de tal modo que, ao mover o corte, ganha-se em sensibilidade e perde-se em especificidade, ou vice-versa [@unal2017cutpoint].

De acordo com Gonçalves et al. [-@goncalves2014roc], a análise da curva ROC foi pioneiramente utilizada na segunda guerra mundial quando a capacidade dos operadores de radar (receptores) foi testada para determinar se um sinal na tela do radar representava um objeto ou ruído. Contudo, devido a sua utilidade, passou rapidamente a ser usada em outras áreas, dentre as quais a área de saúde, para avaliação e obtenção de testes diagnósticos em situações em que o uso de testes padrão ouro são custosos ou inexistentes. Outra grande área em que a curva ROC é utilizada é na avaliação da perfomance de métodos de aprendizado de máquina para classificação, como por exemplo, modelos de regressão logística, árvore de decisão e máquinas de vetores de suporte [@bradley1997auc].

Para medir a capacidade diagnóstica de um teste, é comum usar medidas resumidas. Conforme Zhou et al. [-@zhou2011diagnostic], a área sob a curva ROC (AUC) e/ou a área parcial sob a curva ROC (pAUC) são consideradas índices da capacidade discriminatória global de um teste. Um teste com AUC = 1 discrimina indivíduos perfeitamente como doentes ou saudáveis, por exemplo. Enquanto isso, um teste com uma AUC de 0,5 é equivalente a lançar uma moeda - um teste não informativo [@zweig1993rocplots].

A escolha de um valor de corte apropriado é de suma importância para usar um teste de forma eficaz. Embora os valores de AUC, sensibilidade e especificidade sejam úteis na avaliação de um teste, eles não especificam pontos de corte “ótimos” diretamente. Na literatura, há diversas abordagens que usam sensibilidade e especificidade para seleção de pontos de corte [@unal2017cutpoint].

Um dos métodos amplamente usados na literatura é baseado no índice \(J\), proposto por Youden [-@youden1950index] e que considera tanto sensibilidade quanto especificidade para definir o valor “ótimo”. Este método define o ponto de corte ótimo como o ponto que maximiza a função de Youden, isto é, que maximiza

\[ J(c) = Se(c) + (1 - Sp(c)) \]

sobre todos os pontos de corte \(c\); \(\hat{c}_j\) denota o ponto de corte correspondente a \(J\). Quando o valor de \(J\) é máximo, \(\hat{c}_j\) é o valor de corte “ótimo” e corresponde a um ponto na curva ROC com a maior distância vertical da linha diagonal de 45° (o ROC de um teste não informativo).

Árvore de decisão

Nesta seção, introduzimos brevemente o conceito e as principais características da árvore de decisão. Trata-se de um método não paramétrico, com o objetivo de realizar predições para uma variável de interesse (resposta), a partir de um conjunto de variáveis subjacentes (explicativas), a partir do particionamento do espaço de valores das variáveis explicativas através de um critério pré estabelecido.

Uma vez que a construção da árvore é baseada na identificação de variáveis com potencial para explicar a variável de interesse, isso indica que ela fornece evidências de quais dessas variáveis são importantes, realizando uma seleção automática, além de indicar qual a ordem de importância, já que variáveis no topo da árvore possuem maior relevância [@izbicki2020ml].

A árvore de decisão possui grande aplicabilidade prática em diversas áreas do conhecimento, tanto por sua facilidade de implementação e baixo custo computacional, quanto pela simplicidade de interpretação dos resultados.

A maioria das aplicações práticas da árvore de decisão consiste na estimação de funções de predição. Contudo, é possível usar esses métodos também para realizar análise exploratória de dados, permitindo extrair insights sobre a relação e importância das variáveis.

Vários estudos têm usado a árvore de decisão como uma estratégia para identificar pontos de cortes ótimos para variáveis de interesse. Por exemplo, Costa et al. [-@costa2022alzheimer] propõem o uso desse método para identificação de Alzheimer com base em biomarcadores do liquido cerebroespinal. Já Fiorenzato et al. [-@fiorenzato2024parkinson] usam estratégias para identificação da doença de Parkinson usando pontos de corte em relação ao Mini-Mental State Examination e Montreal Cognitive Assessment, que são instrumentos usados para triagem cognitiva.

De maneira formal, a árvore de regressão cria partições das variáveis explicativas em regiões distintas e disjuntas \(R_{1}, \ldots, R_{j}\). Para prever o valor da variável resposta \(Y\) para uma observação com variáveis explicativas \(x \in R_k\), considera-se a média das variáveis respostas correspondentes a essa mesma região, isto é,

\[ g(x) = \frac{1}{|\{i: x_i \in R_k\}|}\sum_{i: x_i \in R_k}y_i. \] Para avaliar quão razoável uma árvore \(T\) é, avaliamos o seu erro quadrático médio

\[ \mathcal{P}(T) = \sum_{R}\sum_{i:x_i \in R}\frac{(y_i - \hat{y}_R)^2}{n}, \] em que \(\hat{Y}_R\) é valor predito para a resposta de uma observação pertencente a região \(R\). Um critério para obteção de uma árvore de regressão seria encontrar \(T\) que minimizasse \(\mathcal{P}(T)\), o que é computacionalmente inviável. Nesse sentido, utiliza-se uma heurística que consiste em divisões binárias recursivas, de modo a encontrar árvores de regressão com baixo erro de predição. Para mais detalhes ver [@james2021isl].

Resultados

Nesta seção são apresentados os principais resultados dos métodos descritos anteriormente para estimação do número de eleitores aptos por seão para o pleito de 2026, com base nos dados das eleições de 2018. Como a interpretação dos resultados e as discussões da aplicação do modelo de calibração, análise da curva ROC e árvore de decisão são análogas, os resultados para o pleito de 2022 são apresentados no apêndice. Inicialmente é apresentada uma análise exploratória de dados. Em seguida, são discutidos os resultados da aplicação dos métodos supracitados.

Resultados da análise exploratória de dados

Nesta seção são apresentados resultados da análise exploratória de dados realizada para avaliar características gerais das eleições de 2018 e 2022 em relação ao tamanho das seções eleitorais e ao tempo de votação dos eleitores. Os resultados foram sumarizados através de medidas descritivas de posição e dispersão e também por meio de recursos de visualização de dados.

Na Tabela 1 são sumarizados dados gerais das eleições de 2018 e 2022. O número de eleitores aptos nos pleitos foram de 32.738.608 e 34.682.973, respectivamente. Já o percentual de eleitores com biometria foram de 45,09% em 2018 e 67,09% em 2022. Dessa forma, nota-se um percentual expressivamente maior de eleitores com biometria em 2022.

Tabela 1: Percentual de eleitores aptos com biometria nas eleições de 2018 e 2022.
Ano Eleitores aptos Eleitores com biometria % com biometria
2018 32.738.608 14.762.947 45,09%
2022 34.682.973 23.269.771 67,09%
Tabela 2: Medidas descritivas para o tempo de atendimento total (min) para as eleições de 2018 e 2022.
Tabela 3: Medidas descritivas para o número de eleitores aptos para as eleições de 2018 e 2022.

A Figura 1 apresenta as estimativas das densidades do número de eleitores aptos para os pleitos de 2018 e 2022 dentro das seções que fizeram uso ou não da identificação biométrica. Nota-se, para ambos os pleitos , uma concentração de seções com número de eleitores aptos superior a 300 nas seções com 100% de identificação biométrica e cerca de 350 nas demais. Ainda, há um número expressivo de seções com mais de 400 eleitores. Esse fato pode estar associado as agregações que são realizadas durante a eleição.

Na Tabela 4 são apresentadas, de forma complementar, algumas medidas descritivas para o eleitorado apto na votação com identificação 100% biométrica para ambas as eleições. O tamanho médio das seções em 2022 foi superior aquele observado no pleito de 2018, cujos valores foram de aproximadamente 304 e 334 eleitores, respectivamente. Ainda, o valor mediano para o pleito de 2022 foi de 341, indicando que 50% das seções eleitorais tinham número de eleitores aptos superior a esse valor. O valor mediano para a eleição de 2018 foi de 311.

Figura 1: Densidade dos aptos por seção com relação à votação com e sem identificação biométrica nas eleições de 2018 e 2022.
Tabela 4: Estatísticas descritivas das seções com identificação biométrica nas eleições de 2018 e 2022.
Ano Nº seções Média Mediana Desvio padrão Máximo Mínimo
2018 9.411 303,88 311,00 66,02 405 19
2022 46.726 333,71 341,00 54,38 570 23

Na Figura 2 são apresentados os mapas para ambos os pleitos em relação ao tamanho médio das seções para cada uma das zonas eleitorais. O mapa indica diversas regiões com altos valores de aptos por seção. Além disso, os mapas indicam uma diferença expressiva de cenário em que as eleições foram realizadas. De fato, o número de zonas com revisão biométrica em 2022 é expressivamente maior quando comparado com o cenário do pleito de 2018.

Figura 2: Mapa da média de eleitores aptos/seção por zona eleitoral nas eleições de 2018 e 2022.

Com os logs das urnas eletrônicas é possível apurar o tempo de atraso para o encerramento das urnas após às 17 horas, que é o horário estipulado para o fim do processo de votação. Assim, considerando o tempo de atraso no encerramento daquelas urnas eletrônicas dos pleitos de 2018 e 2022 em que o eleitor foi identificado com biometria, obtive-se as estatísticas apresentadas na Tabela 5.

Dos resultados, nota-se que o tempo médio de atraso nas seções eleitorais em 2018 foi de 4,33 minutos com um desvio padrão de 7,53 minutos. A estimativa do desvio padrão indica alta dispersão do tempo de atraso nas seções. O tempo médio foi de 2,25 minutos. Ainda, observa-se que o tempo médio na eleição de 2022 o tempo médio de atraso foi quase o dobro, também marcada por uma alta variabilidade.

Na Figura 3 podem ser vistos as distribuições dos tempos de atraso, medidos em minutos referentes às seções que utilizaram identificação com biometria para ambos os anos.

Figura 3: Distribuição do atraso do encerramento da eleição (em min) nas seções com identificação biométrica nas eleições de 2018 e 2022.
Tabela 5: Estatísticas descritivas do tempo de atraso (min) no encerramento das seções com identificação biométrica nas eleições de 2018 e 2022.
Ano Seções Média Mediana Desvio padrão Mínimo Máximo
2018 9.411 4,33 2,25 7,53 0,02 109,30
2022 46.726 8,61 3,03 15,64 0,02 251,23

Para avaliar a distribuição espacial do tempo de atendimento total médio e do tamanho das seções eleitorais em ambos os pleitos, foram construídos gráficos que sumarizam essas informações para cada uma das zonas eleitorais. Destaca-se que as regiões em cinza representam zonas em que não foram realizadas revisões biometricas. Na Figura 4 são representados os valores máximo para o tempo de atendimento total médio para cada uma das zonas eleitorais. Nota-se, para o pleito de 2022, diversas zonas eleitorais com tempo máximo de atendimento superior a 100 segundos.

Figura 4: Mapa do máximo do tempo de atraso/seção por zona eleitoral nas eleições de 2018 e 2022.

Ainda com dados extraídos dos logs das urnas eletrônicas, especificamente das seções em que o voto foi totalmente habilitado biomtericamente em 2018 e 2022, é possível calcular o tempo total médio de atendimento do eleitor (TMAE) que é o tempo, medido em segundos, desde a habilitação até o encerramento da votação do eleitor. Esse tempo reflete a duração média do processo de votação do eleitor em cada seção para completar todos os votos necessários. As principais estatísticas descritivas podem ser vistas na Tabela 6.

Apesar da diferença de um candidato entre as duas eleições, nota-se que não há diferenças expressivas entre os tempos de atendimento médio total. O valor médio estimado para o ano de 2018 foi de 82,86 segundos e para 2022 a estimativa foi de 82,35 segundos.

Tabela 6: Estatísticas descritivas do tempo total médio de atendimento do eleitor (TMAE em segundos) das seções com identificação biométrica nas eleições de 2018 e 2022.
Ano Seções Média Mediana Desvio padrão Máximo Mínimo
2018 9.411 82,86 81,21 10,72 183,27 53,50
2022 46.726 82,35 81,08 10,20 151,24 51,93

Resultado para o Modelo de Calibração

Nesta seção são apresentados os resultados da aplicação do modelo de calibração. Para isso, definiu-se como variável de interesse o tempo total médio de atendimento (\(y\)) e como variável explicativa o número de eleitores aptos (\(x\)). Nesse sentido, o objetivo é obter uma estimativa para o número de eleitores aptos para a seção eleitoral, fixado um valor plausível do tempo total médio de atendimento. Na Figura 5 é apresentado do diagrama de dispersão, que indica uma relação linear entre essas variáveis, o que configura o modelo de calibração como plausível para modelar os dados.

Figura 5: Gráfico de dispersão entre os tempos total de votação médio e eleitores aptos na seção para a eleição de 2018.

No primeiro estágio do modelo de calibração foram estimados os parâmetros associados ao modelo linear entre as variáveis consideradas. Com base nesses valores, realizou-se o experimento de calibração, que consiste em estimar o valor do número de eleitores \(x_0\) para um dado valor \(y_0\) para o tempo de atendimento. Para estimar o número de eleitores aptos por seção, foi considerado como valor de referência para \(y_0\) o valor mediano do tempo total médio de votação dos eleitores em seções com votação biométrica no pleito de 2018, cujo valor foi de 81,2 segundos.

Os cálculos apresentados nas equações 1 e 3 realizados para o conjunto de dados utilizados neste estudo resultaram na estimativa do número de eleitores por seção, segundo o modelo de calibração de \(x_0 =\) 323. O intervalo de confiança de 95% para a estimativa foi realizada por meio de um método de reamostragem bootstrap, considerando o modelo de calibração especificado com 1.000 replicações. A estimativa intervalar, com base no método bootstrap com nível de confiança de 95%, indica que as seções devam ter entre 321 e 325 eleitores para que o tempo total médio de votação seja de 81,2 segundos. A Figura 6 apresenta o intervalo de confiança estimado.

Figura 6: Intervalo de confiança de 95% bootstrap para a número de eleitores por seção estimado pelo modelo de calibração para o ano de 2018.

Para avaliar a quantidade de seções eleitorais necessárias considerando o número de eleitores aptos estimado por seção, foram realizadas algumas simulações considerando, para tanto, o eleitorado atual nos locais de votação atualizados em 16/09/2025. O saldo de seções será determinado pelo número atual de seções eleitorais nos locais de votação subtraído da quantidade necessária de seções, resultado da divisão do eleitorado do local de votação pelo número 325 (eleitorado arredondamento para o próximo inteiro subsequente). Vale destacar que os resultados do saldo serão agregados por Zona Eleitoral e que não leva em consideração a capacidade dos locais de votação comportarem novas seções eleitorais.

O resultado final indica a necessidade de criação de 8.584 seções no Estado para redistribuir os eleitores dentro de seus locais de votação com o número de 325 eleitrores/seção, como estimado pelo modelo de calibração. Isso corresponde a criação de cerca de 8,31% mais de seções no Estado (atualmente há 103.265 seções).

Nas Tabelas 7 e 8 são apresentados as 10 primeiras Zonas eleitorais com maiores saldos de seções a criar e as 10 primeiras zonas eleitorais que teriam diminuição de seções se o critério fosse adotado, respectivamente.

Tabela 7: 10 primeiras Zonas Eleitorais que possuem maior necessidade de criação de seções eleitorais se o número máximo de eleitores for 325 por seção (modelo de calibração).
Zona Locais Seções Aptos Seções necessárias Saldo % sobre seções atuais
372 48 654 247.481 788 134 20,5%
418 43 522 200.812 639 117 22,4%
192 58 489 181.730 588 99 20,2%
371 41 551 202.902 646 95 17,2%
388 32 426 163.586 521 95 22,3%
20 38 454 171.489 548 94 20,7%
199 36 424 162.230 517 93 21,9%
346 44 511 189.359 604 93 18,2%
394 39 451 169.983 544 93 20,6%
256 40 485 180.792 576 91 18,8%
Tabela 8: 10 primeiras zonas eleitorais que teriam diminuição de seções se número máximo de eleitores for 325 por seção (modelo de calibração).
Zona Locais Seções Aptos Seções necessárias Saldo % sobre seções atuais
13 31 305 79.501 258 -47 −15,4%
174 34 402 111.200 360 -42 −10,4%
70 42 317 84.814 282 -35 −11,0%
101 32 287 77.925 253 -34 −11,8%
206 47 378 104.352 348 -30 −7,9%
401 42 444 128.983 418 -26 −5,9%
62 37 287 80.557 264 -23 −8,0%
161 30 202 53.327 180 -22 −10,9%
239 19 169 44.725 147 -22 −13,0%
119 35 315 90.567 294 -21 −6,7%

Resultados para a Curva ROC

Para a estimativa do número de eleitores por seção utilizou-se como variável de interesse um indicador de atraso, que foi definida como 1, se o atraso do encerramento da urna foi igual ou superior a 1 hora ou 0, caso contrário. Com essa variável classificando o atraso em cada uma das seções eleitorais nessas duas categorias e conhecendo-se o número de aptos em cada uma delas, buscou-se definir o valor de corte ótimo dessa variável que maximizasse a sensibilidade e a especificidade, ou seja, que permite a obtenção de altas probabilidades de acerto em relação ao atraso das seções eleitorais.

Para isso, são definidos uma série de pontos de cortes e para cada um deles são obtidos os valores de sensibilidade e especificidade. O ponto de corte ótimo, então, é escolhido com base no critério de Youden, discutido anteriormente. Aqui, assumimos que o número de eleitores aptos por seção aleitoral é um bom preditor ou “teste diagnóstico”, fazendo uma analogia com testes clínicos, para identificar quanto uma seção irá atrasar, com alta probabilidade de acerto. Dessa forma, esse valor pode ser tomado com referência para definição do número de aptos por seção.

A análise da Curva ROC indica que o número de corte que maximiza a capacidade de identificar atraso quando se trata de atraso, como definido no escopo desse estudo, e a capacidade de minimizar os falsos positivos foi 341 eleitores por seção. A curva ROC e o ponto de corte ótimo são apresentados na Figura 7.

Figura 7: Curva Roc considerando atraso no encerramento de votação superior a 1 hora para a eleição de 2018.

Para esse ponto de corte, obtem-se um valor de sensibilidade de cerca de 80,8% e especificidade, 72,1%. Com base nesse ponto de corte, espera-se classificar seções eleitorais em atraso com um pouco mais de 80% de acerto. A área sob a curva calculada foi \(AUC = 76,8\%\), o que afasta a ideia de uma relação aleatória, representada pela linha tracejada na Figura 7 e que corrobora com o poder de discernir o atraso nas seções eleitorais com base no eleitorado apto por seção.

O intervalo de confiança bootstrap de 95% de confiança, com 2.000 replicações para o ponto de corte da curva ROC fica entre 304,5 a 383,5 eleitores por seção. O intervalo de confiança utilizado foi o não paramétrico e por isso não é simétrico em torno do ponto estimado.

A avaliação do impacto dos valores estimados de eleitores aptos por seção eleitoral com base na curva ROC no número de seções nececssárias para acomodar esses eleitores, foram conduzidas algumas simulações, considerando, novamente, o eleitorado atual nos locais de votação atualizados em 16/09/2025 e não levando em consideração a capacidade dos locais de votação comportarem novas seções eleitorais.

Como feito para o modelo de calibração, o saldo de seções será determinado pelo número atual de seções eleitorais nos locais de votação subtraído da quantidade necessária de seções, resultado da divisão do eleitorado do local de votação pelo número 341 (eleitorado arredondado para o próximo inteiro subsequente). Os resultados do saldo serão agregados por Zona Eleitoral.

O modelo considerando o tamanho de seção com 341 eleitores por seção resulta na necessidade de criação de 3.646 seções no Estado para redistribuir os eleitores dentro de seus locais de votação. Isso corresponde a criação de cerca de 3,53% mais de seções no Estado (atualmente há 103.265 seções). A Tabela 9 indica as 10 primeiras zonas eleitorais com maiores saldos de seções a criar. Já na Tabela 8 são apontas as 10 primeiras zonas eleitorais que teriam diminuição de seções se o critério fosse adotado.

Tabela 9: 10 primeiras Zonas Eleitorais que possuem maior necessidade de criação de seções eleitorais se o número máximo de eleitores for 341 por seção (ponto de corte da Curva ROC)
Zona Locais Seções Aptos Seções necessárias Saldo % sobre seções atuais
372 48 654 247.481 752 98 15,0%
418 43 522 200.812 614 92 17,6%
192 58 489 181.730 561 72 14,7%
199 36 424 162.230 495 71 16,7%
388 32 426 163.586 494 68 16,0%
20 38 454 171.489 521 67 14,8%
394 39 451 169.983 518 67 14,9%
281 40 428 160.768 492 64 15,0%
346 44 511 189.359 575 64 12,5%
371 41 551 202.902 615 64 11,6%
Tabela 10: 10 primeiras zonas eleitorais que teriam diminuição de seções se número máximo de eleitores for 341 por seção (curva ROC).
Zona Locais Seções Aptos Seções necessárias Saldo % sobre seções atuais
174 34 402 111.200 341 -61 −15,2%
13 31 305 79.501 250 -55 −18,0%
206 47 378 104.352 329 -49 −13,0%
70 42 317 84.814 270 -47 −14,8%
401 42 444 128.983 400 -44 −9,9%
101 32 287 77.925 246 -41 −14,3%
135 44 493 146.273 452 -41 −8,3%
62 37 287 80.557 251 -36 −12,5%
119 35 315 90.567 283 -32 −10,2%
161 30 202 53.327 171 -31 −15,3%

De maneira análoga, foi conduzida uma simulação considerando como número de eleitores aptos por seção um valor dentro do intervalo de confiança. Assumindo o valor, então, como estimativa \(n = 380\) eleitores aptos por seção, o saldo geral de seções a serem criadas seria de - 6.651 seções (cerca de -6,6% do total de seções do Estado), ou seja, haveria a redução da quantidade de seções comparando-se à situação atual. As Tabelas 11 e 12 apresentam as 10 primeiras zonas eleitorais que teriam que criar e diminuir seções, respectivamente.

Tabela 11: 10 primeiras Zonas Eleitorais que possuem maior necessidade de criação de seções eleitorais se o número máximo de eleitores for 380 por seção (curva ROC).
Zona Locais Seções Aptos Seções necessárias Saldo % sobre seções atuais
418 43 522 200.812 550 28 5,4%
199 36 424 162.230 449 25 5,9%
372 48 654 247.481 676 22 3,4%
388 32 426 163.586 448 22 5,2%
192 58 489 181.730 510 21 4,3%
345 33 276 105.426 297 21 7,6%
20 38 454 171.489 473 19 4,2%
273 37 328 123.432 347 19 5,8%
248 32 424 160.278 442 18 4,2%
394 39 451 169.983 467 16 3,5%
Tabela 12: 10 primeiras zonas eleitorais que teriam diminuição de seções se número máximo de eleitores for 380 por seção (curva ROC).
Zona Locais Seções Aptos Seções necessárias Saldo % sobre seções atuais
174 34 402 111.200 309 -93 −23,1%
135 44 493 146.273 409 -84 −17,0%
401 42 444 128.983 362 -82 −18,5%
13 31 305 79.501 225 -80 −26,2%
206 47 378 104.352 298 -80 −21,2%
70 42 317 84.814 243 -74 −23,3%
247 39 512 162.867 445 -67 −13,1%
101 32 287 77.925 221 -66 −23,0%
52 60 425 126.732 362 -63 −14,8%
356 45 464 144.902 402 -62 −13,4%

Resultados para a árvore de decisão

Para definir, com base na árvore de decisão, um ponto de corte para o tamanho da seção eleitoral, foi considerada como variável resposta o tempo de atraso das seções eleitorais. Além disso, foi fixado como profundidada máxima da árvore como 1, de modo a obter apenas uma partição da variável tamanho da seção. Na Figura 8 é apresentado o desenho da árvore obtida, em que foi definida como partição ótima um tamanho de seção de 341 eleitores, isto é, uma partição que minimiza a soma dos quadrados dos erros. Vale destacar que não foram apresentadas as tabelas dos cenários simulados para a árvore de decisão, uma vez que o valor estimado para o número de eleitores aptos por seção foi idêntico aquele obtido pela análise da curva ROC.

Figura 8: Árvore de decisão para a eleição de 2018.

Referências

Apêndice A - Resultados 2022

Neste apêndice são apresentados os resultados da aplicação das metodologias apresentadas anteriormente, considerando os dados do pleito de 2022. O objetivo dessas análises é fornecer informações adicionais sobre o dimensionamento do tamanho das seções, considerando uma eleição mais recente. Embora o pleito de 2022 tenha contemplado 5 cargos, os dados sugerem que não há diferenças expressivas no tempo de votação. Contudo, para o número de aptos por seção e para o número de seções que tiveram atraso de pelo menos uma hora é possível observar valores maiores para o ano de 2022 comparativamente a eleição de 2018.

Resultados para o modelo de calibração

Para a eleiçãço de 2022, a estimativa do eleitorado apto por seção segundo o modelo de calibração foi de \(x_0 =\) 355. O respectivo intervalo de confiança de 95% foi de [354, 357] eleitores para que o tempo total médio de votação seja de 81,1 segundos. Na Figura 9 é apresentado o diagrama de dispersão entre o tempo total de votação médio e os eleitores aptos na seção.

Figura 9: Gráfico de dispersão entre os tempos total de votação médio e eleitores aptos na seção para a eleição de 2022.

Nas Tabelas 13 e 14 são apresentados 10 zonas eleitorais com os maiores e menores impactos, respectivamente, ao considerar o valor estimado de 355 eleitores aptos por seção. Destaca-se que nesse cenário, seriam necessárias 102.822 seções eleitorais, o que representa uma redução de aproximadamente -0,43% em relação o número de seções atuais.

Tabela 13: 10 primeiras Zonas Eleitorais que possuem maior necessidade de criação de seções eleitorais se o número máximo de eleitores for 355 por seção (modelo de calibração).
Zona Locais Seções Aptos Seções necessárias Saldo % sobre seções atuais
372 48 654 247.481 723 69 10,6%
418 43 522 200.812 585 63 12,1%
20 38 454 171.489 506 52 11,5%
199 36 424 162.230 476 52 12,3%
192 58 489 181.730 540 51 10,4%
388 32 426 163.586 477 51 12,0%
394 39 451 169.983 499 48 10,6%
346 44 511 189.359 557 46 9,0%
371 41 551 202.902 596 45 8,2%
248 32 424 160.278 467 43 10,1%
Tabela 14: 10 primeiras zonas eleitorais que teriam diminuição de seções se número máximo de eleitores for 355 por seção (modelo de calibração).
Zona Locais Seções Aptos Seções necessárias Saldo % sobre seções atuais
174 34 402 111.200 331 -71 −17,7%
13 31 305 79.501 238 -67 −22,0%
401 42 444 128.983 381 -63 −14,2%
135 44 493 146.273 434 -59 −12,0%
206 47 378 104.352 319 -59 −15,6%
70 42 317 84.814 262 -55 −17,4%
101 32 287 77.925 239 -48 −16,7%
119 35 315 90.567 271 -44 −14,0%
62 37 287 80.557 246 -41 −14,3%
33 32 365 109.984 327 -38 −10,4%

Resultados para a curva ROC

A curva ROC para os dados da eleição de 2022, considerando-se as mesmas configurações do estudo anterior, apresenta ponto de corte de 365 eleitores por seção, com \(AUC =84,3\%\) . A curva pode ser vista na Figura 10.

Figura 10: Curva Roc considerando atraso no emcerramento de votação o tempo maior que 1 hora para a eleição de 2022.

O intervalo de confiança bootstrap de 95% de confiança, com 2.000 replicações para a o ponto de corte da curva ROC fica entre [ 357.5 , 371.5 ] eleitores por seção.

Com os dados da eleição de 2022 e o ponto de corte estimado pela curva ROC em \(n = 365\) eleitores por seção, a quantidade de seções a serem extintas seria de -3.014 unidades (redução de 2,9% com relação à quantidade de seções de 2025 103.265). As 15 e 16 representam as 10 primeiras zonas eleitorais que teriam que criar e diminuir seções, respectivamente.

Tabela 15: 10 primeiras Zonas Eleitorais que possuem maior necessidade de criação de seções eleitorais se o número máximo de eleitores for 365 por seção (Curva ROC).
Zona Locais Seções Aptos Seções necessárias Saldo % sobre seções atuais
418 43 522 200.812 573 51 9,8%
372 48 654 247.481 703 49 7,5%
192 58 489 181.730 527 38 7,8%
20 38 454 171.489 491 37 8,1%
199 36 424 162.230 461 37 8,7%
388 32 426 163.586 463 37 8,7%
281 40 428 160.768 463 35 8,2%
394 39 451 169.983 486 35 7,8%
256 40 485 180.792 516 31 6,4%
273 37 328 123.432 359 31 9,5%
Tabela 16: 10 primeiras zonas eleitorais que teriam diminuição de seções se número máximo de eleitores for 365 por seção (curva ROC).
Zona Locais Seções Aptos Seções necessárias Saldo % sobre seções atuais
174 34 402 111.200 321 -81 −20,1%
401 42 444 128.983 371 -73 −16,4%
13 31 305 79.501 234 -71 −23,3%
135 44 493 146.273 422 -71 −14,4%
206 47 378 104.352 313 -65 −17,2%
70 42 317 84.814 255 -62 −19,6%
101 32 287 77.925 232 -55 −19,2%
119 35 315 90.567 266 -49 −15,6%
62 37 287 80.557 239 -48 −16,7%
52 60 425 126.732 378 -47 −11,1%

Resultados para a árvore de decisão

Os resultados da árvore de decisão com os dados de 2022 são apresentados na Figura 11. O ponto de corte foi seções com \(n=369\) eleitores, resultado muito próximo do encontrado no estudo da curva ROC. Os resultados da simulação da quantidade de seções com a redistribuição hipotética dos eleitores são muito parecidos, também. Seriam extintas 4.023 seções (-3,89%) com relação ao total de seções de 2022.

Figura 11: Árvore de decisão para a eleição de 2022.

As Tabelas 17 e 18 representam as 10 primeiras zonas eleitorais que teriam que criar e diminuir seções, respectivamente se utilizado esse modelo.

Tabela 17: 10 primeiras Zonas Eleitorais que possuem maior necessidade de criação de seções eleitorais se o número máximo de eleitores for 369 por seção (árvore de decisão).
Zona Locais Seções Aptos Seções necessárias Saldo % sobre seções atuais
418 43 522 200.812 567 45 8,6%
372 48 654 247.481 697 43 6,6%
388 32 426 163.586 460 34 8,0%
20 38 454 171.489 486 32 7,0%
199 36 424 162.230 455 31 7,3%
394 39 451 169.983 481 30 6,7%
192 58 489 181.730 518 29 5,9%
281 40 428 160.768 456 28 6,5%
273 37 328 123.432 354 26 7,9%
248 32 424 160.278 449 25 5,9%
Tabela 18: 10 primeiras zonas eleitorais que teriam diminuição de seções se número máximo de eleitores for 369 por seção (árvore de decisão).
Zona Locais Seções Aptos Seções necessárias Saldo % sobre seções atuais
174 34 402 111.200 318 -84 −20,9%
135 44 493 146.273 418 -75 −15,2%
401 42 444 128.983 369 -75 −16,9%
13 31 305 79.501 231 -74 −24,3%
206 47 378 104.352 311 -67 −17,7%
70 42 317 84.814 251 -66 −20,8%
101 32 287 77.925 231 -56 −19,5%
119 35 315 90.567 263 -52 −16,5%
62 37 287 80.557 236 -51 −17,8%
52 60 425 126.732 375 -50 −11,8%