Introdução

No dia 4 de outubro de 2026, cerca de 155 milhões de eleitoras e eleitores aptos a votar no Brasil e no exterior, de acordo com dados de setembro de 2025, deverão comparecer às urnas para escolher os representantes a presidente e vice-presidente da República, a governadores e vice-governadores dos estados e do Distrito Federal, além de deputados federais e estaduais ou distritais e dois senadores por unidade da Federação [@tse2025].

Em São Paulo, maior colégio eleitoral do país, 33.422.502 eleitores estarão aptos para votar em candidatos que concorrerão aos 6 cargos supracitados. Esses eleitores estão distribuídos nos 11.047 locais de votação e 103.303 seções eleitorais em todo o estado, perfazendo as 393 zonas eleitorais [@tresp2025].

Diante da dimensão de uma eleição, os preparativos para cada pleito continuam mesmo em anos não-eleitorais, com o objetivo de avaliar eleições anteriores e com base nessas análises propor melhorias para a logística das próximas eleições. A relevância desse trabalho consiste, principalmente, em garantir ao eleitor o cumprimento do seu papel como cidadão e o exercício da democracia, e por outro lado que a escolha dos representantes por parte dos eleitores ocorra de forma pacífica e sem intercorrências [@tresp2025].

Um dos desafios na elaboração da logística das eleições e que gera impactos negativos aos eleitores é a formação de longas filas de espera nas seções eleitorais. A formação de filas nos locais de votação é um fenômeno que está associado a uma série de fatores, compreendendo desde a dinâmica das chegadas dos eleitores aos respectivos locais de votação, o tempo de votação dos eleitores, bem como o tamanho das seções eleitorais e o perfil do seu eleitorado.

Após o fechamento do cadastro eleitoral são realizados cálculos do eleitorado por urna ou seção, isto é, a Justiça Eleitoral define a quantidade de urnas a serem utilizadas nas eleições gerais [@tresp2025]. Embora o Código Eleitoral (Lei nº 4.737/1965) em seu art. 117 preveja um limite de 400 eleitores nas seções eleitorais, determinar o tamanho da seção baseado em estudos que levem em conta informações do contexto local de cada estado e a dinâmica da votação, são imprescindíveis para uma logística mais assertiva.

A investigação dos dados de tempo de votação dos pleitos anteriores pode evidenciar padrões relacionados a dinâmica de votação nas seções eleitorais. Isso pode sugerir insights para elaboração da logística das próximas eleições, de forma a otimizar o tempo de votação e consequentemente reduzir o tempo de espera nas filas. Nessa perspectiva, o presente estudo tem como objetivo realizar uma análise dos dados do tempo de votação do pleito de 2018 e 2022 com vistas a estimação do número de eleitores a serem alocados nas seções eleitorais do estado de São Paulo para o pleito de 2026.

Metodologia

Nesta seção são apresentados alguns aspectos metodológicos das abordagens utilizadas para estimação do número de eleitores aptos por seção eleitoral. Nesse sentido, são descritos de forma sucinta o modelo de calibração, análise da curva ROC e a árvore de decisão, métodos usados no presente estudo.

Modelo de calibração

O modelo de calibração possui aplicações práticas em diversas área do conhecimento. Na engenharia e na física, por exemplo, os modelos de calibração são usados para aferição de instrumentos de medição de grandezas físicas. Já na medicina, esses métodos são utilizados para calibrar instrumentos que são indicadores de saúde pública. Outras áreas de destaque de aplicação dessa classe de modelos é a biologia e a química no estudo de composição de materiais e concentração de substâncias, respectivamente [@Ramos1987; @cavalcante2013].

Para o modelo de calibração clássico, o processo de modelagem é baseado tipicamente em dois estágios. No primeiro, denominado de processo de calibração, são amostradas \(n\) pares de observações \((y_1, x_1), \ldots, (y_n, x_n)\). No segundo estágio, isto é, no experimento de calibração, observa-se \(k\) observações da variável de interesse \(y\), \((y_{01}, \ldots, y_{0k})\), associadas a uma quantidade desconhecida \(x_0\). Dessa forma, o interesse principal de aplicação do modelo de calibração reside em estimar \(x_0\).

Assumindo que a relação entre a variável de interesse \(y\) e a variável explicativa \(x\) é linear, temos o modelo de calibração usual, cujas as equações referentes ao processo de calibração e ao experimento de calibração, respectivamente, são dadas por

\[ y_{i} = \alpha + \beta x_i + \epsilon_{i}, \quad i = 1, \dots, n, \tag{1}\]

\[ y_{0i} = \alpha + \beta x_0 + \epsilon_{i}, \quad i = n + 1, \dots, n + k. \tag{2}\]

Os parâmetros do modelo de calibração são estimados, sob certas suposições, pelo método dos mínimos quadrados. Em particular, pode-se provar, que o estimador para o valor de \(x_0\), no caso em que \(k = 1\) é dado por

\[ x_0 = \frac{y_{0} - \hat{\alpha}}{\hat{\beta}} \tag{3}\]

em que \(\hat{\alpha}\) e \(\hat{\beta}\) são os valores estimados dos parâmetros da regressão entre \(y\) e \(x\).

Método da Curva característica do receptor (curva ROC)

A curva ROC (“Receiver Operating Characteristic”), em português, Curva característica do receptor, é um mapeamento das taxas de verdadeiros positivos (TPF = sensibilidade) e as taxas de falsos positivos (FPF = 1 − especificidade) para todos os valores possíveis do ponto de corte que tenta prever um desfecho binário. Cada ponto da curva corresponde a um ponto de corte de tal modo que, ao mover o corte, ganha-se em sensibilidade e perde-se em especificidade, ou vice-versa [@unal2017cutpoint].

De acordo com Gonçalves et al. [-@goncalves2014roc], a análise da curva ROC foi pioneiramente utilizada na segunda guerra mundial quando a capacidade dos operadores de radar (receptores) foi testada para determinar se um sinal na tela do radar representava um objeto ou ruído. Contudo, devido a sua utilidade, passou rapidamente a ser usada em outras áreas, dentre as quais a área de saúde, para avaliação e obtenção de testes diagnósticos em situações em que o uso de testes padrão ouro são custosos ou inexistentes. Outra grande área em que a curva ROC é utilizada é na avaliação da perfomance de métodos de aprendizado de máquina para classificação, como por exemplo, modelos de regressão logística, árvore de decisão e máquinas de vetores de suporte [@bradley1997auc].

Para medir a capacidade diagnóstica de um teste, é comum usar medidas resumidas. Conforme Zhou et al. [-@zhou2011diagnostic], a área sob a curva ROC (AUC) e/ou a área parcial sob a curva ROC (pAUC) são consideradas índices da capacidade discriminatória global de um teste. Um teste com AUC = 1 discrimina indivíduos perfeitamente como doentes ou saudáveis, por exemplo. Enquanto isso, um teste com uma AUC de 0,5 é equivalente a lançar uma moeda - um teste não informativo [@zweig1993rocplots].

A escolha de um valor de corte apropriado é de suma importância para usar um teste de forma eficaz. Embora os valores de AUC, sensibilidade e especificidade sejam úteis na avaliação de um teste, eles não especificam pontos de corte “ótimos” diretamente. Na literatura, há diversas abordagens que usam sensibilidade e especificidade para seleção de pontos de corte [@unal2017cutpoint].

Um dos métodos amplamente usados na literatura é baseado no índice \(J\), proposto por Youden [-@youden1950index] e que considera tanto sensibilidade quanto especificidade para definir o valor “ótimo”. Este método define o ponto de corte ótimo como o ponto que maximiza a função de Youden, isto é, que maximiza

\[ J(c) = Se(c) + (1 - Sp(c)) \]

sobre todos os pontos de corte \(c\); \(\hat{c}_j\) denota o ponto de corte correspondente a \(J\). Quando o valor de \(J\) é máximo, \(\hat{c}_j\) é o valor de corte “ótimo” e corresponde a um ponto na curva ROC com a maior distância vertical da linha diagonal de 45° (o ROC de um teste não informativo).

Árvore de decisão

Nesta seção, introduzimos brevemente o conceito e as principais características da árvore de decisão. Trata-se de um método não paramétrico, com o objetivo de realizar predições para uma variável de interesse (resposta), a partir de um conjunto de variáveis subjacentes (explicativas), a partir do particionamento do espaço de valores das variáveis explicativas através de um critério pré estabelecido.

Uma vez que a construção da árvore é baseada na identificação de variáveis com potencial para explicar a variável de interesse, isso indica que ela fornece evidências de quais dessas variáveis são importantes, realizando uma seleção automática, além de indicar qual a ordem de importância, já que variáveis no topo da árvore possuem maior relevância [@izbicki2020ml].

A árvore de decisão possui grande aplicabilidade prática em diversas áreas do conhecimento, tanto por sua facilidade de implementação e baixo custo computacional, quanto pela simplicidade de interpretação dos resultados.

A maioria das aplicações práticas da árvore de decisão consiste na estimação de funções de predição. Contudo, é possível usar esses métodos também para realizar análise exploratória de dados, permitindo extrair insights sobre a relação e importância das variáveis.

Vários estudos têm usado a árvore de decisão como uma estratégia para identificar pontos de cortes ótimos para variáveis de interesse. Por exemplo, Costa et al. [-@costa2022alzheimer] propõem o uso desse método para identificação de Alzheimer com base em biomarcadores do liquido cerebroespinal. Já Fiorenzato et al. [-@fiorenzato2024parkinson] usam estratégias para identificação da doença de Parkinson usando pontos de corte em relação ao Mini-Mental State Examination e Montreal Cognitive Assessment, que são instrumentos usados para triagem cognitiva.

De maneira formal, a árvore de regressão cria partições das variáveis explicativas em regiões distintas e disjuntas \(R_{1}, \ldots, R_{j}\). Para prever o valor da variável resposta \(Y\) para uma observação com variáveis explicativas \(x \in R_k\), considera-se a média das variáveis respostas correspondentes a essa mesma região, isto é,

\[ g(x) = \frac{1}{|\{i: x_i \in R_k\}|}\sum_{i: x_i \in R_k}y_i. \] Para avaliar quão razoável uma árvore \(T\) é, avaliamos o seu erro quadrático médio

\[ \mathcal{P}(T) = \sum_{R}\sum_{i:x_i \in R}\frac{(y_i - \hat{y}_R)^2}{n}, \] em que \(\hat{Y}_R\) é valor predito para a resposta de uma observação pertencente a região \(R\). Um critério para obteção de uma árvore de regressão seria encontrar \(T\) que minimizasse \(\mathcal{P}(T)\), o que é computacionalmente inviável. Nesse sentido, utiliza-se uma heurística que consiste em divisões binárias recursivas, de modo a encontrar árvores de regressão com baixo erro de predição. Para mais detalhes ver [@james2021isl].

Resultados

Nesta seção são apresentados os principais resultados dos métodos descritos anteriormente para estimação do número de eleitores aptos por seão para o pleito de 2026, com base nos dados das eleições de 2018. Como a interpretação dos resultados e as discussões da aplicação do modelo de calibração, análise da curva ROC e árvore de decisão são análogas, os resultados para o pleito de 2022 são apresentados no apêndice. Inicialmente é apresentada uma análise exploratória de dados. Em seguida, são discutidos os resultados da aplicação dos métodos supracitados.

Resultados da análise exploratória de dados

Nesta seção são apresentados resultados da análise exploratória de dados realizada para avaliar características gerais das eleições de 2018 e 2022 em relação ao tamanho das seções eleitorais e ao tempo de votação dos eleitores. Os resultados foram sumarizados através de medidas descritivas de posição e dispersão e também por meio de recursos de visualização de dados.

Na Tabela 1 são sumarizados dados gerais das eleições de 2018 e 2022. O número de eleitores aptos nos pleitos foram de 32.738.608 e 34.682.973, respectivamente. Já o percentual de eleitores com biometria foram de 45,09% em 2018 e 67,09% em 2022. Dessa forma, nota-se um percentual expressivamente maior de eleitores com biometria em 2022.

Tabela 1: Percentual de eleitores aptos com biometria nas eleições de 2018 e 2022.

Ano	Eleitores aptos	Eleitores com biometria	% com biometria
2018	32.738.608	14.762.947	45,09%
2022	34.682.973	23.269.771	67,09%

Tabela 2: Medidas descritivas para o tempo de atendimento total (min) para as eleições de 2018 e 2022.

Tabela 3: Medidas descritivas para o número de eleitores aptos para as eleições de 2018 e 2022.

A Figura 1 apresenta as estimativas das densidades do número de eleitores aptos para os pleitos de 2018 e 2022 dentro das seções que fizeram uso ou não da identificação biométrica. Nota-se, para ambos os pleitos , uma concentração de seções com número de eleitores aptos superior a 300 nas seções com 100% de identificação biométrica e cerca de 350 nas demais. Ainda, há um número expressivo de seções com mais de 400 eleitores. Esse fato pode estar associado as agregações que são realizadas durante a eleição.

Na Tabela 4 são apresentadas, de forma complementar, algumas medidas descritivas para o eleitorado apto na votação com identificação 100% biométrica para ambas as eleições. O tamanho médio das seções em 2022 foi superior aquele observado no pleito de 2018, cujos valores foram de aproximadamente 304 e 334 eleitores, respectivamente. Ainda, o valor mediano para o pleito de 2022 foi de 341, indicando que 50% das seções eleitorais tinham número de eleitores aptos superior a esse valor. O valor mediano para a eleição de 2018 foi de 311.

Figura 1: Densidade dos aptos por seção com relação à votação com e sem identificação biométrica nas eleições de 2018 e 2022.

Tabela 4: Estatísticas descritivas das seções com identificação biométrica nas eleições de 2018 e 2022.

Ano	Nº seções	Média	Mediana	Desvio padrão	Máximo	Mínimo
2018	9.411	303,88	311,00	66,02	405	19
2022	46.726	333,71	341,00	54,38	570	23

Na Figura 2 são apresentados os mapas para ambos os pleitos em relação ao tamanho médio das seções para cada uma das zonas eleitorais. O mapa indica diversas regiões com altos valores de aptos por seção. Além disso, os mapas indicam uma diferença expressiva de cenário em que as eleições foram realizadas. De fato, o número de zonas com revisão biométrica em 2022 é expressivamente maior quando comparado com o cenário do pleito de 2018.

Figura 2: Mapa da média de eleitores aptos/seção por zona eleitoral nas eleições de 2018 e 2022.

Com os logs das urnas eletrônicas é possível apurar o tempo de atraso para o encerramento das urnas após às 17 horas, que é o horário estipulado para o fim do processo de votação. Assim, considerando o tempo de atraso no encerramento daquelas urnas eletrônicas dos pleitos de 2018 e 2022 em que o eleitor foi identificado com biometria, obtive-se as estatísticas apresentadas na Tabela 5.

Dos resultados, nota-se que o tempo médio de atraso nas seções eleitorais em 2018 foi de 4,33 minutos com um desvio padrão de 7,53 minutos. A estimativa do desvio padrão indica alta dispersão do tempo de atraso nas seções. O tempo médio foi de 2,25 minutos. Ainda, observa-se que o tempo médio na eleição de 2022 o tempo médio de atraso foi quase o dobro, também marcada por uma alta variabilidade.

Na Figura 3 podem ser vistos as distribuições dos tempos de atraso, medidos em minutos referentes às seções que utilizaram identificação com biometria para ambos os anos.

Figura 3: Distribuição do atraso do encerramento da eleição (em min) nas seções com identificação biométrica nas eleições de 2018 e 2022.

Tabela 5: Estatísticas descritivas do tempo de atraso (min) no encerramento das seções com identificação biométrica nas eleições de 2018 e 2022.

Ano	Seções	Média	Mediana	Desvio padrão	Mínimo	Máximo
2018	9.411	4,33	2,25	7,53	0,02	109,30
2022	46.726	8,61	3,03	15,64	0,02	251,23

Para avaliar a distribuição espacial do tempo de atendimento total médio e do tamanho das seções eleitorais em ambos os pleitos, foram construídos gráficos que sumarizam essas informações para cada uma das zonas eleitorais. Destaca-se que as regiões em cinza representam zonas em que não foram realizadas revisões biometricas. Na Figura 4 são representados os valores máximo para o tempo de atendimento total médio para cada uma das zonas eleitorais. Nota-se, para o pleito de 2022, diversas zonas eleitorais com tempo máximo de atendimento superior a 100 segundos.

Figura 4: Mapa do máximo do tempo de atraso/seção por zona eleitoral nas eleições de 2018 e 2022.

Ainda com dados extraídos dos logs das urnas eletrônicas, especificamente das seções em que o voto foi totalmente habilitado biomtericamente em 2018 e 2022, é possível calcular o tempo total médio de atendimento do eleitor (TMAE) que é o tempo, medido em segundos, desde a habilitação até o encerramento da votação do eleitor. Esse tempo reflete a duração média do processo de votação do eleitor em cada seção para completar todos os votos necessários. As principais estatísticas descritivas podem ser vistas na Tabela 6.

Apesar da diferença de um candidato entre as duas eleições, nota-se que não há diferenças expressivas entre os tempos de atendimento médio total. O valor médio estimado para o ano de 2018 foi de 82,86 segundos e para 2022 a estimativa foi de 82,35 segundos.

Tabela 6: Estatísticas descritivas do tempo total médio de atendimento do eleitor (TMAE em segundos) das seções com identificação biométrica nas eleições de 2018 e 2022.

Ano	Seções	Média	Mediana	Desvio padrão	Máximo	Mínimo
2018	9.411	82,86	81,21	10,72	183,27	53,50
2022	46.726	82,35	81,08	10,20	151,24	51,93

Resultado para o Modelo de Calibração

Nesta seção são apresentados os resultados da aplicação do modelo de calibração. Para isso, definiu-se como variável de interesse o tempo total médio de atendimento (\(y\)) e como variável explicativa o número de eleitores aptos (\(x\)). Nesse sentido, o objetivo é obter uma estimativa para o número de eleitores aptos para a seção eleitoral, fixado um valor plausível do tempo total médio de atendimento. Na Figura 5 é apresentado do diagrama de dispersão, que indica uma relação linear entre essas variáveis, o que configura o modelo de calibração como plausível para modelar os dados.

Figura 5: Gráfico de dispersão entre os tempos total de votação médio e eleitores aptos na seção para a eleição de 2018.

No primeiro estágio do modelo de calibração foram estimados os parâmetros associados ao modelo linear entre as variáveis consideradas. Com base nesses valores, realizou-se o experimento de calibração, que consiste em estimar o valor do número de eleitores \(x_0\) para um dado valor \(y_0\) para o tempo de atendimento. Para estimar o número de eleitores aptos por seção, foi considerado como valor de referência para \(y_0\) o valor mediano do tempo total médio de votação dos eleitores em seções com votação biométrica no pleito de 2018, cujo valor foi de 81,2 segundos.

Os cálculos apresentados nas equações 1 e 3 realizados para o conjunto de dados utilizados neste estudo resultaram na estimativa do número de eleitores por seção, segundo o modelo de calibração de \(x_0 =\) 323. O intervalo de confiança de 95% para a estimativa foi realizada por meio de um método de reamostragem bootstrap, considerando o modelo de calibração especificado com 1.000 replicações. A estimativa intervalar, com base no método bootstrap com nível de confiança de 95%, indica que as seções devam ter entre 321 e 325 eleitores para que o tempo total médio de votação seja de 81,2 segundos. A Figura 6 apresenta o intervalo de confiança estimado.

Figura 6: Intervalo de confiança de 95% bootstrap para a número de eleitores por seção estimado pelo modelo de calibração para o ano de 2018.

Para avaliar a quantidade de seções eleitorais necessárias considerando o número de eleitores aptos estimado por seção, foram realizadas algumas simulações considerando, para tanto, o eleitorado atual nos locais de votação atualizados em 16/09/2025. O saldo de seções será determinado pelo número atual de seções eleitorais nos locais de votação subtraído da quantidade necessária de seções, resultado da divisão do eleitorado do local de votação pelo número 325 (eleitorado arredondamento para o próximo inteiro subsequente). Vale destacar que os resultados do saldo serão agregados por Zona Eleitoral e que não leva em consideração a capacidade dos locais de votação comportarem novas seções eleitorais.

O resultado final indica a necessidade de criação de 8.584 seções no Estado para redistribuir os eleitores dentro de seus locais de votação com o número de 325 eleitrores/seção, como estimado pelo modelo de calibração. Isso corresponde a criação de cerca de 8,31% mais de seções no Estado (atualmente há 103.265 seções).

Nas Tabelas 7 e 8 são apresentados as 10 primeiras Zonas eleitorais com maiores saldos de seções a criar e as 10 primeiras zonas eleitorais que teriam diminuição de seções se o critério fosse adotado, respectivamente.

Tabela 7: 10 primeiras Zonas Eleitorais que possuem maior necessidade de criação de seções eleitorais se o número máximo de eleitores for 325 por seção (modelo de calibração).

Zona	Locais	Seções	Aptos	Seções necessárias	Saldo	% sobre seções atuais
372	48	654	247.481	788	134	20,5%
418	43	522	200.812	639	117	22,4%
192	58	489	181.730	588	99	20,2%
371	41	551	202.902	646	95	17,2%
388	32	426	163.586	521	95	22,3%
20	38	454	171.489	548	94	20,7%
199	36	424	162.230	517	93	21,9%
346	44	511	189.359	604	93	18,2%
394	39	451	169.983	544	93	20,6%
256	40	485	180.792	576	91	18,8%

Tabela 8: 10 primeiras zonas eleitorais que teriam diminuição de seções se número máximo de eleitores for 325 por seção (modelo de calibração).

Zona	Locais	Seções	Aptos	Seções necessárias	Saldo	% sobre seções atuais
13	31	305	79.501	258	-47	−15,4%
174	34	402	111.200	360	-42	−10,4%
70	42	317	84.814	282	-35	−11,0%
101	32	287	77.925	253	-34	−11,8%
206	47	378	104.352	348	-30	−7,9%
401	42	444	128.983	418	-26	−5,9%
62	37	287	80.557	264	-23	−8,0%
161	30	202	53.327	180	-22	−10,9%
239	19	169	44.725	147	-22	−13,0%
119	35	315	90.567	294	-21	−6,7%

Resultados para a Curva ROC

Para a estimativa do número de eleitores por seção utilizou-se como variável de interesse um indicador de atraso, que foi definida como 1, se o atraso do encerramento da urna foi igual ou superior a 1 hora ou 0, caso contrário. Com essa variável classificando o atraso em cada uma das seções eleitorais nessas duas categorias e conhecendo-se o número de aptos em cada uma delas, buscou-se definir o valor de corte ótimo dessa variável que maximizasse a sensibilidade e a especificidade, ou seja, que permite a obtenção de altas probabilidades de acerto em relação ao atraso das seções eleitorais.

Para isso, são definidos uma série de pontos de cortes e para cada um deles são obtidos os valores de sensibilidade e especificidade. O ponto de corte ótimo, então, é escolhido com base no critério de Youden, discutido anteriormente. Aqui, assumimos que o número de eleitores aptos por seção aleitoral é um bom preditor ou “teste diagnóstico”, fazendo uma analogia com testes clínicos, para identificar quanto uma seção irá atrasar, com alta probabilidade de acerto. Dessa forma, esse valor pode ser tomado com referência para definição do número de aptos por seção.

A análise da Curva ROC indica que o número de corte que maximiza a capacidade de identificar atraso quando se trata de atraso, como definido no escopo desse estudo, e a capacidade de minimizar os falsos positivos foi 341 eleitores por seção. A curva ROC e o ponto de corte ótimo são apresentados na Figura 7.

Figura 7: Curva Roc considerando atraso no encerramento de votação superior a 1 hora para a eleição de 2018.

Para esse ponto de corte, obtem-se um valor de sensibilidade de cerca de 80,8% e especificidade, 72,1%. Com base nesse ponto de corte, espera-se classificar seções eleitorais em atraso com um pouco mais de 80% de acerto. A área sob a curva calculada foi \(AUC = 76,8\%\), o que afasta a ideia de uma relação aleatória, representada pela linha tracejada na Figura 7 e que corrobora com o poder de discernir o atraso nas seções eleitorais com base no eleitorado apto por seção.

O intervalo de confiança bootstrap de 95% de confiança, com 2.000 replicações para o ponto de corte da curva ROC fica entre 304,5 a 383,5 eleitores por seção. O intervalo de confiança utilizado foi o não paramétrico e por isso não é simétrico em torno do ponto estimado.

A avaliação do impacto dos valores estimados de eleitores aptos por seção eleitoral com base na curva ROC no número de seções nececssárias para acomodar esses eleitores, foram conduzidas algumas simulações, considerando, novamente, o eleitorado atual nos locais de votação atualizados em 16/09/2025 e não levando em consideração a capacidade dos locais de votação comportarem novas seções eleitorais.

Como feito para o modelo de calibração, o saldo de seções será determinado pelo número atual de seções eleitorais nos locais de votação subtraído da quantidade necessária de seções, resultado da divisão do eleitorado do local de votação pelo número 341 (eleitorado arredondado para o próximo inteiro subsequente). Os resultados do saldo serão agregados por Zona Eleitoral.

O modelo considerando o tamanho de seção com 341 eleitores por seção resulta na necessidade de criação de 3.646 seções no Estado para redistribuir os eleitores dentro de seus locais de votação. Isso corresponde a criação de cerca de 3,53% mais de seções no Estado (atualmente há 103.265 seções). A Tabela 9 indica as 10 primeiras zonas eleitorais com maiores saldos de seções a criar. Já na Tabela 8 são apontas as 10 primeiras zonas eleitorais que teriam diminuição de seções se o critério fosse adotado.

Tabela 9: 10 primeiras Zonas Eleitorais que possuem maior necessidade de criação de seções eleitorais se o número máximo de eleitores for 341 por seção (ponto de corte da Curva ROC)

Zona	Locais	Seções	Aptos	Seções necessárias	Saldo	% sobre seções atuais
372	48	654	247.481	752	98	15,0%
418	43	522	200.812	614	92	17,6%
192	58	489	181.730	561	72	14,7%
199	36	424	162.230	495	71	16,7%
388	32	426	163.586	494	68	16,0%
20	38	454	171.489	521	67	14,8%
394	39	451	169.983	518	67	14,9%
281	40	428	160.768	492	64	15,0%
346	44	511	189.359	575	64	12,5%
371	41	551	202.902	615	64	11,6%

Tabela 10: 10 primeiras zonas eleitorais que teriam diminuição de seções se número máximo de eleitores for 341 por seção (curva ROC).

Zona	Locais	Seções	Aptos	Seções necessárias	Saldo	% sobre seções atuais
174	34	402	111.200	341	-61	−15,2%
13	31	305	79.501	250	-55	−18,0%
206	47	378	104.352	329	-49	−13,0%
70	42	317	84.814	270	-47	−14,8%
401	42	444	128.983	400	-44	−9,9%
101	32	287	77.925	246	-41	−14,3%
135	44	493	146.273	452	-41	−8,3%
62	37	287	80.557	251	-36	−12,5%
119	35	315	90.567	283	-32	−10,2%
161	30	202	53.327	171	-31	−15,3%

De maneira análoga, foi conduzida uma simulação considerando como número de eleitores aptos por seção um valor dentro do intervalo de confiança. Assumindo o valor, então, como estimativa \(n = 380\) eleitores aptos por seção, o saldo geral de seções a serem criadas seria de - 6.651 seções (cerca de -6,6% do total de seções do Estado), ou seja, haveria a redução da quantidade de seções comparando-se à situação atual. As Tabelas 11 e 12 apresentam as 10 primeiras zonas eleitorais que teriam que criar e diminuir seções, respectivamente.

Tabela 11: 10 primeiras Zonas Eleitorais que possuem maior necessidade de criação de seções eleitorais se o número máximo de eleitores for 380 por seção (curva ROC).

Zona	Locais	Seções	Aptos	Seções necessárias	Saldo	% sobre seções atuais
418	43	522	200.812	550	28	5,4%
199	36	424	162.230	449	25	5,9%
372	48	654	247.481	676	22	3,4%
388	32	426	163.586	448	22	5,2%
192	58	489	181.730	510	21	4,3%
345	33	276	105.426	297	21	7,6%
20	38	454	171.489	473	19	4,2%
273	37	328	123.432	347	19	5,8%
248	32	424	160.278	442	18	4,2%
394	39	451	169.983	467	16	3,5%

Tabela 12: 10 primeiras zonas eleitorais que teriam diminuição de seções se número máximo de eleitores for 380 por seção (curva ROC).

Zona	Locais	Seções	Aptos	Seções necessárias	Saldo	% sobre seções atuais
174	34	402	111.200	309	-93	−23,1%
135	44	493	146.273	409	-84	−17,0%
401	42	444	128.983	362	-82	−18,5%
13	31	305	79.501	225	-80	−26,2%
206	47	378	104.352	298	-80	−21,2%
70	42	317	84.814	243	-74	−23,3%
247	39	512	162.867	445	-67	−13,1%
101	32	287	77.925	221	-66	−23,0%
52	60	425	126.732	362	-63	−14,8%
356	45	464	144.902	402	-62	−13,4%

Resultados para a árvore de decisão

Para definir, com base na árvore de decisão, um ponto de corte para o tamanho da seção eleitoral, foi considerada como variável resposta o tempo de atraso das seções eleitorais. Além disso, foi fixado como profundidada máxima da árvore como 1, de modo a obter apenas uma partição da variável tamanho da seção. Na Figura 8 é apresentado o desenho da árvore obtida, em que foi definida como partição ótima um tamanho de seção de 341 eleitores, isto é, uma partição que minimiza a soma dos quadrados dos erros. Vale destacar que não foram apresentadas as tabelas dos cenários simulados para a árvore de decisão, uma vez que o valor estimado para o número de eleitores aptos por seção foi idêntico aquele obtido pela análise da curva ROC.

Figura 8: Árvore de decisão para a eleição de 2018.

Referências

Apêndice A - Resultados 2022

Neste apêndice são apresentados os resultados da aplicação das metodologias apresentadas anteriormente, considerando os dados do pleito de 2022. O objetivo dessas análises é fornecer informações adicionais sobre o dimensionamento do tamanho das seções, considerando uma eleição mais recente. Embora o pleito de 2022 tenha contemplado 5 cargos, os dados sugerem que não há diferenças expressivas no tempo de votação. Contudo, para o número de aptos por seção e para o número de seções que tiveram atraso de pelo menos uma hora é possível observar valores maiores para o ano de 2022 comparativamente a eleição de 2018.

Resultados para o modelo de calibração

Para a eleiçãço de 2022, a estimativa do eleitorado apto por seção segundo o modelo de calibração foi de \(x_0 =\) 355. O respectivo intervalo de confiança de 95% foi de [354, 357] eleitores para que o tempo total médio de votação seja de 81,1 segundos. Na Figura 9 é apresentado o diagrama de dispersão entre o tempo total de votação médio e os eleitores aptos na seção.

Figura 9: Gráfico de dispersão entre os tempos total de votação médio e eleitores aptos na seção para a eleição de 2022.

Nas Tabelas 13 e 14 são apresentados 10 zonas eleitorais com os maiores e menores impactos, respectivamente, ao considerar o valor estimado de 355 eleitores aptos por seção. Destaca-se que nesse cenário, seriam necessárias 102.822 seções eleitorais, o que representa uma redução de aproximadamente -0,43% em relação o número de seções atuais.

Tabela 13: 10 primeiras Zonas Eleitorais que possuem maior necessidade de criação de seções eleitorais se o número máximo de eleitores for 355 por seção (modelo de calibração).

Zona	Locais	Seções	Aptos	Seções necessárias	Saldo	% sobre seções atuais
372	48	654	247.481	723	69	10,6%
418	43	522	200.812	585	63	12,1%
20	38	454	171.489	506	52	11,5%
199	36	424	162.230	476	52	12,3%
192	58	489	181.730	540	51	10,4%
388	32	426	163.586	477	51	12,0%
394	39	451	169.983	499	48	10,6%
346	44	511	189.359	557	46	9,0%
371	41	551	202.902	596	45	8,2%
248	32	424	160.278	467	43	10,1%

Tabela 14: 10 primeiras zonas eleitorais que teriam diminuição de seções se número máximo de eleitores for 355 por seção (modelo de calibração).

Zona	Locais	Seções	Aptos	Seções necessárias	Saldo	% sobre seções atuais
174	34	402	111.200	331	-71	−17,7%
13	31	305	79.501	238	-67	−22,0%
401	42	444	128.983	381	-63	−14,2%
135	44	493	146.273	434	-59	−12,0%
206	47	378	104.352	319	-59	−15,6%
70	42	317	84.814	262	-55	−17,4%
101	32	287	77.925	239	-48	−16,7%
119	35	315	90.567	271	-44	−14,0%
62	37	287	80.557	246	-41	−14,3%
33	32	365	109.984	327	-38	−10,4%

Resultados para a curva ROC

A curva ROC para os dados da eleição de 2022, considerando-se as mesmas configurações do estudo anterior, apresenta ponto de corte de 365 eleitores por seção, com \(AUC =84,3\%\) . A curva pode ser vista na Figura 10.

Figura 10: Curva Roc considerando atraso no emcerramento de votação o tempo maior que 1 hora para a eleição de 2022.

O intervalo de confiança bootstrap de 95% de confiança, com 2.000 replicações para a o ponto de corte da curva ROC fica entre [ 357.5 , 371.5 ] eleitores por seção.

Com os dados da eleição de 2022 e o ponto de corte estimado pela curva ROC em \(n = 365\) eleitores por seção, a quantidade de seções a serem extintas seria de -3.014 unidades (redução de 2,9% com relação à quantidade de seções de 2025 103.265). As 15 e 16 representam as 10 primeiras zonas eleitorais que teriam que criar e diminuir seções, respectivamente.

Tabela 15: 10 primeiras Zonas Eleitorais que possuem maior necessidade de criação de seções eleitorais se o número máximo de eleitores for 365 por seção (Curva ROC).

Zona	Locais	Seções	Aptos	Seções necessárias	Saldo	% sobre seções atuais
418	43	522	200.812	573	51	9,8%
372	48	654	247.481	703	49	7,5%
192	58	489	181.730	527	38	7,8%
20	38	454	171.489	491	37	8,1%
199	36	424	162.230	461	37	8,7%
388	32	426	163.586	463	37	8,7%
281	40	428	160.768	463	35	8,2%
394	39	451	169.983	486	35	7,8%
256	40	485	180.792	516	31	6,4%
273	37	328	123.432	359	31	9,5%

Tabela 16: 10 primeiras zonas eleitorais que teriam diminuição de seções se número máximo de eleitores for 365 por seção (curva ROC).

Zona	Locais	Seções	Aptos	Seções necessárias	Saldo	% sobre seções atuais
174	34	402	111.200	321	-81	−20,1%
401	42	444	128.983	371	-73	−16,4%
13	31	305	79.501	234	-71	−23,3%
135	44	493	146.273	422	-71	−14,4%
206	47	378	104.352	313	-65	−17,2%
70	42	317	84.814	255	-62	−19,6%
101	32	287	77.925	232	-55	−19,2%
119	35	315	90.567	266	-49	−15,6%
62	37	287	80.557	239	-48	−16,7%
52	60	425	126.732	378	-47	−11,1%

Resultados para a árvore de decisão

Os resultados da árvore de decisão com os dados de 2022 são apresentados na Figura 11. O ponto de corte foi seções com \(n=369\) eleitores, resultado muito próximo do encontrado no estudo da curva ROC. Os resultados da simulação da quantidade de seções com a redistribuição hipotética dos eleitores são muito parecidos, também. Seriam extintas 4.023 seções (-3,89%) com relação ao total de seções de 2022.

Figura 11: Árvore de decisão para a eleição de 2022.

As Tabelas 17 e 18 representam as 10 primeiras zonas eleitorais que teriam que criar e diminuir seções, respectivamente se utilizado esse modelo.

Tabela 17: 10 primeiras Zonas Eleitorais que possuem maior necessidade de criação de seções eleitorais se o número máximo de eleitores for 369 por seção (árvore de decisão).

Zona	Locais	Seções	Aptos	Seções necessárias	Saldo	% sobre seções atuais
418	43	522	200.812	567	45	8,6%
372	48	654	247.481	697	43	6,6%
388	32	426	163.586	460	34	8,0%
20	38	454	171.489	486	32	7,0%
199	36	424	162.230	455	31	7,3%
394	39	451	169.983	481	30	6,7%
192	58	489	181.730	518	29	5,9%
281	40	428	160.768	456	28	6,5%
273	37	328	123.432	354	26	7,9%
248	32	424	160.278	449	25	5,9%

Tabela 18: 10 primeiras zonas eleitorais que teriam diminuição de seções se número máximo de eleitores for 369 por seção (árvore de decisão).

Zona	Locais	Seções	Aptos	Seções necessárias	Saldo	% sobre seções atuais
174	34	402	111.200	318	-84	−20,9%
135	44	493	146.273	418	-75	−15,2%
401	42	444	128.983	369	-75	−16,9%
13	31	305	79.501	231	-74	−24,3%
206	47	378	104.352	311	-67	−17,7%
70	42	317	84.814	251	-66	−20,8%
101	32	287	77.925	231	-56	−19,5%
119	35	315	90.567	263	-52	−16,5%
62	37	287	80.557	236	-51	−17,8%
52	60	425	126.732	375	-50	−11,8%

Outros formatos

Introdução

Metodologia

Modelo de calibração

Método da Curva característica do receptor (curva ROC)

Árvore de decisão

Resultados

Resultados da análise exploratória de dados

Resultado para o Modelo de Calibração

Resultados para a Curva ROC

Resultados para a árvore de decisão

Referências

Apêndice A - Resultados 2022

Resultados para o modelo de calibração

Resultados para a curva ROC

Resultados para a árvore de decisão