Travis-CI Build Status AppVeyor Build Status

1 pesqEle

Scraper de estatísticos registrados nas pesquisas do TSE.

1.1 Instalação

Este pacote não está disponível no CRAN. Para instalar, rode

if (!require(devtools)) install.packages('devtools')
devtools::install_github('conre3/pesqEle')

1.2 Utilização

Esse pacote contém funções úteis para baixar informações do serviço pesqEle do TSE. Exemplo de utilização:

library(pesqEle)
data(cities)
d_log <- pesq_download_cities(head(cities))
arqs_main <- dir('data-raw/html', 
                 pattern = '[A-Z]{2}_[0-9]+\\.html',
                 full.names = TRUE)
arqs_details <- dir('data-raw/html', 
                    pattern = '[A-Z]{2}_[0-9]+_[0-9]+\\.html',
                    full.names = TRUE)
d_main <- pesq_parse_main(arqs_main)
d_details <- pesq_parse_main(arqs_details)

As bases completas já foram baixadas e carregadas no pacote:

  • cities contém a relação de cidades.
  • pesq_main contém informações básicas de cada pesquisa eleitoral.
  • pesq_detalhes contém detalhes de cada pesquisa eleitoral.

Veja help(<bd>) para mais detalhes.

2 Histórico

A Consulta às Pesquisas Eleitorais por Estatístico é uma ferramenta do TSE que permite consultar todas as pesquisas eleitorais realizadas no Brasil. A possibilidade de pesquisar pesquisas por nome do estatístico revelou uma série de fraudes, como a inclusão indevida da presidente do CONRE-3 em mais de 20 pesquisas eleitorais.

3 Análise da base de dados

Foram baixadas duas bases principais. A primeira, aqui chamada pesq_main mostra informações básicas de cada pesquisa, especificamente: código identificador, nome fantasia da empresa contratada, nome e número de registro do estatístico, data de registro, município e UF. A segunda, chamada pesq_details está estruturada na forma ‘key-value’ e contém informações do plano amostral, custo e CNPJ da empresa responsável.

3.1 Base principal

Temos no total 8104 pesquisas registradas, envolvendo 453 nomes distintos de estatísticos responsáveis e 536 nomes distintos de empresas.

As Tabelas 3.1 e 3.2 mostram o volume de pesquisas registradas por nome do estatístico responsável e nome fantasia da empresa, respectivamente.

Figure 3.1:

Figure 3.2:

A Figura 3.3 mostra o volume de pesquisas registradas diariamente.

Figure 3.3: Volume diário de pesquisas registradas.

A Figura 3.4 mostra a distribuição geográfica das pesquisas. Ainda falta arrumar 19 nomes que não bateram.

Figure 3.4: Distribuição geográfica das pesquisas registradas.

3.2 Base detalhada

A Tabela 3.5 mostra todas as 537 empresas que registraram pesquisas, ordenadas por volume de pesquisas. As 10 empresas com maior volume de pesquisas concentram 20% das pesquisas.

Figure 3.5:

A Tabela 3.1 confronta os CNPJs das empresas que realizaram pesquisas (somente em SP, PR, MT e MS) com a relação de empresas que estão registradas e em dia com o CONRE-3, o CONRE-4 ou o CONRE-6. A Tabela 3.6 mostra a relação das empresas que não estão registradas ou estão registradas e não estão em dia com o CONRE-3 ou CONRE-6. É importante mencionar que as empresas dessa relação podem ser registradas em conselhos de outras regiões.

Table 3.1: Contagem de empresas registradas no CONRE-3, CONRE-4 ou CONRE-6 que registraram pesquisas no TSE (somente em SP, PR, MT e MS).
Registrado n
Não 104
Sim 66

Figure 3.6:

4 License

MIT