Scraper de estatísticos registrados nas pesquisas do TSE.
Este pacote não está disponível no CRAN. Para instalar, rode
if (!require(devtools)) install.packages('devtools')
devtools::install_github('conre3/pesqEle')
Esse pacote contém funções úteis para baixar informações do serviço pesqEle do TSE. Exemplo de utilização:
library(pesqEle)
data(cities)
d_log <- pesq_download_cities(head(cities))
arqs_main <- dir('data-raw/html',
pattern = '[A-Z]{2}_[0-9]+\\.html',
full.names = TRUE)
arqs_details <- dir('data-raw/html',
pattern = '[A-Z]{2}_[0-9]+_[0-9]+\\.html',
full.names = TRUE)
d_main <- pesq_parse_main(arqs_main)
d_details <- pesq_parse_main(arqs_details)
As bases completas já foram baixadas e carregadas no pacote:
cities contém a relação de cidades.pesq_main contém informações básicas de cada pesquisa eleitoral.pesq_detalhes contém detalhes de cada pesquisa eleitoral.Veja help(<bd>) para mais detalhes.
A Consulta às Pesquisas Eleitorais por Estatístico é uma ferramenta do TSE que permite consultar todas as pesquisas eleitorais realizadas no Brasil. A possibilidade de pesquisar pesquisas por nome do estatístico revelou uma série de fraudes, como a inclusão indevida da presidente do CONRE-3 em mais de 20 pesquisas eleitorais.
Foram baixadas duas bases principais. A primeira, aqui chamada pesq_main mostra informações básicas de cada pesquisa, especificamente: código identificador, nome fantasia da empresa contratada, nome e número de registro do estatístico, data de registro, município e UF. A segunda, chamada pesq_details está estruturada na forma ‘key-value’ e contém informações do plano amostral, custo e CNPJ da empresa responsável.
Temos no total 8104 pesquisas registradas, envolvendo 453 nomes distintos de estatísticos responsáveis e 536 nomes distintos de empresas.
As Tabelas 3.1 e 3.2 mostram o volume de pesquisas registradas por nome do estatístico responsável e nome fantasia da empresa, respectivamente.
Figure 3.1:
Figure 3.2:
A Figura 3.3 mostra o volume de pesquisas registradas diariamente.
Figure 3.3: Volume diário de pesquisas registradas.
A Figura 3.4 mostra a distribuição geográfica das pesquisas. Ainda falta arrumar 19 nomes que não bateram.
Figure 3.4: Distribuição geográfica das pesquisas registradas.
A Tabela 3.5 mostra todas as 537 empresas que registraram pesquisas, ordenadas por volume de pesquisas. As 10 empresas com maior volume de pesquisas concentram 20% das pesquisas.
Figure 3.5:
A Tabela 3.1 confronta os CNPJs das empresas que realizaram pesquisas (somente em SP, PR, MT e MS) com a relação de empresas que estão registradas e em dia com o CONRE-3, o CONRE-4 ou o CONRE-6. A Tabela 3.6 mostra a relação das empresas que não estão registradas ou estão registradas e não estão em dia com o CONRE-3 ou CONRE-6. É importante mencionar que as empresas dessa relação podem ser registradas em conselhos de outras regiões.
| Registrado | n |
|---|---|
| Não | 104 |
| Sim | 66 |
Figure 3.6:
MIT