29 de setembro de 2016

Introduçao

Contexto

  • Indicadores de Desenvolvimento Regional;

  • Serviço de mapas e geoprocessamento;

  • Output: dados regionalizados (municípios, microrregiões, etc.) em mapas interativos.

  • Objetivos:

    • Registro sistemático de dados e indicadores;
    • Documentação sobre conteúdo e definições dos inicadores apresentados;
    • Documentação completa do processo de criação destes indicadores;
    • Reprodutibilidade da informação

Contexto

  • Múltiplas fontes de dados (estruturas variadas), que seguem um fluxo de dados

Reprodutibilidade

Reprodutibilidade

  • Reprodutibilidade em pesquisas
  • Vantagens da reprodutibilidade dos dados:
    • Preserva a integridade da informação;

    • Alinha o conhecimento sobre os dados e indicadores;

    • Permite trabalhos colaborativos e auditorias internas;

    • Evita retrabalho;

    • Evita números incoerentes sobre o mesmo indicador;

Ferramentas

Ferramentas para documentação

Até o momento utilizou-se as seguintes ferramentas para registro e documentação de dados e indicadores:

  • Planilha de Metadados (Dicionário de Variáveis) -

  • Relatórios em ferramenta cms -

  • Scripts de programação -

  • Controle de versão dos scripts -

Planilha de metadados

(Dicionário de variáveis)

Planilha de metadados

  • Catalogação sistemática das bases de dados;

  • Regisro dos nomes e descrições de colunas;

  • Registro de outras informações essenciais:
    • periodicidade;
    • recorte territorial;
    • fonte da informação;
    • Dentre outros.
  • Endereço para um relatório em página wiki e o script de programação utilizado;

  • Planilha de metadados (exemplo).

Relatórios

Ferramenta CMS

Ferramentas WIKI/CMS

  • XWIKI, JOOMLA, WORDPRESS

  • Torna amigável a gestão do conteúdo;

  • Ambiente colaborativo;

  • Permite criar páginas com relatórios sobre cada base de dados ou indicador;

  • Uso para dados: documentação abordando detalhes que não cabem na planilha de metadados
    • ex.: método de contrução da informação primária;
    • interpretação dos dados;
    • limitações metodológicas e ressalvas
  • Página sobre fonte de dados

  • Página sobre indicador consolidado

Scripts de produção dos dados

Scripts de produção dos dados

  • Objetivos:
    • Automatizar/acelerar operações
    • registrar detalhes técnicos da construção do dado/indicador
    • torna o trabalho reproduzível
  • As linhas de comando por si só já registram detalhes das operações realizadas;

  • Nem tudo é programação: alterações manuais são também registradas, para talvez virarem código de programação no futuro;

  • Exemplo: script de consolidação do grau de cobertura vegetal municipal

Git

Ferramenta para controle de versão

Controle de versão

  • Controle de versão via Git;

  • O Git registra espécie de ``fotografias'' de um conjunto de arquivos editáveis;

  • Preserva a integridade das rotinas (e, por consequência, dos dados em si);

  • Facilita o compartilhamento de scripts;

  • Interface gráfica amigável via Git Extensions;

Funcionamento básico do Git

Exemplo funcional

Exemplo de mapa no ODR

Aprimoramentos possíveis

Aprimoramentos Possíveis e Adaptações

  • Hospedagem de documentação:
    • Wordpress/Joomla
    • Arquivos .md no Gitlab/Github Ex.
  • Rmarkdown: rotina e documentação em um só arquivo
  • Metadados produzidos no script
  • Metadados alimentados diretamente em banco de dados via formulário.

  • Páginas Git:

Software R

Mais vantagens para se usar

Mais vantagens para se usar o R

OBRIGADO!