Simbolo Colorido



É de suma importância documentar o todo o processo de ajuste dos dados, desde a criação da base de cadastro, a anomização até a limpeza dos dados. Ter tudo o que foi feito relatado em arquivos acessíveis é interessante por vários motivos: para facilitar a divulgação dos dados, a publicação de pesquisa, e, para no futuro, conseguir reviver o que foi feito e decisões que foram tomadas. Para isso, criamos modelos de documentação em arquivos .txt1 2 para orientar o quê precisa ser documentado e como. Esse arquivo deve começar com o nome “leia_me” e deve ser complementado com o nome do que se refere, por exemplo “leia_me_limpeza” e “leia_me_anonimizacao”.

O seu leia-me deve sempre começar com o nome do projeto.

Em seguida, é preciso contextualizar sobre o projeto, então faça um parágrafo breve apresentando o projeto.

Por fim, também deve sempre ter uma parte que destaque os arquivos utilizados e os gerados, e os programas utilizados. SEMPRE INCLUINDO O CAMINHO EM QUE ESTÃO SALVOS, para que seja possível rastrear o processo sem perda de informação.

Base de cadastro

Além dos tópicos já ditos, em relação ao Leia-me da Base de Cadastro é preciso uma parte com a descrição de como o identificador foi criado, quais informações foram utilizadas e a origem delas3. A Figura 1 abaixo exemplifica como o Leia-me deve ser organizado e seu conteúdo.

Figura 1 - Exemplo do conteúdo e de organização do Leia-me da Base de Cadastro

Anonimização

Primeiro, para a anonimização é preciso que os dados passem por uma organização, vide o Protocolo do Processo de Ajuste de Dados. Em seguida é feita a anonimização.

Assim, além dos tópicos padrões, é preciso que no Leia-me de Anonimização tenha uma parte explicando as correções feitas antes da anonimização. É preciso explicar, também, se houveram duplicações e como elas foram tratadas. Por fim, que se explicará o processo de anonimização. A Figura 2 abaixo exemplifica como esse Leia-me deve ser organizado e seu conteúdo.

Figura 2 - Exemplo do conteúdo e de organização do Leia-me de Anonimização

Limpeza dos dados

O Leia-me de Limpeza de dados precisa falar todos os processos feitos na limpeza de forma resumida e com exemplos. A Figura 3 abaixo ilustra o quê é preciso descrever nesse documento. É possível, ainda, que a base em que esteja trabalhando possua alguma alteração específica e ela precisa ser relatada no Leia-me.

Por fim, é preciso descrever a ordenação de colunas feita na base de dados e o formato salvo. Por exemplo: ordenação das colunas conforme questionário ou instrumento aplicado e as variáveis criadas foram adicionadas ao final.

Figura 3 - Exemplo do conteúdo e de organização do Leia-me da Limpeza de Dados

Contato

Laboratório de Estudos e Pesquisas em Economia Social (LEPES).

Rua das Paineiras, casa 11. Campus da USP-RP

www.lepes.fearp.usp.br

  1. 3315-3918

Acompanhe-nos:
Facebook Instagram Linkedin YouTube Twitter


  1. O formato .txt é mais universal do que .doc.↩︎

  2. No Windows pode ser feito no Bloco de Notas. No macOS pode ser feito no TextEdit.↩︎

  3. Para mais informações sobre a Base de Cadastro, veja o Protocolo do Processo de Ajuste de Dados↩︎