Durante a trajetória do LEPES, diversas pessoas participaram de múltiplos projetos, cada um com um modo particular de trabalho e organização. Ao longo dos anos, naturalmente, a constante elaboração de projetos gerou (e continua gerando) um grande volume de dados e todo dado coletado é relevante para a pesquisa. Tendo em vista que a falta de padronização e organização pode levar a perda de muitos desses dados, seja por falha no equipamento ou por falta de comunicação, a Equipe de Dados elaborou, com base em estudos de caso do Banco Mundial e de Data Management, um protocolo para orientar todas as ações nesse âmbito, evitando a perda de dados e otimizando o trabalho realizado.
Este documento apresenta a estrutura organizacional que deve ser adotada para uso no Google Drive. Também descreve procedimentos para a padronização do trabalho dos membros do laboratório, como a maneira correta de documentar, armazenar e organizar os arquivos.
A adoção de um modelo único de nomenclatura facilita a recuperação de dados interequipes e dos dados em geral. Evita o desaparecimento de arquivos e também soluciona problemas relacionados ao versionamento. Em suma, minimiza as dificuldades encontradas pelos usuários nos processos de busca pelos arquivos.
Regras gerais:
Não utilizar acentuação, ç (cedilha), símbolos ª ou º, caracteres especiais ou de pontuação (^~*!#%$&);
Não utilizar espaços em branco ou - (hífen). Os campos deverão ser separados por underscores “_” sem espaço de digitação;
Utilizar apenas letras minúsculas;
Evitar preposições, conjunções e artigos (o, a, e, de, do, da…);
Os nome dados aos arquivos devem facilitar a sua busca, devendo ser orientado pelo seu conteúdo, como relatório de…, apresentação X, proposta y, etc.;
A data da última edição do arquivo será utilizada como versionamento. O padrão adotado é o ISO 8601-2:2019, no formato ano-mês-dia (AAAAMMDD);
O versionamento pode ser inserido antes ou depois do nome do arquivo. Dentro de um mesmo projeto a inserção deve ser uniforme, ou seja, sempre antes ou sempre depois.
Exemplo:
Considere 26/08/2021 como a data da última alteração:
Nome anterior: Questionário do Diretor-5º ano v2
Nome atual: questionario_diretor_5_ano_20210826 ou 20210826_questionario_diretor_5_ano
A ferramenta de trabalho adotada pelo LEPES é o Google Drive. A estrutura definida é composta por seis pastas principais que serão explicadas a seguir: Dados, Dados Pessoais, Projetos, Equipes, Utilitários e Instrumentos.
Para a nomeação das pastas deverá ser seguido o padrão adotado para a nomeação de arquivos. Importante: Não é obrigatório o uso do versionamento para as pastas.Atenção ao criar pastas e subpastas, o limite estabelecido de 10 (dez) níveis não deve ser ultrapassado.
Contém arquivos pertinentes à cada equipe como cronogramas, fluxo de trabalho e dias de estudo assim como outros conteúdos relativos à organização da equipe.
Esta pasta contém todos os arquivos relacionados aos dados já anonimizados do projeto, inclusive os dados.
Esta pasta é uma pasta opcional, que só deve ser criada caso haja necessidade. Ela deve conter dados externos ao projeto mas que estão sendo utilizados nele, como por exemplo, dados do Censo ou do Censo Escolar que foram utilizados em algum momento do projeto. Atenção, caso esses dados já existam no LEPES, eles não devem ser copiados nessa pasta, mas sim serem chamados de onde estão.
Esta pasta contém dados que não são brutos e também não são finais, ou seja, são dados que estão no processo de finalização. O seu intuito é armazenar arquivos que sofreram alguma alteração e precisam ser mantidos, sendo possível realizar checagens futuras, caso necessário.
Esta pasta deve conter somente os dados finais, que já passaram pela limpeza, pela anonimização e qualquer outro tratamente necessário. Esse dados finais, são dados já prontos para serem analisados e utilizados.
Esta pasta contém os questionários utilizados no projeto, geralmente no formato .doc ou .pdf.
Esta pasta contém os dicionários dos dados finais.
Esta pasta deve conter todos os programas utilizados após a anonimização. Esses programas devem estar ordenados conforme o processo do tratamento dos dados, através de números no início do nome do arquivo. Por exemplo: 03_limpeza, 04_renomeacao … Essa ordenação orienta qual foi o processo que o dado passou.
Ainda, esta pasta deve conter a documentação (em leia-me) sobre os processos que os dados passaram. Sobre essa documentação, veja o Protocolo de Documentação (leia-me).
Pasta Campo: Caso o seu projeto faça o uso de algum programa durante a coleta dos dados, esse programa deve ser salvo nessa pasta, mas atenção, esses dados não podem conter informações pessoais.
A orientação é que as subpastas sejam divididas por anos, estados ou cidades, de acordo com o projeto em questão, como é ilustrado na figura abaixo.
Esta pasta contém todos os arquivos relacionados aos dados ainda não anonimizados do projeto, ou seja, os dados que possuem informações pessoais e sensíveis.
Essa pasta contém o resultado dos sorteios da amostra realizados para a pesquisa de campo que incluam dados pessoais.
Esta pasta é uma pasta opcional, que só deve ser criada caso haja necessidade. Ela deve conter dados externos ao projeto mas que estão sendo utilizados nele, como por exemplo, dados do Censo ou do Censo Escolar que foram utilizados em algum momento do projeto. Atenção, caso esses dados já existam no LEPES, eles não devem ser copiados nessa pasta, mas sim serem chamados de onde estão.
Esta pasta deve conter somente os dados brutos, ou seja, os dados obtidos na coleta e que não sofreram nenhum tipo de alteração.
Observação: Em geral, os dados coletados (dados brutos) vêm com informações pessoais, por isso os dados brutos estão localizados na pasta marco Dados pessoais. Caso seu projeto tenha dados brutos já anonimizados (ou sem informações pessoais), essa pasta pode ser criada dentro da pasta macro Dados.
Esta pasta contém os dicionários da base de cadastro e dos dados pessoais (que estavam na base bruta e foram separados durante a anonimização).
Esta pasta deve conter todos os programas utilizados até a anonimização. Esses programas devem estar ordenados conforme o processo do tratamento dos dados, através de números no início do nome do arquivo. Por exemplo: 00_base_cadastro, 01_organizacao, 02_anonimizacao … Essa ordenação orienta qual foi o processo que o dado passou.
Pasta Campo: Caso o seu projeto faça o uso de algum programa durante a coleta dos dados, esse programa deve ser salvo nessa pasta. Por exemplo: um script para checagem da qualidade dos dados pode ser salvo nessa pasta.
A orientação é que as subpastas sejam divididas por anos, estados ou cidades, de acordo com o projeto em questão, como é ilustrado na figura abaixo.
A pasta macro projetos traz o trabalho consolidado, cada pasta é referente a um projeto específico. Altamente recomendado que na pasta de cada projeto haja um arquivo LEIA-ME para explicar como o projeto em específico se relaciona com as demais agendas do LEPES. Esse arquivo deverá ser elaborado no formato .txt.
Versões finais de todas as apresentações feitas no projeto.
Esta pasta possui arquivos relacionados ao acompanhamento do campo de pesquisa do projeto. Caso haja a necessidade de compartilhamento externo, usar a pasta acesso externo.
Trata-se de uma pasta destinada para armazenar todo e qualquer material de cunho burocrático. Isso engloba desde contratos em tramitação a comitês de ética. Os arquivos editáveis que geraram contratos devem estar nessa pasta. Acordos de cooperação, termos de responsabilidade, consentimento, ou de qualquer natureza que qualifiquem parceria e/ou permissão jurídica de realização da pesquisa. Pastas como CEP, (Comitê de Ética e Pesquisa) acordos e termos e plano de trabalho são sugeridas para orientar a organização, sendo possível a criação de outras, caso surja a necessidade.
Contém pastas para conteúdos que ajudam a orientar o projeto, como outline, cronogramas, orçamentos e atas de reuniões.
Esta pasta deve ter os instrumentos e informações relacionadas, contendo, de preferência, a versão original, versão em português (e algo sobre o processo de tradução/retrotradução se houver), literatura (ex.: art. Validação, art. aplicações), etc. Aqui também se encaixam questionários para entrevistas estruturadas ou semiestruturadas. Em outras palavras, quaisquer instrumentos utilizados, sejam qualitativos ou quantitativos, precisam ser inseridos aqui, junto com outras informações. Deve conter as subpastas intermérdiarios e finais.
Ao se tratar dos elementos consumidos na composição do projeto, a pasta “insumos” é a indicada. Nela são inseridos arquivos como o material literário utilizado. Importante não colocar arquivos intermediários na pasta, apenas arquivos utilizados para desenvolver o projeto.
Deve conter todos os resultados obtidos, organizados em imagens, tabelas, textos e programas.A pasta programas não precisa conter as subpastas intermediários e finais. Já as pastas textos, imagens e tabelas devem, obrigatoriamente conter as subpastas inermediários e finais, como consta na figura que ilustra a estrutura.
Contém modelos de apresentações, textos e outras informações a serem acessadas e utilizadas por todos do LEPES.
Aqui estão todos os protocolos vigentes no LEPES.
A pasta cursos armazena os vídeos e materiais dos cursos realizados e oferecidos pelo LEPES.
Contém modelos de slides e apresentações, manual de comunicação visual, outros recursos gráficos e orientações úteis.
Aqui constam estruturas de contratos e relatórios disponibilizadas pelo administrativo. Caso não encontre o modelo que busca nesta pasta, o arquivo provavelmente não deve ser armazenado em pastas de acesso geral, basta entrar em contato com o líder de equipe para buscar orientações.
A pasta instrumentos é exclusiva para quando o projeto é o desenvolvimento ou criação de um instrumento.
A pasta “campo_validacao” é uma pasta que contém arquivos de acompanhamento de um campo realizado para validação do instrumento.
Versões finais de todas as apresentações feitas no projeto.
Trata-se de uma pasta destinada para armazenar todo e qualquer material de cunho burocrático. Isso engloba desde contratos em tramitação a comitês de ética. Os arquivos editáveis que geraram contratos devem estar nessa pasta. Acordos de cooperação, termos de responsabilidade, consentimento, ou de qualquer natureza que qualifiquem parceria e/ou permissão jurídica de realização da pesquisa. Pastas como CEP, (Comitê de Ética e Pesquisa) acordos e termos e plano de trabalho são sugeridas para orientar a organização, sendo possível a criação de outras, caso surja a necessidade.
Contém pastas para conteúdos que ajudam a orientar o projeto, como outline, cronogramas, orçamentos e atas de reuniões.
Ao se tratar dos elementos consumidos na composição do projeto, a pasta “insumos” é a indicada. Nela são inseridos arquivos como o material literário utilizado. Importante não colocar arquivos intermediários na pasta, apenas arquivos utilizados para desenvolver o projeto.
Essa pasta é uma pasta obrigatória e contém arquivos os feedbacks de especialistas recebidos na etapa de validação de conteúdo do instrumento, os quais serão utilizados como insumo para a melhoria do instrumento.
Dentro de resultados, teremos as seguintes pastas: artigos, relatórios, validação, normatização, certificação, treinamento, taxonomia e instrumento. Essas pastas contém o resultado desse tipo de análise realizado na criação de um instrumento. Os arquivos dentro dessas pastas devem ser organizados nas subpastas.Exemplo: dentro de validação teremos arquivos divididos em programas, textos, imagens, tabelas e audiovisual (arquivos em vídeos e áudios) relacionados à validação do instrumento.
Na pasta instrumento, dentro das subpastas textos > finais, teremos versões do instrumento junto ao gabarito, quando existir. Deve ser criada uma pasta para cada versão do instrumento como “versao_1” ou “versao_20220909” dentro de “finais” para uma versão finalizada e dentro de “intermediários” para versões ainda não finalizadas.
Laboratório de Estudos e Pesquisas em Economia Social (LEPES).
Rua das Paineiras, casa 11. Campus da USP-RP
Recomendação Técnica para nomear arquivos. Disponível em: http://www.unesp.br/ai/pdf/rt-ai.02.01.01.pdf. Acesso em: 22/10/2021
Manual de Boas Práticas para Gestão de Pastas e A/rquivos Digitais. Disponível em Manual de Boas Práticas para Gestão de Pastas e Arquivos Digitais. Acesso em: 15 set. 2021. Guia para uso, organização de dados e códigos do Lepes no servidor.