Aqui você encontra as etapas para realizar um projeto de Geração Cidadã de Dados (GCD). Vale lembrar que entendemos a GCD como o conjunto de ações que possibilitam aos cidadãos, gerar, recolher e utilizar dados para benefícios de suas comunidades ou coletivos.

Estas sugestões são baseadas na experiência do trabalho do data_labe, como também na escuta de outras iniciativas que geram e coletam dados de forma participativa no Brasil. Por isso, não consideramos esta recomendação como sendo uma fórmula única ou que não possa ser completamente adaptada.

Aqui vão, portanto, sete pontos que ajudam a basear qualquer trabalho de GCD no data_labe. Eles vêm acompanhados de perguntas importantes que se adequam a qualquer processo, independentemente da temática ou problema escolhido para o seu projeto.
Atenção: É importante ressaltar que a palavra “problema” não precisa estar relacionada a uma falta ou ausência qualquer no seu contexto ou realidade. A GCD é uma metodologia capaz de oferecer diagnósticos sobre qualquer tema e iniciativa, ainda que ela seja positiva, como a mensuração de sucesso de uma ação, um banco de talentos ou um mapeamento comunitário. Ao mesmo tempo é importante que você entenda que a falta de dados (sobre qualquer assunto) é sim um problema que precisa ser encarado, afinal de contas, através de dados entendemos melhor o mundo e nossas realidades.

1) Identificar o problema

Qual problema, assunto, experiência ou realidade precisa ser evidenciada através de dados?
Existem muitos aspectos que merecem visibilidade e mais dados para possibilitar uma discussão qualificada em muitas esferas da vida. Porém, nem sempre temos todos os recursos (financeiros, humanos) para abordar todas essas questões. Por isso, é necessário selecionar entre todas as urgências que você vive, aquela que merece sua atenção prioritária e que será melhor abordada com os dados que você irá levantar.
Imagine que você precisa dividir um bolo entre cinco pessoas. Sua decisão precisa estar baseada em dados e você só tem duas informações: a quantidade de pessoas e o tamanho do bolo. Talvez você decida dividí-lo em cinco partes iguais. Porém, se você adiciona mais dados para melhor compreender esse grupo, sua decisão poderá ser tomada de forma mais efetiva. Imagine que entre essas cinco pessoas, existe apenas uma que possui uma família que ainda não almoçou naquele dia. Estes dados “adicionais”, sobre a composição familiar e estado nutricional de cada um dos cinco componentes desse grupo, possibilitará a você tomar atitudes mais justas e embasadas em uma realidade mais ampliada.

2) Delimitar os subtópicos

A maioria dos problemas sociais possuem muitas causas e consequências e, portanto, é necessário escolher de forma sagaz quais partes desses problemas você poderá trabalhar. Quais são as causas que melhor poderiam explicar o problema selecionado por você e seu grupo?
Por exemplo, quando começamos a levantar irregularides de direitos ao saneamento básico nas favelas da Maré, escolhemos falar dos subtópicos relacionados a lixo, esgoto e falta d’água. Pensando apenas no lixo, coletamos queixas que evidenciavam acúmulo de lixo, essa escolha foi pensada baseada em muita estratégia, nós poderíamos ter escolhido recolher dados sobre regularidade do caminhão de lixo, coleta seletiva, entre outros. Mas entendemos que esse subtópico identifica de forma específica o problema de saneamento básico. O que é importante você entender, é que quase nunca apenas um sintoma / subtópico sera suficiente para diagnosticar o problema, mas é necessário escolher entre os mais específicos.
Portanto, invista tempo nesse debate, converse com quem está sendo afetado diretamente pelo problema, veja quais são os pontos em comum nas conversas com essas diferentes pessoas. Consulte professores ou pesquisadores que trabalhem com o mesmo problema que você escolheu. Compartilhe, e reavalie o seu problema e os tópicos escolhidos para abordá-lo.

3) Discutir seus limites

Até aqui, você precisou fazer pelo menos duas escolhas muito difíceis: qual problema você irá atuar e em quais momentos você escolherá coletar dados. Por isso, é necessário listar e discutir da melhor forma, para você e seu grupo, os potenciais dessa escolha, bem como os limites dela. Quais outros subtópicos do problema você não irá abordar e o quanto isso afeta o seu trabalho? Nesse momento você precisará ser gentil consigo mesmo e entender que seu trabalho é parte do enfrentamento e solução do problema. Dificilmente uma iniciativa conseguirá gerar todos os dados sobre um mesmo problema, pois isso poderá acarretar processos muito longos e custosos, o que prejudicaria a repercussão do seu trabalho e as pessoas acabariam desistindo de participar.
Então, discuta e registre todos os potenciais e limites das escolhas que você realizou, isso lhe ajudará posteriormente a explicar melhor os seus dados e análises geradas a partir deles. Além disso, servirá como guia para futuros trabalhos que queiram aprofundar a discussão que você mesmo começou.

4) Selecionar bases de dados auxiliares

Existem outras bases de dados que já abordam o mesmo problema que você escolheu? Estas bases estão publicadas e disponíveis para uso?
Estas duas perguntas servirão para você tanto se certificar que está trabalhando com um problema e subtópicos adequados, como para garantir que suas decisões estão também baseadas em dados.
Existem dados sendo gerados a todo tempo e de diversos aspectos, porém nem todos estão organizados e disponibilizados para que a sociedade possa analisá-los e discutí-los. Por isso, o princípio de sempre trabalhar e produzir dados abertos é muito importante no processo da GCD.
Caso não existam bases de dados abertas sobre o problema e subtópicos que você escolheu, esse já é um primeiro sinal de que seu trabalho terá grande relevância, pois os dados em questão serão os primeiros sobre o assunto.
Entretanto, mesmo com bases de dados existentes e também no formato aberto, muitas vezes os dados não possuem uma qualidade adequada à realidade que você e seu grupo enfrentam. Seja porque o problema escolhido tem muitas camadas e complexidades que apenas uma iniciativa mais aproximada e local conseguirá abordá-lo efetivamente, ou porque a forma que os dados foram coletados e disponibilizados não foram tão boas assim.
Podemos afirmar que a inexistência ou baixa qualidade de dados é uma realidade quando queremos falar sobre periferias e territórios populares e tradicionais. Então, além de escolher as bases de dados auxiliares ao seu problema, é aconselhável que você explore as análises e relatórios realizados anteriormente por outras organizações (ou até mesmo pelo governo) para entender em quais brechas você irá atuar.
Existem bases de dados de extrema qualidade no Brasil, porém, às vezes, as pessoas e grupos envolvidos nas análises e divulgação dos resultados, não realizam cruzamentos e diagnósticos importantes para que você e seu território se sintam representados. Portanto, apenas novas análises e olhares serão suficientes para aprofundar alguns debates. Nesses casos você nem precisa empreender um processo de geração de dados do zero. Por isso, investigue e analise com profundidade as bases de dados que se relacionam com seu problema e as análises já disponibilizadas sobre elas. Procure os repositórios de bases de dados governamentais, da sociedade civil, da pesquisa acadêmica e entre parceiros que você sabe que atuam no mesmo tema.

5) Engajar as pessoas

Depois desse longo processo de decisões estratégicas chegou a hora de considerar quem irá te ajudar e participar do processo da coleta e geração de dados.
É importante considerar as pessoas que mais são afetadas pelo seu problema, pois elas tem profundo conhecimento sobre as causas e consequências do mesmo. A geração de dados se torna cidadã quando os indivíduos possuem lugar de protagonismo em todo o processo. Por isso não é coerente que você deixe as pessoas mais afetadas de fora dos processos, ou utilize essas pessoas apenas como fonte dos dados ou respondentes de questionários. Esse é um processo excludente e infelizmente muito praticado durante nossa história, aonde as pessoas que são afetadas pelo problema são apenas ouvidas de forma passiva, tendo seus conhecimentos e realidades apropriadas ou expropriadas para produções muito distante de suas realidades.
Por isso, ouça as pessoas e inclua elas no centro de todas as atividades, construa junto as formas de coleta, as decisões sobre os dados e as análises. Inclua os saberes tradicionais e formas de existir desse grupo em todo o processo. Isso garantirá legitimidade, reconhecimento e validação das informações geradas.
Por fim, dê prioridade às tecnologias já usadas por esse grupo na geração dos dados e, caso seja necessário, troque conhecimento e incorpore novas tecnologias à realidade das pessoas sem jamais desrespeitar seus modos de viver a vida e o respeito aos valores e tradições locais.

6) Estruturar a coleta dos dados

Quais processos e sistematizações serão necessárias para gerar dados de forma computacional?
Existem muitas formas de coletar uma mesma informação e estruturá-la para que sejam geradas bases de dados possíveis de serem analisadas e comunicadas. Sua escolha pode ser baseada em quais formas terão mais consistência e efetividade levando em consideração as práticas e conhecimentos das pessoas selecionadas.
A consistência dessa coleta tem muita relação com a sustentabilidade de duração do projeto pois você, provavelmente, irá querer que mais pessoas se envolvam e continuem seu projeto, para que ele tenha longevidade e consiga realizar um controle de maior prazo sobre o problema. Portanto, escolher tecnologias extremamente difíceis ou que dependam especificamente do seu conhecimento terão graves consequências na manutenção das atividades necessárias para a GCD.
O segundo ponto que levamos em consideração nessa escolha está baseado na efetividade da tecnologia. Ela precisa levar em consideração a melhor aplicação no dia a dia e o oferecimento dos melhores resultados possíveis. Nem sempre o melhor software é o mais caro ou o último lançamento do mercado. A melhor ferramenta será sempre a que você e seu grupo decidirem que funcionará para sua realidade, nos subtópicos escolhidos para o problema selecionado. Aqui temos outro princípio do trabalho da GCD: o uso de ferramentas livres e abertas. Elas garantem sua liberdade de empresas ou corporações privadas que, quase sempre, estão baseadas em princípios colonizadores e capitalistas. Além disso, os softwares livres garante que pessoas externas ao seu projeto possam avaliar ou auditar cada etapa e que outros grupos possam adaptar as metodologias e tecnologias desenvolvidas às suas realidades.
Esse trabalho colaborativo e replicável é uma prática que garante a produção de conhecimentos mais abertos e de tecnologias mais soberanas. Assim você fomenta uma cultura de maior transparência e garante mais acesso e mais diversidade aos projetos e iniciativas de dados.

7) Comunicar os dados

Quais estratégias você e seu grupo criarão para comunicar os resultados do trabalho?
Nós falamos muito sobre transparência, participação e colaboração e por isso é muito importante que sua comunidade seja convocada a conhecer os dados que você e seu grupo produziram ou analisaram. Para isso utilize as linguagens, estéticas e referências de seu público-alvo. Quase sempre elas também serão as suas.
Não podemos esquecer que as pessoas que participaram dos processos de debate, coleta, análise dos dados merecem conhecer todas as informações geradas nesse processo, assim como ter a oportunidade de difundir essas informações para suas redes de trabalho, pesquisa e militância. Qualquer pessoa, independente de formação técnica ou acadêmica deve ser capaz de discutir e compreender qualquer trabalho com dados.
É importante levar em consideração os outros grupos que você quer informar para além da sua comunidade. Muitas vezes usamos a GCD para construir políticas públicas e por isso precisaremos identificar os atores e agentes com poder de decisão que escolheremos para alcançar e comunicar nossos resultados e demandas.
É importante garantir que o mesmo protagonismo dado nas atividades anteriores permaneça nesta etapa, por mais que a comunicação seja feita para outros grupos, pois mais uma vez, são as pessoas mais afetadas pelo problema que terão mais propriedade para falar sobre ele e discutir com profunda qualidade os resultados gerados pelos dados gerados.