Agindo como um cientista de dados
Como um cientista de dados, você entra na listagem de issues, escolhe a label “analysis” e encontra algo que se interesse por trabalhar.
Questionando
Mesmo se você não planeja trabalhar diretamente em uma issue em específico, faça perguntas válidas. Elas são bastante úteis para esclarecer o trabalho que precisa ser feito.
Atribuindo-se
Se encontrar algo que lhe interesse, atribua a investigação a si mesmo — através dos comentários (por exemplo, “going to work on it”) ou através dos “Assignees” do próprio Github caso você seja parte da organização. Em análises, ter múltiplas pessoas trabalhando no mesmo problema é benéfico. Até mesmo se obterem resultados diferentes.
Trabalhando na issue
Esse trabalho pode ser feito de forma totalmente privada ou você pode abrir um pull request assim que estiver pronto para receber feedback. A label “work in progress” pode ser adicionada por alguém da organização.
Encontrando casos para serem validados
Análises, assim como em outras áreas da Ciência, são úteis mesmo quando não reportamos um resultado positivo ou notas com atividades ilegais. Se você tem uma lista de notas que acredita que precisam ser investigadas manualmente, primeiro faça-o por conta própria. Pedimos que você nos entregue evidências que justifiquem a dedicação de mais pessoas no caso. Ex: “esse deputado tem 13 notas de refeição no mesmo dia”, ou “essa nota tem um valor não compatível com os atributos do gasto”.
Denunciar para a organização
Atualmente, o responsável por receber as denúncias sou eu, Irio Musskopf. Envie uma mensagem para e-mail disponível no GitHub, mostrando o seu resultado e as informações que devem ser entregues aos investigadores. Links do Jarbas para todos os documentos envolvidos no caso são muito bem vindos.
Primeira confirmação
Alguém do time de Jornalismo de Dados vai fazer a primeira checagem dos documentos e dos motivos por trás da investigação.
Armazenamento interno
Se a denúncia for válida, a colocaremos no Trello e em uma planilha do Google. Trello é um quadro Kanban onde podemos facilmente ver casos parados no processo de investigação. A primeira coluna é “Suspeitos”, e a última “Publicados”. A planilha do Google é feita para coletar, em um formato fácil de ser lido por máquinas, quais casos foram reportados, seus status e resultados. Bastante útil para Aprendizado de Máquina Supervisionado.
Envio dos casos para investigação
Alguém usará o script distribute_cases.py para sortear 3 investigadores disponíveis para cada um dos casos. Um email será enviado para cada investigador, que NÃO podem saber quem são os outros. Este é o template do email e este é o template da resposta.
Compilando a investigação em um dossiê
Quando recebermos as 3 respostas de volta, alguém do time de Jornalismo de Dados vai compilar todos os resultados em um dossiê único.
Dê o direito de resposta
Nós ligamos para o político entregando o dossiê, pedindo esclarecimento do caso antes de tomarmos outras medidas. Nós educadamente pedimos que o parlamentar devolva o dinheiro aos cofres públicos.
Ministério Público
Se o dinheiro não for devolvido por escolha própria do parlamentar, tomaremos ações legais denunciando para as autoridades competentes.
Mídia
Deixamos a população saber quem fez uso ilegal de dinheiro público.
Quer nos ajudar fazer esse projeto? Acesse nossa campanha de financiamento coletivo. https://www.catarse.me/serenata
Originalmente publicado em medium.com/serenata em 15 de setembro de 2016.