Blog

Esse guia é direcionado a qualquer pessoa interessada em levar a Serenata de Amor para outros espaços. Se ele parecer técnico demais, é porque são conhecimentos mínimos necessários para implementação e adaptação do projeto.

Até então a Operação Serenata de Amor tem permanecido focada na Cota para o Exercício da Atividade Parlamentar da Câmara dos Deputados. Mesmo antes de provar que nossos modelos seriam eficientes em detectar corrupção, muitos já pediam que expandíssemos para o Senado, câmaras municipais, prefeituras, licitações, cargos comissionados… Para isso, precisamos primeiro entender bem o que já temos em mãos.

Nossos modelos hoje são pensados para alertar suspeitas em gastos de pessoas físicas. Fazemos isso de várias formas, combinado-as para criar uma Inteligência Artificial poderosa. Usamos de regras simples (como garantir que não foi ultrapassado um limite mensal pré-estabelecido), análises matemáticas (como a Lei de Benford), das próprias características do gasto (quando detectamos que uma compra de material de escritório foi na verdade uma doação eleitoral), comparamos também com outros da mesma categoria (quando vemos que um parlamentar gastou R$ 600 em um restaurante onde outras dezenas gastaram apenas R$ 30), detectamos quando múltiplos gastos não foram feitos pela mesma pessoa (como refeições em Porto Alegre e Recife separadas por 1 hora) e ainda cruzamos com outras informações para encontrar casos mais difíceis de detectar (como gastos feitos em empresas de familiares ou em lugares já com histórico de irregularidades).

Página da Data Science Brigade no GitHub

Página da Data Science Brigade no GitHub

Quer se aprofundar no que já é possível fazer com a nossa plataforma? Começa dando uma olhada nesse artigo que explica a arquitetura e depois dá uma passada no nosso GitHub que encontrará todo o código por lá.

Precisamos de dados disponíveis em nível transacional, ou seja, informações de cada um dos gastos feitos, e não agregações.

Dado transacional, ou bruto. É o tipo de informação que precisamos.

Dado transacional, ou bruto. É o tipo de informação que precisamos.

A Câmara dos Deputados cumpre bem esse requisito, divulgando cada um dos gastos feitos por parlamentares usando a Cota Parlamentar com até 3 meses de atraso, prazo explicado na sua legislação interna. De cada gasto, vemos alguns dados importantes: nome do deputado, empresa (com nome e CNPJ) que recebeu o pagamento, data e categoria.

Dado agregado, ou estatístico. Insuficiente para nós.

Dado agregado, ou estatístico. Insuficiente para nós.

Se a Câmara divulgasse apenas quanto o deputado gastou no mês, ou quanto cada empresa recebeu, não nos serviria. Nesses casos, seriam apenas dados estatísticos, e não dados brutos ou transacionais. Não ter isso impede a ação da Operação Serenata de Amor. Entenda a Lei de Acesso à Informação e exija do próprio órgão que comece a disponibilizar os dados dessa forma. Caso precise de ajuda, consulte também o Ministério da Transparência e a Open Knowledge Foundation para saber como fazer que a lei seja cumprida.

Além de estarem em uma página da web, os dados da Cota para o Exercício da Atividade Parlamentar da Câmara dos Deputados também estão disponíveis em arquivos XML, mais convidativos para análise automatizada. Encontrar referências a APIs, web services ou outros formatos como CSV, JSON, XLS e TXT são bons sinais também.

Essa é uma pergunta útil de ser respondida porque nos permite planejar o quanto de trabalho teremos para fazer a adaptação. A corrupção que você pensa em detectar é semelhante à da Câmara dos Deputados, que já estudamos? É referente à gastos de pessoas físicas ou foge dessa alçada? Se for do mesmo tipo, precisamos fazer uma adaptação do código; caso contrário, sabemos que precisamos apenas criar novos modelos, específicos para esse novo órgão.

Deletar dados de ações passadas do governo parece ser algo de uma ficção distópica ou ditadura, mas acontece. A Câmara dos Deputados, por exemplo, remove do seu histórico reembolsos que foram cancelados — as denúncias que já fizemos e geraram devolução de dinheiro não estão mais disponíveis na fonte oficial, apenas nas cópias feitas por nós. Uma boa arquitetura de software dependerá de ter essa pergunta respondida.

Só começamos a trabalhar em um novo problema depois de entender sua legislação. A Serenata usa Inteligência Artificial para aumentar a capacidade de ação efetiva dos órgãos de fiscalização, então queremos fazer apenas denúncias excelentes. Quando denunciamos um gasto como suspeito, é porque realmente ele é ilegal pelo nosso entendimento das leis que definem o gasto.

A Cota para o Exercício da Atividade Parlamentar foi definida no Ato de Mesa nº 43 de 2009 e está sob a legislação interna da Câmara dos Deputados, então não pode vir a descumprir outras recomendações feitas a parlamentares.

Tente se conectar com outras pessoas interessadas nessa implementação. Quer levar a Serenata ao seu município? Talvez você não seja o único com essa ideia. Criar uma comunidade em volta do objetivo fortalece o projeto, tornando muito mais fácil fazer exigências e garantir que tudo funciona como deveria.

E claro, se inspire pesquisando por outros projetos. Mande e-mails para eles, para conhecer suas dificuldades. Uma das nossas inspirações foi a OPS, que já fazia um trabalho de auditoria manual na Câmara dos Deputados.

Diminuir a corrupção é algo que beneficia todos os envolvidos na comunidade. Existe alguma organização local capaz de financiar um projeto com esse objetivo?

A nossa Serenata é paga por quem voluntariamente decide que vale o investimento. Você pode fazê-lo por cartão de crédito, boleto ou Bitcoin.

Com exceção do primeiro item, “Os dados estão disponíveis?”, nenhum deles é pré-requisito para propor novos projetos e ter a Rosie fiscalizando mais gastos.

Em suma: faça sua pesquisa e publique online. Convide outros a criticarem e sugerir modificações — nós da Serenata de Amor somos apenas parte da comunidade. A qualidade do projeto é proporcional ao número de contribuições que recebeu, chegando cada vez mais próximo de se tornar algo real e de benefício comum. Não será um trabalho fácil, mas completará a primeira versão entendendo mais dos problemas envolvidos na distribuição de dados pelo governo e conhecendo pessoas incríveis, dispostas a ajudar a resolvê-los.

Prefere um contato comercial? A Data Science Brigade é a empresa que lidera o desenvolvimento da Operação Serenata de Amor e pode ser contratada para criar soluções especiais baseadas em Inteligência Artificial e Big Data. Fale com a gente.

Originalmente publicado em medium.com/serenata em 24 de janeiro de 2017.