E se robôs pudessem fazer investigações transnacionais?

por Friedrich Lindenberg
Oct 30, 2018 em Jornalismo de dados

O jornalismo de investigação transfronteiro tem sido muito discutido nos últimos anos. Trabalhando com African Network of Centers for Investigative Reporting (ANCIR), tive a chance de observar esse processo quando duas repórteres do projeto reportagem investigativa da Itália (IRPI) vieram visitar a África do Sul atrás dos interesses de negócios da máfia italiana no país.

Cecilia Anesi do IRPI e Khadija Sharife e ANCIR ficavam verificando nomes entre elas:

"Você conhece o X?"

"Sim, é o cara da imobiliária na Cidade do Cabo."

"Na Itália, ele é do Cosa Nostra. Temos pilhas de documentos judiciais sobre ele a partir dos anos noventa."

Aos poucos, as duas jornalistas começaram a compartilhar suas pesquisas da rede de Mafia, políticos e pessoas de negócios.

Enquanto este processo requer um grande esforço, aborda o desafio de como uma investigação transnacional pode incorporar o contexto local mais relevante em cada país que cobre. As organizações que dominam esse processo, como o International Center for Investigative Journalism (ICIJ) e o Organized Crime and Corruption Reporting Projec (OCCRP), produzem as reportagens mais importantes em nossa indústria.

Para apoiar essas investigações aprofundadas, eu trabalhei em uma série de projetos de banco de dados para jornalistas investigativos, abrindo a informação pública em países variados, da Alemanha à África do Sul e Moçambique. Com a tendência crescente de dados governamentais abertos, a disponibilidade de dados em massa aumentou em muitos países e setores.

Infelizmente, o uso dessas bases de dados também requer mais contexto: se você quer procurar informações sobre os políticos do Chile, visite Poderopedia, da África do Sul, veja Siyazana. Para informações sobre empresas, acesse OpenCorporates, mas também todos os bancos de dados listados no Investigative Dashboard. Para os contratos públicos na Europa temos o TED, exceto da Eslovénia e  Eslováquia que têm as melhores bases de dados no país. Você está anotando? Isso fica confuso rápido e a paisagem muda a cada mês.

A web e dados abertos não deveriam tornar as coisas mais simples ao invés de confundir? Recolher todos os dados de tantos lugares diferentes não seria um trabalho melhor para máquinas ao invés de seres humanos?

Se queremos tornar os dados aberto relevantes para o jornalismo investigativo, temos de simplificar a maneira como as pessoas acessam. Temos que criar um caminho para nossas ferramentas de dados falarem umas com as outras, para fazer a pergunta exata que os jornalistas perguntam em investigações transfronteiras: "Conhece o X? O que você pode me dizer sobre ele?"

Criar uma função tão comum, uma API de dados que nós começamos a chamar de "Who's got the dirt" (Quem está sujo?)", é um objetivo do projeto de mapeamento de influência, o Influence Mapping, financiado pela Fundação Open Society. Este grupo reúne técnicos, pesquisadores e jornalistas para desenvolver uma maneira simples de "enriquecer" informações básicas sobre as pessoas e empresas a partir de múltiplas fontes.

Os membros fundadores do grupo, a Assembleia Americana na Universidade de Columbia, OpenCorporates, LittleSis.org, Poderopedia, OpenNorth.ca e o Grano Project, que eu trabalhei como parte de minha bolsa, estão focados em compartilhar dados abertamente. Para os projetos de investigação, no entanto, uma variação desse mecanismo poderia ser usada para fontes de dados confidenciais, tais como documentos e bases de dados que vazaram. Aqui, a resposta não seria um conjunto de registros correspondentes, mas uma resposta simples para indicar se a informação está disponível - e quem contatar.

O que isso significaria na prática? Durante a Al Jazeera Canvas Hackathon em dezembro, eu trabalhei com um grupo de desenvolvedores, designers e jornalistas para criar um protótipo chamado Newsclip.se, uma ferramenta de desenvolvimento de histórias para jornalistas que digitalizam suas anotações enquanto você escreve, detecta menções a empresas e pessoas e em seguida, encontra ligações relevantes em bancos de dados abertos que você pode explorar para aprofundar a sua investigação.

Enquanto Newsclip.se é apenas uma demo, por agora, “Who’s got dirt?” permitirá que muitas ferramentas auxiliem a sua investigação -- de ferramentas de análise de redes como detective.io a listas de observação simples de entidades que buscam continuamente informações sobre a propriedade da empresa, processos judiciais, os direitos à terra e mineração ou relações familiares.

Se conseguirmos criar uma dinâmica em torno desta noção de colaboração, talvez o jornalismo transfronteiriço em breve terá um irmão robô mais novo: a investigação entre bancos de dados.

Imagem principal sob licença Flickr via Discos Konfort