Paradise Papers: métodos e ferramentas para investigar um vazamento em massa

porFabiola Torres López
Nov 18, 2017 em Jornalismo investigativo

Enquanto há mais segredos sobre como corporações, políticos e celebridades em todo o mundo escondem suas fortunas em paraísos fiscais, os jornalistas que trabalham na investigação global "Paradise Papers" confirmam a relevância do trabalho colaborativo e o valor da tecnologia informática para reinventar métodos de pesquisa de dados, sua análise e a cobertura das notícias resultantes.

Para esta investigação em particular, o Consórcio Internacional de Jornalistas Investigativos (ICIJ, em inglês) disponibilizou três plataformas de trabalho para 383 repórteres de 67 países: uma para comunicações internas (I-Hub global), outra para pesquisa de documentos (Knowledge Center Global) e uma terceira para estabelecer conexões de dados (Linkurius). "Esta é a única maneira possível de colaborar em larga escala", disse Marina Walker, vice-diretora do ICIJ, quando nos reunimos em Munique em março de 2017 para coordenar os principais detalhes do caso que emergiu sete meses depois.

Como na investigação "Panama Papers", o novo vazamento de 13,4 milhões de documentos dos escritórios de advocacia offshore Appleby e Asiaciti Trust veio de dois repórteres do jornal alemão Süddeutsche Zeitung: Bastian Obermayer e Frederik Obermaier. Eles compartilharam os dados com o ICIJ para organizar o que são agora chamados de "Paradise Papers". A maioria dos repórteres envolvidos já havia participado de outras investigações globais com o Consórcio e já estava ciente dos protocolos a seguir. No entanto, com cada história surgem novos desafios.

A investigação incluiu passar vários meses examinando documentos, e-mails, PDFs e imagens indexadas na plataforma criptografada do Knowledge Center Global, que nos ofereceu uma infinidade de materiais. Se encontrássemos dados sobre uma empresa ou uma figura pública de interesse que levaria a uma matéria, começávamos o trabalho de campo que envolvia, em muitos casos, viagens, verificação cruzada de informações e análise de bancos de dados externos, bem como a realização de entrevistas e o contato com outras fontes para entender a história em potencial.

A equipe do ICIJ, liderada por Marina Walker, tornou-se uma guia permanente para todos os jornalistas que colaboraram no "Paradise Papers". Com suas respectivas especialidades, Mar Cabra, Emilia Díaz-Struck, Cecile S.Gallego e Rigoberto Carvajal nos ajudaram a navegar milhões de dados em diferentes formatos. Os dados não eram estruturados no início -- mas, uma vez organizados, revelaram transações financeiras, contratos, transferências bancárias e listas de clientes, bem como os métodos que empresas multinacionais, como o Glencore, usam para ignorar as regras, evadir impostos e ocultar seus ativos em territórios offshore.

Os dados são enormes e abrangem um período de quase 70 anos, de 1950 a 2016 --uma das principais diferenças entre o vazamento Appleby e Asiaciti Trust e o vazamento do Mossack Fonseca, a fonte do "Panama Papers". Mas o perfil do cliente também é diferente: empresas multinacionais e pessoas super ricas que podem ser rastreadas em 19 paraísos fiscais, incluindo Bermudas, Bahamas, Barbados, Malta e Ilha de Man. Entre as pessoas encontradas na base de dados estão a Rainha Elizabeth, membros do gabinete do Presidente Donald Trump, cantores como Bono e Shakira, e corporações como a Apple, Nike e Facebook.

O vazamento "Paradise Papers" consiste em cerca de 1,4 terabytes de dados - um pouco mais do que metade do tamanho do vazamento do "Panama Papers" no ano passado.

Se os jornalistas participantes da investigação tivessem trabalhado sozinhos e fossem relutantes em aderir a uma rotina de novos métodos de reportagem e tecnologia facilitada pela equipe do ICIJ, a investigação não levaria meses mas vários anos. O ICIJ tornou-se um modelo para investigações transfronteiriças em todo o mundo.

Agora vou compartilhar as ferramentas e os programas com os quais nos familiarizamos enquanto trabalhamos no "Paradise Papers". Estes são divididos em três categorias: segurança digital, pesquisa de documentos e conexões de dados.

Segurança digital

VeraCrypt

O ICIJ armazenou os 13,4 milhões de documentos que compõem o "Paradise Papers" em um sistema de código aberto criptografado chamado VeraCrypt, que permite que uma pessoa tenha "arquivos ocultos". Esse programa oferece criptografia dupla: uma senha é necessária para acessar o primeiro nível de informação e outra para acessar o segundo: o nível invisível. Portanto, é muito improvável que uma pessoa fora da investigação perceba que há uma segunda camada secreta de dados. 

E-mails criptografados 

Todos os membros da equipe ICIJ e nossas fontes se comunicam e trocam documentos através de emails criptografados usando extensões como o Mailvelope. So é necessário a troca de chaves PGP (Pretty Good Privacy). 

I-Hub global:

Um tipo de Facebook interno para os jornalistas participantes, o I-Hub global é acessado através de um registro de usuários e um sistema de autenticação de dois fatores. No "hub" [centro], os grupos são divididos por tópicos de interesse. Há também uma linha de tempo pública e um sistema de mensagens interno. "É a nossa redação virtual", diz Mar Cabra, editora de dados do ICIJ. Esta plataforma é construída com um software de código aberto chamado Oxwall.

Pesquisa de documento

Knowledge Center

Para examinar os documentos, os jornalistas precisavam acessar uma plataforma criptografada chamada "Knowledge Center" com um nome de usuário e um código de autenticação. Este sistema de pesquisa agora integra os bancos de dados dos últimos três grandes vazamentos mundiais: Offshore Leaks, "Panama Papers" e "Paradise Papers".

O motor de pesquisa nos permite ver as pastas de vazamento organizadas por ano e tipo de arquivo e também facilita a localização de dados usando determinados padrões de palavras. Quando um documento é localizado, é possível visualizá-lo e baixá-lo.

Os desenvolvedores do ICIJ criaram o "Knowledge Center" com três softwares: Apache Tika para extrair e processar dados de documentos; Apache Solr para indexá-los; e Blacklight para oferecer uma plataforma de pesquisa intuitiva e fácil de usar.

Nuix

Os desenvolvedores do ICIJ e a equipe Süddeutsche Zeitung usaram o software Nuix para processar mais de 10 milhões de documentos vazados, incluindo e-mails, documentos digitalizados, PDFs e imagens. Este programa da companhia australiana Firepower nos permitiu completar uma espécie de exame forense da informação e passar pelo seu reconhecimento ótico de imagens para transformá-la em documentos de texto analisáveis. Por exemplo, quando digitamos um contrato ou um bilhete, estes são salvos como imagens, mas o Nuix é capaz de reconhecer se eles têm texto dentro deles e extraí-lo.

Depois que os dados introduzidos foram processados, a equipe de informática do "Paradise Papers" criou o banco de dados no qual os jornalistas podiam examinar todos os tipos de arquivos.

Conexões de dados

Linkurious e Neo4j:

Para visualizar o universo de dados do "Paradise Papers", os jornalistas trabalharam com o Linkurious, um software licenciado que transforma os dados em gráficos, ilustrando as conexões dinâmicas e complexas entre os ricos e poderosos. Esta ferramenta funciona de forma muito simples: possui um sistema de pesquisa no qual os nomes de interesse são inseridos e o resultado é um gráfico de todas as conexões identificadas no banco de dados.
 

Um panorama sobre a visualização de dados do sistema Linkurius.

O sistema Linkurius exigiu alguns passos prévios chave feitos pela equipe informática do ICIJ: a informação do "Paradise Papers" estava em um formato de banco de dados relacional em SQL, mas foi transformada no formato de gráficos Neo4j usando o software Talend.

Fabiola Torres López ajuda jornalistas da América Central, México e Colômbia a adotar as mais recentes técnicas digitais de jornalismo investigativo para melhorar sua cobertura em questões de corrupção, transparência e governança. Saiba mais sobre seu trabalho como bolsista Knight do ICFJ aqui.

Imagem cortesia do ICIJ; imagens secundárias por Fabiola Torres López.