Ferramentas para buscar informação difícil de encontrar

por Rowan Philp
Dec 29, 2021 em Jornalismo de dados
Two people reviewing data.

Boa parte da infraestrutura para investigações de vigilância eficazes — de bases de dados globais a ferramentas de código aberto de ponta — já foi construída, e jornalistas de todas as partes foram convidados a usar essas técnicas para aprofundar a investigação durante a 12ª Conferência Global de Jornalismo Investigativo (#GIJC21, na sigla em inglês).

Em uma sessão de "rodadas relâmpago" da #GIJC21, um painel trouxe repórteres e editores que precisaram de apenas cinco minutos cada para delinear novas ideias sobre o que jornalistas podem fazer para apurar fatos difíceis de encontrar.

Aqui estão algumas das sugestões:

Reconhecimento facial

Considere ferramentas de reconhecimento facial baseadas em pontuação, como a Findclone, para monitorar e identificar possíveis extremistas em inesperadas posições de poder, como neonazistas em órgãos das forças de segurança. Sébastien Bourdon, jornalista independente que investiga a extrema direita, disse que a Findclone pode mostrar cinco correspondências prévias — com uma pontuação de verossimilhança entre zero e um — de rostos em plataformas de redes sociais como a russa VK (VKontakte) e, inclusive, ela pode achar imagens em contas deletadas. A organização investigativa sem fins lucrativos Bellingcat observou que sistemas como a Findclone têm "usos muito limitados, mas mesmo assim poderosos, para procurar a presença de uma pessoa na VK", mas advertiu os repórteres a levarem em conta os problemas éticos significativos associados com softwares de reconhecimento facial e a lembrar que esses sistemas têm sido usados para fins nefastos. 

[Leia mais: Você trabalha com dados? Saiba como checar fontes e números]

Crowdsourcing

Experimente dados de crowdsourcing e ferramentas de evidência como a CrowdNewsroom. Marc Engelhardt, diretor da CrowdNewsroom da Suíça, disse que a ferramenta permite que jornalistas lancem campanhas de crowdsourcing, criem uma matéria orientada a dados com uma ferramenta de edição de uso fácil, no estilo arrastar e soltar, e então analisem e verifiquem as informações recebidas. "A população pode compartilhar seus dados ou histórias pessoas através da plataforma de forma segura", afirma.

 

CrowdNewsroom

Engelhardt diz que a plataforma independente Correctiv já usou a CrowdNewsroom para várias investigações, incluindo o rastreamento do dinheiro por trás de uma campanha para um partido político europeu de extrema direita. O projeto obteve dados enviados por 3.500 pessoas.

Assim como um iceberg, a maior parte de investigações orientadas a dados — extração de informação, limpeza, análise e conversão — acontece "abaixo da superfície".

Uma vez que este método depende da mobilização do público, Engelhardt diz que projetos bem-sucedidos precisam de colaborações com ONGs e parceiros de mídia, promoção offline e eventos para a comunidade.

Bases de dados

Use o poder dos dados e a flexibilidade da ferramenta Aleph, do Projeto de Reportagem sobre Crime Organizado e Corrupção (OCCRP na sigla em inglês). O editor de dados do OCCRP, Jan Strozyk, recomenda a Aleph como um arquivo interativo e global para pesquisa investigativa. Assim como um iceberg, a maior parte de investigações orientadas a dados — extração de informação, limpeza, análise e conversão — acontece "abaixo da superfície", o que geralmente a audiência não vê. Strozyk diz que vários recursos dentro do arquivo podem ajudar jornalistas com o trabalho menos glamouroso com os dados.

A Aleph inclui hoje 309 bases de dados públicas, 200 raspadores de dados e dados de mais de 150 milhões de entidades. Strozyk diz que a plataforma também permite que repórteres compartilhem em segurança suas investigações com colaboradores, subam praticamente qualquer tipo de arquivo, pesquisem em vários scripts e transformem dados em gráficos clicáveis que mostram conexões subsequentes.

Para mapear aplicações de mineração e o cumprimento da regulamentação no sul da África — e para orientar repórteres em outras partes sobre como a indústria do carvão funciona — confira a ferramenta #MineAlerts, desenvolvida pela Oxpeckers, uma organização investigativa sem fins lucrativos. Andiswa Matikinca, repórter e gerente de dados na Oxpeckers, diz que a plataforma combina uma base de dados digital com uma ferramenta de geo-jornalismo, e que isso também inclui documentos relacionados ao licenciamento de aplicações e minas operacionais, bem como a questão crucial do uso de água no entorno de minas.

 

Oxpeckers

De modo semelhante, a Offshore Leaks Database permite que jornalistas busquem por investigações que envolvem empresas que operam internacionalmente. Delphine Reuter, jornalista de dados do Consórcio Internacional de Jornalistas Investigativos (ICIJ na sigla em inglês), diz que esta base de dados gratuita e de código aberto contém dados de 800.000 entidades e que esse número vai em breve aumentar com o acréscimo de dados do Pandora Papers. Reuter também deu várias dicas para usar a ferramenta:

  • Tente grafias diferentes na sua pesquisa — como "limited" e "ltd" ou "corporation" e "corp." — e coloque os nomes entre aspas.
  • Preste atenção na fonte e na data dos dados na seção "Power Players" da base de dados — que inclui vazamentos como o Panama Papers e Paradise Papers — e lembre que os dados apresentados são um retrato do momento da investigação. Reuter diz que jornalistas também devem verificar atualizações de registros corporativos para ter dados mais recentes. 
  • Embora a base dados permita buscas por nome, endereço ou o país, Reuter observa que é frequentemente importante buscar empresas fiduciárias e offshores sob a categoria "jurisdição" para obter resultados mais precisos. 

[Leia mais: As iniciativas brasileiras que oferecem dados gratuitos para jornalistas]

Recursos de países específicos

Tenha em mente que há novos registros de bases de dados para países específicos, como Ucrânia e Cazaquistão. Dmitry Chaplinsky, especialista em TI do veículo ucraniano Bihus.info, diz que repórteres em busca de registros públicos, documentos de divulgação de ativos, dados de contratos públicos e outros registros públicos da Ucrânia e do Cazaquistão devem conferir duas bases de dados de código aberto novas e atualizadas frequentemente. A Ring é uma ferramenta de busca de documentos em mais de 20 bases de dados da Ucrânia com mais de 29 milhões de registros públicos. A Open Base é um repositório de dados similar para o Cazaquistão, com cerca de uma dúzia de fontes de dados. Chaplinsky diz que as pesquisas na Ring podem ser feitas em ucraniano, inglês e russo.

"Minha ferramenta favorita de todas é o R e o RStudio." — Mohammad Haddad, editor de dados da Al Jazeera

Uma caixa de ferramentas de reportagem para uso diário

Ainda que novas ferramentas sejam empolgantes, pode ser igualmente valioso aprender sobre ferramentas nas quais redações investigativas confiam o tempo todo. Mohammad Haddad, editor de dados da Al Jazeera Media Network, revelou as cinco melhores ferramentas que ele usa todos os dias.

  • Mapbox — e o recurso de storytelling da ferramenta. "Se você quer contar sua história com geografia, essa é a ferramenta", diz Haddad. "Essa é, de longe, nossa ferramenta de mapas preferida. Você pode levar seus leitores em uma viagem pelo mundo — levamos nossa audiência para o rio Nilo e para a disputada região da fronteira entre a Índia e a China."
  • Nivo. "Esta é uma ótima ferramenta de visualização de dados que requer pouco código para configurar visualizações de dados muito elaboradas", explica Haddad. "A Al Jazeera usou a Nivo para analisar como os países votaram na ONU desde 1946."
  • AMP Stories. "É uma plataforma de storytelling voltada para dispositivos móveis fácil de lidar. É ótima para matérias centradas em personagens, e funciona muito bem em celulares, de onde a maior parte do nosso tráfego tem probabilidade de vir", ele observa. "Nós usamos o AMP Stories para o nosso projeto 100 Faces of Rohingya e para nossa série sobre pessoas negras mortas nos Estados Unidos, bem como na Palestina e em Mianmar."
  • Chartbeat. "Para entender como sua matéria está repercutindo em meio à audiência, use as análises em tempo real do Chartbeat", sugere Haddad. "Para mim, o recurso mais útil é o indicador de performance em redes sociais, que te ajuda a ver onde sua matéria foi compartilhada nas redes sociais."
  • Linguagem R e RStudio. "Minha ferramenta favorita de todas é o R e o R Studio", diz Haddad. "Ferramentas vêm e vão, então a melhor ferramenta é aquela que você pode construir em uma linguagem de programação. O R é usado por toda nossa equipe, desde a coleta de dados até a edição. O que você pode fazer com o R? — praticamente tudo."

Data visualization tool

Uma característica impressionante das ferramentas apresentadas nas rodadas relâmpago é que elas tornam gerenciáveis volumes de informação aparentemente descomunais — e mostram que dados contidos em diferentes linguagens, formatos de arquivo e imagens podem potencialmente serem pesquisados online por qualquer repórter.


Este artigo foi publicado originalmente pela Rede Global de Jornalismo Investigativo e republicado na IJNet com permissão.

Foto por UX Indonesia no Unsplash.