Como aproveitar ao máximo dados para uma reportagem

porAlex Ludka
Jul 10, 2015 em Jornalismo de dados

Muitos jornalistas têm um tesouro de dados públicos disponível para usar em suas reportagens. Mas mesmo que os repórteres tenham a liberdade de usar os dados, nem sempre é fácil encontrá-los. E quando você consegue localizá-los, muitas vezes é ainda mais difícil decifrá-los.

Jeff South, professor associado e diretor de estudos de graduação na Escola de Comunicação em Massa da Virginia Commonwealth University, falou com 16 jornalistas latino-americanos que estão nos Estados Unidos como parte do programa “Digital Path to Entrepreneurship and Innovation for Latin America” (Caminho Digital ao Empreendimento e Inovação para a América Latina) do ICFJ sobre as melhores maneiras de encontrar, entender e visualizar dados. 

Usando um gráfico criado Paul Bradshaw do OnlineJournalismBlog.com, Jeff descreveu os passos necessários para comunicar efetivamente com o jornalismo de dados.

Compilar

"O primeiro passo é encontrar os dados, obviamente," disse Jeff. "Talvez seja buscando online, talvez seja em um PDF e você precisa tirar os dados dele. Onde quer que seja, precisa compilá-los."

Além das táticas usuais de encontrar informações, como o uso de mídia social ou motor de busca, Jeff enfatizou a importância de olhar na web profunda.

"Um monte de informações online não está na web aberta. Está nas bases de dados do governo que, nos Estados Unidos, você tem que saber onde esses bancos de dados estão ", disse ele. "Um monte de dados do governo está aberto, mas se você não sabe aonde olhar, não vai encontrar."

Jeff compartilhou com o grupo bancos de dados úteis que eles podem usar em suas reportagens, incluindo  Federal Register (Diário Oficial do Governo Federal dos Estados Unidos da América), o U.S. Securities and Exchange Commission (Comissão de Títulos e Câmbio dos Estados Unidos) e a Federal Election Commission (Comissão Eleitoral Federal).

Limpar

"Muitas vezes, os dados são muito sujos, ou seja, os nomes não são consistentes", afirmou Jeff. "Se eu estivesse incluído no banco de dados, poderia ser 'South, Jeff'. Outra entrada poderia ser 'South, Jeffrey'. "Outra entrada poderia ser 'South, JC'. Os dados podem estar muito sujos e precisamos limpá-los antes de podermos usá-los."

Ele sugeriu o uso de ferramentas online gratuitas como TextWrangler ou OpenRefine para limpar dados sujos.

Contexto

Depois de ter compilado e limpado seus dados, você precisa entendê-los. Isso significa fazer perguntas como: Quem reuniu os dados? Quando ele foi compilado? Que metodologia foi usada?

Depois de entender os dados, então você pode usá-los com precisão em uma matéria.

Associar/combinar 

Jornalistas costumam usar mais de um conjunto de dados para obter informações para uma matéria. Jeff usou o exemplo de pegar uma lista de todos os motoristas de ônibus em uma cidade e também uma lista separada de todos nessa cidade que foram condenados por dirigir embriagados. Ao associar essas duas listas, você pode descobrir que uma alta porcentagem de motoristas de ônibus foram condenados por dirigir embriagados, o que seria uma boa história.

No entanto, ele também advertiu que manter os dados em contexto é extremamente importante durante esta etapa. "Correlação não é igual a causa", disse ele. É importante estar ciente de fatores externos que podem afetar os dados.

Além dos quatro passos descritos no gráfico de Bradshaw, Jeff incluiu um quinto: visualizar.

"A visualização de dados pode ser muito importante para comunicar o que estamos fazendo para o público", disse ele.

Jeff sugere usar ferramentas como Timeline JS para timelines, Infogram para infográficos e Chartbuilder para tabelas e criar visualizações que ajudam a contar uma história.

Este post apareceu originalmente no site do Centro Internacional para Jornalistas e é reproduzido na IJNet com permissão.

Imagem principal sob licença CC no Flickr via Intel Free Press - imagem secundária cortesia de Paul Bradshaw do OnlineJournalismBlog.com.