Planejando uma matéria de jornalismo de dados do início ao fim

porAntoine Laurent
Jun 2, 2014 em Jornalismo de dados

Este artigo resume as notas do primeiro workshop da Escola de Jornalismo de Dados, organizado pelo Centro Europeu de Jornalismo, a Open Knowledge Foundation e do Festival Internacional de Jornalismo. A sessão foi conduzida por Steve Doig, cátedra Knight em jornalismo, especializado em reportagem assistida por computador --o uso de computadores e técnicas de ciências sociais para ajudar os jornalistas a melhorarem seu trabalho.

Você pode baixar a apresentação de Steve aqui (em inglês).

Por que fazer jornalismo de dados?

Steve Doig acredita que o jornalismo de dados permite que o jornalista vá além de anedotas e baseie suas matérias em fatos e provas. Utilizando dados para a reportagem, ele ou ela é capaz de olhar para os melhores pontos, aqueles que são mais ilustrativos dessa história particular.

Assim, como o jornalista pode encontrar ideias de matérias de dados? Em primeiro lugar, tente olhar para temas que você já cobre como esportes, eleições, desastres, investigações de crimes, fluxos de dinheiro, etc. Quase todos os assuntos que os jornalistas normalmente cobrem produzem dados que podem ser analisados. Outros lugares para se obter ideias para matérias de jornalismo de dados incluem:

  • Ver o que outros jornalistas estão fazendo. Se algo está acontecendo em uma cidade, há a possibilidade de que está acontecendo em sua cidade também
  • Dar uma olhada em projetos de destaque no DataDrivenJournalism.net
  • Conferir o Extra Extra feed do IRE
  • Seguir o DataBlog do Guardian
  • Ler documentos produzidos por órgãos governamentais e acadêmicos que coletam grandes quantidades de dados. Prestar atenção às notas de rodapé e bibliografia, que podem levar a fontes de dados interessantes!

Como sair de uma ideia para uma matéria?

Retrace os passos de uma matéria a partir de sua ideia :

Pense nas declarações que você quer fazer

Comece com uma hipótese como "o crime está piorando na minha área". Para essa hipótese, você pode querer obter declarações, tais como: o crime aumentou x vezes, a quantidade de crimes por 1.000 pessoas na cidade tal e tal é maior em nossa área, etc.

Pense nas variáveis ​​que você precisa para obter as declarações

Pense em termos de tabela de informações (colunas são variáveis e as linhas são os pontos de dados individuais).

Existem dois tipos diferentes de variáveis:

  • Categórica: como gênero, tipo de crime, CEP. Variáveis ​​com etiquetas.
  • As variáveis ​​numéricas: tais como a contagem, o número de crimes, o número de acidentes, número de detenções.

Um exemplo dessas variáveis ​​que trabalham em conjunto seria: tipo de crime, a população dos lugares onde o crime está acontecendo, data do crime, hora, local, número de vítimas, houve prisão (sim/não?).

Pense em quem recolhe os dados

Uma vez que sabemos nossas variáveis, verifique quem os recolhe. Agências e organizações, tais como governo, empresas e etc, recolhem muita informação, por isso não temos que coletar os dados nós mesmos na maioria das vezes.

Obtenha os dados

Então nos deparamos com o problema de obter os dados. Nos Estados Unidos, há leis relativamente fortes de registros públicos. Na Europa também, a maioria dos países tem leis de Liberdade de Informação ou uma forma oficial para solicitar dados de órgãos públicos.

Não se deixe intimidar por diferentes formatos. Saiba como você vai querer trabalhar com os dados, por exemplo usando Excel. Você não precisa obter os dados em formato xls, mas pode usar programas para converter dados de um formato para outro. Encontre um nerd de dados que pode ajudá-lo! Um lugar para encontrar bons nerds é formulários ou listas de e-mail, por exemplo:

Um formato que você deve tentar evitar é PDF; não é importado bem em outros formatos. Se só consegue obter um PDF, existem ferramentas para exportá-lo em outros formatos, como Tabula.

Limpe os dados

Os dados podem ser confusos. Um exemplo clássico é a informação de financiamento de campanha digitada por voluntários --os nomes das cidades estão sempre com erros ortográficos! Neste caso, você tem que encontrar todas as cidades com erros e corrigi-las de modo que você possa dizer, por exemplo, quanto foi coletado de uma única cidade. As pessoas que coletam dados muitas vezes o fazem para fins burocráticos e realmente não importa para eles se os dados estão limpos. As pessoas que usam os dados para análise exigem mais precisão e, portanto, devem limpar os dados. Algumas ferramentas para a limpeza de dados incluem:

Depois de ter os dados limpos, o que você faz com eles?

Procure por padrões! Altos e baixos, máximos, mínimos, médias, etc. Tenha na sua mente a forma dos dados, olhe para os extremos, qualquer coisa em seus dados que pareça estranho e se destaque. Lembre-se que muitas histórias foram descobertas por coisas simples como separar por categorias, etc. Algumas ferramentas que podem ajudar:

  • Utilize as funções de planilhas simples, como classificar, filtrar, funções e tabelas dinâmicas
  • Outra ferramenta é o seu cérebro: matemática e estatística, mas é tão simples como 1+1=2! Um recurso para a matemática é: http://t.co/CaZg5qS0jM

Finalmente, é importante lembrar que as matérias de jornalismo de dados são melhor realizadas em equipes. Há muitos papéis para cobrir, incluindo: repórteres, editores, artistas gráficos, fotógrafos, videomakers, designers de páginas, Web designers, desenvolvedores de aplicativos, etc

Antoine Laurent é um estrategista e gerente de projeto sênior no Centro Europeu de Jornalismo. Anteriormente, ele foi o vice-diretor da Rede Global de Editores e fundador e diretor do Prêmio de Jornalismo de Dados, o Lab Hackdays dos Esitores e Startups for News.

_Este artigo apareceu originalmente no DataDrivenJournalism.net e é publicado na IJNet com permissão sob a licença Atribuição de Uso Não-Comercial Creative Commons. Criado pelo Centro Europeu de Jornalismo, esta iniciativa de jornalismo de dados é destinada a permitir que mais jornalistas ao redor do mundo usem dados para melhorar suas reportagens._

Imagem sob licença CC no Flickr via Intel Free Press