Quando o conjunto de dados que você precisa não existe: formas criativas para encontrar e coletar dados do #NICAR14

porMaite Fernandez
Mar 10, 2014 em Jornalismo de dados

Depois de uma fonte ter se queixado ao jornal San Jose Mercury News que um grupo de juízes de tribunais criminais estavam passando as sextas-feiras no golfe em vez de na sala de audiências, o jornal atribuiu uma equipe de quatro repórteres e um fotógrafo para a história.

No tribunal do condado de Santa Clara, eles notaram as vagas de estacionamento reservadas com os nomes dos juízes. Escreveram os números das placas e seguiram os carros. Também obtiveram o horário completo dos juízes, bem como seus registros de golfe e deficiências.

Após uma investigação de cinco meses, eles descobriram que às sextas-feiras os juízes, que eram os jogadores ávidos, passavam a maior parte do dia nos campos, o que contribuiu para um acúmulo de casos no tribunal. Depois da investigação "The Judge Club" (O Clube de Juízes) ser publicada, o golfe das sextas chegou ao fim.

Às vezes, os dados que você precisa para reportar uma história simplesmente não estão disponíveis, ou porque não existem ou não estão sendo coletados adequadamente. O que um repórter deve fazer?

Você pode começar por recolher dados de maneiras criativas. Um painel liderado por Sarah Cohen do New York Times na conferência do National Institute for Computer-Assisted Reporting (NICAR) em Baltimore deu algumas ideias.

O Wall Street Journal publicou recentemente uma investigação sobre como a empresa de material de escritório Staples varia os preços de alguns de seus itens, dependendo dos IPs das pessoas e, portanto, dos CEPs. Para isso, o jornal testou os preços de itens várias vezes usando diferentes códigos postais.

O jornal descobriu que a Staples cobra clientes mais de um dólar a mais por um grampeador dependendo de quem compra.

Para a investigação, os repórteres do Wall Street Journal leram atentamente os Termos de Serviço no site da Staples e fizeram capturas de tela no caso de a empresa decidir mudá-los. Eles também consultaram o editor de ética da sua organização de notícias para se certificar de que não estavam envolvidos em táticas questionáveis legalmente ou eticamente​​.

Para o projeto "Dollar Politics”, a National Public Radio (NPR) recorreu à sabedoria do público.

Durante a sessão do Comitê do Senado sobre Saúde, Educação, Trabalho e Pensões discutindo a nova lei de saúde de 2009, a NPR tinha notado uma horda de lobistas presentes após o evento. Para esta matéria, os repórteres quiseram saber quem eram os participantes e qual a influência que eles tinham. Então, eles viraram a câmera para a plateia, tiraram fotos dos lobistas e pediram ao público para ajudar a identificá-los. Cada vez que um participante era identificado, a NPR pôs o nome e cargo da pessoa na foto.

Construa um banco de dados a partir do zero

Uma investigação do jornal USA Today sobre assassinatos em massa nos Estados Unidos começou basicamente a partir do zero, pois não havia um conjunto de dados que centralizassem todos os casos.

A equipe de banco de dados começou com informações do FBI, mas rapidamente percebeu que o conjunto de dados não estava completo por várias razões. (No final da investigação, eles descobriram que os dados do FBI tinham uma taxa de precisão de 61 por cento devido a casos errôneos s e incidentes perdidos.) Alguns estados, como a Flórida, não compartilham seus dados com o público, enquanto outros demoram para fazê-lo.

Depois disso, eles compilaram dados que encontraram através de pesquisa no Google News e LexisNexis. Usando a definição de assassinato em massa (quatro ou mais pessoas mortas) do FBI, eles acabaram encontrando 236 incidentes desde 2006.

"Construir o seu próprio banco de dados leva tempo e esforço sério", disse a palestrante e jornalista do USA Today Meghan Hoyer. Mas vale a pena, ela acredita, porque permite aos jornalistas desenvolverem o banco de dados do jeito que querem. "Você é o capitão do seu próprio navio."

A experiência construindo bancos de dados a partir do zero ensinou a Hoyer algumas lições. Ela recomenda que o repórter planeje de antemão, defina o tema, exponha suas ideias a um parceiro e introduza um sistema de verificação de erros.

Solte os drones

E, se não existem os dados, você sempre pode usar hardware para recolher o seu próprio conjunto de dados. Redações de todo o mundo (como WNYC em Nova York e La Prensa Gráfica em El Salvador) têm tido cada vez mais experiências com drones e sensores para coletar dados específicos.

Matt Waite, também integrante do painel e conhecido como o rei dos drones, apresentou algumas experiências que ele vem fazendo no Laboratório de Jornalismo Drone da Faculdade de Jornalismo e Comunicação de Massa da Universidade de Nebraska- Lincoln. Enquanto depender do governo para liberar dados pode limitar jornalistas, Waite recomendou que repórteres coletem seus próprios dados.

Waite tem experimentado com drones para reportar já há algum tempo, utilizando-os para cobrir a seca de Nebraska em 2012, por exemplo.

Recentemente, ele experimentou com sensores Arduino conectados a microfones, que ele usou para detectar os níveis de ruído do lobby da faculdade de jornalismo da Universidade de Nebraska. Esses sensores podem ser usados ​​para coletar os níveis de ruído de um bairro ou cidade, ele disse, enquanto que drones podem ser usados ​​para mapeamento digital ou, com alguns ajustes, como câmeras infravermelhas.

Primeira imagem: Captura de tela do artigo "A Tale of Two Prices" no site to Wall Street Journal. Segunda imagem: Captura de tela do projeto Dollar Politics da NPR.

Maite Fernández é a editora-chefe da IJNet. Ela fala inglês e espanhol e é mestre em jornalismo multimídia pela Universidade de Maryland.