Nota
Eu venho trabalhando nesse sucinto manual há pouco mais de um ano. Algumas partes são baseadas em observações de exemplos no Brasil e no exterior, mas não diretamente em outros manuais — por isso a falta de referências e links (se você quer aprender jornalismo de dados, visite o site da Escola de Dados). A maior parte é basicamente experiência minha trabalhando nisso há alguns anos e trocando ideias informalmente com a excelente comunidade de jornalismo de dados no Brasil.
Creio que é melhor ser direto e breve do que prolixo, redundante e monótono. Também não quis ser acadêmico nem usar exemplos. É meramente um manual de formatação e organizacional. Me reservo ao direito de revisar esse material e atualizá-lo a qualquer momento. Esse manual foi adotado para a formação da equipe de dados do Vortex, da qual sou editor.
A licença é creative commons e ele pode ser usado e replicado à vontade, mesmo sem pedir permissão e sem citação de fonte (mas se você utilizar e for uma pessoa legal e transparente, pode dar crédito para Sérgio Spagnuolo, editor do Volt Data Lab).
Introdução
Uma equipe dedicada de dados em certa redação precisar ter uma atuação bastante diversificada e constante, caracterizando-se principalmente por três atividades:
- produção própria de conteúdo orientado por dados;
- construção de capacidades;
- auxílio para outras áreas editoriais.
Deve-se notar que, como em qualquer outra área, essas atividades podem ser mutuamente excludentes no dia a dia, ou seja, a depender do esforço empenhado em cada uma delas, as outras podem ser adiadas ou atrasadas.
Por exemplo, num esforço de breaking news, materiais especiais ficam para depois. No caso de urgência de outras áreas da redação, a produção própria pode ficar em segundo plano. Essa priorização deverá ser decidida caso a caso, a partir de avaliações de importância e urgência, levando em conta determinações da gerência e do editor.
1. Produção própria
A equipe de dados deverá desenvolver um programa próprio de produção de conteúdo, a ser determinado a partir de deliberações internas da editoria em sincronia com a demanda de outras áreas e os acontecimentos do momento. Essa será uma atribuição fundamental da equipe de dados, trabalhando harmoniosamente dentro dela mesma ou com outras áreas e equipes da redação.
A produção de conteúdo próprio deverá incluir, mas não ficar limitada a:
- Reportagens, análises e investigações;
- Visualizações de dados (gráficos, mapas, redes, linhas do tempo etc.);
- Aplicações especiais (bancos de dados interativos, quizzes etc.);
- Conteúdo para produtos editoriais diversos;
- Pauta da semana;
- Painel de dados;
- Produção de ferramentas e processos para coleta, extração e análises de dados, incluindo open source.
2. Resposta ao noticiário
O noticiário não espera ninguém acabar o que está fazendo. Eventos se desdobram à revelia de nosso itinerário. Por esse motivo, a equipe de dados precisa estar em prontidão para dar respostas rápidas a esses eventos, a fim de criar o máximo de impacto possível. Essa é uma prioridade, sempre levando em conta o tempo diferente do trabalho jornalístico de dados.
Essa prontidão pode ser representada na preparação anterior a algum evento esperado ou iminente. Pode também estar contida em protocolos de produção que contemplam resposta rápida, como sincronia dos esforços da equipe e pre-estabelecimento de fontes confiáveis acerca de diversos temas diferentes.
Convém salientar que, como em qualquer outro segmento do jornalismo, é necessário ter cautela na expectativa com o material produzido: quanto mais rápida a resposta, menor a profundidade de levantamentos, análises e visualizações.
É reconhecido que o melhor do jornalismo de dados — conteúdo significativo, representativo e visualmente sofisticado — exige tempo, diligência e revisão insistente. Não é possível esperar que uma resposta imediata a um evento gere um conteúdo tão completo e aprofundado quanto um trabalho de várias semanas ou meses.
Por esse motivo, é necessário haver preocupação da equipe para esforços de preparação. Quanto mais diligência, melhor será a resposta. Muito comumente é impossível prever acontecimentos e eventos, e isso deve ser levado em conta no tempo de resposta e no aprofundamento do conteúdo.
Também é preciso salientar que, possivelmente, os dados acerca de certo assunto serão inexistentes ou insatisfatórios, o que, claramente, pode atrasar ou até inviabilizar um trabalho orientado por dados.
Preparação e construção de capacidade:
- Observar eventos e tramitações:
- Comissões (CCJ, Relações Exteriores, CAE, Direitos Humanos)
- Ministros
- Presidente
- Presidentes das Casas (Senado e Câmara)
- Prestar sempre atenção às comissões parlamentares (primeiro passo legislativo) - Observar agendas e calendários de divulgação de dados relevantes
- Segurança pública (MJ, Datasus, Forum de Segurança Pública, Sinesp)
- IBGE (PIB, emprego)
- Caged
- Polícia Federal (armas, passaportes, operações) - Manter bancos de dados atualizados com dados úteis, prontos para serem explorados
- Manter aplicações próprias para consulta
- Elaborar modelos e códigos reutilizáveis próprios
- Criar templates e alicerces de dados e visualizações
- Produzir com antecedência, antecipando acontecimentos previsíveis
- Documentar trabalho com dados (scrapers, análises) para facilitar a reutilização de códigos e ferramentas
- Elaboração de pedidos feitos via Lei de Acesso à Informação
- Parcerias e convênios com outras partes que possam acrescentar à capacidade da organização
3. Auxílio para outras áreas
Dado seu expertise técnico com grande volume de informação, processos e metodologias, pode ser requisitado que a equipe de dados auxilie outras áreas. Isso é perfeitamente normal em qualquer iniciativa jornalística e deve ser encorajado, a fim de garantir maior colaboração e consequente enriquecimento do jornalismo produzido.
É preciso notar, no entanto, que uma equipe de dados ideal é uma equipe autônoma e não uma “prestadora de serviços”.
Os auxílios a outras áreas podem acontecer de diversas formas, notadamente:
- Esforços de cobertura perante eventos que exijam esforços noticiosos complexos;
- Empréstimo de capacidades técnicas para outra área;
- Ajuda na elaboração de conteúdo de dados para reportagens e especiais;
- Auxílio na análise de dados de outras áreas;
- Treinamento e transferência de conhecimento.
A equipe pode também ajudar outras áreas em seus esforços de conteúdo especial e investigativo, como elaboração conteúdo para newsletters e podcasts, embora não possa arcar com o empenho de produção executiva desses materiais e formatos.
É importante notar que esses auxílios, mesmo que recorrentes, não devem automaticamente ser incorporados em detrimento ao trabalho em andamento da equipe de dados — ou seja, a prioridade dos trabalhos desenvolvidos em conjunto com outra área dependerá de acordo entre a gerência e o editor de dados, a fim de não interromper outros fluxos em andamento. Esse acordo será baseado em diversas variáveis, como urgência, importância, prazos e complexidade.
4. Equipe
Uma equipe ideal de jornalismo de dados deve ser:
- multidisciplinar e diversa
- tecnicamente versátil
- responsiva aos eventos e cenários correntes
- autônoma, mas colaborativa
Para que tudo isso aconteça, é necessária uma harmonização entre as atribuições e execuções da equipe. O trabalho do editor de dados é garantir que essa engrenagem funcione própria e eficientemente, mantendo ritmos, prazos e padrões de qualidade.
Apesar de certa sobreposição de tarefas entre seus integrantes ser inevitável — e até mesmo desejável — é preciso que atribuições sejam claramente estabelecidas, a fim de evitar duplicação de esforços, conflitos de tarefas e até mesmo ineficiência dos processos e protocolos internos.
De toda forma, é encorajado que todos os membros da equipe aprendam tarefas e responsabilidades de seus pares e que eventualmente possam expandir seu conhecimento, tornando-se profissionais mais eficientes. A troca de conhecimento entre eles, assim como com outras áreas, é fundamental.
A composição da equipe ideal de dados em uma redação, então, deve partir das demandas tradicionalmente atribuídas a esse quadro: extração, organização, análise e visualização de dados. Para isso, inicialmente, deverão ser incorporados:
5. Tarefas específicas principais
Editor de dados
- Coordenação da equipe de dados;
- Interlocução e articulação da equipe de dados acerca da adoção de novos caminhos ou demandas de outras áreas;
- Elaboração da pauta da semana (tanto para a equipe de dados quanto para conhecimento do resto da organização);
- Edição de textos para publicação;
- Eventual apuração, análise e redação de textos;
- Eventual coleta de dados e assistência na produção de aplicações.
Repórter
- Apuração de agenda da semana de dados, a fim de permitir a melhor preparação possível aos eventos (ex. divulgação de PIB, contas partidárias, etc.);
- Condução de apurações (coleta de dados, documentos, entrevistas);
- Elaboração de textos para as reportagens orientadas por dados;
- Idealização de pautas especiais e de cobertura jornalística;
- Trabalho em conjunto com analista de dados.
Analista de dados
- Extração e coleta de dados;
- Condução de análise estatística de dados levantados;
- Criação de metodologias e abordagens para tratamento e análise de dados;
- Elaboração de relatórios que sustentarão reportagens, visualizações e outros conteúdos;
- Eventual apuração, análise e redação de textos.
Analista de aplicações
- Produção de scrapers, crawlers, ferramentas de monitoramento, pacotes e bibliotecas com a finalidade de automatizar coleta de dados;
- Criação de metodologias e abordagens para tratamento e análise de dados;
- Controle de aplicações (banco de dados, environment de desenvolvimento, preparação de dados) para produção de conteúdo especial, coberturas e demandas de outras áreas;
- Eventual elaboração de relatórios que sustentarão reportagens, visualizações e outros conteúdos;
- Desenvolvimento de ferramentas;
- Eventual apuração, análise e redação de textos;
- Eventual elaboração de visualizações de dados.
Repórter visual
- Concepção de visualizações de dados e de design para aplicações;
- Tratamento final dos dados para input em ferramentas específicas de visualização;
- Desenvolvimento criativo de metodologias para visualizações de dados, a partir de várias ferramentas disponíveis;
- Implementação de interatividade em visualizações;
- Eventual elaboração de relatórios que sustentarão reportagens, visualizações e outros conteúdos;
- Eventual apuração, análise e redação de textos.
6. Principais fontes
Uma das principais atividades de uma editoria de dados é identificar e estudar bem os dados disponibilizados pelas instituições e áreas que se propõe a cobrir. Isso significa “destrinchar” as APIs de órgãos governamentais, especialmente da Câmara dos Deputados, do Senado Federal, do Supremo Tribunal Federal, do Conselho Nacional de Justiça e do Superior Tribunal de Justiça. A partir desse processo, será possível criar bancos de dados e ferramentas internas próprias para agilizar processos de apuração e geração de novos conhecimentos.
Obviamente, todas as outras fontes governamentais, especialmente aquelas que possuem APIs e atualização automática, deverão ser exploradas, especialmente autarquias como IBGE, Ipea e agências reguladoras, entre outras instituições.
Organizações internacionais que possuem muitas trovas de dados, como Banco Mundial, OCDE, ONU, FMI também deverão ser observadas.
Outras fontes, incluindo de empresas, redes sociais, consultorias renomadas e organizações do terceiro setor, certamente devem estar no radar para serem utilizadas de acordo com a necessidade e demanda por elas.
A equipe também deve ser encorajada para criar seus próprios levantamentos, cruzamentos e dados, como em pesquisas, enquetes, criação de índices, scrapings etc.
7. Política de qualidade
Um bom trabalho é um trabalho cujos processos são eficientemente revisados e testados. Erros são fundamentalmente inevitáveis, mas devem ser esquivados ao máximo, a partir de processos e métodos desenhados com essa finalidade. Para isso, um trabalho diligente de revisão e edição, tanto pelo editor quanto pelos outros membros da equipe.
Quaisquer erros que vierem a ser publicados deverão ser publicamente corrigidos, seguidos de explicações.
A equipe de dados deverá ao máximo explicar referências e métodos adotados, a exemplo das melhores práticas de transparência no jornalismo orientado por dados.
8. Formatos
Engajamento
A equipe deve pensar constantemente em formatos, metodologias e conteúdos que possam trazer ao máximo uma interação com um leitor. Seja um furo de reportagem, um gráfico interativo, um quiz ou até mesmo responder comentários de leitores, essa é uma meta que deve estar sempre no escopo do grupo.
Dados abertos
A editoria de dados terá repositórios específicos de códigos e dados abertos, a fim de garantir transparência de dados, especialmente quando utilizando dados públicos. Idealmente, todo conteúdo publicado deverá ter seus dados e códigos subsequentemente acrescentados ao repositório — notando, obviamente, a elegibilidade pra isso (ex. dados para embargo, dados não públicos, microdados que podem comprometer privacidade individual ou de fontes).
Criação de templates
Apesar de ser encorajado que a equipe trabalhe com novos formatos e processos, é preciso também produzir templates para facilitar o trabalho — sejam templates de dados, métodos, formatos de publicação e visualizações. Isso deverá ser incorporado aos trabalhos da equipe com o tempo e a percepção de realidades que possam ser replicadas com facilidade, especialmente em caso de reação rápida ao noticiário.
Experimentação
É altamente encorajado que a equipe pense em experimentos que possam ser aplicados ao noticiário, como desenvolvem então de bibliotecas específicas ou ferramentas que poderão ser usadas não somente pela equipe ou internamente, como também pelo leitor.
9. Dados como recurso, não como solução universal
Por fim, uma editoria de dados só é bem sucedida quando utiliza dados como um recurso para o jornalismo produzido, não como uma solução universal para uma reportagem.
Embora reportagens possam ser exclusivamente baseadas em dados, é frequente que sejam acompanhadas de muitas validações com outros tipos de fontes, como pedidos via LAI, documentos, autoridades, instituições e especialistas reconhecidos.
Pedidos de comentários para partes afetadas sempre deverão ser realizados, exceto em situações que não exijam esse decoro — como por exemplo análises rápidas feitas a partir de divulgações oficiais de dados, análises descritivas e aplicações.
Os dados podem responder ‘o que’, ‘quem’, ‘quando’ e ‘onde’, mas só com reportagem respondemos ‘por que’ alguma coisa importa de verdade.
Sérgio Spagnuolo, ex-bolsista TruthBuzz do Centro Internacional para Jornalistas (ICFJ, em inglês), é editor e fundador da agência de jornalismo Volt Data Lab e editor do Vortex Media. Siga-o no Twitter: @sergiospagnuolo.
Este artigo foi publicado originalmente no Medium sob licença Creative Commons.
Imagem sob licença CC no Unsplash via Annie Spratt.