Dicas para visualizar dados sobre COVID-19

por Rowan Philp
Jun 29, 2020 em Reportagem sobre COVID-19
Lista de números de casos da COVID-19

O painel da Universidade Johns Hopkins sobre casos de COVID-19 — com seus números claros e suas bolhas vermelhas em um mapa-múndi escuro — tornou-se uma imagem confiável da pandemia para muitos repórteres e audiências em todo o mundo.

E representa o surgimento mais amplo de ferramentas de visualização de dados como um dos veículos mais poderosos para a compreensão pública de uma ameaça global invisível.

Mas, de acordo com o renomado professor de visualização Alberto Cairo, mesmo o excelente gráfico da Johns Hopkins poderia ser melhorado.

Isso se deve porque as bolhas na Europa representam casos por país, enquanto as dos Estados Unidos representam condados — e algumas audiências, segundo ele, podem entender mal o volume de bolhas nos EUA.

"Este gráfico é maravilhoso", disse Cairo, que ocupa a Cátedra Knight em Jornalismo Visual na Faculdade de Comunicação da Universidade de Miami. “Mas devemos tornar o nível desses dados mais consistente? Talvez apenas no nível nacional, e então possamos ampliar para o nível de condado?"

[Leia mais: Como o jornalismo de dados está cobrindo a pandemia na América Latina]

 

No 12° webinar da série da GIJN sobre "Investigando a Pandemia", a repórter investigativa Danielle Ivory e a especialista em dados de saúde Amanda Makulec se juntaram a Cairo para compartilhar ideias sobre como os jornalistas devem escolher e apresentar imagens gráficas e os dados por trás delas. Eles falaram para uma audiência online de 266 jornalistas de 46 países.

O consenso do painel foi o seguinte: depois de verificar cuidadosamente as informações, os jornalistas devem não apenas mostrar os dados da forma mais apropriada e digerível, mas também explicar claramente o gráfico e os dados e a incerteza por trás deles.

Cairo disse que a visualização provou ser um dos formatos de entrega de informações mais eficazes do mundo, ajudando o público a entender a pandemia.

"Eu acho que está claro que a parte mais difícil de cobrir a crise do coronavírus está relacionada à qualidade dos dados, e não à visualização", disse Cairo, que é autor do livro "How Charts Lie — Getting  Smarter about Visual Information" [Como os Gráficos Mentem...]. “A boa notícia é que a visualização venceu e está se tornando mais popular. Mas também observei muitos erros em como os dados sobre a pandemia foram visualizados.”

Makulec, especialista em informações de saúde e diretora de operações da Data Visualization Society, alertou que os repórteres precisam entender como os dados da COVID-19 são coletados e agregados antes de considerar as informações para uso em gráficos ou tabelas.

[Read more: COVID-19 expõe falta de democracia da informação no Brasil]

Por exemplo, Makulec mostrou dez etapas separadas — desde a coleta com os cotonetes até os resultados nas planilhas dos testes — nas quais erros humanos ou defasagens de dados poderiam ocorrer antes que a contagem de casos de COVID-19 fosse reportada nos conjuntos de dados nacionais.

Ivory, repórter investigativa do New York Times, disse que as comparações de dados equivalentes nos casos de COVID-19 representavam um grande desafio, com as autoridades de saúde dos estados e municípios muitas vezes citando conjuntos de dados diferentes ou usando definições diferentes. Alguns podem citar casos confirmados ou mortes, enquanto outros podem citar casos prováveis ​​— e depois mudar para a outra abordagem ou revisar seus números.

No mês passado, Ivory e seus colegas revelaram que mais de um terço de todas as mortes de COVID-19 nos EUA estavam relacionadas a instituições de assistência a longo prazo, incluindo lares de idosos.

"Conseguimos coletar dados de quase todos os estados e ainda estamos coletando — é praticamente um esforço ininterrupto", disse Ivory. “Cerca de 70% é coletado manualmente, com chamadas ou acessando o site de um estado, e grande parte do restante é coletado por meio de raspador [automatizado], e esperamos que mais possam ser coletados dessa maneira para se tornar um processo sustentável. Mas temos muito cuidado para sermos transparentes sobre o que não sabemos."

Ivory disse que fazer telefonemas diretamente para as autoridades de saúde continua sendo a melhor maneira de resolver os dados aparentemente confusos ou contraditórios.

Com base nos três painelistas, aqui estão algumas dicas de como conseguir uma visualização correta dos dados da COVID-19.

10 recomendações

(1) Explique como ler o gráfico, antes de explicar como ler os dados. Em um gráfico recente sobre empregos perdidos devido à pandemia, o New York Times incluiu explicadores bem destacados, usando uma linguagem simples como esta: “Cada bolha neste gráfico representa uma ocupação. Quanto maior a bolha, mais pessoas fazem esse trabalho.”

(2) Escreva o texto do seu gráfico ao mesmo tempo em que você o está projetando, pois esse processo ajuda a enquadrar o processo para você e o leitor.

(3) Classifique os dados de maneira intuitiva: como cronologicamente ou em grupos comparáveis.

Cairo reorganizou os dados de COVID-19 de um gráfico de barras confuso do Departamento de Saúde da Geórgia (à esquerda) em um novo gráfico (à direita) agrupado por município e organizado cronologicamente.

 

(4) Se você ou seu público são novos na visualização de dados, comece de maneira simples, com gráficos básicos, como mapas, gráficos de barras ou gráficos de linhas. Considere ferramentas como o Datawrapper,  Flourish e iNZight. Siga tutoriais online especializados sobre ferramentas gratuitas, como o guia de Cairo.

(5) Não se limite a ferramentas e gráficos simples. Às vezes, desafie seu público-alvo com alterações incrementais na forma como você apresenta os dados visualmente.

Alguns dos muitos formatos de visualização de dados que os editores podem escolher. Crédito da imagem: datavizcatalogue.com

 

(6) Não tente visualizar muitos dados e edite-os se há um excesso. Defina os pontos principais e atenha-se a eles.

(7) Não há formatos ruins de visualização, mas alguns são mais apropriados para o conjunto de dados e o público do que outros. Gráficos que parecem especialmente contra-intuitivos podem precisar de um gráfico secundário como ponto de referência. Por exemplo, os cartogramas — que distorcem as áreas de um mapa, dependendo de sua relação com uma variável — devem ser apresentados com um mapa comum dessa área ao lado para comparação.

(8) Use escalas lineares para números e escalas não lineares — incluindo escalas logarítmicas — para taxas de mudança. Explique gráficos não lineares com clareza e destaque, pois os leitores costumam achar esse tipo de gráfico difícil de entender.

Usando gerações de gerbos como pontos de dados, Cairo contrastou a escala linear (acima) com uma escala logarítmica (abaixo) para mostrar por que escalas não lineares são importantes para ilustrar as taxas de mudança. Imagem: Alberto Cairo.

 

(9) Exiba a incerteza dos dados visualmente, onde você puder, como margens de erro ou intervalos de confiança. A incerteza que não pode ser quantificada — como a forma como os dados foram gerados — pode ser exibida em texto escrito.

(10) Esqueça o mantra de design tradicional do "show, don't tell" [mostre, não conte]. Cairo disse que os jornalistas visuais precisam "mostrar e contar". Antes considerada um ponto secundário por muitos designers, a parte do texto de um gráfico, conhecida como "camada de anotação", agora é considerada crucial, tanto em termos de enfatizar novamente os principais tópicos, quanto para a compreensão pública da própria forma gráfica.


Este artigo foi publicado originalmente pela Global Investigative Journalism Network e reproduzido na IJNet com permissão.

Rowan Philp é repórter da GIJN. Rowan foi ex-repórter-chefe do Sunday Times da África do Sul. Como correspondente estrangeiro, ele reportou notícias, política, corrupção e conflito de mais de duas dúzias de países ao redor do mundo. 

Imagem principal sob licença CC no Unsplash por Christine Sandu