Das infecções à mobilidade: Dicas para encontrar e analisar dados da COVID-19

porRowan Philp
Jul 14, 2020 em Reportagem sobre COVID-19
Pessoas atravessando a rua

O crime organizado está mudando suas rotas de tráfico, aproveitando-se da sombra que a COVID-19 oferece. Contrabandistas de madeira na Amazônia estão aumentando seu comércio na ausência de supervisão. As taxas de desemprego e dependência de álcool estão aumentando, e as mudanças climáticas continuam inabaláveis.

O mundo está mudando rapidamente e em quase todos os níveis à sombra da pandemia de coronavírus, diz Giannina Segnini, diretora do Programa de Jornalismo de Dados da Universidade de Columbia, nos Estados Unidos.

Mas Segnini diz que dados e ferramentas estão disponíveis para investigar e analisar essas mudanças, e que os repórteres podem acompanhar muitas dessas mudanças em tempo real, incluindo mudanças de comportamento.

Data ideas for the post-COVID-19 landscape
Ideias com foco em dados para o cenário pós-COVID-19. Imagem: Universidade Columbia e CLIP.

 

“Olha, seus netos estarão falando sobre a era pré e pós-COVID-19. Realmente, estamos testemunhando uma situação histórica aqui ”, disse ela em um webinar de 18 de junho, parte da série Investigating the Pandemic, da GIJN. “Essa coisa está apenas começando. Há tantas coisas acontecendo além das fronteiras que não estão sendo monitoradas. Mas existem dados para monitorar o que está acontecendo, e nunca antes os dados foram uma ferramenta melhor para dar sentido ao mundo à nossa volta.”

[Leia mais: Dicas para visualizar dados sobre COVID-19]

 

Cofundadora do Centro Latino-Americano de Jornalismo Investigativo (CLIP, em espanhol), Segnini e seu colega do CLIP, o jornalista de dados Rigoberto Carvajal, compartilharam ideias sobre como encontrar novas fontes de dados para investigar esse novo mundo.

Além das ameaças diretas à saúde por causa da COVID-19 e suas consequências, Segnini disse que as redações podem criar painéis de dados mostrando mudanças na vida cotidiana de suas comunidades.

"Usando integração automatizada de dados e escalas padronizadas, você pode imaginar painéis que refletem alterações em variáveis como, por exemplo, multas de trânsito, prisões, preços de alimentos, despejos", disse ela. “Todas essas mudanças vão acontecer imediatamente na sociedade. E maus atores estão tirando proveito do fato de que todos nós estamos distraídos com o coronavírus. O tráfico de seres humanos e a corrupção ainda estão acontecendo, mas eles estão mudando rotas e métodos. Há destruição das cadeias de suprimentos. Há mudanças drásticas no transporte marítimo e nas companhias aéreas, com as restrições de viagem.”

Newsrooms could create their own dashboards
Embora os números sejam fictícios neste modelo, Segnini disse que as redações podem criar seus próprios painéis com dados da "vida cotidiana" sobrepostos nos dados de casos de COVID-19 para mostrar os impactos mais amplos. Imagem: Universidade Columbia e CLIP

 

Anteriormente, Segnini foi chefe da unidade de investigações no La Nación, na Costa Rica, e o trabalho de sua equipe levou ao julgamento de mais de 50 figuras públicas, incluindo três ex-presidentes.

Em seu trabalho anterior no Consórcio Internacional de Jornalistas Investigativos (ICIJ, em inglês), Carvajal foi um dos especialistas em dados na investigação "Panama Papers".

Carvajal disse que os dados de casos de COVID-19 fornecidos pelos governos variaram de números brutos e painéis básicos a dados agregados para download (o formato mais comum) e o formato melhor, mas mais raro: dados granulares, caso a caso. Na América Latina, ele disse que o México, a Colômbia e o Peru se destacam como países que oferecem os mais completos dados de casos.

[Leia mais: Como o jornalismo de dados está cobrindo a pandemia na América Latina]

 

“A melhor maneira de obter uma visualização rica do conhecimento dos conjuntos de dados é extrair dados granulares, com registros [anonimizados] individuais para cada paciente [caso]”, disse Carvajal.

Ele disse que é importante usar programas "ETL" (extrair, transformar, carregar) para importar automaticamente esses dados para painéis ou visualizações devido ao seu grande volume. Ele usa uma ferramenta de código aberto, o Talend Open Studio, para integração de dados.

No entanto, com os dados de COVID-19 ainda não confiáveis ​​em muitos países, Segnini disse que minar os dados de excesso de mortalidade continua sendo uma técnica poderosa para mostrar os impactos mais amplos da pandemia.

“Se você possui dados granulares ou agregados, sabemos que nem todos os casos estão sendo contados -- porque muitos morrem em casa ou não foram testados e a política apenas [cita] pessoas com teste positivo ou porque os sistemas de relatório são inadequados ou imprecisos”, ela disse. “Muitos têm medo de ir aos hospitais e poderiam ter morrido porque tiveram complicações. Existe uma metodologia que permite calcular esse excesso de mortalidade. Você precisa ter dados sobre todas as mortes anteriores durante o mesmo período de anos anteriores. Você pode representá-las por números absolutos ou como porcentagem. Quanto mais anos você tiver, melhor o cálculo.”

Ela disse que o surgimento de dados de mobilidade -- onde os sinais pessoais de telefones móveis podem ser anonimizados e agregados -- representa uma nova e poderosa ferramenta para descrever mudanças rápidas.

Ferramentas de dados recomendadas por Carvajal e Segnini

Talend data integration
Imagem: Universidade Columbia e CLIP

Este artigo foi publicado originalmente pela Global Investigative Journalism Network e reproduzido na IJNet com permissão. Para mais informações sobre a série de webinars relacionados a COVID-19, visite o site.

Rowan Philp é repórter da GIJN. Rowan foi ex-repórter-chefe do Sunday Times da África do Sul. Como correspondente estrangeiro, ele reportou notícias, política, corrupção e conflito de mais de duas dúzias de países ao redor do mundo. 

Imagem principal sob licença no Unsplash via Ryoji Iwata