Nota do Editor: Confiscati Bene, lançado em meados de dezembro na Europa, é uma colaboração de jornalismo de dados pioneira que investiga €4 bilhões de bens confiscados de criminosos na UE pelas autoridades europeias. Uma equipe internacional de jornalistas e seus aliados criaram uma base de dados europeia de bens apreendidos e buscam responder a questões preocupantes sobre a prestação de contas do processo.
Neste post, Andrea Mauro Nelson, fundador líder do projeto DataNinja.it, conta para a GIJN sobre a organização do projeto na Itália, que envolveu um grupo diversificado de jornalistas, ativistas e tecnólogos. Mauro descreve a investigação passo-a-passo -- agora publicada em 19 jornais italianos e em toda a Europa -- e explica as várias ferramentas utilizadas, incluindo web scraping, curadoria de conteúdo, mineração de dados e codificação.
Em 5 de setembro, tivemos um dia de publicação na Itália para nossa investigação sobre bens confiscados da máfia: um jornal de circulação nacional (L’Espresso) e 18 sites da mesma editora (Repubblica-L'Espresso) -- veja o mapa abaixo -- publicaram online nossa série revelando como muitos prédios e empresas foram apreendidos, região por região, a quem tinham pertencido e o que o governo está fazendo para retornar esses ativos aos cidadãos italianos. Foi uma grande oportunidade e uma experiência incrível para nós que trabalhamos na investigação. Demos início ao projeto em julho de 2015.
Enquanto isso, um post muito interessante por Alberto Cairo, Knight Chair em Jornalismo Visual na Universidade de Miami, apareceu no site do Nieman Lab. Intitulado "Data Journalism Needs To Up Its Own Standards” (Jornalismo de Dados Precisa Elevar Suas Normas Próprias), o artigo focou no excesso de promessas dos projetos FiveThirtyEight e Vox.com que devem "tratar seus dados com maior rigor científico", segundo Cairo. Para esses e outros exemplos que ele citou, você pode encontrar -- em minha humilde opinião -- uma série de sugestões interessantes, especialmente se está fazendo jornalismo com dados, e o tipo de questões e dúvidas que vemos todos os dias em nossos postos de trabalho na produção do DataNinja. Até agora o jornalismo de dados desenvolveu muito como estatística descritiva, visualizações de dados, análise preditiva e efeitos especiais na web (o "Efeito Uau" - como alguns amigos dizem - ou "mapa-tites", sobre pessoas que publicam um mapa a cada minuto sem qualquer valor jornalístico).
Então, eu gostaria de compartilhar o que fizemos para o projeto "Confiscati Bene" (literalmente, "Bem Confiscado") com o objetivo de iniciar um diálogo e obter feedback sobre o que fizemos bem e o que precisamos melhorar.
Passo 1: Desenvolver o projeto de dados “Confiscati Bene” e trabalhar
Spaghetti Open Data (SOD) é um grupo de cidadãos italianos interessados na divulgação de dados públicos em formato aberto.
O mundo de dados aberto me deu uma grande oportunidade para reformular minhas habilidades, e alguns anos atrás eu entrei para a comunidade "Spaghetti Open Data" da Itália. Em março de 2014, durante uma hackatona, desenvolvemos a primeira versão do "Confiscati Bene", um projeto independente alimentado por cidadãos para abrir os dados sobre bens apreendidos da máfia. Como primeiro passo, todos os dados foram raspados a partir do site oficial da agência que tem um banco de dados de bens confiscados. Que ótima oportunidade! Não só para a publicação dos dados, mas para tentar melhorar o projeto com as nossas competências jornalísticas e de dados.
Nós nos juntamos à equipe e ajudamos a construir uma plataforma online com um catálogo de dados sobre os ativos da máfia que precisavam ser atualizados. Trabalhando desta forma, aprendemos muito sobre bens confiscados (lendo Atos do Parlamento e descobrindo vários relatórios e documentos). Os membros da equipe compartilharam esses documentos em uma lista de discussão do projeto. Quanto tempo eu teria gasto para encontrar esses recursos sozinho, em vez de ter uma equipe que compartilhou rapidamente? Quanto as pessoas poderiam ajudar a melhorar o nosso trabalho de jornalismo se apenas déssemos uma oportunidade para ajudar? Fazendo juntos -- e não só com os jornalistas -- pode funcionar melhor.
Passo 2: Começar a investigação e publicar em 19 jornais e sites
Até o final de julho, nós começamos a nossa investigação e construímos uma equipe de três jornalistas (Andrea Nelson Mauro --que sou eu--, Alessio Cimarelli e Gianluca De Martino). Nós lemos algo como 3.000 páginas de documentos e relatórios de várias instituições e observatórios, para entender melhor os dados (mesmo não sendo especialistas nesta área). Correspondendo resultados e informações que se destacavam, criamos uma espécie de "curadoria de conteúdo" dos documentos, extraindo as questões jornalísticas mais importantes (para nós).
Por exemplo, descobrimos que o governo italiano (com a UE) forneceu €6 milhões para o órgão público que supervisiona bens confiscados para construir um grande banco de dados para coletar esses dados, mas ninguém fez nada, ninguém sabe para onde foi o dinheiro e ninguém nunca viu o projeto.
Sobre as técnicas e atividades que desenvolvemos:
- Mineração de dados (e de história) - Este foi um grande capítulo da investigação: fizemos isso em documentos oficiais e também na web para encontrar resultados e estatísticas correspondentes com os dados raspados da agência pública sobre os bens confiscados. Às vezes você precisa ser determinado para entender exatamente em que etapa o bem é tomado. Por exemplo, é apreendido, confiscado, congelado pela lei ou cedido a uma ONG?
- Questões de codificação e geográficas - Para mostrar bens confiscados em um mapa, precisávamos desenvolver uma ferramenta de visualização. Esta foi criada por Alessio Cimarelli, utilizando apenas ferramentas de código aberto (Leaflet, D3js, OSM Nominatim e outros). Os dados são mostrados nas regiões italianas por valores absolutos e não normalizados pela população ou outras dimensões, porque visamos elaborar uma espécie de visão geral em bruto: para mostrar onde a máfia gastou o dinheiro e as diferenças entre cidades grandes e pequenas cidades.
- Curadoria de conteúdo - Nós achamos que cada confisco deveria ser contado por todos os jornais também. A partir desta ideia, nós agregamos cada história por região e arquivos de jornais e os patrões mais importantes de quem as mercadorias foram confiscadas. Trabalhando dessa forma (e depois de corresponder os resultados com os dados quantitativos) podemos criar um panorama mostrando o tipo de máfia (siciliana, de Camorra, Ndrangheta) e uma espécie de distribuição por região.
- Processo de revisão - Trabalho em equipe é muito útil para apontar os erros, mas ainda melhor na minha opinião foi compartilhar rascunhos dos artigos com outros membros do projeto.
Passo 3: Caminhar adiante, fazendo jornalismo de banco de dados
Depois da publicação, devolvemos os dados para o Confiscati Bene fazendo o upload de um catálogo de dados desenvolvido com DKAN (CKAN do tipo CMS do Drupal, alimentado por nós pelo Twinbit). Nós fazemos parte da equipe desse projeto, por isso estamos interessados em melhorá-lo, coletar outros dados e desenvolver outros capítulos (por exemplo, em toda a Europa). Com o lançamento do projeto em 19 jornais, disseminamos com sucesso não só as notícias do projeto, mas os dados em si; e estamos continuando a atualizar os dados. Eu não sei onde vai acabar, mas sei que nós estamos avançando e tentando melhorar isso, então talvez você ainda vá ouvir mais sobre Confiscati Bene.
Este post foi publicado originalmente no DataNinja.it, reproduzido pela Global Investigative Journalism Network e aparece na IJNet com permissão. Andrea Nelson Mauro é jornalista de dados e fundador do DataNinja.it e Datamediahub.it.
Imagem é caputra de tela do homepage do Confiscati Bene