Nota del editor: Confiscati Bene, lanzado a mediados de diciembre pasado en Europa, es un proyecto colaborativo pionero de periodismo de datos que investiga los 4 mil millones de euros en bienes confiscados a delincuentes en la Unión Europea. Un equipo internacional de periodistas y sus aliados intentaron crear una base de datos europea de activos incautados y responder preguntas problemáticas sobre la transparencia del proceso.
En este post, Andrea Nelson Mauro, fundador de DataNinja.it, cuenta a la Red Global de Periodismo de Investigación cómo se organizó el proyecto en Italia, que involucró a un grupo diverso de periodistas, activistas y tecnólogos. Mauro describe paso a paso la investigación — ya publicada en 19 periódicos italianos y en toda Europa—, y explica las herramientas empleadas, incluyendo el raspado de datos (scraping), la curaduría de contenidos, la minería de datos y el trabajo de programación.
El 5 de septiembre de 2015 fue el día de publicación en Italia de nuestra investigación sobre los bienes confiscados a la mafia: un periódico nacional (L’Espresso) y 18 sitios web del mismo grupo editorial (Repubblica-L’Espresso) –ver el mapa a continuación– publicaron nuestra serie, que revelaba cuántos edificios y empresas habían sido incautados, región por región, a quién pertenecían y qué estaba haciendo el gobierno para devolverle esos activos a los ciudadanos italianos. Fue una gran oportunidad y una experiencia increíble para quienes trabajamos en la investigación. Iniciamos el proyecto en julio de 2015.
Entretanto, un post muy interesante de Alberto Cairo, director de la cátedra Knight de Periodismo Visual en la Universidad de Miami, apareció en el sitio web de Nieman Lab. Titulado Data Journalism Needs To Up Its Own Standards ("El periodismo de datos necesita superar sus propios estándares"), el artículo se refería a las promesas excesivas hechas por los proyectos de FiveThirtyEight y Vox.com que, según Cairo, deberían “tratar a sus datos con mayor rigor científico”. Para estos y otros ejemplos que citó, podrías encontrar –en mi humilde opinión– un montón de sugerencias interesantes, especialmente si estás haciendo periodismo con datos y te topas con el mismo tipo de problemas y dudas con los que nos encontramos día a día en DataNinja. Hasta ahora, el periodismo de datos –me parece– se ha desarrollado demasiado a modo de estadísticas descriptivas, visualizaciones de datos, análisis predictivos y efectos especiales en la web (el "efecto wow" como dicen algunos amigos, o "mapa-itis", referido a quienes publican un mapa a cada minuto sin ningún valor informativo).
Así que me gustaría compartir con ustedes lo que hemos hecho en el proyecto Confiscati Bene (literalmente, "Bienes confiscados"), con el objetivo de iniciar un diálogo y recibir una devolución acerca de lo que hicimos bien y lo que tenemos que mejorar.
Paso 1: De conocer el proyecto de datos abiertos “Confiscati Bene” a trabajar en él
Spaghetti Open Data (SOD) es un grupo de ciudadanos italianos interesados en la liberación de datos públicos en formato abierto.
El mundo de los datos abiertos me dio una gran oportunidad para actualizar mis habilidades, y hace unos años me uní a la comunidad "Spaghetti Open Data" de Italia. En marzo de 2014, durante un hackatón, desarrollamos la primera versión de Confiscati Bene, un proyecto independiente impulsado por ciudadanos para abrir los datos de los bienes incautados a la mafia. Como primer paso, todos los datos se rasparon de la página oficial de la agencia que contiene la base de datos de los bienes confiscados. ¡Qué gran oportunidad! No solo para la publicación de esos datos, sino para tratar de mejorar el proyecto con nuestras habilidades periodísticas y del trabajo con datos.
Nos unimos al equipo y ayudamos a construir una plataforma online a través de un catálogo de datos sobre los activos de la mafia que necesitaba ser actualizado. Trabajando de esa manera aprendimos mucho acerca de los bienes decomisados (mediante la lectura de las actas del parlamento y el descubrimiento de diversos informes y documentos), en tanto los miembros del equipo compartíamos la información en una lista de correo del proyecto. ¿Cuánto tiempo habría pasado buscando esos recursos por mí mismo, en lugar de contar con un equipo que compartía la información rápidamente? ¿Cuánto podría ayudarnos la gente a nosotros (los periodistas) a hacer nuestro trabajo, si le diéramos la oportunidad de ayudar? Hacerlo en equipo –y no solo con periodistas– tiene que ser mejor.
Paso 2: Del inicio de la investigación a la publicación en 19 periódicos y sitios web
A fines de julio ya habíamos comenzado nuestra investigación y construido un equipo de tres periodistas (Andrea Nelson Mauro –yo; Alessio Cimarelli y Gianluca De Martino). Leímos algo así como 3.000 páginas de documentos e informes de diversas instituciones y observatorios para comprender mejor los datos (aunque no somos expertos en esta área). Al cotejar los resultados e informaciones destacadas, creamos una especie de "curaduría de contenidos" de los documentos, para extraer los temas periodísticos que nos parecían más importantes.
Por ejemplo, descubrimos que el gobierno italiano (con la UE) dio seis millones de euros a la agencia pública que supervisa los bienes confiscados para construir una gran base para recopilar esos datos, pero nadie hizo nada, nadie sabe adónde fue el dinero y nadie jamás vio el proyecto.
Respecto de las habilidades y actividades que desarrollamos:
- Minería de datos (y de historias): este fue un gran capítulo de la investigación. Lo hicimos con los documentos oficiales y también en la web, para encontrar resultados y estadísticas que coincidieran con los datos raspados de la agencia pública que contiene los bienes confiscados. A veces es necesario ser muy determinante para entender exactamente cuál es el “estatus” del bien. Por ejemplo, ¿ha sido capturado, confiscado, congelado por la ley, cedido a una ONG?
- Programación y geolocalización; para mostrar los bienes confiscados en un mapa, necesitábamos desarrollar una herramienta de visualización. Esta fue creada por Alessio Cimarelli, utilizando solamente recursos de código abierto (Leaflet, D3js, OSM Nominatim y otras). Los datos son mostrados en las regiones italianas con valores absolutos y no relativos a la población u otras dimensiones, ya que nuestro objetivo fue elaborar una especie de visión cruda para mostrar dónde la mafia gasta el dinero, y las diferencias entre las grandes ciudades y los pueblos pequeños.
- Curaduría de contenido: también pensamos que cada bien decomisado debía ser publicado en todos los periódicos. Partiendo de esa idea, clasificamos cada historia según región y archivos de periódicos, y según los jefes más importantes a quienes les habían sido confiscados estos bienes. Trabajando de esa manera (y después de contrastar los resultados con los datos cuantitativos) pudimos trazar un panorama general mostrando qué mafia estaba implicada (la siciliana, la Camorra, la Ndrangheta), y hacer una especie de distribución por región.
- El proceso de revisión: trabajar en equipo fue muy útil para señalar errores, pero lo mejor, según mi sincera opinión, fue compartir los borradores de los artículos con otros miembros del proyecto.
Paso 3: Mirando hacia el futuro, hacemos periodismo de bases de datos
Después de publicar, devolvimos los datos a Confiscati Bene subiéndolos en un catálogo de datos desarrollado con DKAN (un CMS Drupal como CKAN, impulsado por nosotros vía Twinbit). Formamos parte del equipo de esta iniciativa, por lo que nos interesa mejorarla, recogiendo otros datos y desarrollando otros capítulos (por ejemplo, en otros países de Europa). Con el lanzamiento del proyecto en 19 periódicos, hemos difundido con éxito no solo las noticias de este sino también los datos en sí, que continuamos actualizando. No sé dónde vamos a terminar, pero sé que nos estamos moviendo hacia adelante y tratando de mejorar, así que tal vez vuelvas a escuchar sobre Consfiscati Bene.
Este post fue publicado originalmente en DataNinja.it. Fue reproducido por la Red Global de Periodismo de Investigación (GIJN, por su sigla en inglés) y publicado en IJNet con permiso. Andrea Nelson Mauro es periodista de datos y fundador de DataNinja.it y de Datamediahub.it.
Imagen: captura del sitio Confiscati Bene.