Mientras salen a la luz más secretos de cómo corporaciones, políticos y celebridades de todo el mundo esconden sus fortunas en paraísos fiscales, los periodistas que participamos en la investigación global llamada Paradise Papers comprobamos la relevancia del trabajo colaborativo y la utilidad de la tecnología informática para reinventar nuestros métodos de búsqueda de datos, su análisis y la cobertura de las noticias.
Para esta investigación, el Consorcio Internacional de Periodistas de Investigación (ICIJ, por sus siglas en inglés) puso al alcance de 383 reporteros de 67 países tres plataformas de trabajo: una para comunicación (Global I-Hub), otra para la búsqueda de documentos (Global Knowledge Center) y una tercera para establecer relaciones entre los datos (Linkurius). “Solo así es posible una colaboración a gran escala”, nos dijo Marina Walker, subdirectora del ICIJ, cuando nos reunimos en Munich, Alemania, en marzo de 2017 para coordinar detalles claves de este caso que vio la luz siete meses después.
Como en los Panama Papers, la nueva filtración de 13,4 millones de documentos de los estudios jurídicos ‘offshore’ Appleby y Asiaciti Trust llegó a través de Bastian Obermayer y Frederik Obermaier, reporteros del periódico alemán Süddeutsche Zeitung, quienes compartieron los datos con el ICIJ para que organizara los ahora llamados Paradise Papers. La mayoría de reporteros convocados ya habíamos participado en otras investigaciones globales del consorcio y conocíamos sus protocolos, pero siempre se abren más retos cada vez que abordamos una nueva historia.
La investigación implicó pasar varios meses examinando documentos, correos, PDF e imágenes indexados en una plataforma encriptada que nos ofreció un universo interminable de material, que se denominó The Knowledge Center. Si hallábamos el dato de una empresa o personaje de interés público que diera pie a un reportaje, comenzábamos el trabajo de campo que implicaba, en muchos casos, viajes, cruces de información y bases de datos externas, entrevistas y todo tipo de fuentes documentales para comprender la historia identificada.
El equipo del ICIJ que lideró Marina Walker se convirtió en una guía permanente para todos los periodistas que colaboramos con los Paradise Papers. Desde su especialidad, Mar Cabra, Emilia Díaz-Struck, Cecile S.Gallego y Rigoberto Carvajal nos ayudaron a navegar entre millones de datos en distintos formatos que al principio no estaban estructurados, pero una vez que fueron organizados revelaban operaciones financieras, contratos, transferencias bancarias, listas de clientes y muchos otros archivos de los métodos que compañías multinacionales como Glencore usan para saltar las normas, evadir impuestos y esconder su patrimonio en territorios offshore.
La data es enorme y abarca un período de casi setenta años, desde 1950 hasta 2016. Esta es una de las principales diferencias de la filtración de Appleby y Asiaciti Trust con respecto a la de Mossack Fonseca en Panamá Papers. Lo es también el perfil de los clientes: multinacionales y súper ricos de los que se puede seguir el rastro en 19 paraísos fiscales, como las islas Bermudas, Bahamas, Barbados, Malta y la Isla de Man. En la base de datos fueron ubicados desde la reina Isabel hasta miembros del gabinete del presidente Donald Trump, cantantes como Bono y Shakira, y corporaciones como Apple, Nike y Facebook.
Las filtraciones de los Paradise Papers leak consisten en cerca de 1,4 terabytes de datos, un poco más de la mitad de los archivos de los Panama Papers.
La investigación no se hubiera extendido meses, sino varios años, si los periodistas hubiésemos trabajamos solos y nos hubiésemos resistido a incorporar a nuestra rutina nuevos métodos de reporteo y la tecnología facilitada por el equipo del ICIJ, que se ha convertido en un modelo para las investigaciones transfronterizas en el mundo.
Comparto con ustedes las herramientas y los programas que aprendimos con los Paradise Papers en tres bloques: Seguridad Digital, Búsqueda de Documentos y Relaciones entre Datos.
Seguridad digital:
VeraCrypt
Los discos duros donde se almacenan los 13,4 millones de documentos que conforman los Paradise Papers fueron cifrados mediante un sistema de código abierto llamado VeraCrypt, que permite tener ‘ficheros ocultos’. Este programa ofrece una doble encriptación: para acceder al primer nivel de información se coloca una contraseña y para el segundo nivel - el invisible - se coloca otra. De esta manera, es muy poco probable que una persona ajena a la investigación pueda advertir que hay una segunda capa secreta de datos en los dispositivos de almacenamiento.
Correos cifrados
Todos los miembros del equipo del ICIJ y nuestras fuentes nos comunicamos e intercambiamos documentos mediante correos electrónicos cifrados a través de extensiones como Mailvelope. Solo se requiere el intercambio de claves por PGP (Pretty Good Privacy).
Global I-Hub
Es una especie de Facebook interno del equipo de periodistas que participamos en las investigaciones convocadas por el ICIJ. Se accede a través de un registro de usuario y un sistema de doble autenticación de identidad. En el Global IHUB hay grupos por temas de interés de los investigadores, un muro público y un sistema de mensajería interna en tiempo real. “Es nuestra redacción virtual”, dice Mar Cabra, editora de datos del ICIJ. Esta plataforma está construida con un software de código abierto llamado Oxwall.
Búsqueda de documentos:
The Knowledge Center
Para examinar todos los documentos de la investigación era necesario ingresar a una plataforma encriptada llamada The Knowledge Center con un usuario y códigos de autenticación. Este sistema de búsqueda fue repotenciado por el equipo del ICIJ y ahora integra las bases de datos de las últimas tres grandes filtraciones: Offshore Leaks, Panama Papers y Paradise Papers.
El buscador permite ver las carpetas de las filtraciones por años, por tipo de archivo y también facilita la ubicación de datos por determinados patrones o palabras. Una vez ubicado un documento se puede tener una vista previa y luego descargarlo.
Los desarrolladores del ICIJ crearon The Knowledge Center con tres software: Apache Tika para extraer y procesar datos de los documentos, Apache Solr para indexarlos, y Blacklight para ofrecer una plataforma de búsqueda intuitiva y fácil de usar.
Nuix
Los desarrolladores del ICIJ y del Süddeutsche Zeitung usaron el software Nuix para procesar los más de diez millones de documentos de la filtración que incluyeron correos, documentos escaneados, en PDF e imágenes. Este programa de la compañía Australian Firepower permitió hacerle una especie de examen forense a la información y pasar por su reconocimiento óptico de caracteres todas las imágenes para convertirlas en documentos de texto analizables. Un ejemplo: cuando escaneamos un contrato o una boleta, estos se guardan como imágenes, pero Nuix es capaz de reconocer si tienen texto en su interior y de extraerlo. Luego de que se procesaron los datos introducidos en este software, el equipo informático de los Paradise Papers creó la base de datos en la que los periodistas hicimos consultas sobre todo tipo de archivos. Nuix es usado por la CIA, las Naciones Unidas y gobiernos en 65 países.
Relaciones entre los datos:
Linkurious y Neo4j
a la visualización del universo de datos de los Paradise Papers, los periodistas trabajamos con Linkurius, un software con licencia que permite representar datos en gráficos y establecer relaciones dinámicas y complejas entre aquellos que tienen con muchas conexiones. Esta herramienta funciona de manera muy sencilla: tiene un sistema de búsqueda en el que se coloca el nombre de interés y el resultado es un gráfico de todas las conexiones identificadas en la base de datos.
Una vista del sistema de visualizaciones de datos de Linkurius.
El sistema de Linkurius requirió algunos pasos previos claves realizados por el equipo informático del ICIJ: la información de los Paradise Papers estaba en un formato de base de datos relacional en SQL, pero fue transformada al formato de gráficos Neo4j con el software Talend.
Fabiola Torres López ayuda a periodistas de Centroamérica, México y Colombia a adoptar las últimas herramientas del periodismo de investigación digital para que mejoren en la cobertura de la corrupción, la transparencia y cuestiones de gobierno. Lee más acerca de su trabajo como becaria ICFJ Knight aquí.
Imagen principal cortesía de ICIJ. Imágenes secundarias tomadas por Fabiola Torres López.