¿Y si los robots pudieran realizar investigaciones transfronterizas?

porFriedrich Lindenberg
Jun 19, 2015 en Periodismo de datos

El periodismo de investigación transfronterizo ha recibido mucha atención en los últimos años. Mientras trabajaba con la Red Africana de Centros de Investigación Periodística (ANCIR, por su sigla en inglés), tuve la oportunidad de observar ese proceso cuando dos periodistas del Proyecto de Periodismo de Investigación de Italia (IRPI, por su sigla en inglés) vinieron a Sudáfrica para rastrear los intereses económicos de la mafia italiana en el país.

Cecilia Anesi, de IRPI, y Khadija Sharife, de ANCIR, pasaban horas intercambiando nombres:

“Conoces a X?”

“Sí, un hombre del negocio inmobiliario de Cape Town.”

“En Italia es de la Cosa Nostra. Tenemos mucha documentación sobre él de tribunales durante los años 90”.

Gradualmente, ambos periodistas comenzaron a unir sus informaciones y comprendieron la red de mafiosos, políticos, y empresarios que estaban revisando.

Si bien este proceso requiere un gran esfuerzo, aborda el reto de cómo una investigación transnacional puede incorporar los datos locales más relevantes en cada país que aterriza. Las organizaciones que dominan este proceso, tales como el Centro Internacional para el Periodismo de Investigación (ICIJ, por su sigla en inglés) y el Proyecto de Investigación del Crimen Organizado y la Corrupción (OCCRP, por su sigla en inglés), han publicado algunas de las revelaciones periodísticas más importantes de nuestra industria.

Para apoyar este tipo de investigaciones en profundidad, he trabajado en una serie de proyectos de bases de datos para periodistas de investigación, abriendo información pública en países que van desde Alemania y Sudáfrica hasta Mozambique. La tendencia cada vez mayor hacia los gobiernos abiertos hace que la disponibilidad de datos en masa se haya disparado en muchos países y sectores específicos.

Desafortunadamente, el uso de estas bases de datos también requiere de una gran cantidad de contexto: si estás buscando información sobre políticos chilenos, puedes visitar Poderopedia. En Sudáfrica puedes acceder a Siyazana. Para información sobre empresas, ingresa a OpenCorporates, pero también a todas las bases de datos que figuran en Investigative Dashboard. Puedes encontrar contratos públicos en Europa en TED, a excepción de Eslovenia y Eslovaquia, que tienen mejores bases de datos en sus países. ¿Estás tomando nota? Esto se vuelve confuso muy rápidamente y el panorama cambia de mes a mes.

¿La web y los datos abiertos no deberían simplificar las cosas, en lugar de hacerlas más complicadas? Recoger datos de tantos lugares diferentes, ¿no debería ser un trabajo para máquinas en lugar de para seres humanos?

Si queremos que los datos abiertos sean relevantes para el periodismo de investigación, tenemos que simplificar el proceso para acceder a ellos. Debemos encontrar el modo en el que nuestras herramientas de datos puedan comunicarse entre sí, para poder plantearse exactamente las mismas preguntas que los periodistas se hacen en las investigaciones transfronterizas: “¿Conoces a X? ¿Qué puedes contarme sobre él?”

Crear esa función tan común, una API de datos a la que hemos empezado a llamar “Who’s got dirt?” (“¿Quién está sucio?”), es uno de los objetivos del Influence Mapping project, financiado por la Fundación Open Society. Este grupo reúne a tecnólogos, investigadores y periodistas para desarrollar una forma sencilla de "enriquecer" la información básica acerca de personas y empresas proveniente de múltiples fuentes.

Los miembros fundadores del grupo, la American Assembly de la Universidad de Columbia, OpenCorporates, LittleSis.org, Poderopedia, OpenNorth.ca y el Grano Project (en el que trabajé como parte de mi beca), centran su trabajo en la posibilidad de compartir los datos abiertamente. Para los proyectos de investigación podría utilizarse una variación de este mecanismo en el caso de fuentes de datos confidenciales tales como documentos y bases de datos filtrados. Aquí, el resultado no sería un conjunto de registros coincidentes, sino una respuesta sencilla que indicara si la información se encuentra disponible (y a quién contactar para acceder a ella).

¿Qué significaría esto en la práctica? Durante la Al Jazeera Canvas Hackathon de diciembre pasado trabajé con un grupo de desarrolladores, diseñadores y periodistas para crear un prototipo llamado Newsclip.se, una herramienta de desarrollo de historias para periodistas que escanea los artículos de prensa a medida que los escribes, detecta menciones a empresas y personas, y luego encuentra información relevante en bases de datos abiertos que puedes explorar para profundizar tu investigación.

Si bien Newsclip.se por ahora es solo un demo, “Who’s got dirt?” hará que muchas herramientas te ayuden en tu investigación: desde instrumentos para analizar redes como detective.io, a simples listas de observación de organizaciones que te permitirán buscar continuamente información sobre dueños de empresas, casos judiciales, concesiones de tierra y minería o relaciones familiares.

Si logramos crear un impulso en torno a esta idea de colaboración, tal vez el periodismo transfronterizo pronto tendrá un pequeño hermano robot: la investigación entre bases de datos.

Imagen principal con licencia Creative Commons en Flickr, vía Discos Konfort.