¿Buscando datos difíciles? Estas herramientas te ayudarán

por Rowan Philp
Dec 28, 2021 en Periodismo de datos
Two people reviewing data.

Gran parte de la infraestructura necesaria para llevar a cabo buenas investigaciones —desde conjuntos globales de datos hasta herramientas de fuentes abiertas de última generación— ya ha sido creada, y se invitó a periodistas de todo el mundo a profundizar en ellas en la 12ª Conferencia Global de Periodismo de Investigación (#GIJC21).

En una sesión del evento, un panel de reporteros y editores empleó cinco minutos para dar ideas a los periodistas acerca de cómo reunir datos difíciles de encontrar.

Estas son algunas de sus sugerencias:

Reconocimiento facial

Considera la posibilidad de utilizar herramientas de reconocimiento facial, como Findclone, para rastrear e identificar, por ejemplo, a posibles extremistas en posiciones de poder, como neonazis dentro de las fuerzas del orden. Sébastien Bourdon, periodista independiente que investiga la extrema derecha, dijo que Findclone puede mostrar cinco coincidencias previas —con una puntuación de probabilidad entre cero y uno— de rostros en plataformas de redes sociales como la rusa VK (VKontakte) y, lo que es más importante, puede incluso encontrar imágenes en cuentas eliminadas. La organización de investigación Bellingcat ha señalado que sistemas como Findclone tienen "usos muy limitados, aunque potentes, para buscar la presencia de una persona en VK", pero advirtió a los periodistas que deben tener en cuenta los importantes problemas éticos asociados al software de reconocimiento facial, y recordar que estos sistemas se han utilizado de forma abusiva con fines ilegales.

[Lee más: ¿Trabajas con datos? Algunas claves para verificar tus fuentes y números]

Crowdsourcing

Prueba el crowdsourcing de datos y evidencias con recursos como CrowdNewsroom. Marc Engelhardt, director de CrowdNewsroom Suiza, dijo que la herramienta permite a los periodistas lanzar campañas de crowdsourcing, construir fácilmente una historia de datos, y luego analizar y verificar la información entrante. "Los ciudadanos pueden compartir sus datos o historias personales a través de la plataforma de forma segura", dijo.

 

CrowdNewsroom

 

Engelhardt dijo que la plataforma independiente Correctiv ya ha utilizado CrowdNewsroom para varias investigaciones, incluido el seguimiento del dinero que hay detrás de una campaña de cartelería para un partido político europeo de extrema derecha. El proyecto obtuvo entradas de datos de 3.500 personas.

Bases de datos

Utiliza la potencia de los datos y la flexibilidad de la herramienta Aleph del Organized Crime & Corruption Reporting Project (OCCRP). Su editor de datos, Jan Strozyk, recomendó Aleph como un archivo global interactivo para la investigación.

Al igual que en un iceberg, la mayor parte de las investigaciones basadas en datos —extracción, limpieza, análisis y conversión de la información— tiene lugar "por debajo de la línea de flotación", que el público no suele ver. Strozyk afirma que varias funciones del archivo pueden ayudar a los periodistas en este trabajo de datos menos glamoroso.

Aleph incluye ahora 309 conjuntos de datos públicos, 200 raspadores de datos y datos de más de 150 millones de entidades. Pero Strozyk dijo que la plataforma también permite compartir de forma segura investigaciones con colaboradores, cargar casi cualquier tipo de archivo, buscar en varias secuencias de comandos y convertir los datos en gráficos cliqueables que muestran conexiones.

Para cartografiar las solicitudes de explotación minera y el cumplimiento de la normativa en el sur de África —y para orientar a periodistas de otros lugares sobre el funcionamiento de la industria del carbón—, consulta la herramienta #MineAlerts, desarrollada por la organización sin ánimo de lucro Oxpeckers. Andiswa Matikinca, reportera y directora de datos de Oxpeckers, dijo que la plataforma combina una base de datos digital con una herramienta de geoperiodismo, y que también incluye documentos relacionados con las solicitudes de licencia y las minas en funcionamiento, así como información sobre el uso del agua alrededor de las minas.

 

Oxpeckers

 

Del mismo modo, la base de datos Offshore Leaks permite buscar investigaciones relacionadas con empresas que operan a nivel transfronterizo. Delphine Reuter, periodista de datos del Consorcio Internacional de Periodistas de Investigación (ICIJ), dijo que esta base gratuita y de código abierto ya contiene datos de 800.000 entidades y que esta cifra pronto aumentará con la incorporación de los datos de los Pandora Papers. Reuter también ofreció varios consejos para utilizar la herramienta:

    • Prueba con alternar las grafías en tu búsqueda, como "limited" y "ltd", o "corporation" y "corp.", y utiliza comillas entre los nombres.
    • Toma nota de la fuente y la fecha de los datos en la sección "Power Players", que incluye hallazgos de los Panama y los Paradise Papers. Y recuerda que los datos presentados son una instantánea del momento de la investigación. Reuter dijo que los periodistas también deberían comprobar los registros corporativos actualizados para obtener información más reciente.
    • Aunque la base de datos permite realizar búsquedas por nombre, dirección o país, Reuter señaló que a menudo es importante buscar fideicomisos y sociedades offshore en la categoría "jurisdicción" para obtener resultados precisos.

    [Lee más: Cómo encontrar y usar datos para cubrir conflictos]

    Recursos específicos por país

    Ten en cuenta que existen nuevas bases de países específicos, como Ucrania y Kazajistán. Dmitry Chaplinsky, especialista en tecnologías de la información del portal ucraniano Bihus.info, afirma que los periodistas que busquen registros públicos, documentos de divulgación de activos, datos de contratación pública y otros registros públicos de Ucrania y Kazajistán deben consultar dos nuevas bases de datos de fuentes abiertas que se actualizan periódicamente. Ring es un motor de búsqueda de documentos de más de 20 bases de datos de Ucrania con 29 millones de registros públicos. Dentro de la base se pueden hacer búsquedas en ucraniano, inglés y ruso. Open Base es un repositorio de datos similar para Kazajistán, con una docena de fuentes.

     

    “Mi herramienta favorita es R y R Studio.” — Mohammad Haddad, editor en Al Jazeera

    Una caja de herramientas de uso diario

    Aparte de las nuevas herramientas, puede ser igualmente valioso conocer otras más tradicionales en las que confían numerosos medios de comunicación. Mohammed Haddad, editor de datos de Al Jazeera Media Network, reveló los cinco principales recursos que utiliza a diario.

      • Mapbox — y su funcionalidad Scrollytelling. "Si quieres contar tu historia a través de la geografía, esta es la herramienta", dijo Haddad. "Es nuestro recurso cartográfico favorita, por lejos. Puedes llevar a tus lectores a un viaje alrededor del mundo: hemos llevado a nuestro público por el río Nilo y a través de la disputada región fronteriza entre India y China".
      • Nivo. "Es una gran herramienta de visualización de datos que requiere un código mínimo para configurar visualizaciones muy elaboradas", explicó. "Al Jazeera utilizó Nivo para analizar cómo votaron los países en la ONU desde 1946".
      • AMP Stories. “Se trata de una plataforma de narración para móviles que es fácil de usar. Es ideal para coberturas con personajes y funciona muy bien en los teléfonos móviles, de donde probablemente procederá la mayor parte de tu tráfico", señaló. "Utilizamos AMP Stories para nuestras 100 caras de los Rohingya y nuestra serie sobre negros asesinados en Estados Unidos, así como en otras coberturas de Palestina y Myanmar".
      • Chartbeat. "Para entender cómo está resonando tu historia con tu audiencia, utiliza los análisis en tiempo real de Chartbeat", aconsejó Haddad. "Para mí, la función más útil es el indicador de rendimiento en redes sociales, que te ayuda a ver cómo se ha compartido tu historia en esas plataformas".
      • R coding y R Studio. “Mi herramienta favorita es R y R Studio", dijo Haddad. "Las herramientas van y vienen, así que la mejor es la que se puede construir en un lenguaje de programación. Todo nuestro equipo utiliza R, desde la recolección de datos hasta la edición. ¿Qué se puede hacer con R? Prácticamente todo".

       

      Data visualization tool

       

      Una característica común y llamativa de las herramientas presentadas por el panel fue que hacen manejables volúmenes de información en apariencia abrumadores, y muestran que los datos contenidos en diversos idiomas, contextos, tipos de archivo e imágenes son potencialmente buscables para cualquier periodista con acceso a Internet.


      Este artículo fue publicado originalmente en el sitio de la Red Global de Periodismo de Investigación y es reproducido en IJNet con permiso.

      Foto de UX Indonesia en Unsplash.