Herramientas para realizar una investigación periodística online

porSantiago Sánchez
Jan 6, 2021 en Periodismo de investigación
lupa

Realizar una investigación periodística en profundidad siempre supone un desafío, y si a eso le sumamos las restricciones de movilidad que ha habido durante la pandemia, (y que muchos gobiernos de Latinoamérica han dejado de lado la difusión y el acceso a la información pública), la cosa se pone aún más compleja.

Pero en tiempos de COVID-19 el periodismo de investigación es más importante que nunca; mientras muchos jerarcas la han utilizado la pandemia como excusa para no informar debidamente sobre sus gestiones, la desigualdad económica y social se acentúa y hay vidas que corren riesgo.

En ese contexto es fundamental lo que podamos hacer frente a nuestro ordenador, y por eso IJNet Español organizó un seminario online a principios de diciembre con la destacada periodista costarricense Hassel Fallas, quien compartió un kit de herramientas para realizar investigación periodística online. 

Fallas mostró herramientas para realizar una serie de procedimientos claves en una investigación periodística en seis etapas: detectar la información, extraerla, limpiarla, ordenarla, verificarla y visualizarla.

1. Detectar

Una de las herramientas más comunes para buscar información es Google Advance Search Website. A través de este sitio podemos, por ejemplo, buscar frases exactas utilizando las comillas o indagar dentro de un sitio web específicamente.

Para sacarle provecho a la herramienta, Fallas recomendó, por ejemplo, usar las terminaciones en sitios oficiales (por ejemplo, gob.cr en el caso de Costa Rica) para buscar dentro de páginas web estatales. Este recurso se puede usar con sitios oficiales de cualquier gobierno. Además, Google cuenta con un buscador específico de imágenes llamado Google Advanced Image Search.

Google también tiene un archivo de periódicos antiguos de todo el mundo, lo que puede ser útil para realizar una investigación histórica o para entender el origen de un proceso. Incluso, el sitio permite rescatar urls que nos lleven directamente a la noticia encontrada.

Pero según dijo Fallas, una clave en tu investigación online puede ser utilizar otro tipo de buscadores. Así, por ejemplo, recomendó Duckduckgo, que a diferencia de Google no rastrea la información del usuario, y permite hacer búsquedas por país o de documentos específicos como pdf.

Search Carrot, por ejemplo, es otro buscador que nos da guías y mapas de qué tipo de documentos se pueden encontrar. “Es una manera más entretenida de hacer una búsqueda de información y de organizar las búsquedas”, dijo Fallas.

Para buscar información sobre antecedentes penales y judiciales en Estados Unidos, Fallas recomendó un sitio llamado Pacer, que tiene información de “todos los registros electrónicos de tribunales de Estados Unidos. Si bien dijo que se trata de un sitio pago, sostuvo que es “bastante ventajoso” a la hora de consultar información sobre acusaciones o juicios y “vale la pena considerarlo”.  

Otro sitio sobre información judicial en Estados Unidos es Court House News. Según Fallas, este sitio es particularmente interesante para investigar procesos judiciales transfronterizos, y puede ser muy bien explotado al combinarse con la búsqueda de documentos pdf y con Google Advanced Search.

En ese país también hay buscadores que permiten hacer indagaciones sobre el mercado financiero. Por ejemplo Edgar, que permite hacer una recopilación automatizada de toda la información enviada por empresas y otras entidades financieras a los organismos supervisores de Estados Unidos. Esto es obligatorio para todas las empresas que cotizan en bolsa.

Fallas también dio herramientas para realizar búsquedas temporales. Cachedviews.com, por ejemplo, es un sitio que sirve para ver versiones antiguas de una página web; nos da un registro pormenorizado desde el primer momento en que el sitio web que busquemos estuvo online hasta ahora. “Esto es importante porque muchas veces necesitamos recuperar alguna información, foto, detalle o algo que estaba en ese momento pero en la versión actual no está disponible”, ejemplificó. El sitio web.achives.org también ofrece una funcionalidad similar.

Por último, Fallas también compartió una herramienta para averiguar a quién pertenece un sitio web. Al buscar un sitio en Who Is, esta herramienta nos informará sobre algunos datos de este, como la forma en que se ve, e incluso algunas veces aparece la dirección de la persona y su contacto, si es que su creador no pagó para que sus datos sean privados.

[Lee más: Design Thinking para periodistas: herramientas para incentivar la innovación]

 

2. Extraer

Tabula nos ayuda a extraer una tabla de datos desde un pdf a un Excel o a un Word. También puede trabajar con lenguaje python y R, aunque no es imprescindible dominarlos para usar esta herramienta.

Smallpdf es un sitio que “le hace la vida más fácil a uno cuando tiene que trabajar con documentos pdf”. Nos permite convertir archivos pdf a Excel, editar archivos pdf y una multitud de cosas más.

Por su parte, Scraper Easy Web es un agregado que se añade a Google Chrome (solo funciona con ese navegador) y te permitirá descargar tablas de datos en archivos cvs, Excel u otros. ¿Cómo? Seleccionando una tabla en un sitio, haciendo clic en el botón derecho del mouse y pulsando “get similar data miner”, lo que nos llevará a una interfaz para trabajar con esos datos.

Para extraer información y raspar datos en redes sociales una herramienta que puede ser muy útil es Octoparse. Si bien es paga, permite una versión gratuita de hasta 10.000 registros de información. Para utilizarla simplemente hay que colocar la dirección de la cuenta de la red social. La aplicación dará una serie de instrucciones que te guiarán en el proceso. Luego, en una hoja de cálculo aparecerá toda la información extraída y una serie de instrucciones para que paso a paso podamos descargar la información.

A su vez, Importhtml es una función para raspar o importar datos que se encuentran en tablas dentro de una web con código html, que  se puede usar con Google sheets. Para usarla, en la hoja de cálculo hay que escribir en una celda la siguiente fórmula =IMPORTHTML(“la dirección url”; “table”; “el número de la tabla que quieras extraer”).

 Fallas también recomendó tener en cuenta a Open Corporates, un repositorio de datos gigante sobre entidades corporativas que tiene datos abiertos. “Es una muy buena herramienta para buscar indicios de una investigación”.

Por su parte, Aleph, una herramienta de Organized Crime an Corruption Reporting Project, evidencia los vínculos del crimen internacional y es una plataforma que ayuda a los periodistas a seguir las pistas del dinero. “Hay que inscribirse y tiene mecanismos de seguridad pero vale la pena”, dijo Fallas.

“Muchas veces estos temas nos quitan muchísimo tiempo, pero conociendo estas herramientas nos podemos ahorrar un tiempo valioso para poder concentrarnos en lo que importa”, explicó.  

[Lee más: Infografía periodística, el elemento visual más efectivo para informar sobre la pandemia]

 

3. Limpiar

Trifacta es una herramienta que a través de una interfaz gráfica realiza limpieza y análisis de datos. Por ejemplo, cuando existen nombres que deberían ser una misma categoría pero están escritos de forma diferente en una tabla (como por ejemplo “Mexico” y “México”), Trifacta nos da la oportunidad de hacer un reemplazo de datos.

Open Refine es también otra herramienta sencilla de utilizar. Sirve para hacer limpieza de datos con la ayuda de algoritmos. “Es una forma de hacer fácil un trabajo complicado”, dijo Fallas.

4. Ordenar

Para ordenar la información, Fallas recomendó usar una herramienta de Google llamada Journalism Studio, que se puede solicitar, y tiene muchas opciones para organizar y crear esquemas para una investigación y para visualizar información.

Otra opción podría ser Jamboard, que se encuentra en Google Drive, que permite crear esquemas visuales e incluso hacer una paginación sobre cómo querríamos que se viera nuestra investigación en la web.

5. Verificar

Para la verificación de videos, Fallas recomendó tener en cuenta el sitio Citizen Evidence de Amnistía Internacional de Estados Unidos. “Ponemos el video que queremos ver y lanza datos y metadatos sobre ese video que nos va a ayudar y guiar en la verificación de ese video”, explicó.

Otra herramienta importante es TynEye, que permite hacer una búsqueda inversa de imágenes.

6. Visualizar

Onodo es una opción que permite crear mapas de relaciones y que es muy fácil de usar.

Kumu.io también es sencilla de utilizar y es gratuita. Es útil para visualizar relaciones entre personas y flujos de dinero, contrataciones ilícitas, licitaciones, etc.

7. Una extra: transcribir

Transcribe.wreally.com es una herramienta que permite transcribir lo que se dice en videos de Youtube. Según dijo Fallas, lamentablemente en español no da resultados demasiado eficientes.

¿Quieres aprender más herramientas o saber mejor cómo utilizar las que te presentamos? Mira el seminario online entero que impartió Fallas:


Imagen con licencia Creative Commons en Unsplash, vía Agence Olloweb.