Machine Learning: desenmarañando una selva de datos

نوشته Moisés Alvarado
Oct 21, 2022 در Temas especializados
xxfvsdf

¿Alguna vez has visto o utilizado uno de esos software que crean imágenes artísticas con solo escribir unas pocas palabras? Es impresionante cómo, aparentemente de la nada, ante tus ojos puede aparecer una desconocida obra de arte.

Ese y muchos otros logros son posibles gracias a la inteligencia artificial, la disciplina en la que un programa de computación es diseñado para replicar esa facultad humana que nos permite aprender, entender, razonar, tomar decisiones y formarnos una idea de la realidad. Vuela la cabeza darte cuenta de los alcances de esta tecnología. Y, en particular, del machine learning, que tiene entre sus aplicaciones el procesamiento y análisis de enormes cantidades de datos, que serían imposibles de manejar a través de otro método.

Ese es, precisamente, uno de los componentes de la inteligencia artificial con más aplicaciones para el periodismo de investigación. El machine learning ha hecho posibles trabajos en los que se revela, por ejemplo, que la cantidad de pozos petroleros abandonados en Texas que el Estado tendría que limpiar es mucho mayor que lo reflejado en las cuentas de las autoridades; o que la pandemia de COVID-19 impactó en la economía de los ciudadanos de Georgia de una forma más dramática que lo que indican las estadísticas oficiales.

En Latinoamérica, el machine learning ha servido para profundizar de manera sistémica en una problemática tan amplia y enmarañada como la selva que la acoge: el especial “Corredor furtivo”, publicado por el medio venezolano Armando.info y El País de España, descubrió la existencia de 3.718 puntos de actividad minera, la mayor parte de ellos ilegales, en los estados de Bolívar y Amazonas. También, la presencia cerca de estos de hasta 42 pistas clandestinas, de las que parten cargamentos contrabandeados de oro y otros minerales desde el suelo venezolano hacia el extranjero. 

Para lograr estos hallazgos, se echó mano del machine learning, con el que se creó un algoritmo capaz de identificar, a partir de imágenes satelitales, dónde están ubicados esos puntos. Se trató de un proceso multidisciplinario, en el que participaron expertos en inteligencia artificial y otras fuentes.

Lo primero fue definir cómo se mira desde el cielo un espacio de explotación minera, las características y patrones visuales presentados por aquellos lugares en los que se sabía con plena certeza que se realizaba esta actividad. A partir de un nutrido conjunto de datos, se alimentó el modelo, que hizo un barrido a las imágenes obtenidas desde el satélite Sentinel 2, lanzado en 2015 por la Agencia Espacial Europea, y mostrar los posibles puntos objetivo de la investigación.

Tras ello, el equipo periodístico (integrado por los venezolanos María de los Ángeles Ramírez, Joseph Poliszuk, María Antonieta Segovia y Minerva Vitti) analizó lo obtenido por el algoritmo y lo cruzó con otros datos, de diversas fuentes, para disminuir el riesgo del aparecimiento de falsos positivos.

Una base excelente. Pero solo una base

Joseph Poliszuk, uno de los periodistas de la escuadra, afirma que el uso de la tecnología representó un paso adelante en una aspiración acariciada por años. Desde 2006, cuando cubrió una masacre contra mineros cometida por miembros del Ejército venezolano, quiso poder contar la escala del fenómeno de la minería ilegal en su país, más allá de sucesos concretos o anécdotas. “Corredor furtivo” permitió comprobar que se trata de un problema regional, en el que no solo está implicado el Estado y el crimen organizado venezolanos, sino miembros de la guerrilla colombiana y garimpeiros de Brasil. También, que el río Caroní es uno de los epicentros de la actividad. Según Poliszuk, lo aportado por la tecnología fue, sin embargo, solo un comienzo, una espléndida base sobre la cual apoyarse para, luego, ir a llenarse las botas de barro.

“La tecnología nos dio un mapa para no salir a reportear con una venda en los ojos o confiar solamente en la palabra de una fuente. Pero las historias están en el terreno. La tecnología puede ser un faro, pero no es todo el trabajo”, comenta Poliszuk. Tener un grado más alto de certeza de éxito les permitió hacer un mejor uso de los recursos de tiempo y dinero, un elemento crucial en un territorio como el sur de Venezuela, donde incluso encontrar gasolina para un viaje es un reto.

El reporteo en campo no solo posibilitó consultar en persona a las fuentes sumergidas en la problemática, como los grupos indígenas de la región, sino que le dio al equipo nuevas luces para buscar más datos en las imágenes satelitales.

Esto se ilustra muy bien en un caso en el que el grupo de los piaroa encontró una nave en las adyacencias de San Pedro del Orinoco, en el estado de Amazonas. Tenía imágenes que probaban su existencia. Sin embargo, Poliszuk y sus compañeros no habían ubicado una pista en este sector. Al revisar de nuevo lo obtenido por el satélite, pudieron concluir que se trataba de una rústica pista de reciente creación. Por tanto, el reporteo en el campo se alimentó de lo entregado por la tecnología; y la tecnología pudo ubicar nueva evidencia gracias a datos aportados por el reporteo en el terreno.

¿Dónde obtener fondos para realizar tu idea de reporteo con machine learning?

Si tienes una idea que creas que el machine learning te puede ayudar a realizar, puedes aplicar a un financiamiento por parte del Pulitzer Center, que tiene abierto un grant específico para ello. No hay un monto fijo, pero, según sus bases, anteriores ganadores han recibido entre US$10.000 y US$25.000.

Se debe incluir una sinopsis del proyecto, un resumen de la metodología a utilizar y un presupuesto estimado para su ejecución, en el que, además de lo que costará la creación del algoritmo, incluyas recursos para el reporteo en campo.

Por otro lado, en el mercado hay muchos expertos en inteligencia artificial que ya cuentan con experiencia colaborando con el periodismo de investigación. Ese es el caso de los científicos de datos Edward Boyda y Caleb Kruse (de Earthrise Media, organización creadora de productos digitales para el desarrollo), quienes colaboraron para la realización de “Corredor furtivo”.


Imagen de DeepMind en Unsplash.