Periódico japonés utiliza IA para aumentar la velocidad y precisión de sus resúmenes diarios

por Tim Hornyak
Oct 30, 2018 en Temas especializados

En otro paso adelante del periodismo robotizado, un periódico regional de Japón está lanzando un sistema de inteligencia artificial que genera automáticamente resúmenes de noticias para su distribuir en distintas plataformas.

El Shinano Mainichi Shimbun se asoció con Fujitsu, la compañía de servicios de IA más grande de Japón, para crear el software. El staff del periódico ha estado produciendo resúmenes de forma manual, una tarea que toma hasta cinco minutos por artículo. El software crea resúmenes al instante y con mayor precisión que otros métodos de síntesis que comienzan con la cabeza del artículo y se detienen cuando se alcanza el límite de palabras.

El sistema de Fujitsu, en cambio, usa una combinación de procesamiento de lenguaje natural y aprendizaje automático para seleccionar las partes más destacadas del texto, colocando a cada oración en términos de importancia.

Para probar la tecnología se la entrenó en un conjunto de 2.500 artículos y de sus resúmenes manuales.

"Al combinar los artículos originales con sus resúmenes y definirlos como referencia o datos instructivos, construimos un 'importante modelo de extracción de oraciones' que evalúa la importancia del contenido de acuerdo con oraciones individuales, así como un 'modelo de reducción de oraciones' que mantiene la estructura gramatical al tiempo que se eliminan las palabras innecesarias", dice Masato Yokota, director del Grupo Empresarial de Infraestructura y Finanzas de Fujitsu.

El software puede funcionar con artículos escritos en japonés o inglés. Fue construido con una API web que puede insertarse fácilmente en el flujo de trabajo editorial existente. Un botón de "resumen" que activa la API se implementó en la pantalla de edición para las noticias de televisión por cable del periódico, contó Yokota.

Captura de pantalla del sistema AI durante su período de prueba muestra el artículo original en japonés (izquierda), una clasificación de oraciones generada automáticamente por importancia (centro) y el texto resumido (derecha).


Robots vs. periodistas

Fundado en 1873, el Shinano Mainichi Shimbun es uno de los diarios más antiguos de Japón. Con sede en Nagano, al noroeste de Tokio, afirma tener una edición matutina de 487.000 ejemplares y distribución al 61% de los hogares de la prefectura de Nagano.

“La IA de la tercera ola se convertirá en una tendencia de gran relevancia, y ahora es el momento de hacer esfuerzos concertados para mejorar también el flujo de trabajo de la producción de periódicos", dice Hiroshi Misawa, su director general.

Por lo que se sabe, el Shinmai planea lanzar el sistema en abril para su servicio de resúmenes de noticias de TV por cable, con el objetivo de acelerar las actualizaciones de noticias.

El resumen de IA se suma a una serie de otras aplicaciones de noticias automatizadas a veces descritas como “periodismo automatizado o aumentado”. Heliograf, el bot de noticias del Washington Post, produjo alrededor de 300 informes breves sobre los Juegos Olímpicos de Río de 2016, y desde entonces ha cubierto las elecciones estadounidenses y los juegos de fútbol de preparatoria, produciendo alrededor de 850 artículos en su primer año, según Digiday. The Associated Press trabajó con la firma de IA Automated Insights para implementar un software para cubrir noticias sobre ganancias corporativas.

"A través de la automatización, AP está brindando a sus clientes 12 veces más información sobre ganancias corporativas que antes (hasta más de 3.700), incluso para muchas empresas muy pequeñas que nunca habían recibido mucha atención", dijo la editora comercial global de AP, Lisa Gibbs, en su informe de 2017.

"Con el tiempo liberado, los periodistas de AP pueden involucrarse con más contenido generado por los usuarios, desarrollar informes multimedia, realizar trabajos de investigación y centrarse en historias más complejas".

Este artículo fue publicado originalmente en The Splice Newsroom y es reproducido en IJNet con permiso.

Imagen con licencia Creative Commons en Pixabay, vía geralt.