Jornal japonês usa AI para aumentar velocidade e precisão de resumos

por Tim Hornyak
Oct 30, 2018 em Temas especializados

Em outro passo em direção ao jornalismo robotizado, um jornal regional no Japão está lançando um sistema de inteligência artificial que gera automaticamente resumos de artigos de notícias para distribuição em uma variedade de plataformas de mídia.

O Shinano Mainichi Shimbun juntou-se à Fujitsu, a maior empresa de serviços de tecnologia de informação no Japão, para criar o software. A equipe do jornal produzia resumos manualmente, uma tarefa que levava até cinco minutos por artigo. O software cria resumos instantaneamente e com maior precisão do que um método diferente de síntese que começa com o lide e para quando o limite de palavras é atingido, de acordo com a Fujitsu.

O sistema usa uma combinação de processamento de linguagem natural e aprendizado de máquinas para escolher as partes de maior destaque no artigo, classificando cada frase em termos de importância.

Um teste foi feito com um conjunto de dados de 2.500 artigos do jornal, bem como seus resumos compilados manualmente.

"Ao combinar os artigos originais com os resumos e definir isso como referência, ou dados instrutivos, construímos um 'modelo de extração de frases importante' que avalia a importância do conteúdo de acordo com frases individuais, bem como um 'modelo de encurtamento de frases' que mantém a estrutura da frase ao excluir palavras desnecessárias", diz Masato Yokota, diretor do Grupo Empresarial de Infraestrutura e Finanças Fujitsu.

O software pode trabalhar com artigos escritos em japonês ou inglês. Ele foi construído com uma API Web que pode ser facilmente inserida no fluxo de trabalho editorial existente. Um botão de "resumo" que ativou a API foi implementado na tela de edição das notícias da TV a cabo do jornal, explica Yokota.

Uma captura de tela do sistema de inteligência artificial durante teste mostra o artigo original em japonês (esquerda), um ranking de frases gerado automaticamente por importância (centro) e o texto resumido (à direita).

Robôs vs. jornalistas

Fundado em 1873, o Shinano Mainichi Shimbun é um dos mais antigos jornais do Japão. Com sede em Nagano, noroeste de Tóquio, afirma ter uma edição matutina de 487.000 exemplares e distribuição para 61 por cento das famílias da região de Nagano.

"A terceira onda de inteligência artificial está configurada para se tornar uma tendência de grande relevância, e agora é o momento de fazer esforços conjuntos para melhorar o fluxo de trabalho de produção do jornal também", diz Hiroshi Misawa, diretor-gerente do jornal.

O Shinmai, como é conhecido, planeja lançar o sistema em abril pelo seu serviço de resumo de notícias de televisão a cabo, com o objetivo de tornar mais rápidas as atualizações de notícias.

A síntese de inteligência artificial se junta a uma série de outros aplicativos automatizados de notícias às vezes descritos como jornalismo automatizado ou aumentado. Heliograf, o bot de notícias do Washington Post, produziu cerca de 300 resumos nas Olimpíadas de 2016 no Rio e desde então cobriu as eleições dos EUA e os jogos de futebol americano, resultando em 850 artigos em seu primeiro ano, de acordo com a Digiday. A Associated Press trabalhou com a empresa Automated Insights para implantar software para cobrir notícias sobre ganhos corporativos.

"Através da automatização, a AP está fornecendo aos clientes 12 vezes mais reportagens de ganhos corporativos do que antes (mais de 3.700), incluindo para várias empresas muito pequenas que nunca receberam muita atenção", disse Lisa Gibbs, editora global de negócios da AP, em um informe de 2017.

"Com o tempo liberado, os jornalistas da AP podem engajar mais com o conteúdo gerado pelos usuários, desenvolver reportagem multimídia, fazer trabalho investigativo e se concentrar em histórias mais complexas."

Este artigo foi publicado originalmente no The Splice Newsroom. É reproduzido na IJNet com permissão.

Imagem sob licença CC no Pixabay via geralt