Японская газета использует искусственный интеллект для создания кратких анонсов новостных статей

Автор Tim Hornyak
Oct 30, 2018 в Специальные темы

Региональная газета из Японии делает еще один шаг по направлению к робожурналистике, используя систему искусственного интеллекта, которая автоматически генерирует краткие анонсы новостных статей для распространения на различных платформах.

Газета Shinano Mainichi Shimbun при помощи крупнейшей в Японии IT-компании Fujitsu работает над созданием программного обеспечения, в основу которого легли технологии, разработанные лабораторией Fujitsu.

Сотрудники редакции пишут краткие резюме материалов, и это занимает до пяти минут на статью. По утверждению Fujitsu, программа создает такие анонсы практически мгновенно – и с гораздо меньшим количеством ошибок. Этот способ работает значительно лучше, чем другой метод, когда резюме статьи включает первый абзац и столько текста, сколько позволяет ограничение по объему.

Система использует комбинацию методов обработки естественного языка и машинного обучения, позволяющую выделить наиболее важные части статьи и определить, насколько важно каждое предложение.  

Во время испытаний программа использовала 2 500 газетных статей и их резюме, написанных сотрудниками редакции.

"Сопоставляя оригинальные статьи с их резюме, мы создали "модель извлечения важных предложений", оценивающую важность каждого предложения, и "модель сокращения предложений", сохраняющую структуру предложения, удаляя лишние слова", – объясняет Масато Йокота, директор State Infrastructure and Finance Business Group компании Fujitsu.

Программа может работать со статьями на японском или английском языке. Она была создана с помощью сетевого API, который можно легко ввести в уже существующий рабочий процесс редакции. По словам Йокоты, запускающая API кнопка "резюме" используется на редакторском экране кабельных теленовостей газеты.

 

На скриншоте системы искусственного интеллекта, сделанной во время испытания программы, оригинальная статья на японском языке (слева), предложения, расставленные программой в порядке важности, (в центре) и резюме (справа).

Роботы или журналисты

Выходящая с 1873 года газета Shinano Mainichi Shimbun – одно из самых старых ежедневных изданий в стране. Ее редакция расположена в Нагано – городе, расположенном к северо-западу от Токио. По утверждению редакции, утренний тираж газеты расходится в количестве 487 000 копий – ее покупает 61 процент живущих в префектуре Нагано семей.  

"Искусственный интеллект третьего поколения должен стать важным трендом. Кроме того, пришло время предпринять согласованные усилия по совершенствованию процесса производства газет", – говорит управляющий директор издания Хироши Мисава.

Shinmai, как люди называют газету, планирует в апреле начать использовать систему автоматического генерирования резюме на своем сервисе кабельных теленовостей, чтобы ускорить процесс обновления новостного контента.

Создающий резюме AI дополнил другие автоматизированные приложения для новостной индустрии, которые иногда называют автоматизированной или дополненной журналистикой. Например, Heliograf – новостной бот Washington Post, выпустил около 300 коротких заметок и новостей об Олимпийских играх в Рио-де-Жанейро в 2016 году; с тех пор он помогал освещать выборы в США и футбольные игры – по сообщению Digiday, за первый год он опубликовал около 850 статей. Что касается Associated Press, то эта организация также сотрудничала со специализирующейся в области искусственного интеллекта фирмой Automated Insights: вместе эти компании разработали программу, которая используется в работе над материалами о доходах.

"Благодаря автоматизации, AP стала предлагать покупателям в 12 раз больше материалов о доходах компаний, чем раньше (более 3 700), включая материалы о множестве маленьких компаний, на которые прежде обращалось мало внимания", – сказала, по сообщению отчета 2017 года, редактор AP по международному бизнесу Лиза Гиббс.

"Освободившееся время журналисты AP могут использовать на работу с пользовательским контентом, создание мультимедийных материалов, проведение журналистских расследований. Это также даст им возможность сфокусироваться на работе над более сложными материалами".

Эта статья сначала появилась в The Splice Newsroom. Публикуется на сайте IJNet с разрешения.

Источник основной фотографии geralt, лицензия СС сайта Pixabay.