Искусственный интеллект помогает автоматизировать работу журналистов

Искусственный интеллект может не только генерировать тексты, но и создавать видео, автоматизировать процессы и программировать работу с базами данных.

Об этом во время четвертого вебинара, прошедшего в рамках организованного Международным центром для журналистов (ICFJ) Международного саммита по продвижению правды (ETT) 2024, рассказал журналист и продюсер Виталий Ругайн, глава по инновациям организации Free Press for Eastern Europe (FPEE) и тренер Пражской медиашколы. Саммит по продвижению правды проходит в рамках программы ICFJ Форум Памелы Ховард по освещению глобального кризиса.

Сильные стороны ChatGPT

Виталий Ругайн заметил, что первая нейросеть появилась еще в 50-х годах и уже тогда в весьма упрощенном виде делала то, чем сейчас известен ChatGPT. ChatGPT может строить предложения и объяснять сложные вещи простым языком, но он не обладает интеллектом.

"Это языковая модель, а не искусственный разум", — объяснил Виталий. Языковая модель не может обучаться сама или при взаимодействии с пользователем, не способна обновлять свои знания, не умеет взаимодействовать с внешними устройствами или собирать данные в реальном времени. При использовании ChatGPT в журналистике нужны редактура и фактчекинг.

Среди сильных сторон ChatGPT — возможность создания текстов, оптимальных с точки зрения поискового продвижения (SEO). Виталий советует использовать ChatGPT для программирования: пользователю уже не нужно изучать сам язык, достаточно понимать, что означают отдельные команды и каковы общие требования к коду.

"Самое главное, чем я пользуюсь — использую ChatGPT для программирования на JavaScript и Python. Даже с нулевым знанием можно написать простой скрипт для Google App Script, который будет работать с вашими данными в таблице", — говорит он.

В платной версии функционал шире: например, можно сгенерировать изображение или определить локацию, где сделано то или иное фото. А вот личность человека ChatGPT, скорее всего, откажется определять, потому что в программу заложено, что это неэтично.

Загружайте анонимные данные и общайтесь вежливо

Используя ChatGPT для получения информации, Виталий советует учитывать, что языковая модель может "фантазировать" — придумывать часть результатов, если у нее не хватает данных. Как с этим справиться? Во-первых, общаться по-английски, потому что на этом языке при обучении загружено больше текстов. Во-вторых, лучше делать это вежливо.

"При вежливом обращении [чат-бот] отвечает лучше, чем если грубить, потому что обучался на текстах, которые писали люди. А люди общаются друг с другом более развернуто, когда вежливы", — говорит Виталий.

ChatGPT — самая популярная, но не единственная в своем роде языковая модель, на ее основе работают некоторые другие сервисы: например, PopAi с возможностью бесплатно анализировать файлы или Claude.AI. Но, объяснил Виталий, важно помнить, что все эти сервисы не дают гарантии конфиденциальности.

"Все, чем вы делитесь через такие приложения, могут видеть их создатели — запросы, файлы... И сам OpenAI не дает гарантии сохранности загруженной информации. Как это решено у нас? Если мне надо проанализировать отчеты, я их анонимизирую", — говорит он.

Редактируйте изображения и генерируйте звук

Сервисы на основе искусственного интеллекта довольно многочисленны и могут использоваться не только для работы с текстом, но также для создания презентаций или иконок и оцифровки рукописного текста.

Для автоматизации рабочего процесса можно использовать Zapier. Для этого нужно описать задачу на английском языке. Например, в какой момент нужно отправить бухгалтерии письмо о выплате гонорара или по какому хэштегу отслеживать публикации. Можно дать Zaiper задание помещать результаты в Google-таблицу, заполняя различные поля (дата, заголовок, ссылка и так далее).

Существует ряд сервисов для работы со звуком. Превратить голосовые файлы в текст можно с помощью платного Text-To-Speech, а также бесплатных TurboScribe и Transkriptor. Последний имеет функцию расшифровки видео с YouTube. Сервис для генерации звука AIVA может писать музыку в разных стилях или генерировать треки по мотивам загруженных аудио.

Генерировать изображения можно при помощи трех самых известных сервисов: Midjourney, Stable Diffusion и Dall-E (встроен в платную версию ChatGPT). Если для вас важна конфиденциальность данных, Stable Diffusion можно запустить на собственном устройстве с использованием мощностей сервиса для работы с кодом, который называется Google Colab. Альтернатива — воспользоваться генерацией Stable Diffusion онлайн.

Искусственный интеллект также упрощает обработку изображений. Например, Removal.ai и Remove.bg удаляют фон с фотографии, а Cleanup.pictures — любой нежелательный объект, дефект или текст с изображений.

"С его помощью мы убирали памятники Ленину с белорусских площадей и показывали, как бы они выглядели с памятниками другим людям", — приводит пример Виталий.

Генерация видео

Искусственный интеллект также дает возможность создавать видео по текстовому описанию (промту), либо оживлять уже имеющуюся картинку. Но генерация видео пока находится не на самом высоком уровне, потому что требует много ресурсов.

"Одна секунда видео — это минимум 24 сгенерированные картинки. Видео требует гораздо больше вычислительной мощности для нейросетей, [чем изображения]", — говорит Виталий.

Он советует использовать такие сервисы, как Runway, который не только создает видео, но также позволяет их редактировать, и при этом работает в браузере. Еще несколько вариантов: Stable Video, PixVerse и Kaiber. А с помощью GoEnhance AI можно превратить видео в аниме. Большой резонанс недавно вызвал сервис Sora от OpenAI, но он пока недоступен для публичного использования.

"Думаю, он взорвет мир видеопродакшна — и, возможно, будут протесты операторов и монтажеров, подобные протестам сценаристов из-за использования ChatGPT", — сказал Виталий.

Как обнаружить сгенерированный контент

Работая со сгенерированными текстом, видео или фото, журналисты должны быть в состоянии отличать их от подлинного контента. Идентифицировать сгенерированные изображения можно, внимательно их изучая.

"Нужно обращать внимание на пальцы, черты лица, детали. Сгенерированные фотографии выглядят [слишком] идеально, или наоборот. Смотрите также на тени: чем они идеальнее, тем вероятнее, что это сгенерированная картинка. В видео нужно смотреть на мимику, на движение глаз и зрачков. Искусственный интеллект уже умеет двигать губы, а все остальное — не очень", — объяснил Виталий.

Также можно использовать сервисы для определения сгенерированного контента, но полностью полагаться на результаты их проверки нельзя.

"Сервисов много, но у них не всегда получается определить, написан ли текст искусственным интеллектом. Для этого нужен опытный взгляд редактора, то же касается картинок, и особенно видео", — сказал Виталий.

Photo by Igor Omilaev on Unsplash

Другие статьи

Фриланс-журналистка

Ганна Валынец

Ганна Валынец – независимая журналистка из Минска, Беларусь. Сейчас живет в Литве. Публиковалась в более чем 30 белорусских и зарубежных медиа. Сферы интереса – общество, политика, экология, права человека, журналистика, музыка.