Сервис Dataminr for News помогает журналистам обнаружить "горячие" новости в море твитов

Автор Maite Fernandez
Oct 30, 2018 в Miscellaneous

Twitter, самая популярная социальная сеть для поиска информации о "горячих" новостях, продолжает расти, и поиск нужного сигнала в этом информационном шуме становится всё более сложным делом.

В потоке обновлений твитов последние фото домашних любимцев следуют за инстаграмными закатами, фотографиями протестов на Украине и снимком Джастина Бибера, сделанным в полицейском участке. Для журналистов умение найти нужную информацию о "горячих" новостях среди 500 миллионов ежедневных твитов становится большим преимуществом.

Dataminr for News, новый инструмент, разработанный в результате совместной работы Twitter, CNN и Dataminr - компании, специализирующейся на анализе информации в социальных сетях. Технология, которую использует Dataminr, решает проблему работы с переизбытком информации в Twitter "с помощью алгоритма обнаружения, оценки, классификации и оповещения клиентов о наиболее важной информации в режиме реального времени", - говорится в пресс-релизе компании.

Базирующаяся в Нью-Йорке аналитическая компания делает такого рода работу для предприятий финансового сектора и государственных учреждений с 2009 года. Теперь Dataminr сотрудничает с Twitter и CNN, которые в течение нескольких месяцев принимали участие в тестировании данного инструмента, чтобы приспособить его к нуждам редакций и журналистов.

Но каким образом Dataminr ищет нужное в информационном шуме? В своем выступлении на мероприятии Twitter, DevNest, генеральный директор Dataminr Тед Бейли пояснил, что сервис использует около 18 различных сигналов, извлечённых из Twitter и его метаданных, чтобы определять потенциально "горячие" темы и посылать информацию о них своим пользователям.

Показательный случай произошёл в 2011 году в связи со смертью Усамы бен Ладена - событием, наиболее интенсивно обсуждаемым за всю историю сайта Twitter. Dataminr отправил оповещение об этом событии в 10:20 вечера по восточному времени, на 23 минуты раньше, чем о нём сообщили новостные агентства. Как объяснил Бейли, в этом случае было использовано три сигнала (объем сообщения, классификация настроения и лингвистический анализ), основывающихся на 19 твитах, отправленных до того, как новость была подтверждена.

Объем твитов предупреждает Dataminо о появлении "горячей" темы. Хотя 19 твитов - это, кажется, не так уж и много, но на момент, когда это произошло, бен Ладен не был в числе широко обсуждаемых тем, пояснил Бейли, так что тогда такое количество твитов было необычным.

Такой внезапно возникший интерес к личности бен Ладена привлёк внимание, но этого ещё было не достаточно для посылки предупреждения, поэтому был сделан лингвистический анализ. Они также искали - и нашли - настроение, которое Бейли определяется как внезапно возникшую "эмоциональную реакцию".

После того как информация, достойная освещения в СМИ, обнаружена, сведения о ней отправляются пользователям через приложение, уведомления по электронной почте, через текстовые сообщения. Предупреждения также могут быть совмещены с существующими в конкретной редакции программными решениями.

Платный сервис Dataminr for News будет выпущен в этом году.

Видео презентации Dataminr на мароприятии Devnes.

Фото пользователя Garrett Heath, лицензия CC сайта Flickr.

Майте Фернандес – главный редактор IJNet. Она владеет английским и испанским языками и имеет степень магистра в области мультимедийной журналистики, полученную в Университете штата Мэриленд.