Twitter, самая популярная социальная сеть для поиска информации о "горячих" новостях, продолжает расти, и поиск нужного сигнала в этом информационном шуме становится всё более сложным делом.
В потоке обновлений твитов последние фото домашних любимцев следуют за инстаграмными закатами, фотографиями протестов на Украине и снимком Джастина Бибера, сделанным в полицейском участке. Для журналистов умение найти нужную информацию о "горячих" новостях среди 500 миллионов ежедневных твитов становится большим преимуществом.
Dataminr for News, новый инструмент, разработанный в результате совместной работы Twitter, CNN и Dataminr - компании, специализирующейся на анализе информации в социальных сетях. Технология, которую использует Dataminr, решает проблему работы с переизбытком информации в Twitter "с помощью алгоритма обнаружения, оценки, классификации и оповещения клиентов о наиболее важной информации в режиме реального времени", - говорится в пресс-релизе компании.
Базирующаяся в Нью-Йорке аналитическая компания делает такого рода работу для предприятий финансового сектора и государственных учреждений с 2009 года. Теперь Dataminr сотрудничает с Twitter и CNN, которые в течение нескольких месяцев принимали участие в тестировании данного инструмента, чтобы приспособить его к нуждам редакций и журналистов.
Но каким образом Dataminr ищет нужное в информационном шуме? В своем выступлении на мероприятии Twitter, DevNest, генеральный директор Dataminr Тед Бейли пояснил, что сервис использует около 18 различных сигналов, извлечённых из Twitter и его метаданных, чтобы определять потенциально "горячие" темы и посылать информацию о них своим пользователям.
Показательный случай произошёл в 2011 году в связи со смертью Усамы бен Ладена - событием, наиболее интенсивно обсуждаемым за всю историю сайта Twitter. Dataminr отправил оповещение об этом событии в 10:20 вечера по восточному времени, на 23 минуты раньше, чем о нём сообщили новостные агентства. Как объяснил Бейли, в этом случае было использовано три сигнала (объем сообщения, классификация настроения и лингвистический анализ), основывающихся на 19 твитах, отправленных до того, как новость была подтверждена.
Объем твитов предупреждает Dataminо о появлении "горячей" темы. Хотя 19 твитов - это, кажется, не так уж и много, но на момент, когда это произошло, бен Ладен не был в числе широко обсуждаемых тем, пояснил Бейли, так что тогда такое количество твитов было необычным.
Такой внезапно возникший интерес к личности бен Ладена привлёк внимание, но этого ещё было не достаточно для посылки предупреждения, поэтому был сделан лингвистический анализ. Они также искали - и нашли - настроение, которое Бейли определяется как внезапно возникшую "эмоциональную реакцию".
После того как информация, достойная освещения в СМИ, обнаружена, сведения о ней отправляются пользователям через приложение, уведомления по электронной почте, через текстовые сообщения. Предупреждения также могут быть совмещены с существующими в конкретной редакции программными решениями.
Платный сервис Dataminr for News будет выпущен в этом году.
Видео презентации Dataminr на мароприятии Devnes.
Фото пользователя Garrett Heath, лицензия CC сайта Flickr.
Майте Фернандес – главный редактор IJNet. Она владеет английским и испанским языками и имеет степень магистра в области мультимедийной журналистики, полученную в Университете штата Мэриленд.