Почему работающим с данными репортерам стоит задавать себе пять основных вопросов журналистики

АвторSimon Rogers
Nov 10, 2014 в Журналистика данных

"Пять основных вопросов журналистики данных" – часть материалов "Введения в журналистику данных", одного из курсов MOOC, проходившего в начале этого года. Более подробно об этом курсе можно узнать здесь.

Кто?

Откуда получены данные? Почему важно знать это? Этот вопрос может быть самым существенным. Поскольку данные, как и любая информация, могут быть ложными, то, чем менее надежен их источник, тем менее вероятно, что эти данные точны. Прозрачность в таких вопросах тоже очень важна – если ваш читатель знает, откуда вы получили данные, он скорее вам поверит. А если читатель не верит вам, то ваша работа не имеет никакого смысла.

Одна из причин того, почему это важно, в том, что обычно в журналистике данных используются общедоступные данные – и законы о свободе информации во всем мире, которые позволяют журналистам использовать в своей работе скрытые государственные данные.

Но доступ к открытым данным автоматически не означает полной свободы – даже в Бахрейне и Саудовской Аравии в наше время существуют порталы открытых данных. Работа журналиста – это поиск и исследование информации. Мы можем проверить, насколько точны эти данные, и сравнить их с другой известной информацией, чтобы узнать что-то новое о событиях, вошедших в новости.

Традиционно журналисты относились к данным с благоговейным доверием, с каким никогда не относились к людям – источникам информации. В числа верят, потому что процесс их исследования слишком пугает. Бывший репортер BBC Майкл Бластленд исследовал эпидемию норовируса (winter vomiting bug) 2008 года, чтобы показать, как легко ошибиться, работая с числами. Считалось, что три миллиона человек пострадали от этой болезни в предыдущем году.

Он рассмотрел доверительные интервалы – метод, позволяющий понять, насколько достоверными являются данные, – и увидел, что число заболевших вполне может равняться 280 000. Или даже 34 миллионам. Где же правда? Никто не знает, но материал уже увидел свет.

Что?

Что вы пытаетесь сказать? Какие мысли вы хотите донести до читателя? Вы не академик, терпеливо выкладывающий аргумент за аргументом. Лучшие экземпляры журналистики данных рассказывают историю просто и ясно, так, чтобы за ней было легко следить. Статистические отчеты не ориентированы на широкую публику – а ваша работа ориентирована. Ваша работа заключается в том, чтобы раскрыть тему понятным образом.

Пример: The Art Market for Dummies в 2013 году получил награду Data Journalism awards. Этот проект использовал данные, полученные из различных источников, собрал их вместе и с помощью визуализации рассказал цельную историю. В основу истории легли доступные данные арт-рынка, полученные из базы данных Artprice. Кроме того, были использованы PDF-файлы, переведенные в формат Excel. Автор также привлек к работе экспертов, которые помогли ему в переводе профессионального жаргона. В ходе работы были использованы такие инструменты, как

Outwit, приложение Firefox для преобразования PDF-файлов в Excel формат, Open Refine для очистки и объединения баз данных и Google API Currency Converter для приведения цифр, данных в разных валютах, к единому знаменателю. Для визуализации данных были использованы D3.js и Hichcharts.js.

Работа автора заключалась в том, чтобы представить данные понятным для всех образом, что и принесло ему награду в области журналистики данных. Задача журналиста – построить мост [понимания] между данными и пользователями, что значит – ответить на вопрос "Что?"

Когда?

Как давно были получены ваши данные? Велика вероятность того, что вы получите официальные данные не раньше чем через год после того, как они были собраны, а это слишком долго в наш век срочных новостей и мгновенных реакций. Это одна из причин того, почему все журналисты, работающие с данными, заинтересованы в методах сбора данных, дающих доступ к более свежей информации, а именно:

Данные, полученные практически в режиме реального времени, можно почерпнуть из официальных источников, таких, как эта карта убийств города Чикаго, созданная на основе последних отчетов о преступности в городе. Так как информация на этом сайте постоянно обновляется (пользователи также могут загружать данные), то эти данные служат постоянным источником новостей для журналистов. Например, для таких историй, как эта, написанная после того, как в одном из районов города в течение какого-то времени уровень убийств держался на необычайно высоком уровне.

Данные социальных медиа, собранные в режиме реального времени на сервисах социальных медиа, могут обеспечить мониторинг информации о срочных новостях, поиск источников информации и анализ того, как аудитория относится к данному событию. Сайт бизнес-новостей Quartz проанализировал твиты, размещенные пользователем аккаунта Twitter @J_tsar, предположительно связанного с Джохаром Царнаевым, организатором бомбардировки на Бостонском марафоне, и, на основе времени публикации твитов, определил режим его сна и бодрствования.

Сенсорная журналистика: новые дешевые технологии могут стать источником данных, анализ которых журналисты смогут использовать в работе. Команда по работе с данными WNYC создала этот проект с помощью мониторинга миграции цикад на восточном побережье – и призвала своих читателей помочь им в работе над проектом с помощью установки собственных дешевых датчиков. Это новый вид журналистики данных: сенсорная журналистика, и Джон Кифа со своей командой стали пионерами в этой области, показав, как это может быть сделано. Более подробно об этом можно узнать здесь.

Краудсорсинговая журналистика. Когда происходит крупное новостное событие, читатели могут помочь быстро получить необходимые для публикации данные. Для этого нужны активные, заинтересованные читатели, желающие принять участие в освещении этой истории. Необработанные данные, которые предлагают такие читатели, могут стать основой материала. И этот способ не требует больших денежных вложений. Вы можете сделать это в несколько шагов с помощью простых бесплатных инструментов:

  1. На странице выкладывается опросная форма Google для сбора ответов читателей
  2. Собранные данные редактируются журналистами, чтобы убрать повторяющуюся или оскорбительную информацию
  3. Данные импортируются в Google Fusion Tables
  4. На основе этих данных создается карта, обновляющаяся каждый раз при перезагрузке

В такой работе есть свой риск, но обратите внимание на сайт Zooniverse, специализирующийся на краудсорсинге информации в небольшом, но активном сообществе.

Где?

Очень важным моментом является геолокация данных. В журналистике данных необходимо сопоставлять различные базы данных, чтобы получить новый материал. Создание этой карты, на которой отражено количество людей, владеющих огнестрельным оружием, и уровень убийств, совершенных с помощью такого оружия, стало возможно только благодаря тому, что данные были привязаны к месту, в данном случае – к определенной стране. Чем больше существует местных границ, тем труднее объединять данные на местном уровне. Это просто проклятие открытых публичных данных, полученных от разных уровней власти. Поэтому знание географии очень важно и позволяет создавать новые виды историй.

Почему?

С этим связаны самые трудные вопросы в журналистике данных. Такая журналистика хорошо подходит для демонстрации того, что происходит, но хуже – для коррелляции данных и выявления причинно-следственных связей. То есть тот факт, что одна страна имеет одновременно большое количество владеющих оружием людей и высокий уровень убийств, совершенных с помощью такого оружия, не обязательно означает, что одно является следствием другого – независимо от того, насколько очевидным это кажется. Журналистике данных часто приходится отвечать на простейшие журналистские вопросы:

  • Насколько велико [данное явление]?
  • Увеличивается оно или уменьшается?
  • Как оно соотносится с чем-то/происходящим в другом месте?

Иногда возникают отличные, использующие сложный статистический анализ, материалы в жанре журналистики данных. Но в таких случаях используются очень передовые методы, и такие работы появляются довольно редко. Часто к работе над такими материалами привлекают экспертов, и это еще одно большое отличие от обычной журналистики, опирающейся на источники информации и документы.

Перевернутая пирамида

Пол Брэдшоу предложил модель перевернутой пирамиды для журналистики данных (на занятиях по журналистике во всем мире говорят о перевернутой пирамиде журналистики), которая хорошо объясняет, как работает этот процесс. Больше о "перевернутой пирамиде журналистики" можно узнать здесь.

Брэдшоу пишет:

Журналистика данных начинается одним из двух способов: либо у вас есть вопрос, для ответа на который нужны данные, либо набор данных, который ставит вопросы. В любом случае сопоставление данных – это то, что [превращает процесс] в журналистику данных.

Этот момент имеет решающее значение. Есть что-то в том, что вы делаете, что отличает вашу работу от простой публикации данных, – это редакционная идея, которая стоит за этим процессом, идея истории, которую вы собираетесь рассказать.

Я бы хотел знать, чего не хватает в этом списке: что бы вы могли добавить?

Этот материал первоначально был опубликован в блоге Саймона Роджерса и перепечатан IJNet с разрешения.

Верхнее изображение пользователя Ian, лицензия CC сайта Flickr. Изображение внутри текста предоставлено Полом Брэдшоу.