Существует много ресурсов для журналистов, заинтересованных в инструментах, которые можно использовать в журналистике данных. Но в Интернете не так уж много ресурсов, помогающих понять основные концепции и принципы, лежащие в основе работы с данными и использования данных в журналистике.
Джонатан Стрей, сотрудник Центра цифровой журналистики Тоу, недавно опубликовал "Руководство по данным для любознательных журналистов" – бесплатную, легко читающуюся онлайн-книгу, содержащую обзор таких принципов.
"Истории в журналистике должны быть не только правдивыми, но и интересными; они должны иметь отношение к целевой аудитории, – пишет Стрей. – Журналистика данных отличается от чистого статистического анализа (если такая вещь существует) – ведь культура, закон и политика помогают нам понять, какие данные важны – и почему они важны".
Книга, которую Стрей называет "коллекцией больших идей", разделена на три части.
Квантификация (сведение качественных характеристик к количественным)
Квантификация, или процесс накопления и обработки данных, – это первый шаг к выявлению тенденций и закономерностей в обществе, которые затем могут стать основой истории. Но, по словам Стрея, квантификация – не очень надежный процесс, так как большая часть данных содержит допущенные людьми ошибки и другие неточности.
"Весь процесс должен работать правильно, и наше понимание того, как именно все это работает, должно быть правильным – или данные не будут иметь смысла", – пишет он.
В этом разделе книги Стрей использует два примера из реальной жизни, иллюстрирующие наше восприятие квантификации; в раздел также включен обзор того, что на самом деле важно, когда мы решаем, подходят данные для квантификации или нет.
Анализ
Когда вы получаете набор данных, в игру вступает анализ или поиск историй, скрытых в этих данных. Анализ данных может быть непростым делом, поскольку для него требуется нечто большее, чем просто математика: интуиция для поиска элементов, важных для хорошей истории, – ведь в одном наборе данных может содержаться много историй.
Для иллюстрации роли, которую анализ данных играет для журналистов, в книге используется пример работы с данными о нападениях в центре города – и проводится попытка выяснить, действительно ли более раннее закрытие баров помогает уменьшить количество таких нападений. В помощь журналистам, желающим разобраться в анализе данных, представлены также основные статистические принципы и такие современные методы работы с данными, как байесовские выводы и причинно-следственные графики.
Связь
Если вы нашли и данные, и скрытую в них историю, наступает время продемонстрировать эту историю вашей аудитории. Для историй, построенных на основе данных, это часто означает создание убедительных визуализаций данных, которые иллюстрируют доказательства, легшие в основу истории.
Но визуализация данных, сделанная неправильно, может также послужить созданию неверных стереотипов или способствовать формированию ложных представлений. Поэтому журналисты ответственны не только за то, как была рассказана история, – они отвечают и за то, что будет думать их аудитория после прочтения истории. Стрей также рассказывает, как журналисты добиваются того, чтобы их базирующиеся на использовании данных истории наилучшим образом отражали реальность, представляя цифры в правильном свете.
Чтобы прочитать книгу, нажмите сюда.
Изображение Gene Han, лицензия CC сайта Flickr.