Может ли визуализация данных вводить в заблуждение и как этого избежать

АвторCorinne Podger
Nov 21, 2019 в Журналистика данных
Man looking at chart

В своей новой книге "Как лгут графики" Альберто Каиро не жалеет слов, предупреждая об опасности некачественных визуализаций данных. Он выделяет пять категорий в дизайне графиков, которые могут стать причиной проблемы – от тех, что представляют неполные данные, до тех, что скрывают информацию или намеренно обманывают читателей.

Возьмем, к примеру, такую тему: риск быть убитым для жителей США. "Если вы создадите график, который включает только уровень убийств на национальном уровне, все выглядит так, будто США становится все более опасной страной, – но это неправда", – говорит Каиро – глава кафедры визуальной журналистики в Университете Майами.

"В большинстве мест в США уровень убийств очень низкий, но в некоторых местах этот уровень такой высокий, что повышает и общий национальный уровень, – продолжил он. – Если вы и правда хотите продемонстрировать реальную картину происходящего, нужно включить данные о местной и региональной статистике".

Alberto Cairo and the book "How Charts Lie"

Причины ошибок в создании графиков

Каиро считает, что причиной некачественного дизайна графиков часто становится чрезмерное упрощение, когда автор старается сделать сложные данные более простыми для понимания. Хуже всего, если авторы намеренно скрывают сложность или делают вводящие в заблуждение выводы, которые якобы основаны на имеющихся базах данных. Создатели таких графиков могут пытаться дискредитировать научные данные, выдвигать ложные утверждения, говорить о существовании ложных причинно-следственных связей или поддерживать предубеждения.

В качестве примера Каиро в своей книге говорит об истории Дилана Роуфа – человека, застрелившего девять афроамериканцев в церкви Южной Каролины в 2015 году, – и о том, какое потенциальное влияние могли на него оказать дезинформационные графики, которые распространяют в США расистские группы.

"В этой части своей книги мне нужно было очень тщательно выбирать слова, потому что графики сами по себе – не причина того, что этот человек совершил преступление, – говорит Каиро. – Но есть ли вероятность того, что события пошли бы по другому сценарию, если бы такому человеку не попадались подобные графики, вводящие в заблуждение?"

Роль журналистов

Чтобы не попасться на удочку, журналистам для начала нужно признать: так же, как и более широкую публику, их может обмануть убедительная и простая визуализация.

"Нам нужно перестать верить, осознанно или нет, что графики – это просто иллюстрация. Это не так. Графики – это визуально сформулированные аргументы, и их нужно оценивать и проверять с той же тщательностью, как и всю другую информацию, которую мы используем в своих материалах", – сказал он.

Чтобы провести верификацию, нужно выяснить, на основании каких данных составлен график, можно ли считать, что источник этих данных заслуживает доверия, можно ли назвать выборку, на которой основана информация, репрезентативной. Также нужно проверить, не была ли какая-либо информация пропущена или скрыта – это может привести к созданию неправильной или вводящей в заблуждение визуализации.

В комментариях к графикам, основанным на данных опросов, авторы должны сообщать аудитории, существует ли неопределенность или предел погрешности в интерпретации данных. По словам Каиро, это должно быть общепринятой практикой при освещении выборов.

"Множество раз я видел заголовки, возвещающие, что "кандидат А обогнал кандидата Б", а потом я просматривал данные и выяснял, что результат на самом деле 45% против 43%. Если статистическая погрешность составляет четыре процента, то нельзя утверждать, что один из кандидатов впереди, – говорит он. – Вы можете сказать, что кандидаты показывают примерно одинаковые результаты, или можно пойти и провести дополнительные опросы, а потом включить эти данные в исследование, потому что это даст вам более точную картину, чем единичный опрос".

Карлотта Дотто, журналистка First Draft News, специализирующаяся на работе с данными, говорит, что ее медиа все больше беспокоит появление визуализаций данных, в которые намеренно или случайно включена неверная информация. Она считает, что книга Каиро поможет журналистам разобраться в сложных вопросах, связанных с созданием графиков, а также с проверкой графиков, предоставленных источниками информации.

"Нас все больше интересует этот вопрос.  Мы учим журналистов, ученых и студентов по всему миру, как использовать журналистику данных для сбора и визуализации информации, а также для поиска некачественно сделанной визуализации", – говорит она.

Одна из таблиц, приведенных в книге  Каиро, – карта, на которой предвзято представлены результаты выборов 2016 года в США.  

Практические советы

Каиро предлагает в своей книге много практических советов, что делает ее отличным пособием по созданию визуализаций и по интерпретации графиков, представленных источниками.

Вот пять основных советов.

  1. Соберите как можно больше данных и убедитесь в их надежности.
  2. Узнайте разницу между средним значением и медианой – числом, находящимся в середине списка.
  3. Выберите правильный дизайн для вашего графика. Должен ли это быть линейный график, тепловая карта, круговая диаграмма или что-то еще?  Этот пост HubSpot, опубликованный в блоге в 2018 году, рассказывает о типах графиков и о том, как выбрать лучший вариант для визуализации ваших данных.
  4. Тщательно выбирайте название графиков. И грамотно выполненная визуализация может вводить в заблуждение, если в заголовке содержатся утверждения, не соответствующие представленным данным.
  5. Будьте готовы поставить под сомнение собственные предположения. Собранные вами данные могут не соответствовать утверждению, которое вы планировали доказать, а также могут содержать нюансы, которые нужно объяснить.

Каиро видит и положительную сторону вопроса: растущее число таких бесплатных или недорогих инструментов для визуализации данных, как Datawrapper и Flourish, сделало создание качественных материалов на основе данных доступным даже для самых небольших медиа.

"Мы считаем The New York Times золотым стандартом визуализации данных, но у флоридского издания Tampa Bay Times всего два или три сотрудника, которые могут делать работу такого типа, а они выполняют ее так, что получают Пулитцеровскую премию, – говорит он. – Эти инструменты делают создание визуализаций чем-то похожим на написание статей, в том смысле, что этому каждый может научиться и начать извлекать пользу, и я думаю, что это прекрасно". 


Источник основной фотографии – Frank Busch, лицензия CC сайта Unsplash.