的一个项目

数据视觉化可能有误导性,但这里是你可以做的

作者Corinne Podger
Nov 15, 2019 发表在 数据新闻
Man looking at chart

在新书“图表如何撒谎”里面,Alberto Cairo在说到糟糕的数据视觉化的危险时毫不留情。他指出了五种图表设计与初看之下不同的类型 — 从那些包含不完整数据的,到故意隐藏或者误导受众的。

比如以美国死于非命的风险的视觉化为例。“如果你创作一幅图表,仅包含全国谋杀率,看起来美国在变得更危险 — 但这不是事实,”迈阿密大学视觉新闻奈特中心主席Cairo说。

“美国大多数地方谋杀率很低,但一些地方谋杀率是如此之高以至于会使得全国数字被扭曲,"他继续。"如果你真的希望告知公众事实,你需要包含进本地和区域的数据”。

Alberto Cairo and the book "How Charts Lie"

糟糕设计的原因

糟糕的图表设计往往是尝试将复杂信息变得通俗易懂时过度简化的结果。但是,光谱另一端就是会出现很多故意隐藏复杂性或者故意误导隐藏数据之下的类型的图表。这样的图表可能试图使得科学证据看起来不可信,推广虚假陈述,强化并不存在的因果关系,或者支持特定偏见。

作为后者的案例,Cairo在他的书中公开探讨了美国种族主义团体传播的误导性图表可能对2015年南加州黑人教堂疑凶Dylann Roof的影响。

“我在这一部分之中措辞很小心,因为图表并非这个人进行杀戮的理由,”Cairo说。“但是如果这样的人没有接触这样的虚假信息又会怎样?”

记者的作用

记者无法保护他们自己不像普罗大众一样被简易视觉效果的具有说服力的图表“欺骗”。

“我们需要停止相信 — 明确或不明确地 — 图表能够说明情况。它们不能。它们是视觉化的阐述,它们需要被评估和验证,正如其他任何写入报道的内容,”他说。

验证应该包含找到数据图表的基础,是否源于可信信源,是否基于有代表性的样本,是否漏掉了什么信息或者粉饰了什么信息从而使得视觉化错误或误导。

关于调查问卷的图表应该也能使得受众明白是否存在不确定性或者错误边界,Cairo说这些是报道选举的惯例操作。

“我看到过多少次新闻标题说A候选人领先B候选人,但是接着我读到数据其实是45%和43%?如果错误边界是4个点,你无法判断谁是领先的,” 他说。

“你活着可以说候选人似乎焦灼,或者你拿出更多的民调并且集成数据,因为那会给你比单一民调清晰得多的图景”。

Carlotta Dotto,第一草稿新闻的数据记者,说其机构正越来越担忧图表呈现的恶意或者误导性的信息。她说Cairo的书帮助记者们构建了对于图表的信心,并帮助事实核查他们的信源提供的图表。

“We are increasingly looking at this and developing training for newsrooms, academics and students around the world on how to use data journalism both to collect and visualize data, and to spot a bad visualization,” she said.

One of the charts Cairo reviews is this map purporting to show 2016 U.S. election results.

实践操作贴士

Cairo的书充斥着实际操作的贴士,使之成为一个创作更好的图表或者解释信源提供的图表的资源。

这里是五大关键结论:

  1. 获取尽可能多的数据,确保可靠。
  2. 了解其与平均数之间的差别,也就是一组数据求平均,以及中位数,那是一组数据正中间那个。
  3. 选择你的图表的正确设计。S如果是线形图,热图,饼状图或其他呢?这个HubSpot的2018博客帖有关于图表类型以及如何选择你的数据的最佳视觉化方案的信息。
  4. 仔细考虑你会为你的图表起什么名字。 精心制作的图表可能由于你的标题使得数据并不支撑而变得具有误导性。
  5. 愿意接受对于你的假设的挑战。你收集的数据可能不支持你希望进行的论述,也可能带来需要进一步解释的细微差别。

积极而言,Cairo说,现在有越来越多免费和低成本的视觉化工具,比如DatawrapperFlourish,使得即使最小规模的新闻机构也能够制作高质量、基于数据的报道。 

“我们把《纽约时报》看做数据视觉化的黄金标准,但在佛罗里达,《Tampa海湾时报》只有两三个人从事这项工作,但他们 拿出了普利策获奖作品,”他说。“这些工具就像写作一样制作图表,使得人人皆可学习并从中获益,我觉得很棒”。