目前,有无数资源帮助哪些希望学习数据新闻的工具。但没有很多的在线资源,帮助我们了解数据和数据驱动新闻背后的基本概念和原理。
Tow数字新闻中心(Tow Center for Digital Journalism)的研究员Jonathan Stray最近出版的“好奇记者的数据指南(The Curious Journalist’s Guide to Data)”,一个免费易读的在线书籍,提供这些准则的介绍。
“在新闻中,报道不仅需要正确,还需要有趣,并目标受众有关,”Stray说。“数据新闻与纯粹的统计分析不同——因为我们需要文化、法律和政治学来告诉我们哪些数据很重要,如何重要。”
Stray称这本书“创意的大合集”,分为三个类别:
量化(Quantification)
量化、或是创建数据的过程,是揭示社区趋势和模式,并成为一个故事的第一步。量化是一个脆弱的过程,Stray说,因为数据收集过程可能会受到人为或其它事故的影响。
“整个过程需要妥善完成,而且我们对数据的了解需要正确,否则数据将没有意义,”他写道。
在这本书的量化部分,Stray使用了两个真实世界的案例来展示我们如何思考量化,以及哪些能够让内容被“量化”与否。
分析(Analysis)
一旦有完整的数据摆在你面前,分析——从数据中寻找隐藏的报道——就有了用武之地。由于需要超越数学的技能,数据分析提供着独特的挑战;它需要对形成好故事的新闻直觉——因为一组数据可能包括很多故事。
为了展示数据分析如何影响记者,这本书使用市中心附近的袭击案例,并试图找到过早的酒吧关门时间是否会减少攻击数量。为了帮助记者更好的了解如何分析数据,这本书勾勒出一些关键的统计原理,接着在拓展到更多的前沿方式,例如贝叶斯推理和因果图。
沟通(Communication)
一旦拥有数据并发现了之间的故事,现在是时间与读者进行沟通。对于数据驱动新闻而言,这通常意味着建立一个引人注目的数据视觉化内容,展示故事背后的证据。
如果数据没有被正确使用,数据视觉化可能会强化有害的成见,或是引起读者产生扭曲的观点。这样一来,记者不仅仅负责报道新闻——他们对读者阅读报道后的想法负责。Stray提供了多个案例,展示通过将数字与人联系起来,如何能够确保数据报道能够最好的展示事实。
点击这里阅读全书。
Main image CC-licensed by Flickr via Gene Han.