Icfj 的一个项目

可供自由记者用于数据报道与提案的六大工具

作者 Tory Lysik
Aug 5, 2022 发表在 数据新闻
Data

对很多新手来说,数据新闻的世界可能有点令人生畏。但其实只要掌握正确的概念,任何人都可以提议和着手製作一个数据新闻故事。

对于那些刚开始从事数据新闻工作的人,甚至是希望开始利用数据进行报导的资深记者,以下这六款工具都能助你更好地展开你的报道,并把故事提案交给编辑报题:

编程是必备技能

懂得至少一种编程语言是很重要的。即使是最基本的编程知识,也可以让你能摆脱简单乏味的试算表,为你的工作发挥影响;试算表虽然常用于数据新闻,但由于它无法处理过多的信息,因此不适合进行深入分析之用。

编程技能将容许你更轻松地操作数据。很少有数据集能完全乾淨一致、或是完全符合你的需要;如果你有能够快速清理和整理这些数据集的能力——哪怕是最小的文档——都能有助解决部份最令人头疼的问题。

学习编程技功还能助你逐步掌握诸如网络抓取机器学习等领域,这两种技能均可提升你的工作潜力。虽然这些技能并不简单,但假以时日都能上手。

诚然,并非所有编程语言都是一样的;其中,Python 是最易学、最灵活的语言;它也是可供免费使用的,学习速度要比学 RC++ 快得多。Python 的另一个好处是,但凡错误代码出现时,你更容易能在网上查找解决的答案,并利用易于搜索的在线论坛找寻更多免费的技术协助。

知道如何以视觉呈现你的故事很重要,即使你不打算会进一步使用

编辑需要看到你的数据是什麽模样的,因此即使你不打算在你的故事中使用可视化呈现方法,能够以视觉方式描绘你将使用的信息,也会令你的故事提案看起来更有力,还能向编辑表现你对故事及其背后数据有充份理解。

最常用的可视化工具是 Datawrapper,这是一个免费使用的平台,可以轻松传输数据。它易于学习,能让你创建从简单图象到更複杂的地图等不同内容。Datawrapper 需要使用基本的 HTML 知识,但它也提供了网上指南,让你学会如何在它的界面中编写 HTML 代码。

将你的 datawrapper 图象汇入到 Adob​​e 软件中,也能助你提升图象的精緻度,但这就会变得更複杂。Adobe 提供免费试用版,你能先试用再来确定是否值得成为付费会员。由于 Adobe 比 Datawrapper 更难学习,因此最好将它视作辅助工具,除非你已过了提案阶段,需要正式执行报道计划。

哪怕只是在草稿阶段,颜色也是数码可视化呈现的重要一环

你在高中上的美术课,来到在设计数据可视化时就派上用场了。

我们大脑的运作方式意味着颜色是数据可视化中的重要工具。我们都将颜色理解为另一种信息,能用于有效地描绘信息,或是完全扭曲数据。 哪怕是颜色的不透明度,这些关于色彩的细节都会影响读者对他们正浏览的可视化数据的理解。

灰色、白色或黑色等颜色应该使用得宜,特别是在尝试引导读者留意特定数据点时。掌握如何运用颜色很容易,且非常重要。

有多种代码能用于生成颜色,例如 Hex、RGB 和 HTML。这些代码常用于 HTML,以准确地指令你的电脑该从百万种颜色和色调中选择哪一种。你不必记住每种颜色的六位数代码,但要知道它们的存在,尤其是当你尝试在不同的数据可视化中複製精确的颜色或匹对颜色的时候。

有多款在线工具能让你知道个别的颜色代码:比如 HTMLColorCodes.com 是一个实用的颜色代码生成器,因为它能免费使用,但更多可用的不在此列。长远而言,熟习几款配色并拥有一些你喜欢的预设配色集会对你的工作格外有帮助。

必先考虑你将如何处理手上的故事

在尝试向你的编辑提议故事时,请先考虑最终成品的模样与效果,然后才考虑数据。数据报道更依赖你处理可用数据的能力,而不是视乎你拥有的数据集中有多少信息,这跟你由头创製一般故事的形式是不同的。

虽然你有数千个数据库可供使用,但你需要在使用相关的数据集之前,先去了解你计划如何使用它们。这将助你在找到一个你想用的数据集之前就先评估你的能力,以免之后才发现它可能会太繁複或难以使用。

为此,请先拟好你计划尝试测试的假想,以及你将採用的处理方式;创建一个故事分图,说明你希望如何测试它,以及有甚麽可用的数据。然后,找到你需要的数据,并开始着手开展你的採访。

使用跟 Trello 相类的工具将能帮助你实现这些步骤;它能免费供个人使用,但不适用于团队。

查询数据存取,成也败也?

向政府部门或其他组织提询数据可能是开展故事的好方法,但它也同时带来任何典型文档查询都会随之出现的问题;对于那些不必要地混乱的数据集尤其如此。

你需要明白的是,虽然你可能会以特定格式查询非常特定的数据,但这些数据可能仍然无法完全使用。花时间查询数据的存取,然后等待接收这些数据可能代价高昂,特别是对自由职业者而言。

与其查询数据,在线查找开放数据可能是最符合成本效益的。在美国,大多数州都设有开放数据网站,你需要的数据内容大多都能以此查阅存取,不须通过 FOIA 查询。

即使你不打算继续展开数据报道,整理好积压的数据也很重要

对于处理数据不是很经验丰富的记者来说,掌握并准备好能随时使用的数据集是关键。所有数据记者都该保留它们,并管理好自己的个人档案库。

你能创建一个免费的 Github 帐户,作为你的数据储存库,这可能有助于用作参考。它还有助你建立你的工作履历,甚至成为一个独立的网站,让潜在僱主能看到你之前下了甚麽功夫。


图片来源:Markus Spiske on Unsplash