给调查记者的五款免费数据工具

par Reg Chua
30 oct 2018 dans Miscellaneous

今年于奥兰多举行的调查记者与编辑大会上展示了许多很酷又免费的工具——它们既证实了记者所能使用的工具已经非常强大,也反映了要在时代的不断发展中保持领先需要付出很大的努力。

非常值得一提的是NodeXL,一个免费的Excel模板,可以让我们做出看上去很详尽的社交网络分析。尽管我还没有用过这个软件,但它的演示以及用户评论却令人印象深刻。社交网络分析一直是记者们很难啃的一块骨头,尤其是因为相关软件都不便宜,也很难获得,所以NodeXL可以说是想做好复杂的关系网络分析者的福音。(WhoRunsHKMuckety当然也试过做这些事,但那些只是可视化,不是分析工具。像 Xanalys这样的软件可以帮助发现隐藏的关系,但它并不便宜。)

另一款非常出色的软件是TimeFlow,它能帮助我们可视化并分析时间信息——当你想知道谁在什么时候知道什么,或者分割一个散乱的年代表,甚至寻找不相干的事件在时间上的联系,它都是非常有用的。当然,有别的方法也可以帮助我们处理时间信息,但TimeFlow可以让我们迅速地过滤与可视化这些信息,这让你能更方便的检索已有数据。

关于时间数据还有一个工具,来自于ProPublica的伙计们展示了 timeline setter,这个免费工具可以让网站快速地建立与嵌入可以互动的时间轴。它看上去很棒。

最后是Gnosis——一个免费的插件——可以从你的浏览器运行实体提取或其他语义引擎工具。这意味着在运行时,它能检索你正在浏览的文章或文件,帮你提取出所有想要的人物、公司、地点等等的名称。在时间有限,又要很快检索大量文件的情况下它非常有用。它的创造者也为你们带来了Open Calais(我非常乐意地承认,就是汤森路透公司)。

我几乎还没用过这些工具,但它们看起来十分先进。当然,还有许多在奥兰多展出的工具我还没有去认真研究过,像 Tableau Public(以及Tableau 本身,看上去非常吸引人的但不免费的数据分析、可视化和出版工具。)

这是令人惊喜的:当我们发现个体记者手上原来有——或者可以有——非常强大的能力,并且这一切都是免费的(或几近免费)。在我看来,现在真正的限制在于时间——你如何去跟上新工具的潮流,学习并掌握它们,同时又有时间去真正做新闻?

蔡翔祁(Reginald Chua),汤森路透数据总编,于集团纽约总部工作。他曾任香港《南华早报》总编,以及《华尔街日报》副总编。他的工作经历涵盖了平面媒体、电视、电台,以及新媒体。

此文原刊于作者博客,由Ben Yu翻译,Yolanda Ma编辑。国际记者网获作者授权翻译转载。