的一个项目

Who’s got dirt: 机器人能够胜任调查性报道

作者Friedrich Lindenberg
Jun 01 发表在 数据新闻

跨境调查新闻在近年来备受关注。通过与非洲调查报道中心网络(ANCIR)合作,我有机会了解了来自意大利调查报道项目(IRPI)的两名记者的工作——他们前往南非,追踪意大利黑手党的商业利益链。

IRPI的Cecilia Anesi和ANCIR的Khadija Sharife会花费数小时来追踪不同的名字:

“你知道X吗?”

“是的,他在意大利叫Cosa Nostra。我们有很多关于他在上世纪九十年代的法庭文件。”

渐渐的,两名记者开始了将解他们正在审查的黑手党、政界和商界人士对号入座。

每个报道都需要大量的努力,它解决了跨国调查在当地国家所面临到的所有挑战。掌握报道过程的机构,例如国际调查新闻中心(ICIJ)和组织犯罪和腐败报道项目(OCCRP),在为这个行业带来最引人注目的报道。

为了支持类似的深入报道,我参与了大量为调查记者提供的数据项目,协助公开了从德国到南非和莫桑比克的公共信息。随着政府开放数据的趋势不断增长,很多国家和行业都涌现了大量的信息。

不幸的事,使用这些数据需要调用大量的资源:如果你在寻找智利政治家的信息,可以访问Poderopedia,如果在南非,则需要去Siyazana。想了解公司信息,访问OpenCorporates,还可以访问在Investigative Dashboard列出的数据库。你可以在TED上找到欧洲的公共信息,除了斯洛文尼亚和斯洛伐克,这两个国家有较好的国内数据库。你会发现,我们经常都很混乱,因为媒体每月都在发生剧变。

网络和开放数据不是应该让事情变得简单,而不是让我们变得混乱吗?从如此多的地方收集数据不该是机器的工作,而非人类的工作?

如果我们想要让开放数据与调查新闻相关,我们需要简化处理问题的方式。我们必须建立一种让不同数据进行对话的工具,来询问跨境调查记者之间讨论的问题:“你知道X吗?你能告诉我一些相关信息吗?”

一个我们称之为“Who’s got dirt?”数据API建立了这样一个功能,该项目是开放数据基金会资助的“Influence Mapping”项目的一部分。该小组汇集了技术专家、研究人员和记者,开发一种简单的方式让来自不同信息来源的公司和人员信息更加丰富。

该组织的创始成员,包括哥伦比亚大学的美国议会(American Assembly)、OpenCorporates、LittleSis.org、Poderopedia、OpenNorth.ca和Grano项目,都关注开放数据的分享问题。对于调查项目而言,这一机制的的不同变体可以被用于处理机密数据,例如泄漏的文件和数据库。这里,分析结果不再是一组匹配的数据记录,而是指出信息是否可用——以及联系人是谁。

这在实际工作中意味着什么?在去年11月半岛电视台举行Canvas骇客松中,我与开发人员、设计师和记者合作,开发了一个名为“Newsclip.se”的原型,记者可以用这个工具来扫描笔记、侦测提到的公司和人名、并从开放数据库中找到相关线索,以便提高报道的深度。

虽然Newsclip.se只是一个展示,“Who’s got dirt?”将让很多工具来帮助你的研究——从网络分析工具detective.io,到不断研究公司所有权、法律案件、土地和采矿权或家庭关系的观察名单。

如果我们可以围绕合作的概念建立一个具有里程碑意义的东西,跨境新闻可能很快会有一个小机器人兄弟:跨数据调查新闻。

Main image CC-licensed on Flickr via Discos Konfort.