数据新闻菜鸟:基本技巧和工具

作者Khalid Khattak
Aug 4, 2016 发表在 数据新闻

对像巴基斯坦这些发展中国家而言,“数据新闻”是一个新名词。

在发展中国家,得益于政务公开开放数据知情权(RTI)或阳光法案,越来越多的数据唾手可得。

现在有很多免费且易于使用的在线工具,让所有人能解谜数据,并通过不同方式完成报道。这对记者开辟了一条新途径,即使那些没有资源或意愿建立大型数据新闻团队的媒体——需要做的就是探索。

什么是数据新闻?

我最欣赏的数据新闻定义来自于谷歌数据编辑Simon Rogers,他写道:“数据新闻就是使用数字来讲述好的故事。这不是数学、绘制图表或编写代码。它在于率先进行报道——数学、表格和代码都为之服务。”

这消除了记者对于数据新闻的犹豫和恐惧。一些涉及大数据集的报道会让多个成员的团队参与:记者、代码编写者和程序员。记者可以完成一些简单的数据分析,以从不同的角度和方式报道。尽管有很多复杂的数据新闻报道,但新来者不应感到害怕。总之,数据新闻就是让数据有意义,并告知读者数字背后的故事。

寻找和提取数据

尽管有RTI法律和开放政府运动,获取信息仍然是记者面料的一个挑战。通常情况下,在线数据都以PDF格式呈现,让记者难于使用。由于科技进步,将这些文件转化成电子表格的方式变得更加容易。

寻找数据的最简单地方是联合国教科文组织的数据办公室。你可以根据国家下载四大主题的数据集——教育、科技和创新、文化和传播。

Tabula是从PDF提取数据,并转化成CSV或Excel文件的免费工具之一。另外一个免费工具Online OCR也可以帮助你从PDF提取数据,并转化成Excel或Word文件——该工具识别46种语言。

不要小看Excel的力量

尽管有多如牛毛的工具,微软Excel仍然是分析和视觉化数据的有效工具。网上有很多免费教程,例如这个可以教授数据记者如何排列和筛分数据集,如何制作数据透视表。对于可视化学者而言,网上也有很多教程;你需要有耐心,并尽情地探索和学习。另外一个黄金法则:从小事做起。

数据可视化和报道

除了排序和过滤数据,记者可以使用可视化来发现数据中未见的趋势。你可以通过Excel建立基础的可视化内容,而且还有其他免费工具来帮助进行报道。

Canva是一个非常简单的图形设计软件,你不需要成为一名专业的平面设计师。谷歌Fusion Tables是一个易于使用的数据处理应用,对于初学者来说相当不错,类似的还有Infogr.amPixel Map也是一个可用于网络和报纸的应用程序。

使用这些软件的最终目标是展示有吸引力和有趣的报道。不过记者需要牢记,即便没有数据,新闻的根基也是不会改变的。

其它建议

不同机构提供的大规模开放在线课程(MOOCs)也是学习数据新闻的不错选择。此外,全球调查新闻网络(Global Investigative Journalism Network)提供了数据新闻自由清单,包括不同的语言版本。

当然,数据新闻手册也是不错的选择。

Khalid Khattak is a journalist based in Lahore, Pakistan. He is a staff reporter at The News International. You can find more about him on his data journalism website Data Stories, which he founded last year with an aim to promote data literacy and data storytelling. Journalists from Pakistan can also take a survey developed by Data Stories in collaboration with JournalismPakistan to understand Pakistan’s data journalism landscape.

Main image CC-licensed by Flickr via Chris Khamken.