记者如何从深层网络发掘信息

作者Sandra Crucianelli
May 15, 2012 发表在 Miscellaneous

很多记者在研究新闻故事时,都将谷歌搜索当做第一手的工具;但网络中存在一种所谓“Deep Web(深层网络)”的大量信息,它们没有被谷歌或Bing这类搜索引擎索引出来。记者可以深入挖掘这些信息,获得一些尚未被关注的新闻。

进一步深入,互联网还存在一个被定义为“黑色网络”的区域,这个网络因为不同的原因(国家安全或军事目的)被安全服务器保护起来,因此内容在搜索引擎中被孤立和保护起来。

但是,深层网络比我们想象得更容易访问。记者可以找到一些没有通过HTML结构储存的文件,包括PDF、Excel、PPT、Flash和谷歌地图扩展文件。

给记者的一些提示:

  • 如果你想要发掘一个网站,可以开始使用一些简单操作:探索网站地图——一个不常用的方式,但是可以被用作搜索网站的指南。

  • 学习使用所有搜索引擎中的高级搜索功能,包括Google的高级搜索。

    1. 尝试缩小范围到城市,寻找新信息。在搜索时输入你想要获得信息的城市或居住城市。如果你的搜索目标是“Bogota”,将第一个选项设置为“all of these words(所有相关词语)”;如要搜索“Buenos Aires”,选取第二个“this exact word or phrase(确切的词或短语)”,因为这个城市名是一个复合词。

    2. 尝试将搜索结果限制在最近时间,例如上周或最近24小时。同样,你需要根据想要查找的信息类型决定搜索的格式,例如只查找Excel,你可以有更大几率获得统计图表等数据资料。

    3. 通过域名限制在政府网站寻找信息,例如只添加网站域名(例如wikipedia.org),或只使用域名的最后一个部分,例如搜索阿根廷时使用“gov.ar”。

    4. 尽管你可以在高级搜索中这样做,但是也可以在谷歌左侧的“Time”工具找到最新的链接,例如最近一个小时发布的信息。

    5.学习如何使用其它搜索引擎进行高级搜索,像Bing。

这篇文章是关于如何通过深层网络寻找信息的第一部分。

_Sandra Crucianelli是美国奈特国际记者研究员,调查性新闻记者,数字资源和数据新闻领域专业导师。他是Sololocal.info的建立者和编辑,该在线杂志从阿根廷为世界提供区域信息。

Follow @spcrucianelli

Image CC-licensed via Danard Vincente on Flickr.