Как искать информацию в глубинах интернета

АвторSandra Crucianelli
May 22, 2012 в Miscellaneous

Хотя Google Search является первым инструментом, к которому прибегает большинство журналистов для поиска информации, существует огромное количество информации в так называемых "глубоких сетях", которая не индексируются такими поисковыми системами, как Google и Bing.

Журналисты могут раскопать эту информацию, чтобы написать важную историю, которой ни у кого нет.

Есть область в интернете, которую можно назвать "темная сторона интернета", непроницаемая по своей природе, скрытая в спрятанных серверах, которые защищены по целому ряду причин (национальной безопасности или военных целей), эта информация изолирована и скрыта от поисковых систем.

Однако, по большей части глубины интернета более доступны, чем мы думаем. Здесь предприимчивый журналист может найти документы, которые не были сохранены в HTML, включая PDF, Excel, PPT (Power Point), Flash и расширений, используемых Google Earth.

Советы для журналистов:

  • Если вы хотите изучить вебсайт, начните с простой работы: изучите структуру сайта (site map) -- довольно необычная практика, но которая может служить компасом в поиске.

  • Научитесь использовать расширенные функции поиска во всех поисковых системах, в том числе [расширенный поиск Google]http://www.google.ru/advanced_search.
  1. Попробуйте сузить поиск - введите поиск по городам, чтобы найти новую информацию. Введите название города, в котором вы живете или о котором вы хотите получить информацию, в любом из первых двух полей. Если вы ищете, например, Bogota, то используйте первое поле "со словами", а если это Buenos Aires, используйте второе, "со словосочетанием" так как это составное имя.

  2. Ограничьте временной отрезок: например, введите ограничение «на прошлой неделе» или «за последние 24 часа». Кроме того, в зависимости от типа информации, которую вы хотите найти, вы можете выбрать искомый формат, например, Excel, в котором у вас есть больше шансов найти статистические таблицы или таблицы, показывающие затраты на разработку.

  3. Используйте ограничение в доменах, чтобы найти информацию правительственных сайтов, добавляя только имя сайта (например, "wikipedia.org") или используя только последнюю часть домена, например, "gov.ar" для сайтов в Аргентине.

  4. Для поиска вы можете также использовать функцию «время», инструмент из левой колонки Google, чтобы найти самые свежие ссылки, например, информацию, опубликованную в последний час.

  5. Научитесь выполнять расширенный поиск с помощью других поисковых систем, таких как Bing.

Это первая часть серии статей о поиске информации в глубоком интернете.

Сандра Кручанелли – стипендиат программы Knight International Journalism и преподаватель, специализирующийся на цифровых ресурсах и журналистике данных. Она также является основателем и редактором Sololocal.info, онлайн-журнала, который рассказывает о гиперлокальных новостях города Баия-Бланка, Аргентина.

Image CC-licensed via Danard Vincente on Flickr.