Три инструмента, которые помогут цифровым журналистам сохранить опубликованные материалы в случае закрытия сайта

Автор Laura Hazard Owen
Oct 30, 2018 в Цифровая журналистика

Неожиданное закрытие локальных цифровых новостных медиа Gothamist и DNAinfo в начале этого месяца стало отличным напоминанием для цифровых журналистов: делайте резервное копирование! Делайте резервное копирование!

Дело не только в том, что новостные приложения и запись цифровых разговоров не будут храниться вечно. Как писал в сентябре мой коллега Шан Ванг: "Посмотрите на более широкую картину – из интернета исчезли многие новаторские работы в цифровой журналистике". Одна из сторон этой проблемы – если цифровые журналисты в будущем захотят устроиться на новое место, им нужно будет продемонстрировать потенциальным работодателям образцы своих работ. Если сайт, с которым они сотрудничали, закроется, сделать это будет не так уж легко.

К счастью для журналистов, которым в свое время не хватило предусмотрительности сохранить свои работы (как и большинству из нас), сейчас появилось несколько решений этой проблемы.

Приложение Save My News, запущенное в этом месяце редактором команды Data Desk Беном Уэлшем из Лос-Анджелеса, позволяет журналистам (этот инструмент уже использовали около 300 человек) сохранять ссылки в Internet Archive и WebCite. Вы сможете загрузить все клипы и ссылки в виде таблицы Excel.

Уэлш разработал этот инструмент 6 ноября, через два дня после закрытия DNAinfo. "Я заметил, что многие мои коллеги публиковали растерянные и возмущенные посты в социальных сетях, – сказал он. – И увидел в этом отличную возможность напомнить людям о том, насколько недолговечными могут быть результаты их работы, – ведь вся журналистика, в которую они вкладывают столько усилий, может исчезнуть из интернета". Сервисы, позволяющие сохранить результаты работы, – явление не новое. В блоге Internet Archive можно найти информацию об инструментах, позволяющих журналистам сохранять материалы, – но многие просто не знают об этом.

Уэлш планирует включить в Save My News и другие сервисы для архивирования контента, но хочет, чтобы использовать сервис было по-прежнему просто.  

Паркер Хиггинс, директор по специальным проектам Фонда свободы прессы, обратился к Twitter с призывом объединиться с Gothamist и DNAinfo, чтобы помочь журналистам сохранить результаты их работы, когда казалось, что сайты могут совсем исчезнуть, и архивы придется составлять заново с помощью таких сервисов, как Internet Archive. Он даже начал писать для этого программу, но затем сайты вернулись в интернет, и он создал более надежный и быстрый инструмент, с помощью которого журналисты могут архивировать свои работы, опубликованные на этих сайтах, переведя их в формат PDF, – весь процесс занимает пару часов.

Разработанный Хиггинсом инструмент с открытым кодом Gotham Grabber теперь доступен на Github. "Внеся небольшие изменения, многие журналисты могут использовать этот инструмент для создания архивных версий своего портфолио", – написал он в блоге Фонда свободы прессы. Для того чтобы это сделать, нужно немного разбираться в кодировании. Хиггинс признает: "Большинство журналистов, с которыми я разговаривал и которые публиковали свои работы на этих сайтах, не разбираются в кодировании. Но я надеюсь, что найдутся те, кто поможет адаптировать этот код для других сайтов", – добавил он.

Gotham Grabber превращает контент в PDF-файлы, потому что таков был запрос большинства журналистов, связавшихся с Хиггинсом. "Когда у вас есть портфолио и вы прикрепляете приложение к заявлению на работу, лучше всего, чтобы оно было в формате PDF. Если говорить о сохранении материалов для читателей или о долгосрочном хранении, существуют более эффективные способы архивирования. В конечном итоге эти страницы можно будет превратить в формат HTML и сохранять в базе данных, – объяснил Хиггинс. – Надеюсь, это поможет людям продумать вопрос о долгосрочном хранении и доступе к публикациям. Я имею в виду, что в случае с сайтами Gothamist и DNAinfo, опубликованный на них контент зачастую остается единственным материалом, рассказывающим о местных событиях".

Если вы предпочитаете сделать эту работу и забыть о ней, вы можете использовать сервис Authory, бета-версия которого была запущена в прошлом году с помощью гранта Google Digital News Initiative, а затем, летом, стала доступна широкой публике (я получил бесплатный доступ к Authory еще на стадии бета-версии в обмен на отзывы о моем опыте его использования). Основатель и главный исполнительный директор Authory Эрик Хауч, работал в Axel Springer и Financial Times Deutschland и задумался о том, как понять, когда интересующие его журналисты публикуют новые истории.  

Разговаривая с другими журналистами об инструменте, который помог бы решить эту задачу, он узнал, что они сталкиваются "не только с проблемой рассылки обновлений читателям. Им также непросто отслеживать сами статьи". Хауч решил, что разумно будет совместить обе эти функции. После установки настроек, Authory автоматически архивирует все статьи журналиста (независимо от того, на каком сайте они публикуются), а также дает возможность читателям "подписаться" на публикации журналистов и получать уведомления по электронной почте, когда эти журналисты публикуют что-то новое. (Muck Rack for Journalists выполняет аналогичную функцию, рассылая уведомления, но не архивирует материалы журналистов. Подобную функцию "подписки" на интересующих вас журналистов когда-то предлагал и Byliner.) "Мы просто добавили к этому идею резервного копирования работы журналистов, но теперь это самое важное из того, что мы делаем", – добавил Хауч.

Первые две недели вы можете использовать сервис бесплатно, после этого он стоит 7 долларов США в месяц или 70 долларов в год. Сервис Authory запущен совсем недавно, сейчас он насчитывает около 1 000 активных пользователей – в основном в США и Великобритании. Он может архивировать контент с сайтов с мягкими (soft) и дозированными (metered) системами пэйволлов, а также с некоторых сайтов с жесткими пэйволлами, например, с The Wall Street Journal, но журналист для этого должен войти в свой аккаунт. В будущем этот сервис будет работать с другими сайтами, работающими по системе жестких пэйволлов.

Пользователи могут получить доступ к полным текстам своих статей на своей странице Authory или отправить запрос на экспорт одного или нескольких материалов в формате XML или HTML по адресу hello@authory.com. Позже они смогут загружать свои архивы, а также отдельные PDF-файлы с помощью одного клика мыши.

По словам Хауча, это означает, что "вам не нужно полагаться на нас, чтобы ваши материалы всегда оставались доступными в сети". "Некоторые пользователи опасаются, что наш сервис может перестать работать, – чего мы не собираемся делать", – добавил он. Но... это интернет, и поэтому никогда не знаешь, что может случиться.

Этот материал впервые был опубликован на сайте Nieman Lab и публикуется здесь с разрешения.

Источник основной фотографии Marcin Wichary, лицензия СС сайта Flickr.