O fechamento abrupto dos sites locais Gothamist e DNAinfo no início do mês foi uma recordação dura para os jornalistas digitais que querem o arquivo de seu material: Faça o backup! Faça o backup!
Não é só que aplicativos de notícias e conteúdos digitais não durarão para sempre; como o meu colega Shan Wang escreveu em setembro: "Muitos trabalhos pioneiros de jornalismo digital já não existem online ou existem apenas como uma sombra do que eram". O problema é também que os jornalistas digitais, que um dia vão estar à procura de novos empregos, provavelmente terão que compartilhar as amostras de trabalhos anteriores com os seus empregadores em potencial, e isso é difícil de fazer se o site que você estava trabalhando se foi. Mesmo se você não está procurando trabalho, pode querer provas, em alguns anos, de que produziu algo.
Felizmente para jornalistas que não tiveram a visão de estar guardando tudo o tempo todo (ou seja, a maioria de nós), surgiram algumas soluções.
Save My News, lançado este mês por Ben Welsh, editor da equipe do Data Desk em Los Angeles Times, permite que jornalistas (cerca de 300 até agora) salvem seus links no Internet Archive e WebCite. Você pode baixar todos os clipes e arquivos de links como uma planilha do Excel.
Welsh criou a ferramenta em 6 de novembro, dois dias após do fechamento do DNAinfo. "Nas mídias sociais, vi muitos dos meus colegas entrarem em pânico e ficarem indignados", disse ele. "Parecia uma oportunidade poderosa para aumentar a consciência das pessoas sobre a fragilidade do seu trabalho: que todo o jornalismo ao qual dedicam tanto esforço pode desaparecer da internet, num instante". Serviços que guardam o seu trabalho não são novos, Welsh apontou. O Internet Archives possui ferramentas que permitem que jornalistas preservem seu trabalho, mas muitas pessoas simplesmente não as conhecem. "Então, muitas pessoas que trabalham profissionalmente na internet realmente não sabem que seu trabalho é frágil até ser tarde demais", disse Welsh. "E nem precisa ser um proprietário malvado de site que o faça perder o seu legado; pode ser apenas um redesign do site."
Welsh planeja integrar mais serviços de arquivamento no Save My News, mas ele pretende manter o serviço simples: "Eu estou hospedando-o gratuitamente no Heroku, e não há qualquer modelo de negócio ligado a isso. Estou tentando evitar ampliar demais o alcance."
Parker Higgins, diretor de projetos especiais no Freedom of the Press Foundation, fez uma chamada no Twitter para trabalhar com jornalistas do Gothamist e DNAinfo para preservar seu trabalho quando parecia que os sites iam ser completamente fechados e os arquivos teriam que ser recompilados através de serviços como o Internet Archive. Ele começou a escrever o código para fazer isso, mas então os sites voltaram online e ele pôde fazer uma ferramenta mais robusta, mais rápida que permite que as pessoas arquivam todo o seu trabalho publicado nesse sites em PDF em poucas horas.
A ferramenta, “Gotham Grabber”, está disponível agora com código de fonte aberta no Github. “Com algumas alterações, muitos jornalistas podem usar essa ferramenta para criar uma versão arquivada de todo seu portfólio", escreveu Higgins. Isso requer um pouco de conhecimento sobre codificação - e "a maioria dos jornalistas com quem eu falei trabalhando nesses lugares não são programadores," Higgins disse. "Mas espero ver esse código adaptado em outros sites". Ele agora resgatou mais de 50.000 artigos, cada um como um PDF.
Gotham Grabber guarda o trabalho como PDF porque a maioria dos jornalistas que entraram em contato com Higgins queria assim. "Quando você possui um portfólio e está enviando um anexo para um novo emprego, o PDF é o formato preferido. Há maneiras melhores de arquivar, quando se trata de arquivamento para leitores ou preparação para armazenamento de longo prazo, e, em última instância, essas páginas são destinadas a ser HTML e servidas a partir de um banco de dados", Higgins explicou."Eu espero que isso leve as pessoas a pensar sobre armazenamento e acesso a um prazo mais longo. Quero dizer, alguns sites, como o Gothamist e DNAinfo, estão entre os poucos que registram eventos locais."
Se você preferir configurar e esquecer, há o Authory, um serviço lançado em versão beta no ano passado (com uma bolsa da Google Digital News Initiative, com sede em Hamburgo) e em seguida, uma versão para o público no meio do ano. (Eu comecei a usar o Authority de graça em troca de fornecer feedback quando estava em beta). Eric Hauch, seu fundador e CEO, trabalhava para o Axel Springer e Financial Times Deutschland quando começou a pensar que não era fácil o suficiente descobrir quando seus jornalistas favoritos publicavam novas matérias.
Quando ele começou a conversar com outros jornalistas sobre uma ferramenta que pudesse ajudar com isso, "eles disseram que não tinham só problemas atualizando seus leitores. Eles também tinham problemas para acompanhar seus próprios artigos. Fazia muito sentido combinar essas coisas novas". Após a configuração inicial, o Authory faz backup de todos os artigos de um jornalista (independentemente do site em que são publicados) e também permite que os leitores "assinem" os jornalistas, para que possam receber notificações por e-mail quando algo novo é publicado. (O Muck Rack for Journalists desempenha uma função semelhante no lado da notificação, mas não faz backup do trabalho dos jornalistas". O Byliner ofereceu uma função semelhante ao jornalista.) "A ideia de criar backups para os jornalistas era basicamente algo secundário, mas agora é o centro do que fazemos", disse Hauch.
O teste de duas semanas é gratuito e, depois disso, o serviço custa US$7 por mês ou US$70 por ano. O Authory está em estágios muito iniciais; neste momento, tem menos de 1.000 usuários ativos, principalmente nos EUA e Reino Unido. Pode raspar conteúdo de sites com paywalls leves e medidos, bem como alguns sites com paywalls difíceis como o Wall Street Journal quando os jornalistas fazem o login. No futuro, o serviço irá lidar com paywalls mais difíceis.
Os usuários podem acessar o texto completo de seus artigos em sua página no Authory ou enviar um e-mail para hello@authory.com para solicitar a exportação de alguns ou todos seus artigos como arquivo XML ou HTML. No futuro, eles poderão baixar seus arquivos com um único clique e também baixar PDFs específicos.
Isso significa que "você não precisa confiar em nós para sempre", disse Hauch. "Algumas pessoas têm um pouco de medo que fecharemos, o que não pretendemos fazer". Mas, bem, esta é a internet, e você nunca sabe.
Este artigo foi publicado originalmente no Nieman Lab e é reproduzido na IJNet com permissão.
Imagem sob licença CC no Flickr via Marcin Wichary