Por que jornalistas devem aprender sobre metadados

porMariano Blejman
Nov 12, 2013 em Diversos

Agora que sabemos que o Dropbox bisbilhota em nossos arquivos e que o Google compartilha nossos dados com a NSA e FBI, jornalistas devem adquirir novas habilidades para evitar deixar vestígios ou que rastreiem suas fontes anônimas.

Os dados sobre os nossos dados são chamados "metadados". São gerados toda vez que deixamos um registro eletrônico. Toda foto que tiramos terá dados sobre a câmera, quando foi tirada e provavelmente o nome da pessoa --se geolocalização e detecção de rosto estão ativados no dispositivo. Dessa maneira, tirar uma foto agora é muito mais do que apenas uma foto. Ela traz informação sobre si mesma.

Durante o Media Party desse ano, organizada pela Hacks/Hackers Buenos Aires, Daniel Foguelman da empresa de segurança Infobyte, liderou um workshop sobre como descobrir e limpar metadados. No workshop, Foguelman ensinou jornalistas como descobrir e remover informações de pdfs, jpgs e htmls, evitar deixar informações para trás involuntariamente.

Toda vez que enviamos documentos, além de enviarmos o conteúdo do documento, estamos enviando informações sobre a máquina que os processou e o sistema operacional. Se o software é registrado, com certeza você vai encontrar o seu nome na janela de propriedades. Quando enviamos um e-mail, não estamos apenas enviando o nosso conteúdo e recipiente. Coletivamente, nós também revelamos padrões na forma como interagimos com a sociedade e com os outros.

Parte disso é o que comprovou o experimento Immersion na MIT, que visualizou o conteúdo de contas do Gmail a fim de encontrar padrões em comunicação e comportamentos.

Os pesquisadores do MIT se inspiraram no caso de Edward Snowden, que nos mostrou a importância do rastreamento de metadados de inteligência pelos Estados Unidos. Basicamente, como já foi escrito muitas vezes, quando você se comunica pelo Gmail --que tem acesso a esses dados-- pode aprender rapidamente sobre os grupos dos usuários, relações, amigos, contatos, enfim, tudo o que é inferido a partir do comportamento de nossos dados.

Na conferência do Knight-MIT Civic Media, no final de junho, na entrada do Media Lab, havia um telão mostrando os dados de quem ousou compartilhar os seus nomes de usuários e senhas simplesmente para a exibição, que mostrou como uma máquina pode deduzir rapidamente relacionamentos.

Documentos de jornalistas produzem metadados e todos esses dados, que não estão no conteúdo, deixam rastros. Documentos judiciais têm metadados: o número do julgamento, o nome do juiz, o título e número de páginas. Mas não podemos viver sem metadados. Não podemos enviar um e-mail sem saber para onde ele vai ou tirar uma foto sem saber qual câmera foi utilizada. Não podemos falar no celular sem o sistema saber onde estamos.

Metadados, é claro, também podem ser uma fonte de informação para o jornalismo investigativo: uma maneira de obter uma mensagem anônima, uma maneira de conectar pistas. No MIT, durante uma maratona hacker organizada pela Knight-Mozilla Open News, Waldo Jaquith do State Decoded e Chase Davis do New York Times conduziram um projeto chamado Judgmental.

A ideia foi analisar os textos legais que estavam em formato PDF, encontrar automaticamente os metadados, criar uma API e consultar os documentos de forma interativa. Os participantes da hackatona construíram o protótipo em dois dias. Eles descobriram uma maneira de encontrar documentos do estado com metadados que podem ser utilizados por pesquisadores legais, com base na busca das marcas dos documentos.

Remover tantos metadados ao realizar uma investigação jornalística é uma tarefa difícil e complicada. A melhor maneira de fazê-lo é o de investigar a si mesmo.

Então, comece a olhar para o que você está deixando para trás. Procure seu nome no Google, olhe para a seção "info" quando você está escrevendo ou editando documentos; tente entender como as outras pessoas podem acessar seus dados; abra suas imagens em computadores diferentes e tente entender o que estas estão dizendo sobre você.

Mariano Blejman, bolsista do Knight Internacional Journalism Fellowship, é um editor e empreendedor de mídia especializado em jornalismo de dados.

O conteúdo de inovação de mídia global relacionado aos projetos e parceiros do ICFJ Knight International Journalism Fellowship na IJNet é apoiado pela John S. and James L. Knight Foundation.

Imagem do site Immersion