Como fazer uma pesquisa profunda na Web

porSandra Crucianelli
May 16, 2012 em Diversos

Enquanto a busca do Google é a primeira ferramenta que a maioria dos repórteres usa quando pesquisa uma história, há uma riqueza de informação na chamada "Web profunda", que não é indexada pelos motores de busca como o Google e o Bing. Repórteres podem descobrir estas informações para dar furos que ninguém mais tem.

Uma outra área ainda mais profunda na Web é definida por alguns como a "Internet escura", impenetrável por sua natureza, situada dentro de servidores seguros que são protegidos por uma variedade de razões (segurança nacional ou fins militares), cujo conteúdo é isolado e privado de pesquisas.

No entanto, grande parte da Web profunda é mais acessível do que pensamos. Aqui, jornalistas empreendedores podem encontrar documentos que não tenham sido armazenados em uma estrutura de HTML, incluindo PDF, Excel, PPT (Power Point), Flash e extensões usadas pelo Google Earth.

Dicas para jornalistas:

  • Se você quiser explorar um site, comece com uma operação simples: explore o mapa do site, uma prática bastante incomum que pode servir como uma bússola e guia na sua pesquisa.

  • Aprenda a usar o recurso de pesquisa avançada em todos os motores de busca, incluindo a pesquisa avançada do Google.

    1. Tente restringir a pesquisa por cidade para encontrar novas informações. Digite o nome da sua cidade ou da cidade sobre a qual você deseja obter informações em qualquer um dos dois primeiros campos. Se a pesquisa é sobre Bogotá, por exemplo, use o primeiro campo "todas estas palavras" e se é Buenos Aires, use o segundo campo, "esta palavra ou frase exata", pois é um nome composto.

    2. Limite os resultados pelo período de tempo mais recente: por exemplo, na semana passada ou nas últimas 24 horas. Da mesma forma, de acordo com o tipo de informação que você deseja encontrar, deve decidir o formato, por exemplo, Excel, em que você terá uma maior chance de encontrar quadros de estatística ou custos de desenvolvimento.

    3. Use a restrição de domínio para localizar informações em sites do governo, acrescentando apenas o nome do site (como "wikipedia.org") ou usando apenas a última parte do domínio, por exemplo "gov.ar" para sites na Argentina.

    4. Embora você possa fazer isso usando o recurso de busca avançada, também pode usar a ferramenta "tempo" na coluna esquerda do Google para encontrar links mais recentes, como de informação publicada na última hora.

    5. Saiba como realizar buscas avançadas usando outros motores de busca, como o Bing.

Esta é a primeira parte de uma série sobre como encontrar informação na Web profunda.

Sandra Crucianelli é bolsista do programa Knight de Jornalismo Internacional, uma jornalista investigativa e instrutora, com especialização em recursos digitais e jornalismo de dados. Ela é a fundadora e editora da Sololocal.info, uma revista online que fornece notícias hiperlocais de Bahía Blanca, Argentina.

Imagem usada com licença CC via Danard Vincente on Flickr