Dicas e ferramentas para fazer investigações forenses de áudio

Jun 13, 2025 em Jornalismo investigativo
A woman reviewing audio files on her computer

Determinar a autenticidade de gravações de áudio e verificar o conteúdo das mesmas é fundamental para jornalistas que fazem investigações. Mesmo assim, a análise forense de áudio é frequentemente subutilizada e pode ser difícil de se realizar devido a desafios impostos por inconsistências nos sons de um ambiente, distorção de áudio, entre outros.

"É difícil verificar o que você não consegue ver, já que a regra de evidência sempre se baseou na visão, no tato e no toque. Isso torna a verificação de deepfakes de áudio um desafio para jornalistas", explicou Silas Jonathan, chefe de investigações digitais no Centre for Journalism Innovation and Development, durante um webinar da Rede Global de Jornalismo Investigativo, em abril.

Às vésperas da eleição presidencial de 2023 na Nigéria, Jonathan usou o AI Voice Detector para desmascarar o áudio de uma conversa entre o candidato do Partido Trabalhista, Peter Obi, e o superintendente-geral da Igreja Fé Viva, David Oyedepo. Na gravação, que circulou nas redes sociais, Obi descrevia a eleição como uma guerra religiosa. Muitas pessoas acharam, erroneamente, que a conversa era real. Em um país profundamente enraizado na diversidade religiosa, isso poderia causar medo, raiva e violência. "Não era Obi, era um deepfake gerado com IA", disse Jonathan.

Para jornalistas interessados em aprimorar suas próprias investigações, a seguir estão orientações de especialistas forenses e sugestões de ferramentas relevantes. 

(1) Tenha em mente que pode haver manipulação de áudio e saiba como identificar inconsistências

Primeiramente, jornalistas precisam estar cientes de que pode haver manipulação de áudio e que deepfakes existem, disse Jonathan. 

"Jornalistas devem ter o senso crítico para serem capazes de identificar lacunas em áudio adulterado", disse. "Quando você ouve um áudio de deepfake, a pronúncia do gerúndio é sempre instável; você consegue perceber que não é humano. Mas pode achar que é original se não ouvir com atenção."

Observe quaisquer pausas ou gaguejos que não pareçam naturais, pois isso pode indicar um áudio deepfake. "Se o padrão de fala da voz muda de repente ou se há pausas longas entre palavras que não são típicas da fala natural daquela pessoa, pode ser um sinal de deepfake."

Se você estiver familiarizado com a voz em questão, você pode compará-la com gravações verificadas. "Você pode identificar diferenças súbitas na voz, como tom ou sotaque, que não estão presentes no deepfake", disse Jonathan. "Você também pode considerar o contexto da conversa; se o tópico ou estilo parecerem incomuns ou incondizentes com a pessoa, pode ser sinal de deepfake."

(2) Autentique as gravações

Sempre autentique os áudios usados em suas investigações para assegurar que ele não foi editado ou manipulado. Saber a origem do material ajuda a garantir a confiabilidade da evidência em áudio. 

"Verifique se as gravações foram ou não editadas ou se algo foi adicionado. Se algo tiver sido acrescentado, muito provavelmente você vai achar interrupções irregulares na interferência eletromagnética", disse Lawrence Abu Hamdan, fundador e diretor de investigações na Earshot, durante um webinar do Wits Centre for Journalism. 

A Earshot é uma organização que usa análise forense para realizar investigações em áudio focadas em direitos humanos e defesa do meio ambiente. Ela também capacita jornalistas em temas como análise balística de áudio, perfilagem sônica de aeronaves, entre outros.

(3) Conte com a colaboração de especialistas em tecnologia

Jornalistas devem fazer parcerias com especialistas em tecnologia com conhecimento em análise forense de áudio. Softwares da área normalmente exigem conhecimento técnico e são caros, dois desafios para os usuários.

"Alguns funcionam com base em código, o que pode ser difícil para jornalistas que não têm a capacidade técnica", diz Allan Cheboi, especialista em análise forense digital no Centre for Information and Data Analysis. "Trabalhar com quem tem experiência pode te ajudar a entender a composição do áudio e facilitar seu trabalho."

A Earshot, explicou Hamdan, faz parte da Deepfake Rapid Response Force, que conecta verificadores de fatos e jornalistas com especialistas em análise forense de mídia, síntese de IA e deepfakes a fim de fornecer uma investigação exaustiva de conteúdos suspeitos de terem sido gerados ou manipulados com o uso de IA.

(4) Aperfeiçoe-se

Para realizar investigações forenses de áudio, jornalistas devem se familiarizar com ferramentas especializadas. É preciso usá-las com um olhar crítico, tendo em vista que essas ferramentas podem cometer erros. "Sempre faça muitas comparações e ouça bastante a gravação antes de submeter o áudio a verificações por meio dessas ferramentas", aconselhou Jonathan.

Deve-se também aprender a programar e criar contas no GitHub e no Gitlab, que fornecem softwares gratuitos usados para análise forense de áudio, sugeriu Cheboi.

A seguir há uma lista de ferramentas para que jornalistas se familiarizem a fim de melhorar suas investigações que utilizam áudio.

Audacity

O Audacity, usado principalmente para gravações, também permite a análise de arquivos de áudio para identificar possíveis manipulações e melhorar a qualidade para uma análise mais clara. Assim como outras ferramentas desta lista, ele utiliza recursos como espectrogramas e medidores de nível para representar visualmente o áudio.

Custo: gratuito e de fonte aberta.

Adobe Audition

Esta ferramenta pode ser usada para comparar comprimentos de onda de um arquivo de áudio para determinar se uma gravação foi manipulada e para identificar inconsistências. Também melhora a qualidade do áudio para permitir sua análise.

Custo: assinatura mensal no valor de US$ 24,71.

Izotope RX

O Izotope RX é um software de reparação de áudio que remove ruídos de fundo e restaura áudios com algum tipo de dano.

Custo: há três planos — Element, Standard e Advanced —  com assinaturas custando US$ 19,99, US$ 399 e US$1.199, respectivamente.  

AI or Not

AI or Not é uma ferramenta de fonte aberta que pode detectar áudio gerado por IA e determinar se o conteúdo é falso ou não. 

Custo: a assinatura anual de US$ 5 dá direito a fazer cinco verificações.

AI Voice Detector

Esta ferramenta alimentada por IA detecta se o áudio é real ou gerado por IA. Ela também analisa vozes para identificar semelhanças e diferenças no tom, timbre e estilo de fala.

Custo: a assinatura mensal custa US$ 12,99. 


Foto por cottonbro studio via Pexels.