Ferramentas de inteligência artificial para melhorar qualidade de áudio

por Laine Cibulskis
Apr 25, 2023 em Jornalismo multimídia
Women with headphones editing audio files on her laptop.

Seja você um jornalista que trabalha com áudio, apresentador de podcast ou alguém que precisa gravar entrevistas em áudio para reportagens em algumas poucas ocasiões, há chances de você se deparar com um dos muitos (senão todos) obstáculos a um áudio limpo: latidos de cachorro, ruídos de trânsito, vento soprando, zumbido de ar condicionado, obras, dentre outros. 

Neste mês, a série Innovation in Focus testou quatro serviços diferentes de inteligência artificial (IA) para edição de áudio para ver como eles limpam imperfeições de áudio em diferentes situações.

 

recorder

 

Usamos um gravador da marca Zoom e um microfone de mão para fazer gravações que incluíam:

  • Ruído ambiente
  • Vento
  • Conversas de fundo
  • Barulho da rua
  • Interrupções aleatórias

Editamos todo o áudio produzido com o Adobe Audition, depois exportamos trechos específicos para as ferramentas testadas: Adobe PodcastAudo StudioDescript e Auphonic

Resultados

 

Chart

 

Se você está em busca da opção mais eficaz com o mínimo de resíduos de processamento, o Adobe Podcast é a melhor aposta. Ele também permite mais uploads gratuitos, com três horas de gravações diárias para melhoramento grátis.

O Audo Studio foi a segunda ferramenta mais eficaz, mas o áudio não ficou 100% limpo após a aplicação das melhorias.

Tanto o Descript quanto o Auphonic precisam ser aprimorados, mas se você tiver interesse, tente subir os seus áudios para alguns (ou todos) esses serviços para ver se eles atendem suas necessidades.

Detalhes da performance dos serviços para cada problema no áudio

Ruído ambiente

Mesmo que o ruído no ambiente não seja tão perceptível, deixar o áudio com uma qualidade próxima à de estúdio pode ajudar os ouvintes a focarem mais no conteúdo, e não no zumbido irritante de fundo. 

O melhor serviço para reduzir ruído ambiente foi o Adobe Podcast. Ele deixou minha voz mais alta que o restante do trecho de áudio em um esforço para suprimir os ruídos do ambiente, mas também conseguiu reduzir os ruídos. Pode ser que você precise fazer mais edições em programas como o Audition para equilibrar os níveis de volume.

O volume da minha voz foi preservado com o Audo Studio, mas quase no fim do trecho de áudio ela começou a soar um pouco processada demais. Mais além no espectro de processamento excessivo está o Descript, que deixou minha voz eletrônica e granulosa, o equivalente em áudio para a pixelização. 

O áudio processado pelo Auphonic pareceu normal, mas o recurso de redução de ruídos não funcionou bem de fato para reduzir o barulho de fundo, já que ainda era possível ouvir algumas vozes em segundo plano. 

Vento

O Adobe Podcast se saiu melhor com o barulho de vento. O volume da minha voz ficou equilibrado e o som do vento simplesmente sumiu.

O Audo Studio teve um resultado parecido, mas ainda reteve certa granulação (uma imprecisão que torna o áudio difícil de entender). O Descript fez um bom trabalho na eliminação do vento, mas o resultado final da voz continuou sendo uma voz que soa eletrônica. Por fim, o Auphonic suavizou ligeiramente o barulho do vento, mas ele continuou perceptível.

Conversas de fundo

Conversas de fundo podem muitas vezes ser um obstáculo para envolver o ouvinte, mas se você não consegue gravar em um lugar tranquilo, o Adobe Podcast pode ajudar. Ele fez um trabalho fenomenal de remoção das conversas de fundo ao mesmo tempo em que reteve a autenticidade da voz. 

O Audo Studio suavizou as conversas (tornou-as menos audíveis), mas o resultado final deixou um sussurro estranho de fundo. O Descript teve o mesmo problema de antes, deixando a voz com um som eletrônico, e o Auphonic, mais uma vez, falhou em reduzir substancialmente o ruído de fundo.

Barulho da rua

O barulho da rua é o melhor exemplo de distração: sons aleatórios constantes como obras, carros passando, pessoas conversando, buzinas — tudo isso sem praticamente nenhuma previsibilidade. O Adobe Podcast atenuou bastante o barulho, com apenas um leve ruído de obra audível próximo do fim.

Mais uma vez, o Audo Studio também atenuou o barulho, mas assim como nos outros testes, o áudio final ficou com a mesma granulação. Mas essa granulação nem chega perto do que faz o Descript que, mais uma vez, automatizou minha voz de um jeito artificial.  

E como ocorreu com os outros testes feitos com o Auphonic, o barulho da rua permaneceu no áudio mesmo após o processamento.

Interrupções

Por último, o barulhento e imprevisível: você está gravando áudio em um ambiente que pensa ser tranquilo, mas um barulho inesperado (como uma porta fechando) interrompe a gravação. 

Este teste foi o mais revelador do poder de algumas dessas ferramentas. A capacidade do Audo Studio de remover a batida da porta no meio de uma frase minha foi realmente incrível. Mesmo assim, a tecnologia ainda não chegou lá totalmente. Apesar do Audo Studio ter identificado e mutado a interrupção, o áudio ficou com processamento excessivo, mais até do que de outros trechos de áudio tratados pelo próprio Audo Studio. 

Quanto aos outros serviços, o Adobe Podcast reduziu ligeiramente o barulho da porta, mas ainda era possível ouví-lo. O Descript manteve seu histórico de processamento granular, e a batida da porta continuou audível. Por fim, o Auphonic não mudou quase nada: minha voz soava normal, assim como a batida de porta que a abafava.

Recursos adicionais

Além do poder dos filtros de edição, há mais recursos em cada uma das ferramentas que você pode usar para necessidades específicas. A seguir estão alguns recursos adicionais que cada ferramenta oferece para te ajudar a identificar aquela que funciona melhor para você.

 

Chart

 

Este experimento usou um gravador da marca Zoom e um microfone de mão. Se o seu veículo está começando a trabalhar com áudio, essas ferramentas podem não ser acessíveis de imediato. O áudio gravado com fones de ouvido provavelmente não vai focar tão bem na voz quanto um gravador Zoom, o que vai aumentar os ruídos de fundo e interrupções. Mas use o que você tiver — pode ser que essas ferramentas de IA para melhoria de áudio te ajudem.


Este artigo foi originalmente publicado pelo Reynolds Journalism Institute da Universidade do Missouri. 

Foto por Soundtrap via Unsplash.