أدوات الذكاء الاصطناعي تساعدك على تحسين جودة الصوت

بواسطة Laine Cibulskis
May 5, 2023 في الصحافة متعددة الوسائط
 امرأة ترتدي سماعات الأذن تحرر ملفات صوتية على حاسوبها

سواء كنت صحفيًا متخصصًا في الصوتيات أو تقدم بودكاست أو تسجل المقابلات الصوتية للقصص في المناسبات، من المحتمل أنك واجهت مشكلة في تنقية الصوت، مثل صخب حركة المرور، أو الرياح، أو الطنين في الخلفية من وحدات التكييف، وأعمال البناء وغيرها.

وفي هذا الشهر، اختبرت Innovation in Focus، أربع خدمات مختلفة لتحرير الصوت باستخدام الذكاء الاصطناعي لمعرفة كيف تُنقي الأصوات في المواقف المختلفة.

 

recorder

سجلنا الصوت عبر جهاز تسجيل زووم، وميكروفون محمول باليد، واحتوت الأصوات على:

  • ضوضاء الغرفة.
  • الرياح.
  • أصوات ثرثرة في الخلفية.
  • ضوضاء الشارع.
  • مقاطعات عشوائية.

وقمنا بتحرير جميع ملفات الصوت باستخدام أدوبي أوديشن Adobe Audition، ثم حفظنا ملفات الصوت في الأدوات التي اختبرناها وهي أدوبي بودكاست Adobe Podcast، وأودو ستوديو Audo Studio، وديسكريبت Descript، وأوفونيك Auphonic

النتائج

 

Chart

 

إذا كنت تبحث عن الخيار الأكثر فعالية الذي يقدم الحد الأدنى من رواسب المعالجة، سيكون Adobe Podcast هو خيارك الأفضل، كما أنّه يقدم أكبر عدد من عمليات التحميل المجانية، ويتيح ثلاث ساعات من التحسين المجاني يوميًا.

وكان Audo Studio ثاني أفضل الأدوات فعالية، ولكن لم يكن الصوت نقيًا بنسبة 100٪ بعد التحسين.

وبإمكان Descript وAuphonic استخدام بعض التحسينات.

وإليك بعض التفاصيل بشأن الصوت

ضوضاء الغرفة

على الرغم من أنّ الطنين في الغرفة لم يكن ملحوظًا، إلا أنّ الوصول بملف الصوت ليكون أقرب لجودة الصوت المسجل في الاستوديو بإمكانه مساعدة المستمعين على التركيز أكثر على المحتوى، وليس على صوت الطنين المزعج في الخلفية.

وكانت أفضل خدمة لتقليل ضوضاء الغرفة هي المُقدمة من Adobe Podcast، إذ جعلت صوتي أعلى بكثير من بقية الملف الصوتي في محاولة للتغلب على ضوضاء الغرفة، ولكن قلل التحسين أيضًا من ضوضاء الغرفة، وربما ستحتاج لإجراء بعض التعديلات الإضافية باستخدام تطبيق مثل أوديشن Audition لموازنة مستويات الصوت.

وتمّ الحفاظ على مستوى صوتي عند استخدام Audo Studio، ولكن بالقرب من نهاية هذا الجزء بدأ الصوت يبدو أنه تمت معالجته بمبالغة قليلًا، كما أنه بالنسبة لنطاق المعالجة الزائدة، جعل Descript صوتي آليًا ومشوشًا.

وبدا الصوت في Auphonic طبيعيًا، ولكن لم تعمل خاصية تقليل الضوضاء جيدًا فيما يتعلق بتقليل ضوضاء الخلفية، إذ ما زال بإمكانك سماع أصوات قليلة في الخلفية.

الرياح

كان Adobe Podcast الأفضل فيما يتعلق بضوضاء الرياح، إذ كان مستوى صوتي متوازنًا، واختفى صوت الرياح.

والوضع كان مشابهًا مع Audo Studio، ولكن احتفظ ببعض التشويش (وهو الضبابية الذي تُصعب من فهم الصوت)، بينما قدم Descript أداءً عظيمًا في القضاء على الرياح، ولكن أنتج ملفًا صوتيًا يبدو آليًا. وفي النهاية، خفف Auphonic من صوت الرياح قليلًا، ولكنه بقيَ ملحوظَا. 

أصوات الثرثرة في الخلفية

غالبًا ما قد تشكل الثرثرة حاجزًا للمستمع المتفاعل، ولكن إذا عجزت عن الذهاب إلى مكان هادئ، بإمكان Adobe Podcast تقديم المساعدة، إذ قدم أداءً عظيمًا في إزالة أصوات الثرثرة من الخلفية مع الاحتفاظ بأصالة الملف الصوتي.

وقلّل Audo Studio من الثرثرة، ولكن النتيجة خلفت همسًا غريبًا في الخلفية. وكان لدى Descript نفس مشكلة الصوت الآلي السابقة، وفشل Auphonic مجددًا في تقليل ضوضاء الخلفية إلى حد كبير.

ضوضاء الشارع

تُعد ضوضاء الشارع المثال الأفضل للإلهاء، وهي أصوات عشوائية متواصلة مثل أعمال البناء، وطنين السيارات، ومحادثات الناس، وأبواق التزمير، وجميعها لا يمكن التنبؤ بحدوثها تقريبًا. وبالنسبة لـAdobe Podcast، فقد قلّل ضوضاء الخلفية بدرجة كبيرة، وبقيَ صوت خافت من ضوضاء أعمال البناء مسموعًا بالقرب من النهاية.

كما أخمد Audo Studio من الضوضاء، ولكن كما هو الحال في الاختبارات الأخرى، أُضيف نفس التشويش في الملف الصوتي، ولكن هذا التشويش لا يُقارن بأداء Descript، الذي جعل صوتي آليًا مجددًا بطريقة غير طبيعية.

وكما حدث مع الاختبارات الأخرى لـ Auphonic، ظلت ضوضاء الخلفية في الملف الصوتي حتى بعد المعالجة.

المقاطعات

وأخيرًا، هناك الصوت المرتفع وغير المتوقع: وهو عندما تقاطعك أو تقاطع صوت مصدرك ضوضاء غير متوقعة (مثل غلق باب) أثناء تسجيلك صوتًا فيما تعتقد أنّها بيئة هادئة.

وكان هذا الاختبار الأكثر دلالة على قوة بعض هذه الأدوات: فقد كانت قدرة Audo Studio على الإزالة الكلية لإغلاق باب في منتصف جملتي مذهلة للغاية. ولكن لا تزال التكنولوجيا غير متمكنة من الأمر بقوة، فحتى مع تحديدAudo Studio  للمقاطعة وكتمها، كان الصوت لا يزال معالجًا بدرجة مفرطة، أكثر حتى من المقاطع الصوتية الأخرى التي تمت باستخدام Audo Studio.

أما بالنسبة للخدمات الأخرى، قلّل Adobe Podcast من صوت الباب قليلًا، ولكن كان لا يزال ملحوظًا، بينما احتفظ Descript بسجله الحافل من المعالجة المشوشة وكان لا يزال صوت إقفال الباب مسموعًا، وفي النهاية، لم يُغير Auphonic الصوت كثيرًا على الإطلاق، إذ بدا صوتي طبيعيًا، وكذلك صوت صفعة الذي يطغى عليه.

الخصائص الإضافية

وبالإضافة إلى قوة المرشحات لتحرير الصوت، هناك خصائص أخرى يمكنها أن تضيف إلى الأداة التي تستخدمها لاحتياجات معينة. ونقدم بعض الخصائص الإضافية التي توفرها كل منصة أو أداة لمساعدة الصحفيين في إيجاد أفضل منصة تناسبهم.

 

Chart

 

استخدمت هذه التجربة جهاز تسجيل زووم Zoom وميكروفونًا محمولًا باليد، وإذ كانت الوسيلة الإعلامية التي تعمل فيها قد بدأت للتو في استخدام الصوت ربما لا تتمكن من الوصول لهذه الأدوات على الفور. ومن المرجح ألا يركز الصوت المسجل عبر الهاتف أو سماعات الأذن أو جهاز تسجيل زووم Zoom على الصوت، مما يزيد من ضوضاء الخلفية والمقاطعات. وفي نهاية الأمر استخدم المتاح لديك، وربما بإمكان مُحسِّن صوتي يعمل بتقنية الذكاء الاصطناعي المساعدة في العمل.


نُشرت هذه المقالة في الأصل على معهد رينولدز للصحافة بجامعة ميسوري.

الصورة حاصلة على رخصة الاستخدام على أنسبلاش بواسطة Soundtrap.