البودكاست والذكاء الاصطناعي

byعبد الكريم عويرOct 11, 2024 in موضوعات متخصصة
الصورة الرئيسية مُولدة بالذكاء الاصطناعي بواسطة Chatgpt4.

برزَ الحديث عن الذكاء الاصطناعي وأدواته في المواقع الإلكترونية والنشرات البريدية ومواقع التواصل الاجتماعي، وزادَ البحث في مدى استفادة الصحفيين منه، وما إذا كان يشكّل خطرًا على عملهم أيضًا.

في هذا الإطار، يمكن التفكير بالذكاء الاصطناعي باعتباره أداة مهمة يمكنها مساعدتنا في أعمالنا، فـChat GPT وغيرها من الأدوات المهمة التي سنتطرق لها في هذا المقال، يمكنها أن تكون مساعدًا لنا لننجز الأعمال بشكل أسرع، إذا امتلكنا القدرة على تطويعها.  

في الماضي، كان يجب أن يقضي منتجو الأفلام الوثائقية ومعدو برامج البودكاست ساعات طويلة لتفريغ كلام الضيف، واختيار القطعة المناسبة من الصوت التي تخدم الحلقة التي يعملون عليها، ثمّ إدراج النصوص، إلى أن بدأت تظهر أدوات الذكاء الاصطناعي القادرة على تحويل الأصوات إلى مواد مكتوبة. 

من ضمن الأدوات الأكثر كفاءة في هذا المجال، التي عملتُ عليها لفترة طويلة، ضمن البرامج التي قدمتها في بودكاست الجزيرة وغيره، هي أداة Trint وهي فعالة، تقوم على تحويل الأصوات لنصوص مكتوبة. كما تدعم اللغة العربية الفصحى بشكل جيد. أما بخصوص اللهجات العامية، فإنها تواجه صعوبة في فهمها.  شاهد الفيديو.

وبالطبع فإن هذه الأداة ليست الوحيدة، هناك منصة تحول الصوت إلى نص أثناء عملية الإلقاء مباشرة، بدون الحاجة لرفع الملفات، وهي Descript لكنها لا تدعم اللغة العربية بعد. الأمر لا يتوقف هنا، فلنفترض أنك صانع البودكاست (أو المدونة الصوتية) وتريد أن تضيف بعض الكلمات من اللغة الأوكرانية التي لا تجيدها إلى البودكاست الخاص بك، يمكنك الآن أن تقوم بكتابة النصوص التي تريد من القارئ الآلي أن يقرأها بصوت وجودة عالية، فيقوم الذكاء الاصطناعي بترتيب الأمر ببضع دقائق فقط. شاهد الفيديو.

لهذا الأمر، يمكن استخدام أداة فويسر التي تقوم بتحويل النصوص إلى كلام بأكثر من ٥٠ لغة و٤٠٠ صوت مختلف يمكنكم الاختيار منها.

المنافس الحقيقي لفويسر هو تطبيق 11lab القائم على أساس تحويل النصوص للصوت أيضًا، ويعدّ أداة فعالة تتيح لك أن تبرمج صوتك من خلال تدريب تقنيات الذكاء الاصطناعي ليقوم بالتحدث وكأنه أنت. كما يتيح لك الموقع استخدام عدد كبير من الأصوات المدربة على التطبيق، لتتعامل معها بدون الحاجة لتسجيل صوتك في الموقع.  

وفيما يلي الميزات التي ستغنيكم عن كثير من الأمور الأخرى فلدى منصة Adobe اليوم ثلاث خدمات أساسية.  

١- Mic Check - وهي أداة تمنحك القدرة على تحديد ما إذا كان الميكروفون المستخدم جيدًا للتسجيل وبعيدًا عن فم المتحدث وقادرًا على التقاط الإشارة بشكل واضح.  

٢- تخيل أنك احتجت للتسجيل في ظروف صعبة، لم يكن لديك عازل للصوت بشكل جيد، كانت هناك بعض الضوضاء في الخلفية، أو أنّ صدى الصوت يغطي على بعض الكلمات، هنا وفرت شركة Adobe برنامجها Enhance Speech لتنقية الصوت.  

٣ - أما الخاصية الثالثة، التي يحتاجها كل من يدخل عالم البودكاست اليوم، فهي الخاصية الجامعة للتسجيل، والإنتاج ومنتجة الحلقات كاملة من الألف إلى الياء، وهذه الخاصية التي أسمتها Adobe باسم Studio تمكن المستخدم من تسجيل وتحرير الحلقة كاملة داخل صفحة ويب واحدة.  

في النهاية، لا يمكن لأي منتج صوتي، أو غير صوتي أن يكون ممتعًا بلا موسيقى نبدأ بها المقطع الصوتي، أو نستخدمها لخدمة المادة التي نعمل عليها، ولكن الموسيقى، ليست بالأمر السهل. 

ويمكن الاستعانة بأداة MusicLM، حيث تكتب نوع الموسيقى الذي تود الحصول عليه، ثم تقوم بتأليف مقاطع موسيقية متكاملة تصلح لاستخدامها في منتجاتك الرقمية وليس لها أي حقوق تعيق نشرها.  

وبالحديث عن الموسيقى، لا يمكننا أن نتجاوز الأداة الجديدة المعتمدة على الذكاء الاصطناعي، وهي أداة LALA الشهيرة التي تمكننا من فصل محتوى المقطع الصوتي عن بعضه البعض. 

الصورة الرئيسية مُولدة بالذكاء الاصطناعي بواسطة Chatgpt4.