يتسابق الإعلاميون والأكاديميون لاكتشاف كيف سيُعيد الذكاء الاصطناعي تشكيل العمل الإعلامي، ويتساءلون "هل سيكون موردًا لغرف الأخبار ذات الإيرادات المتدنية؟ هل سيُلغي بعض الوظائف أم يمنح الصحفيين المثقلين بالعمل وقتًا لإنتاج قصص عالية الجودة؟".
ما هو الذكاء الاصطناعي؟ ما هي معالجة اللغة الطبيعية؟
في البداية، دعونا نوضح بعض التعريفات. يُشير الذكاء الاصطناعي إلى قدرة الآلات على أداء المهام المرتبطة عادة بالإدراك المعرفي والذكاء البشري. وفي السياق الصحفي، يُشير الذكاء الاصطناعي عادة إلى التطبيقات التي تحلل النص وتفهمه وتولده بدون تدخل بشري.
وتُعد معالجة اللغة الطبيعية مجموعة فرعية للذكاء الاصطناعي تركّز على التفاعل بين أجهزة الكومبيوتر والبشر من خلال اللغة الطبيعية، وجدير بالذكر أنّ "اللغة الطبيعية" تشير إلى اللغات التي يتحدثها البشر، مثل اللغة الإنجليزية، على عكس لغات البرمجة مثل بايثون.
ويعتمد الكثير من النقاش الذي يدور حول الذكاء الاصطناعي في الصحافة على قدرات معالجة اللغة الطبيعية. فمن خلال معالجة اللغة الطبيعية، يساعد الذكاء الاصطناعي الصحفيين على تلخيص المقالات، وترجمة المحتوى، وتعزيز المعلومات. وبشكل أساسي، أصبحت جميع تطبيقات الذكاء الاصطناعي التي تستخدم لغتنا اليومية ممكنة بفضل معالجة اللغة الطبيعية.
كيف طورنا أداة الذكاء الاصطناعي للصحفيين؟
في 2021، كنت جزءًا من فريق متعدد التخصصات يعمل على حل مشكلة استقصائية، وكنا نحاول تحليل معلومات مهمة من ملايين الصفحات من البيانات – النصوص – غير المنظمة، ومما زاد من صعوبة الأمر هو أننا كنا نعمل على نصوص بلغة غير الإنجليزية، وبدأنا في تجربة واجهة برمجة تطبيقات GPT-3، وهنا جاءتنا لحظة الإلهام التقنية.
وكان هذا الأمر قبل ظهور ChatGPT، وعندما كان الصحفيون يشككون بالذكاء الاصطناعي، وانشغلنا في إنشاء مستند إثبات المفهوم لإظهار قوة هذا الابتكار الجديد من OpenAI.
وبدأنا بتجربة مقالات NPR، وطورنا مُوْجِزًا لتحويلها إلى ملخصات سريعة، على غرار أسلوب مقالات Axios، واستخدمنا هذا الأسلوب بشكل رئيسي لأننا جميعًا أحببنا قصص NPR، ولكنها كثيرًا ما كانت طويلة. وتُلخص الأداة التي طورناها مقالات NPR بمجرد نشرها وتُتيحها على موقعنا Gist، بعد مراجعة صحفي للملخص وموافقته عليه.
وأدركنا في وقت مبكر، أنّ نموذجنا الأولي لم يكن دقيقًا عندما كانت الجمل أطول من سطرين، إذ ولّد الملخص بعض الاقتباسات التي كانت منطقية من الناحية السياقية والنحوية، ولكنها لم تظهر في مقال NPR الأصلي.
ويشير عدم الدقة في سياق معالجة اللغة الطبيعية إلى الحالات التي يولد فيها النموذج مخرجات تكون إما غير دقيقة، أو ليس لها أساس في البيانات المُدخلة، أو بلا معنى بشكل واضح. وفي حالتنا، كنا بحاجة للتأكد من أنّ الاقتباسات الموجودة في الملخص موجودة بالفعل في المقالات الأصلية، فالهلوسات في السياق الصحفي قد تكون قاتلة وتؤدي إلى ظهور المعلومات الخاطئة.
وبدأنا في إجراء التعديلات في النموذج لتحسينه، وكانت هذه عملية مكررة، إذ اضطررنا لتدريب النموذج وتجربته باستمرار، كما أضفنا المزيد من حواجز الحماية الصحفية للعملية، ومنحتنا هذه العملية بعض الدروس المستفادة لتطبيقات الذكاء الاصطناعي المستقبلية في الصحافة.
دروسنا المستفادة
لم يكن تدريب نموذج مع أخذ المعايير الصحفية في الاعتبار أمرًا سهلًا، ولكن هذا المسار الطويل أوضح أربع نقاط لنا:
1) إنّ إعداد التقارير بمساعدة الذكاء الاصطناعي أمر ممكن، ولكن إعداد التقارير بواسطة الذكاء الاصطناعي ليس كذلك، إذ لا يمكن إزالة الإشراف البشري من العملية الصحفية.
الحكم والموافقة البشرية جزء لا يتجزأ من أي عملية صحفية، وبينما يُمكننا استخدام التكنولوجيا لتتولى القيام بالمهام المملة والمكررة، إلا أنّه ليس بإمكان التكنولوجيا أن تحل محل الصحفيين بالكامل، فعلى سبيل المثال، يقرأ صحفي - في نموذجنا – كل ملخص ويوافق عليه قبل نشره.
2) نماذج الذكاء الاصطناعي تتحسّن بقدر التدريب، وللحصول على أفضل النتائج من أي نموذج لغة، ينبغي تحديد الغرض منه، ثم يُمكن تحديد أكثر مسار فعال للتدريب، وبعد ذلك يُمكن بدء العملية.
كما أنّ النماذج ليست حلًا واحدًا يُناسب الجميع، إذ ينبغي على غرف الأخبار أن تأخذ في الاعتبار تحدياتها ومتطلباتها الفريدة من نوعها أثناء استكشافها لحلول الذكاء الاصطناعي. ويجب على الصحفيين لعب دور نشط في تدريب الخوارزمية بدلًا من ترك الأمر للمطورين وحدهم.
3) التعاون متعدد التخصصات ضروري للذكاء الاصطناعي في الصحافة، ولا يُمكن للمطورين بمفردهم بدون الاستعانة بالصحفيين، التعامل مع مهام مثل تدقيق المعلومات، وتلخيص المحتوى، والترجمة، كما لا يستطيع الصحفيون القيام بذلك بمفردهم.
ونحن بحاجة لخلق مساحات تعاونية للصحفيين والمطورين ليعملوا معًا، والأهم من ذلك، ضمان مشاركة الصحفيين في اتخاذ قرارات بشأن كيفية استخدام الذكاء الاصطناعي في مهنتهم.
4) باستطاعة النماذج الحالية تحقيق أداء رائع باستخدام بيانات التدريب الصادرة من المؤسسة التي ينتمي إليها الفرد.
وتقدم الأمثلة عالية الجودة التي صاغها الصحفيون قيمة وأداء أفضل بكثير من استخراج محتوى مماثل من مصادر أخرى، وفي النهاية، يجب ألا تكون هذه العملية خطوة واحدة، وإنما ينبغي على الفِرق تحديد نقاط الضعف في النماذج المتاحة حاليًا، وصياغة أمثلة إضافية تساعد على توضيح السلوك الصحيح.
الصورة حاصلة على رخصة الاستخدام على أنسبلاش بواسطة كوني شنايدر.