زميلة "نايت": الوفاء للمصدر مهم عند استخدام الذكاء الاصطناعي

بواسطة Nithyani Anandakugan
Aug 4, 2025 في الابتكارات الإعلامية
Glowing ai chip on a circuit board

بدأت غرف الأخبار حول العالم في استكشاف طرق جديدة لتحويل الصحافة إلى صيغ مختلفة باستخدام الذكاء الاصطناعي: من المقالات النصية إلى الفيديوهات، والبودكاست، والانفوجرافيك، وغيرها.

لكن مع هذا التحول، لا تكمن التحديات في الدقة فقط، بل في الصرامة التحريرية. فالصحفيون يسعون للتحقق من المعلومات ونسبها لمصادرها بوضوح، وتجنّب التحيز، والتحقق من الادعاءات، والحفاظ على الشفافية. وعندما يُستخدم الذكاء الاصطناعي لتحويل منتج صحفي من شكل إلى آخر، قد لا تنتقل تلك الصرامة تلقائيًا.
في هذا السياق، تقول سانوتا راغو، رئيسة مختبر الذكاء الاصطناعي في Scroll.in وزميلة سابقة في برنامج نايت التابع للمركز الدولي للصحفيين (ICFJ): "أحد أكبر التحديات يتمثل في أن جميع نماذج الذكاء الاصطناعي ومعظم الأدوات التي تعتمد عليها لا تتضمّن المعايير التحريرية التي اعتدنا عليها كصحفيين، فهي مُدرّبة على بيانات عامة وواسعة وغالبًا ما يتم تحسينها في اللغة والشكل – وليس للدقة أو النسب أو القصد التحريري".

العقبات التي واجهتها راغو أثناء تحويل المحتوى باستخدام الذكاء الاصطناعي قد تكون معقدة الفهم، لا سيما لمن يفتقر إلى خلفية تقنية. شخصيًا، وجدت أن "ذاكرة الفلاش" – أي ذكريات الناس الحيّة لأحداث مفصلية في حياتهم والتي تنطوي على تشوّهات عند مقارنتها بالوقائع الحقيقية – تمثّل تشبيهًا مفيدًا لفهم التحديات التي يواجهها الصحفيون عند استخدام الذكاء الاصطناعي لتحويل محتواهم إلى صيغ جديدة.

درس الباحثون هذه الظاهرة بعد أحداث 11 سبتمبر، ووجدوا أن المشاركين يتذكرون الهجمات بثقة عالية ووضوح، ولكن مع تكرار سردهم وإعادة صياغة تجاربهم، بدأت التفاصيل تبتعد عن الحقيقة.

تسعى راغو إلى ترسيخ مبدأ "الوفاء للمصدر". وخلال زمالتها، رسمت خريطة لكيفية "هيكلة وتنسيق وإبراز" الأخبار الرقمية، وجمعت نتائجها في ما أسمته "دليل المحتوى السائل".


الدليل مُنظَّم بحسب كيفية تلقّي المستخدمين للأخبار والصحافة عبر الإنترنت:
البنية التحتية المادية → طبقة الشبكة والنقل ← البروتوكولات التطبيقية ← قنوات التوصيل ← حاوية المحتوى ← تنسيق المحتوى ← اللبنات الأساسية ← الأجهزة وواجهات الاستخدام.
ومن خلال التركيز على النقاط الخمس الأخيرة، أنشأت راغو نظامًا معياريًا أوليًا قادرًا على تحويل شكل من أشكال الصحافة إلى آخر.

في الأشهر المقبلة، ستقوم بوصف كل إدخال في الدليل، وتوضيح الإجابات عن أسئلة مثل:

  • هل المقال النصي يُعتبر حاوية أم تنسيقًا؟
     
  • هل النشرة البريدية قناة توصيل، أم حاوية، أم تنسيقًا؟
     
  • هل الخط الزمني تنسيق أم لبنة أساسية؟

قد يُشكّل هذا المخطط ووصفه مجموعة بيانات تأسيسية لتعليم نموذجٍ الشكلَ الصحفيّ بما يحافظ على المنطق التحريري الذي يوجّه تصميم الأخبار.

تحدثتُ مع راغو حول مفهوم الوفاء للمصدر، وتصميم الأخبار، ومسؤولية الصحفيين في الحفاظ على المعايير التحريرية عند استخدام أدوات الذكاء الاصطناعي.

إليكم ما دار في حديثنا:

كيف تعرّفين "الوفاء للمصدر"؟

راغو: الوفاء لا يعني نفس الشيء في كل المخرجات، لكن فكرته الجوهرية واحدة: هل يحافظ هذا الشكل على القصد التحريري والصرامة التي احتواها العمل الأصلي؟
إنه يتعلق بترجمة المنطق التحريري إلى النموذج ليتمكن من إنتاج كل صيغة.

خذ مثالًا من تحويل مقال نصي إلى فيديو قصير: الوفاء للمصدر يعني أن الحقائق متشابهة؛ والمنطق السردي الأصلي محفوظ (تقرير إخباري نصي يتحوّل إلى فيديو إخباري، ومقالة تفسيرية تتحوّل إلى فيديو تفسيري، وهكذا)؛ يتم إسناد الاقتباسات بدقة ولا تُحوّل إلى تصريحات في السرد؛ الحقائق لا يتم تكثيفها لخلق تأثير عاطفي؛ تُحافظ كلمات مثل "بحسب التقارير" أو "وفقًا للسلطات المدنية" على وجودها؛ والنبرة تتطابق مع الأصل.

أما في حالة تحويل المقال إلى آلة حاسبة تفاعلية، فالوضع مختلف:

  • كل متغير ونقطة بيانات يجب أن تُربط بحقيقة مبلّغ عنها في المقال؛
     
  • تُضاف الإيضاحات والتحفظات؛
     
  • يُحافظ على نطاق المقال (لا يجب أن "يتخيل" الحاسوب نتائج تتجاوز ما هو مذكور في المقال)؛
     
  • ويجب أن يكون من الممكن التحقق من ناتج الآلة الحاسبة والمنطق الكامن وراءه.

يجب تعريف الوفاء لكل صيغة على حدة بهذه الطريقة.

ما العناصر التي تُشوه أو تُفقد غالبًا في التجارب التي مررتِ بها؟

راغو: واحدة من التحديات الأكثر تكرارًا التي واجهتها تتعلّق بتحديد الزمن بدقة في النسخة المحوّلة. وهي مشكلة متعددة الطبقات.

على المستوى الأساسي، لنأخذ هذه الحقيقة: "يوم الاثنين، أوقف العمال إضرابهم الذي استمر 21 يومًا".
غالبًا ما يُنشر هذا التقرير بعد يوم الاثنين أو في اليوم نفسه، ويتضمن تاريخ بدء الإضراب ضمنيًا. معظم النماذج ستلخّصه إلى: "أوقف العمال الإضراب"، ما يؤدي إلى محو السياق الزمني.

وعلى مستوى أكثر تعقيدًا، تتفاقم المشكلة عند استخراج السياق الخلفي أو بناء جداول زمنية من بيانات مؤرشفة ومتجهة (vectorized). أنظمة الاسترجاع تعيد جملًا متشابهة دلاليًا بغضّ النظر عن توقيتها.
إذا طلبتُ مقالات عن "حزمة إنقاذ من صندوق النقد الدولي للبلد X في تموز- يوليو 2025"، فأنا أريد سياقًا لهذا الحدث بالذات، لا أحداثًا مشابهة في سنوات أخرى. لكن النتائج غالبًا ما تُحسّن لتطابق الدلالة، لا التوقيت، ما يخلق مشكلة عند تصميم الجداول الزمنية أو الخلفيات أو التحديثات.

الاقتباسات أيضًا تمثل تحديًا: يتم تسطيحها في كثير من الأحيان. مثلًا، إذا قال وزير: "لا أستبعد الأمر تمامًا، لكنه غير مرجّح هذا العام"، قد تُلخّص العبارة إلى: "الوزير قال إن السياسة غير مرجحة". والاقتباسات المضمنة nested quotes تُعالج بشكل سطحي، ما يفقدها دقتها وتدرّجها.

وفي حالات كثيرة، تُقدّم الاقتباسات كتصريحات بدون نسب وهذه التشويهات تُغيّر المعنى والتأثير التحريري.

 ما التحديات التي تواجه الصحفيين العاملين مع الذكاء الاصطناعي والتي تسترشدين بها في عملك؟

راغو: النماذج مصممة لتُجيد اللغة الإنجليزية شكليًا، لا التحرير الصحفي. مثلًا، مجموعة البيانات المعروفة FineWeb، والتي تُستخدم لتدريب النماذج اللغوية، تتضمن مقالات صحفية – لكن المعيار الأساسي فيها هو جودة اللغة لا جودة التحرير الصحفي.

عندما يستخدم الصحفيون أدوات قائمة على مثل هذه البيانات، فهم معرّضون لفقدان الصرامة التي جعلت من عملهم الأصلي موثوقًا.

تحدٍ آخر هو أن المخرجات تبدو مصقولة وموثوقة حتى عندما تُشوّه المعاني الدقيقة. معظم النماذج تعيد صياغة كلمات مثل "على الأرجح" أو "على ذمة التقارير" إلى عبارات قطعية. أو تُبسّط اقتباسًا أو تُسقط إشارات زمنية مهمة.

ولأن التحويل قائم على عمل الصحفي نفسه، فهناك افتراض بأنه آمن. لكن التحويل بالذكاء الاصطناعي ليس محايدًا – بل يحمل منطقه الخاص.

المشكلة ليست فقط "هلوسات النماذج"، بل الحفاظ على المعنى، والنوايا، والثقة عبر كل نسخة. ويزداد التعقيد أضعافًا عند الانتقال إلى لغة أخرى أو إدخال فروق ثقافية. ولا توجد اليوم مجموعات بيانات كافية تعكس هذه الفروق كما نفهمها نحن كبشر.

 

كيف يبدو تحقيق "الوفاء للمصدر" في الممارسة العملية؟

راغو: أُجيب بسؤال: كيف نعلّم نموذجًا لغويًا يتقن الإنجليزية، ويتطور بلغات أخرى، على الفروق التحريرية الدقيقة التي يفهمها الصحفيون بالفطرة؟

سأبدأ بطرح أسئلة على النموذج مثل:

  • عند تلخيص مقال صحفي، متى تذكر المصدر بالاسم؟ ومتى تشير إليه بشكل عام؟
     
  • كيف تلخّص الاقتباسات المتداخلة؟ (وكيف تلخّص الاقتباسات غير المباشرة؟)
     
  • ما المسموح والممنوع عند تلخيص اقتباس؟
     
  • كيف تقرر ما الذي يجب الاحتفاظ به أو حذفه عند إعادة صياغة قصة معقدة؟
     
  • ما الفرق بين "تلخيص"، "اختصار"، "إعادة صياغة"، و"إعادة كتابة"؟
     

(سؤالي المفضل هو الأخير.)

موقع LMArena مفيد جدًا لإجراء اختبارات مقارنة بين النماذج، وبناء معايير داخلية للتحفظ التحريري.

الخطوة التالية هي بناء دليل لتحويل المحتوى، يشبه دليل الأسلوب التحريري الموجود في كل غرفة أخبار. هذا الدليل سيكون مجموعة بيانات تُراعي كيفية التعامل مع التحفظ التحريري، والحفاظ على تسلسل الأحداث، واحترام النطاق، وعدم تهويل الحدث أو تقليله، والتعامل مع ضغط النص (التلخيص، إعادة الصياغة، إلخ).

ثم علينا التفكير بكيفية تنفيذ ذلك على نطاق واسع:

  • ما هي الإجراءات التشغيلية القياسية وقوائم التحقق التي نحتاجها؟
     
  • وفي أي مرحلة يجب إدخال "صحفي مدرّب ضمن الدورة"؟
     

هذه بعض الأسئلة التي علينا معالجتها لاحقًا.


الصورة الرئيسية حاصلة على رخصة الاستخدام على أنسبلاش بواسطة Immo Wegmann.