أداة من مايكروسوفت للتنقيب بالبيانات وإنجاز تحقيقات استقصائية تعاونية

Jul 19, 2021 в صحافة البيانات
صورة

يعتبر إنشاء التقارير والتحقيقات الإستقصائية المدروسة جيدًا، والسياقية، بوتيرة تتناسب مع دورة الأخبار المتسارعة باستمرار من أبرز الاهتمامات الرئيسية اليوم، لكنّ المانع الرئيسي هو الوقت وعدم كفاءة البحث اليدوي، إذ أنّ عملية البحث عن اسم واحد في بحر من المستندات الممسوحة ضوئيًا أو مقطع فيديو يتطلب الكثير من العمل.

بالنسبة للصحفي، قد يتضمن البحث عن قصة ما التنقيب عبر العديد من أنواع الوسائط لاستخراج السياق التاريخي والرؤية، أو التمشيط من خلال "تفريغ البيانات" للحصول على معلومات ملحّة وحساسة للوقت. ويعدّ اكتشاف مجموعات البيانات يدويًا عملاً مضنيًا، ويستغرق وقتًا طويلاً، ويعتمد على الموارد ويخضع لخطأ بشري أو تحيز. كلما زادت البيانات، زادت الحاجة إلى أداة للعثور على ما هو أكثر صلة.
لذلك هناك بحث دائم عن أداة يمكنها تسريع عمليات البحث، وزيادة تحقيقات البيانات التعاونية وتوسيع نطاقها، من خلال مساعدة الصحفيين في العثور على المحتوى المهم في بحر من البيانات غير المهيكلة.

وقد عملت عملاق التكنولوجيا مايكروسوفت "Microsoft"، التي تعتقد أنّ الوصول المفتوح إلى الأخبار عالية الجودة والموثوقة هو أمر بالغ الأهمية، جنبًا إلى جنب أكثر من 4500 موقع إخباري لإيصال قصصهم ورؤيتهم وتعليقاتهم إلى أكثر من 500 مليون قارئ، بـ 28 لغة في 140 دولة، وذلك بواسطة أداة Content Insights and Discovery Accelerator أو IDA -المدعومة بالذكاء الاصطناعي، والتي تساعد الصحفيين على التنقيب في مجموعات البيانات الكبيرة، ويمكن لـ IDA تحليل مئات الآلاف النصوص والمستندات والصور والصوت ومقاطع الفيديو بنجاح وبسرعة، مما يمكّن المنظمة من إنشاء أرشيف مستندات سهل الاستخدام. ويستطيع الصحفيون مراجعة المحتوى ذي الصلة والبحث فيه واستخلاص الأفكار منه، مما يسمح لهم بكتابة المقالات بسرعة وفعالية لإنجاز تحقيقات استقصائية تعاونية عابرة للحدود.
IDA هي حل جاهز للاستخدام في غرفة الأخبار بالاعتماد على نظام AzureAI لفهرسة كميات هائلة من البيانات، مثل المستندات والصور ورسائل البريد الإلكتروني وملفات PDF والصوت والفيديو. نظرًا لأنها مدعومة من Microsoft Azure، تعمل IDA في أي متصفح ويب حديث، مثل Microsoft Edge المدمج في Windows 10 وإصدارات Microsoft Edge Insider، المتاحة لكل من Windows 10 وMacOS.

كيف تتم العملية؟

من خلال الجمع بين الذكاء الاصطناعي ورؤية الكائن والتعرف البصري على الأحرف (OCR)، يمكن لـ IDA تحليل الصفحات واستخراج النصوص والصور والبيانات الرئيسية الأخرى. كما أنّ الأداة تساعد الصحفي في البحث في مقاطع الفيديو الطويلة، وتحديد الوجوه أو الكلمات الرئيسية، وتوفير نص مقطع فيديو قابل للبحث، كذلك تتعرف على الكيانات داخل النص، وتربط بذكاء الموضوعات ذات الصلة لمساعدتك على فهم الشخصيات والمؤسسات ويمكن من خلالها تصور العلاقات وما إلى ذلك، لمنحك نسخة كاملة ودقيقة من البيانات.

تحليل البيانات

يمكنك استخدام IDA لتحليل المستندات بنفسك أو إنشاء فريق تعاوني (باستخدام وظيفة "Portfolio") يمكنه العمل على نفس التحقيق وترك التعليقات على المشروع المشترك. إذا اخترت الإعداد "خاص"، فلن يتمكن أحد سواك من رؤية قاعدة البيانات الخاصة بك، بينما سيسمح الإعداد "عام" لأي شخص داخل مؤسستك بإلقاء نظرة على عملك.

بمجرد قيامك بتحميل بياناتك، مثل الصفحات الممسوحة ضوئيًا لمستند أو عدد كبير من رسائل البريد الإلكتروني، يمكنك البدء في البحث عن مصطلح معين.

لا تساعدك IDA فقط في العثور على اسم في كل صفحة من صفحات مجموعة البيانات الخاصة بك، بل توفر لك أيضًا رؤى حول عدد مرات ظهورها والأسماء الأخرى المرتبطة بها. ويمكنك أيضًا النقر فوق الكلمات الرئيسية للبحث في سياق أو تعريف إضافي من Bing. على الرغم من أن هذا له حدوده، إلا أنه يمكن أن يكون مكانًا جيدًا لبدء استكشاف موضوع غير مألوف.

بمجرد عرض تحليلاتك، يمكنك البدء في استكشاف "الإحصاءات". تعرض الرسومات المرمزة بالألوان البيانات والأشخاص الموجودين في مجموعة البيانات الخاصة بك.

وتساعدك علامة التبويب "العلاقات" على استكشاف كيفية ارتباط هذه الأسماء وتتيح لك "الشريط المكدس" مقارنة المتغيرات، على سبيل المثال، الأسماء والمواقع.

يمكن أن يكون هذا مفيدًا للغاية عندما تبدأ في تحليل مجموعة بيانات حيث يمكنك معرفة الأشخاص أو المواقع أو ميزات البيانات الأخرى بشكل بارز.

مسح الفيديو والصوت: باستخدام مفهرس الفيديو، حيث يمكن لـ IDA التعرف على الأشخاص والموضوعات والكيانات وسحب النصوص من ملفات الفيديو والصوت.

تساعدك هذه الميزة على تحليل الكلام والوجوه في أي لقطة، بغض النظر عن طولها. تتعرف وظيفة اكتشاف الوجه حاليًا على أكثر من مليوني شخصية عامة وتمنحك أيضًا النسبة المئوية لمدة ظهورهم في الفيديو، إلى جانب معلومات عن هويتهم واحتمال كونهم ذلك الشخص.

تحتوي قاعدة بيانات الكشف عن الوجه على معظم المشاهير أو السياسيين أو الرياضيين. ومع ذلك، يمكن تخصيصها ويمكنك إضافة السياسيين المحليين أو أي شخص يهمك نشره بشكل روتيني.

تمنحك أداة مسح الفيديو أيضًا الموضوعات الرئيسية و"الكيانات المسماة" التي يلتقطها من الخطاب. إذا كنت تريد أن ترى هذه في سياقها، يمكنك البحث عن الصياغة الدقيقة في النسخ. تُظهر لك هذه الوظيفة أيضًا مكان ظهور المصطلح في الفيديو وعدد المرات.

تحتوي أداة التنقيب في الفيديو أيضًا على وظيفة ترجمة تتيح لك متابعة الكلام ونسخه في الوقت الفعلي. يمكن الترجمة إلى أكثر من 30 لغة ويمكنك حتى مشاركة الفيديو المترجم مع جمهورك.

كما هو الحال مع قاعدة بيانات الوجه، يمكنك إضافة مصطلحات أو مصطلحات محددة إلى قاعدة بيانات اللغة. إذا قمت، على سبيل المثال، بتحميل مؤتمر صحفي وكان لديك مقطع من المؤتمر، فيمكنك إضافة جميع أسماء شخصيات الموجودة في الفيديو للحصول على نسخ وتحليل دقيقين. وينطبق الأمر نفسه على التقارير الصحية والرياضية.

تم تطوير IDA بنسبة 80 في المائة من قبل مايكروسوفت، و20 في المائة الأخرى قابلة للتخصيص من قبل المطور الخاص في وسيلة الإعلام التي تعمل فيها، حتى تتمكن من إضافة ميزات أو بيانات للتحليلات الأكثر أهمية في تقاريرك.

يعد Content Insight & Discovery Accelerator أول حل تقني مبتكر مصمم الصحفيين والناشرين من Microsoft News Labs. تأكد من مراجعة مدونة مايكروسوفت للحصول على التحديثات والإعلانات المستقبلية والأدوات الجديدة التي تساعد في تحقيق مهمة Microsoft لتمكين كل شخص ومنظمة من تحقيق المزيد.

نصيحة:

1- قم بزيارة aka.ms/IDA لمعرفة المزيد حول التقنية الكامنة وراء الأداة، وقم بالتسجيل وحضور عرض توضيحي تفاعلي.

2- اتصل بفريق Microsoft News Labs إذا كانت لديك أسئلة أو تريد التحدث عن كيفية مساعدة Microsoft في استخدام الأداة.

عبد اللطيف حاج محمد هو صحفي استقصائي، مهتم بصحافة البيانات والتحول الرقمي في الإعلام.

الصورة الرئيسية حاصلة على رخصة الاستخدام على أنسبلاش بواسطة آني سبرات.