للصحفيين.. إليكم أهم خوارزميات جوجل للحصول على نتائج بحث دقيقة

Feb 11, 2021 в الصحافة الرقمية
صورة

يعاني الكثير من الصحفيين، خاصة الإستقصائيين في التعامل مع جوجل أثناء عمليات البحث عن المعلومات والوثائق والتحقق من الصور والفيديو، ويرجع هذا السبب إلى أنّ معظم الصحفيين يحاولون البحث بشكل عشوائي، أو باستخدام بعض المصطلحات البحثية التقليدية، لكنهم لم ينتبهوا إلى أن جوجل له لغة لا بد أن نُحدثه بها حتى نحصل على نتائج دقيقة للغاية.

في هذا المقال، توضح شبكة الصحفيين الدوليين أهم خوارزميات جوجل التي تساعد بشكل كبير في تضييق دائرة البحث والتحكم في ظهور صفحات الويب لتسهيل الوصول إلى المعلومات التي تحتاجون إليها في تحقيقاتكم الاستقصائية.

أولاً: كيف يعمل محرك البحث جوجل؟

مبدئياً إذا سألنا جوجل هذا السؤال بماذا يجيب؟ ستكون الإجابة في 3 نقاط مهمة.

1- الزحف: يستخدم Google برامج آليه تُعرف باسم برامج الزحف للبحث عن الصفحات الجديدة أو المعدّلة على الويب.

2- الفهرسة: ينتقل محرك البحث Google إلى الصفحات التي اكتشفها عبر الزحف ويحاول تحليل محتوى كل صفحة.

3- خوارزميات من بينها بيج رانك (PageRank): وهي وسيلة لحساب أهمية صفحات أي موقع وتعطى ترتيبات ظهور الصفحات في بحث جوجل.

 

الصورة من ويكيبيديا برخصة ملكية عامة من PageRanks-Example

نتوقف قليلاً عند (PageRank) والتي تعتبر أول خوارزمية استخدمها جوجل لحساب عدد ونوعية الروابط إلى صفحة الويب لتحديد تقدير تقريبي لمدى أهمية الموقع. الإفتراض الأساسي هو أن المواقع الأكثر أهمية من المرجح أن تتلقى المزيد من الروابط من مواقع الويب الأخرى. وبالتالي يُحسن ظهورها في عمليات البحث بشكل سريع.

يُمكن الإطلاع على رابط يوتيوب يوضح بشكل عملي عمل الخوارزمية بيج رانك. 

ولا يستخدم جوجل هذه الخوارزمية لوحدها، وإنما طوّر المُبرمجون تلك الخوارزميات حتى وصلت إلى آلية عمل يُطلق عليها العناكب او (Spiders or Crawlers) لتكوين فهرس كبير يمكن عبره معرفة المواقع المرتبطة بكلمة مفتاحية، أو جملة معينة أو حتى الكلمات والأرقام، وهذا ما يُطلق عليه البحث العشوائي الذي قد لا يكون دقيقاً، لأن تلك الخوارزميات تعتمد على الارتباطات المتشعبة بين المواقع الأكثر شهرة أو بالأحرى الأكثر تداولاً.

يُمكن الإطلاع على رابط يوتيوب يوضح عمل الخوارزميات. 

ثانياً: كيف نستغل الخوارزميات في الحصول على نتائج دقيقة؟

إجابة هذا السؤال نجدها مختصرة في محاضرة بحثية نظمتها الشبكة العالمية للصحافة الاستقصائية GIJN، مع الصحفي HENK VAN ESS، أوضح فيها بعض الطرق لمعادلات يمكن استخدامها في البحث عن المعلومات والتحقق من الصور والفيديوهات، لكن يبقى السؤال ما هي تلك المعادلات؟ ولماذا هي مهمة لهذه الدرجة؟

بحسب بحث أعدّته شركة MT Technology Review، فإنّ المعادلة وآلية عمل بيج رانك في تصنيف صفحات الويب تعمل بنظام الترابط مع بعضها البعض، كما هو موضح في المثال التالي:

مثال: يجب علينا افتراض وجود صفحة ويب ولنُسمّها A، ولنفترض أيضاً أنه يوجد عدد معين من صفحات الويب الأخرى التي تشير إلى الصفحة A، أي التي تتضمن روابط تقود إليها. 

إذا كان عدد الصفحات الأخرى هو n فإننا سنقوم بتسمية هذه الصفحات كما يلي: T1, T2, T3…Tn. عبر استخدام هذه الرموز، سيكون بالإمكان حساب تقييم بيج رانك الخاص بصفحة الويب A عبر المعادلة التالية: PRA=1-d+dPRT1/CT1+…+PRTn/C

  • الرمز d يرمز لمبدأ يُعرف باسم مُعدل التضاؤل Damping Rate، الذي يُشير إلى احتمالية قيام المستخدم بالنقر على روابط جديدة في كل مرة يُدخل فيها لصفحة ويب؛ فعند بداية التصفح، ستكون احتمالية النقر على رابط جديد مرتفعة، ولكن مع كل مرة يفتح فيها المستخدم رابطاً جديداً، ستنخفض احتمالية قيامه بفتح رابطٍ جديد، وهكذا حتى يتوقف عن التصفح بشكلٍ كلي. 
  • الرمز C يمثل عدد الروابط الخارجة من الصفحة A باتجاه أي صفحة من الصفحات T1, T2, T3…Tn. وبهذه الصورة، فإن الحد C T1 – كمثال – يمثل القيمة التي ستحصل عليها الصفحة T1 من الصفحة A. 
  • الحد PR Tn يمثل تقييم بيج رانك للصفحة Tn. 
  • الحد (PR(Tn)/CTn) يمثل القيمة التي ستحصل عليها الصفحة A من الصفحة Tn في حال وجود رابط للصفحة A ضمن الصفحة Tn.

الصورة من pexels ومرخصة للإستخدام المجاني 

بعد تعريف المعادلة نعود مجدداً إلى HENK VAN ESS، الذي ضرب أمثلة عدة في طرق البحث باستخدام المعادلات المختصرة التي تساعد الصحفيين في الوصول إلى ما يبحثون عنه بسهولة، عن طريق لغة جوجل التي ينبغي عليهم فهمها جيداً للحصول على أفضل نتائج، وإليكم بعض النماذج.

1- في البحث عن الصور بشكل دقيق أضِف النص imagesize:widthxheight بعد الكلمة التي تبحث عنها مباشرةً. واحرص على إضافة الأبعاد بالبكسل. 

مثال: imagesize:500x400

2- للبحث عن موقع معين اكتب "site:" قبل الموقع الإلكتروني أو النطاق. على سبيل المثال، site:youtube.com أوsite:.gov.

3- للبحث عن المواقع ذات الصلة اكتب"related:" قبل عنوان ويب تعرفه. على سبيل المثال، related:time.com.

4- لعرض النسخة المخزّنة مؤقتًا في Google لموقع ويب معيّن اكتب "cache:‎" قبل عنوان الموقع الإلكتروني.

5- للبحث عن العلماء بشكل دقيق علينا استخدام مصطلح "scientists" قبل الإسم أو العبارة التي نبحث عنها مثال: "scientists:" who claim coronavirus is a bioweapon

الصورة: سكرين شوت من جوجل 

6- يمكننا أيضاً استخدام معادلة أخرى أقل صعوبة ودقيقة للغاية dr**"AROUND(7) "coronavirus is a bioweapon" -boyle

الصورة: سكرين شوت من جوجل 

7- في حالة البحث عن شخصيات بواسطة الصورة الشخصية، ولضمان العثور على أفضل النتائج يمكنك الذهاب إلى صور Google ورفع صورة الشخص في مربع الكاميرا ولا تضغط بحث مباشرة، هناك إلى جانب الصورة توصيف يُفضل أن تضيف بعض المعلومات  التي بحوزتك من بينها اسم الشخص وتحديد التاريخ إن كنت تعلمه تماماً كالصورة التالية. 

الصورة من ورشة البحث عبر المصادر المفتوحة التي نظمتها الشبكة العالمية للصحافة الاستقصائيةGIJN

أخيراً إليكم بعض الأدوات التي تساعدكم في تحسين البحث عبر جوجل

قبل أن نذهب إلى الأدوات أقدم نصيحة للصحفيين: لا تركزوا على البحث باللغة العربية فقط، ستجدون صعوبة في الوصول إلى النتائج المطلوبة، لأن حجم المعلومات المسجلة باللغة العربية قد تكون معروفة وشائعة بين العامة، قد تكون أيضاً غير دقيقة، خاصةً وإن كان موضوع البحث مرتبط بدول أخرى، أو منح، أو قروض دولية، أو في قضايا اللاجئين والهجرة، يفضل البحث باللغة الإنجليزية بسبب وفرة المعلومات والبيانات، ولكي أُسهل إليكم عمليات البحث عن الروابط والصور والفيديو باستخدام المصطلحات المباشرة أو التنقيب في أرشيف جوجل. وفيما يلي بعض الأدوات التي تساعدكم على ذلك:

Ahrefs

تتميز أداة Ahrefs بقدراتها العالية في أرشفة مواقع الويب وفهرسة الروابط ومعرفة التالف منها، مما يمكّن من معرفة مرات البحث عن كلمة مفتاحية (عالميًا أو حسب الدولة)، ومعاينة نتائج محركات البحث، وسجل ترتيب المواقع والاستفادة من ذلك في الحصول على أفكار واقتراحات عن الكلمات المفتاحية واستغلالها. كما أن لديها وظائف تشمل كل ما يتعلق بمراقبة النطاقات والمقارنة بينها. يمكن للأداة تحليل أداء إعلانات "الدفع مقابل النقرة" للحصول على أفضل فائدة منها، بحسب منصة مستقل

SEMRush

تحسّن هذه الأداة محركات بحث تتوفر على أدوات فعالة للبحث عن الكلمات المفتاحية وتحليلها، ومراقبة النطاقات، وأرشفة المواقع؛ فضلًا عن فحص الروابط واستكشاف فرص الاستفادة المادية من الموقع، والتركيز على البحث حسب نوعية الجهاز المستخدَم (حاسوب مكتبي أو هاتف متنقل). تشترك المنصة مع أدوات أخرى في كثير من الوظائف التي تقدمها، إلا أنها اكتسبت شهرةً كبيرة في السنتين الأخيرتين بسبب تميزها في مجال تحليل المنافسين واستخدام المعلومات المتحصَّل عليها لإعداد حملات تسويقية تؤتي أكلها بسرعة.

Screaming Frog

يتخصّص Screaming Frog في فحص بنية الموقع على نحو سريع وفعال، حيث يعمل على الزحف عبر الموقع والعثور على كل صفحة واستخراج بيانات مفيدة يقدمها بصيغة تقرير يعدِّد المشاكل المختلفة في بنية الموقع مثل الروابط المكسورة، ووسوم Meta الغائبة، وإعادات التوجيه، وغيرها كثير؛ علاوةً على إمكانية تكامله مع أدوات أخرى مثل تحليلات جوجل Google analytics. لا يشتمل البرنامج على ميزة تحليل الإعلانات على محركات البحث.

TinEye Reverse Image Search

يعمل هذا المحرك العملاق على البحث عن الصور بشكل عكسي، هو دقيق للغاية ومجاني في نفس الوقت ولا يحتاج إلى مجهود، يمكنكم أيضاً إضافة الروابط فهو يستطيع البحث بواسطتها من دون إضافة كلمات أو نصوص.

(Pictures (picsearch.com

هذه الأداة للبحث عن الصور والفيديو معاً وتستخدم أيضاً الكلمات والمصطلحات الرئيسية للوصول إلى المعلومات، ويمكنكم فلترة النتائج بشكل سريع وبكل سهولة.

الصورة الرئيسية حاصلة على رخصة الإستخدام على بيكسيلز.