مقابلة البيانات: كيف تُجرِي مقابلة مع سجلات البيانات؟

نوشته عمرو العراقي
Mar 5, 2021 در صحافة البيانات
صورة

لتجري مقابلة صحفية مع سجلات البيانات عليك أن تستخدم عددًا من الحيل الإحصائية، لتنجح في الخروج باستنتاجات تساعدك في صياغة قصتك الصحفية. لا تختلف المقابلات التي نجريها مع البيانات عن تلك التي نجريها مع المصادر البشرية. بحيث ينبغي التحضير المسبق للمقابلة في كلتا الحالتين، ومن الضروري أيضًا أن نجمع معلومات عن سجلات البيانات التي سنلتقي بها كما نفعل مع المصادر البشرية، كل ما هنالك هو اختلاف الأدوات، ففي لقاءات المصادر البشرية نستخدم معدات لتسجيل اللقاء،  ومهاراتنا في التفاوض للخروج بأفضل إجابات من المصدر، بينما في مقابلة البيانات نعتمد فقط على برنامج مايكروسوفت إكسل أو جداول جوجل ومعرفتنا البسيطة بعدد من المعادلات الحسابية التي تقودنا للوصول إلى استنتاجات ذات مغزى.

وكي لا تتحول هذه المقابلة إلى جولة من المبارزة بين الصحفي وجدول البيانات، ينبغي أن يحدها سياق عمل محدد يرسم مراحل سير هذه المقابلة، حيث يفضل أن تدور المقابلة حول فرضية واحدة محددة، يصبح الصحفي قادرًا على تحديد الفرضية عادةً بعد الانتهاء من مرحلة بحثه الأوليّة عن الموضوع الذي يكتب عنه، حيث تأتي عندما يصبح الصحفي على دراية كافية بما بين يديه من مدخلات. يفضل أن لا تكون الفرضية بسيطة يسهل إثباتها أو دحضها دون تحليل البيانات، كما لا يفضل في الوقت ذاته أن تكون معقدة وعصية الإثبات في ظل ما بين أيدينا من بيانات.

الأسئلة الجيدة تقود إلى استنتاجات جيدة

قبل أن تبدأ في إجراء مقابلة مع البيانات عليك أولًا وضع قائمة بالأسئلة التي يمكن الحصول على إجابات عليها من سجلات البيانات، فالبيانات لا تجيب على أسئلة تحمل رأيًا أو رؤية فلسفية، بينما بوسع البيانات أن تعطينا إجابات دقيقة وواضحة إذا وجهنا إليها أسئلة تناسبها. تستطيع من خلال البيانات أن تعرف مقدار التغير في رقم محدد على مدار الزمن أو مدى ارتباط شيء بآخر أو القيمة الوسطى لمجموعة من القيم، وهكذا كلما كانت تلك الأسئلة معدّة مسبقًا كانت مقابلة البيانات فعالة وأصبحت عملية تحليل البيانات أكثر سهولة على الصحفي. نحن لسنا محللي بيانات ولا اختصاصيين، نحن صحفيين نبحث عن شيء جديد يفيد ويخدم فرضيتنا التي نعمل عليها لبناء قصصنا الصحفية، لذلك لا يجب أن ننغمس في عملية تحليل البيانات بقدر ما نهتم بالحصول على إجابات على ما نبحث عنه من تساؤلات.

ولبناء قصة جيدة علينا أن نبحث عن إجابات تتعلق بالمشكلة التي نحن بصدد الكتابة عنها، وكذلك تفسيرات حول سببها، وبالطبع ما تحدثه من أثر على فئات المجتمع المختلفة وفي النهاية نبحث عن حلول، هكذا تكتمل المهمة بطرح الفئات الأربع من الأسئلة: المشكلة، السبب، الأثر، والحلول. ليس شرطًا أن ننجح في الحصول على إجابات على الفئات الأربع في كل قصة، حيث يصعب في كثير من الحالات أن نجد بيانات تمنحنًا حلًّا منطقيًّا للمشكلة التي نكتب عنها، لكن علينا دومًا أن نحاول طرح الأسئلة في الفئات الأربع ونبحث عن بيانات يمكن أن تجيب عليها ونضيفها إلى سجل البيانات الرئيسي لقصتنا التي نعمل عليها.

وحين ننجح في الحصول على إجابات من سجل البيانات لما وضعناه من أسئلة تصبح مهمتنا في محاورة المصادر البشرية أكثر فعالية. تخيل حين تسأل مسؤولًا في الحكومة عن خطتهم لمعالجة هدر المال في الإنفاق على بنود غير ضرورية، بالطبع سوف يجيبك بإجابة دبلوماسية ويخبرك بأنهم يعملون بكل جهد لتقليل الفائض في الإنفاق، بينما عندما تحلل البيانات وتكتشف أن قيمة الهدر بالمال العام في هذه المؤسسة في تصاعد مستمر في السنوات الخمس الأخيرة، فسيصبح سؤالك حينها: "سياستكم في السنوات الخمس الأخيرة لم تقلل حجم الفائض في الإنفاق، فمن يكون المسؤول عن زيادة هذا الهدر في المال العام؟"، هنا يصبح السؤال أكثر عمقًا وكذلك تحصل على إجابة أكثر دقة من المصدر.

معادلات حسابية بسيطة تقود إلى اكتشاف قصص صحفية في سجلات البيانات

هناك العديد من العمليات الرياضية التي تمكنك من كشف أسرار حُزم البيانات التي تعمل عليها لاستخراج قصة صحفية جيدة. لكن لا تصلح جميع المعادلات الحسابية لكافة حزم البيانات، كما أن بعض المعادلات الحسابية قد تقودك إلى نتائج، والبعض الآخر قد يصبح عديم الجدوى، إذا ما تم استخدامه في غير مكانه المناسب. لذا، فالصحفي بحاجة إلى معرفة متى يستخدم كل نوع من أنواع المعادلات الحسابية ليدرك الفرق بين مؤشر إحصائي لا قيمة له ومؤشر مهم، وإلا فإنه يجازف بكتابة قصة صحفية ستكون في أسوء الأحوال خاطئة تمامًا، وفي أفضل الأحوال مضلِّلة ومشوشِة.

الضرب، الجمع، الطرح، والقسمة: عمليات حسابية أساسية للكثير من القصص الصحفية المدفوعة بالبيانات

  • معادلة القسمة لتحطيم الأرقام الكبيرة

الصحفيون يفضلون استخدام الأرقام الكبيرة في عناوين قصصهم الإخبارية، وفي كثير من الأحيان نشاهد أرقامًا بالملايين والمليارات في عناوين الصحف. هذه الأرقام قد تظهر بحجمها الحقيقي عندما يتم قسمتها على رقم آخر، من خلال معادلة القسمة يمكن الحصول على المعدَّل، وهو نسبة شيء إلى شيء. إذا كان لدينا  قاعدة بيانات توضح عدد المصابين بكوفيد 19، وقاعدة بيانات توضح عدد أسرة العناية المركزة في المستشفيات الحكومية في بلد ما، فمن خلال قسمة عدد المرضى على عدد الأَسِرَّة، يمكن أن نعرف معدل المرضى لكل سرير، وهو ما يكشف مثلًا مدى جهوزية المنظومة الصحية لاستقبال المزيد من المرضى. يمكن أيضًا عبر استخدام عملية القسمة، معرفة معدَّل المرضى لكل طبيب، فبقسمة عدد السكان في بلد ما على عدد الأطباء بها، سنعرف المعدَّل، وهو ما يكشف عن مدى توفر الأطباء في هذا البلد. 

من خلال نفس العملية أيضًا، يمكن أن نعرف نسبة الجزء من المجموع، وهو ما يمكن أن نخرج منه بقصص صحفية مثيرة، مثلًا من قاعدة بيانات sipri "لأكبر 100 مبيع للسلاح[RF1] تبدو للوهلة الأولى عبارة عن بيانات لكل شركة لا يستطيع الصحفي الخروج منها بقصص صحفية غير تقليدية، ولكن بمعادلات حسابية بسيطة يمكن الكشف عن حقائق مخفية وراء البيانات. على سبيل المثال، لو جمعنا مبيعات الشركات الأمريكية فقط، وقسمناها على إجمالي مبيعات شركات السلاح المئة، لوجدنا أن الشركات الأمريكية تستحوذ على 60% من إجمالي سوق السلاح، وهو ما يمكن أن يكون عنوانًا لقصة صحفية ومفتاحًا للتنقيب عن مزيد من التفاصيل.

فضلاً عن ذلك، من خلال قسمة عدد المستشفيات الحكومية على إجمالي عدد المستشفيات في هذا البلد يمكننا معرفة نسبة استحواذ القطاع الحكومي ونسبة استحواذ القطاع الخاص على المنظومة الصحية في هذا البلد، ربما نكتشف سيطرة القطاع الخاص، ما يفتح الباب أمامنا إلى التقصِّي عن مدى توافر العلاج لأصحاب الدخل المنخفض في هذا البلد.

وعن طريق معادل القسمة أيضًا يمكن أن نعرف نصيب الفرد من شيء ما، فعلى سبيل المثال عند تغطية حجم الدَّين الخارجي في بلد ما، فبقسمة قيمة الدَّين على عدد المواطنين سنحصل على نصيب الفرد من هذا الدَّين، وبقسمة الناتج على عدد أيام السنة سنحصل على حصة الفرد اليومية من الدَّين الخارجي المستحق على بلده، أي ما يعني ما يفترض أن يسدده كل مواطن يوميًّا لسداد هذا الدَّين. وقد يساعدنا معرفة نصيب الفرد في وضع العديد من التصريحات الحكومية حول الإنفاق في سياق أكثر دقة. مثلًا عندما يتحدث وزير الصحة في بلد ما عن حجم إنفاق حكومته على قطاع الصحة في ظل جائحة كوفيد 19 وأن ما خصصته الحكومة يفوق المليارات، وأنها نسبة كبيرة من الميزانية العامة للدولة، تكشف قسمة هذا الرقم على عدد المواطنين هذا المبلغ، والذي قد لا يتجاوز الجنيهات يوميًّا.

  • المقارنة  بالمتوسط

نستخدم دائمًا المتوسط في حياتنا اليومية، فالناس تقارن نفسها دائمًا بالآخرين، على سبيل المثال إذا كنت تعمل على تحقيقٍ عن المساواة في الحق في التعليم في الأردن، فأول ما ينبغي أن تبحث عنه هو مقارنة الفرص التعليمية المتاحة لدى الطبقات الاجتماعية المختلفة داخل المملكة بمتوسط الفرص المتاحة في المملكة ككل، أو مقارنة متوسط عدد المتعلمين في كل طبقة، أو متوسط الإنفاق على التعليم الذي تنفقه كل طبقة.

يمكن أيضًا من خلال المقارنة بالمتوسط الحسابي، الخروج بقصص صحفية شائقة، والمتوسط الحسابي نستخدمه بشكل دائم في حياتنا اليومية، والواقع أنك لا تعرف أنك في وضع جيد أم سيئ، إلا إذا قارنت نفسك بالمجتمع.

إذا كانت قصتك عن التعليم في مصر، فأول ما يأتي في ذهنك هو متوسط إنفاق الأسر على التعليم في مصر، ومقارنة نسبة الإنفاق لكل أسرة بالمتوسط، وتساعدنا هذه القصة على تحليل أعمق لوضع التعليم في بلدنا.

على سبيل المثال تناقش مقالة في "الإندبندنت" أن داعمي ترامب أكثر تعليمًا من متوسط المواطن الأمريكي، وأكثر دخلًا من المتوسط في أمريكا، فالقصة كلها مبنية على المتوسط.

المتوسط الحسابي ​​يعطي نظرة سريعة إلى البيانات ويلخص سلسلة كبيرة منها، ويمكن حسابه عن طريق قسمة مجموع القيم على عددها، كما يوضح الخبر المشار إليه في الصورة بالأعلى، أن العاملات السوريات يحصلن على أجر أقل من متوسط الأجور في المملكة.

لكنه ليس دائمًا المؤشر الإحصائي المناسب لكافة البيانات وبخاصة إذا كان هناك تفاوت في قيم البيانات، مما يجعل المتوسط غير مُعبِّر بصورة دقيقة عن القيمة الوسطى للبيانات. في هذه الحالة يعتبر "الوسيط" هو المؤشر الإحصائي المناسب لأنه يعني حرفيًّا القيمة الوسطى لسلسلة البيانات بعد ترتيبها بشكل منطقي إما تصاعديًّا أو تنازليًّا.

  • وضع أساس مقارنة ثابت

عند المقارنة ينبغي الحذر، حيث لا يمكن  المقارنة بين معدل انتشار فيروس كوفيد 19 في بلدين، أحدهما حجم السكان به كبير جدًّا والآخر حجم السكان به صغير دون توحيد أسس المقارنة، فبالطبع الأرقام الأولية ستبين أن المصابين أكبر في البلد الأكثر عددًا في السكان، لكن مع توحيد نسبة القياس لكل 100 ألف نسمة قد تتبدل النتائج.

وهذا ما يسمى المعدل لكل 100 ألف نسمة حيث يتم قسمة عدد المصابين في كل بلد على عدد سكانها، ونضرب الناتج في  100 ألف فهنا نحصل على معدل الإصابة بين كل مئة ألف نسمة ما يجعل أساس المقارنة واحدًا عند المقارنة بقائمة أخرى من البلدان ويعطي نتائج أدق. قد تغير هذه المعادلة من قصتنا الصحفية تمامًا وتفتح الأبواب أمام زوايا أخرى أكثر عمقًا في القصة الصحفية.

  • مقارنة التغير عبر الزمن

وهناك أيضًا مؤشر "نسبة التغير"، وهو يختلف في طريقة حسابه عن النسبة المئوية حيث يقيس التغير بين القيم خلال فترات زمنية مختلفة لمعرفة مقدار الزيادة أو النقصان في القيم خلال هذه الفترات. ويكون من المفيد أيضًا أن تحسب نسبة التغير لبعض الأرقام، إذا كان لديك مجموعة بيانات لفترتين زمنيتين مختلفتين، وفي هذه الحالة من الأفضل أن تستخدم نسبة التغير للمقارنة بين الفترتين وتعرف ما إذا زادت الأرقام أم نقصت.

إذا كان لدينا قاعدة بيانات توضح عدد الأسِرَّة في المستشفيات الحكومية في عام 2005 وعدد الأسِرَّة في المستشفيات الحكومية في عام 2020، فبطرح العدد في عام 2020  من عدد الأسرة في عام  2005يمكن أن نحصل على مقدار التغير بين العامين، وبقسمة الناتج على عدد الأسِرَّة في عام 2005 سنحصل على نسبة التغير وهو ما يوضح لنا هل نقصت أم زادت أعداد الأسِرَّة في المستشفيات خلال هذه الفترة، وهو ما يكشف الكثير من الحقائق المخفية  خلف ركام البيانات.

على سبيل المثال، استخدم الصحفي محمد حميد في تحقيقه "لا مستشفيات للفقراء"، نسبة التغير عبر الزمن  في معرفة زيادة أو نقصان المستشفيات الحكومية والخاصة، وكذلك عدد الأسِرَّة فيهما من خلال المقارنة عبر الزمن، وكانت عملية المقارنة عبر الزمن هي جوهر التحقيق.

البيانات في حد ذاتها، قد تكون مضللة ولا تدل على وجود مشكلة ما، ولكن صحفي البيانات يجب عليه الكشف عن المعيار الصحيح الذي سيعتمد عليه في قصته الصحفية، هناك الكثير من المعادلات الحسابية التي يمكن الاستعانة بها بحسب حجم البيانات وطبيعتها لكن معرفتنا بما تم طرحه في هذه التدوينة يكفي لمرحلة الاستكشاف الأولية للبيانات والإجابة على ما يدور بأذهاننا من أسئلة عندما نحاور سجلات البيانات.

أدعوكم إلى معرفة المزيد من الحيل الإحصائية من خلال قراءة التدوينات المنشورة على منصة مدرسة البيانات.

عمرو العراقي هو زميل في مركز نايت للصحافة التابع للمركز الدولي للصحفيين.

الصورة الرئيسية حاصلة على رخصة الإستخدام على أنسبلاش بواسطة Balázs Kétyi.