خبرنگاران داده و ۵ پاسخ کلیدی

نوشتهSimon Rogers
Dec 29, 2015 در داده‌نگاری

این مقاله برداشتی از محتوای یک دوره آموزشی مقدمات خبرنگاری به نام «موک»‌ MOOC است که سال گذشته برگزار شد. برای آشنایی بیشتر با این دوره آموزشی اینجاا کلیک کنید.

چه کسی؟

اولین سوال مهم این است که داده از کجا آمده و این داده ها  چه  اهمیتی دارند . چون داده، مثل هرنوع اطلاعات دیگری، ممکن است نادرست باشد و هرچه منبع آن کمتر قابل اعتماد باشد، احتمال درستی آن ضعیفتر خواهد بود. شفافیت هم در این مورد مهم است-- اگر خواننده تان بداند منبع داده چیست، احتمال آنکه باورتان کند، بیشتر است. اگر خوانندگانتان باورتان نکنند،‌ کاری که انجام می دهید، بی ارزش است.

منبع داده مهم است، چون خبرنگاران داده از اطلاعات و ارقامی که  قابل دسترسی برای عموم مردم هستند استفاده می کنند و قانون آزادی اطلاعات در سراسر جهان به خبرنگاران اجازه می دهد تا به داده های مخفی دولت دسترسی داشته و گزارش تهیه کنند.

اما داشتن پرتال آزاد اطلاعات به خودی خود کافی نیست. حتی بحرین و عربستان سعودی هم پرتال آزاد اطلاعات دارند. اینجا جایی است که خبرنگاران داده وارد عمل می شوند.  با برملا کردن و زیر سؤال بردن داده ها، می توانیم دقیق بودن آنها را آزمایش کنیم، و آنها را با داده های دیگر تلفیق کنیم تا نتایجی به دست آوریم که حاوی تازه هایی درباره خبر باشد.  

خبرنگاران به طور سنتی به داده نوعی اطمینان  مطلق  دارند،  اطمینانی که هیچ گاه به یک منبع انسانی ندارند. اعداد اطمینان بخشند، چون واکاوی آنها میتواند نگران کننده باشد. مایکل بلستلند، خبرنگار سابق بی بی سی، نوروویروس--یا ویروس تهوع زمستانی سال ۲۰۰۸ --را بررسی کرد و دقیقا نشان داد که به سادگی می توان در گزارش ارقام اشتباه کرد. گزارش اولیه این بود که سه میلیون نفر در سال ۲۰۰۷ گرفتار این ویروس شده اند.

او به افت و خیز اطمینان به ارقام نگاه کرد، که راهنمای میزان قابل اتکاء بودن این ارقام بود، و دریافت که تعداد بیماران به آسان می تواند ۲۸۰ هزار نفر یا حتی ۳۴ میلیون نفر باشد. حقیقت چه بود؟ هیچ کس نمی دانست، اما گزارش به هرحال نوشته شده بود.

چه چیزی؟

مطلب چیست؟‌ چه نکاتی را می خواهید مطرح کنید؟‌ شما استاد دانشگاه نیستید که با حوصله هر استدلالی را بررسی کنید. یک   پروژه خبرنگاری داده  باید بتواند گزارش را به شیوه ای روشن و آسان ارائه دهد. هیچ گزارش آکادمیکی، پیرامون هیچ موضوعی، چنین ویژگی ندارد. گزارش های آماری با هدف همه فهم بودن تهیه نمی شوند، اما گزارش شما باید با این هدف تهیه شود. وظیفه شما آن است که اطلاعات خام را ویرایش و قابل فهم کنید.

در اینجا نمونه ای از این کاررا مثال می زنیم:‌ در رقابت های خبرنگاری داده سال ۲۰۱۳، کتاب بازار هنر برای کودن ها برنده جایزه شد. این کتاب از منابع گوناگون اطلاعات گرفته بود و آنها را با تصویر به هم پیوند داده بود، تصویری که داستانی را روایت می کرد. این پروژه از اطلاعاتی در بازار هنر استفاده کرده بود که به سادگی در دسترس بودند و از منبعی به نام آرت پرایس Artprice استخراج شده بودند. این پروژه قابلیت تبدیل فایل های پی دی اِف به اِکسِل را هم داشت. نویسنده برای ترجمه اصطلاحات خاص و تفهیم زبان آثار هنری از کمک چند کارشناس بهره برده بود. او از ابزار دیگری هم برای تکمیل طرحش استفاده کرده بود: از ‌Outwit که یکی از نرم افزارهای تکمیلی فایرفاکس  Firefox  است برای تبدیل  فایل های پی دی اف به اکسل، از Open  Refine برای تمیز کردن و تلفیق مجموعه داده ها، از نرم افزار Google API Currency Converter برای به دست آوردن ارزش یکسان پول، و از Hichcharts.js و D3.js برای به تصویر درآوردن داده ها.

توانایی این نویسنده در ترجمه اطلاعات برای همگان او را برنده جایزه خبرنگاری داده کرد. وظیفه شما از بین بردن فاصله میان داده و کاربر است،  یعنی مطلب را بیان کنید.

کی؟

داده هایتان چقدربه روز هستند؟ با توجه به اینکه تهیه داده  رسمی معمولا یک سال وقت می برد، به احتمال قوی، داده هایتان دست کم یک ساله هستند، که در روزگار خبر فوری و واکنش فوری به اخبار، زمان طولانی است. به همین دلیل خبرنگاران به شیوه های دیگری جهت  گردآوری داده روی آورده اند. برخی از این شیوه ها به قرار زیر هستند:

داده های زنده که از منابع رسمی گردآوری می شوند، مثل این نقشه قتل در شیکاگو، که بر مبنای تازه ترین گزارش های موارد جنایت در آن شهر تهیه می شوند. تلفیق این داده ها با نقشه ای که مرتب به روز می شوند  می تواند منبعی از گزارش های خبری بسازد ، مثل این گزارش خبری، که در مورد تعدادی قتل نامعمول و طویل مدت  در یک منطقه شهر نوشته شده است.

داده های شبکه های اجتماعی که با بهره از خدمات این شبکه ها به دست می آیند، می توانند مانیتورینگ لحظه به لحظه اخبار فوری را تأمین کنند و به عنوان منبع مورد استفاده خبرنگاران قرار گیرند تا تحلیلی از رویکردهای گوناگون را ارایه دهند. به عنوان مثال، سایت خبری بازرگانی کوارتز Quartz، با مانیتور کردن @J_tsar، حساب کاربری توییتر جوهر سارنایف (بمبگذار ماراتن بوستون) بر اساس زمان انتشار تویت های او، الگوی خواب او را دریافت.

گزارشگری از طریق جمع آوری منابع Crowdsoursing :‌ در پی وقوع یک رویداد عمده،‌ نیروی خوانندگان می تواند برای گردآوری  اطلاعات جهت  تهیه گزارش به کار آید. برای انجام این کار، به یک گروه مخاطب فعال نیاز دارید که به آن رویداد اهمیت می دهند و می خواهند سهمی در گزارش دادن آن داشته باشند، اما در عمل  نه خودشان و نه داده های خام آنها می تواند به تهیه گزارش بیانجامد. این، راه گرانی نیست. با استفاده از چند ابزار ساده رایگان، در چند گام می توانید این کار را انجام دهید:

۱. فراهم کردن صفحه ای حاوی یک فرم گوگل Google form برای پیوند دادن پاسخ خوانندگان؛

۲. ویرایش اطلاعاتی که خوانندگان ارایه می دهند توسط خبرنگاران برای حذف اطلاعات تکراری یا پاسخ های توهین آمیز؛

۳.  وارد کردن داده ها به جدول های گوگل فیوژن Google Fusion؛

۴. تهیه نقشه ای که مرتب  با استفاده از همان داده ها  روزآمد شود (به شماره ۳ نگاه کنید).

خطرهای بسیاری در این کار هست، به ویژه به این دلیل که پاسخ خوانندگان را خودتان انتخاب می کنید. اما به عنوان نمونه نگاهی به کار زونیورس Zooniverse بیاندازید.  تخصص او در استفاده از چندین منبع داده با تکیه به جامعه ای کوچک اما فعال است.

کجا؟

مکان جغرافیایی داده ها مسئله ای مهم و حیاتی است. بخشی کلیدی  خبرنگاری داده، توانایی تلفیق مجموعه داده های مختلف برای تهیه گزارشی تازه است. مثلا تهیه این نقشه ی  تعداد قربانیان اسلحه و صاحبان اسلحه، تنها با تکیه بر محدوده های مشابه در سطح ملی ممکن شده است.

هرقدر محدوده های جغرافیایی محلی تر شوند، تهیه نقشه های قابل تلفیق در سطح محلی دشوارتر می شود. این مشکل اطلاعات آزاد قابل دسترس همگان است که در سطوح گوناگون دولتی تهیه می شود. بنابراین، تسلط بر جغرافیای منطقه بسیار مهم است و همزمان به شما اجازه می دهد که انواع تازه ای از گزارش های خبری بسازید.

چرا؟

این دشوارترین پرسش خبرنگاری داده است. گزارشگری داده  اتفاقات در حال افتادن را به خوبی نشان می دهد اما نمی تواند  دلیل اتفاقشان را به خوبی تحلیل می کند. مثلا تنها به این دلیل که تعداد صاحبان اسلحه وتعداد قتل های مسلحانه در کشوری بالاست، نمی توان نتیجه گرفت که اولی عامل دومی است، حتی اگر این ارتباط به نظر روشن بیاید. خبرنگاری داده معمولا ساده ترین پرسش های خبرنگاری را پیرامون یک متغیرمطرح می کند:

- مسیله چقدر بزرگ است؟

- میزان آن کمتر شده یا بیشتر؟

- چقدر با متغیر دیگری، یا در محیط دیگری، قابل قیاس است؟

گاهی خبرنگاری داده  گزارش های خبری عالی تولید می کند و برای تهیه آنها از تحلیل آمارهای  پیچیده بهره می برد. اما این کار نیازمند تکنیک ها ی  پیشرفته و بسیار نادر است. چنین گزارش هایی معمولاً با همکاری کارشناسان تهیه می شوند و تفاوت بسیاری با کار خبری که با تکیه بر منابع رسمی و استاندارد است دارد.

هرم وارونه

پال بردشاو Paul Bradshaw یک هرم وارونه از خبرنگاری داده ساخته که به خوبی فرایند کار را شرح می دهد. اینجا می توانید در مورد آن بیشتر بخوانید. (دوره های آموزش خبرنگاری در سراسر جهان در مورد هرم وارونه صحبت می کنند.)

بردشاو در مورد این هرم نکته بسیار مهمی نوشته است:

خبرنگاری داده با یکی از این دو راه آغاز می شود: یا پرسشی دارید که نیاز به داده دارد، یا مجموعه داده ای دارید که نیاز به پرسش دارد. هر کدام از این دو که باشد،‌ گردآوری داده هاست که گزارشتان را به عنوان یک نمونه کار خبرنگاری داده تعریف می

کند.

این نکته بسیار مهم است. ایده و نوع ارایه مقاله اتان است که گزارش داده اتان را متفاوت از چاپ ساده این ارقام می کند.

میخواهم بدانم به نظر شما چه نکته ای دیگری را باید به این لیست اضافه کنیم؟

این پست،‌ در وبلاگ شخصی سایمون راجرز منتشر شده و با اجازه او اینجا انتشار یافته است.


Main image CC-licensed by Flickr via Ian