داده‌نگاری در روزنامه گاردین؛ از گذشته تاکنون

porIJNetAug 1, 2023 em داده‌نگاری
تصویر انتزاعی

روزنامه گاردین مدت‌ها پیش از این‌که عباراتی چون داده‌نگاری و خبرنگاری محاسباتی فراگیر شوند، داده و محاسبات را در روزنامه‌نگاری به‌کار می‌گرفت. 

روزنامه گاردین با نام «منچستر گاردین»، صد سال پیش تأسیس شد. دفتر این روزنامه بریتانیایی در دهه ۱۹۴۰ به لندن منتقل و تبدیل شد به یک سازمان خبری بین‌المللی که روزنامه‌نگارانش در جای‌جای جهان مستقر بودند. گاردین حضور گسترده‌ای در ایالات متحده دارد و یک بازوی غیرانتفاعی هم دارد. 

شرکت «تراست اسکات» هرچند در اصل یک مرکز غیرانتفاعی به حساب نمی‌آید، تنها مالک گاردین است و تمامی سود این روزنامه به آن منتقل می‌شود. لیز فروگِن، از اعضای پیشین هیأت مدیره گاردین، سال ۲۰۱۶ در این خصوص گفت: «نقش این شرکت آن است که اطمینان حاصل کند روزنامه‌نگاری به‌عنوان اولویت نهایی تمامی این ساز و کارها باقی می‌ماند.» 

تراست اسکات در واقع صندوقی است که به روزنامه‌نگاران گاردین این امکان را می‌دهد تا خطر کنند و زمانشان را بر طرح‌های پژوهشی متمرکز کنند. به کمک همین «صندوق» است که تمامی مقالات وبسایت گاردین به رایگان در دسترس خوانندگان قرار می‌گیرد. بخش اعظم درآمد این سازمان به طور مستقیم از محل اشتراک این روزنامه حاصل می‌شود. 

روزنامه گاردین مدت‌ها پیش از این‌که عباراتی نظیر ر داده‌نگاری و خبرنگاری محاسباتی فراگیر شوند، داده و محاسبات را در روزنامه‌نگاری به‌کار گرفت. 

بیش از یک دهه پیش، سایمون راجرز، ویراستار پیشین بخش داده گاردین شروع کرد به جمع‌آوری داده و انتشار آن در وبسایت «دیتابلاگ». به گفته پاملا دانکِن، ویراستار «پروژه‌های مرتبط با داده»، ایده راجرز این بود که این وبسایت منبعی باشد برای روزنامه‌نگاران علاقمند تا آن‌ها بتوانند داده‌های مورد نیاز خود را به سرعت به دست بیاورند. او می‌گوید: «نیمی از دشواری خبرنگاری داده، پیدا کردن محل نگهداری اطلاعات و دسترسی سریع به آن‌هاست.»

دیتابلاگ در ابتدا بیشتر یک مخزن اطلاعاتی بود که در کنار جذب روزنامه‌نگاران، توجه برنامه‌نویسان توسعه‌دهنده (developers)، دانشمندان حوزه داده و حامیان داده‌های آزاد را به خود جلب می‌کرد، به‌گونه‌ای که آنها همه برای رسیدن به اهداف خود از این وبسایت استفاده می‌کردند. 

از مخزن اطلاعات تا محرکی برای تولید گزارش

کارکرد این وبسایت از زمانی آغاز به تغییر کرد که راجرز شروع کرد به تشویق تحریریه گاردین به تهیه گزارش‌های داده‌محور. آن زمان به عنوان مثال گاردین در گزارشی به بررسی جزء به جزء داده‌های مرتبط با مخارج دولت پرداخت.

دانکن در مقاله‌ای که پیشتر منتشر کرده و در آن به بررسی سیر تکامل تیم گاردین پرداخته، نوشته بود که سال ۲۰۱۰، زمانی که ویکی‌لیکس داده‌های مرتبط با جنگ افغانستان را منتشر کرد، تیم گاردین این اطلاعات را که نزدیک به ۹۰ هزار پرونده بود، بررسی کرد. بر اساس همین اطلاعات درز کرده، گاردین چندین مقاله منتشر کرد و در کنار‌ آن، نقشه‌ای از رویدادهای کلیدی را در اختیار خوانندگان قرار داد تا با استفاده از آن بتوانند اطلاعات مورد نظرشان را از روی این نقشه به صورت اسپردشیت (spreadsheet) بارگذاری کنند.

به گفته دانکن، سال ۲۰۱۱ سالی بود که نحوه فعالیت خبرنگاران داده این تحریریه بار دیگر دستخوش تغییراتی شد. پس از کشته شدن یک جوان در بریتانیا، اعتراضات سراسری از ششم تا یازدهم اوت آن سال در بریتانیا به راه افتاد. آن زمان راجرز و گروهی از روزنامه‌نگاران، کارآموزان و دانشگاهیان، دیتابیسی ساختند تا بر اساس آن بتوانند داستان اعتراض‌های لندن را روایت کنند. آن‌ها اطلاعات تأیید شده مرتبط با شورش را از فایل‌های پی‌دی‌اف دریافت می‌کردند و به صورت دستی وارد دیتابیس می‌کردند. بر همین اساس و به کمک جداول گوگل فیوژن (Google Fusion tables) آن‌ها نقشه‌ای از تمامی اعتراض‌ها در سراسر کشور ساختند. خوانندگان هم می‌توانستند با این داده‌ها کار کنند و هم در صورت تمایل، این اطلاعات را بارگذاری کنند.

آن هنگام بود که روشن شد دیتابلاگ تنها محل آرشیو داده‌های جالب نیست و داده‌نگاران داده می‌توانند فعالیت‌هایی فراتر از ارائه آمار و ارقام بکنند. داده می‌توانست هسته اصلی یک گزارش باشد. اطلاعات برگرفته از داده و افشاگری‌های داده می‌توانست محور روایت گزارش را تعیین کند.

دانکن می‌گوید: «موضوع فقط در اختیار داشتن داده نیست. موضوع، تفسیر، تحلیل و جان دادن به داده است.»

سال ۲۰۱۵، اندکی پس از آن‌که دانکن به گاردین پیوست، دیتابلاگ و گروه «پروژه‌های مرتبط با داده» (گروهی که دانکن ویراستار آن بود) با هم تلفیق شدند و یک گروه سه نفره را تشکیل دادند. این تیم به یکی از بخش‌های اساسی روزنامه گاردین تبدیل شد و از آن پس، «داده و خبر دو بخش مجزا از هم نبودند».

به گفته دانکن، داده‌نگاری طی سال‌های اخیر تغییر کرده و از تحلیل داده‌های دولتی تبدیل شده به بکارگیری خبرنگاری محاسباتی برای ساختن دیتابیس‌های تازه. تلاقی برنامه‌نویسی و خبرنگاری به گفته دانکن در حال حاضر «قوی‌تر از همیشه» به چشم می‌آید.

ساخت دیتابیس و قدرت محاسبه

دانکن فعالیت خود در حوزه روزنامه‌نگاری داده را از ایرلند آغاز کرد. حدود سال ۲۰۱۰، دولت ایرلند دچار دگرگونی جدی شده بود. آن زمان دانکن می‌خواست بداند سیاستمدارانی که دولت را ترک می‌کنند قرار است چقدر حقوق بازنشستگی بگیرند. اطلاعات پیرامون مبلغ حقوق بازنشستگی یک امر خصوصی به حساب می‌آمد و مؤسسات دولتی حاضر نمی‌شدند مبلغ دقیق را به دانکن بگویند. اما نحوه محاسبه میزان این بازنشستگی‌ها موضوع محرمانه‌ای نبود.

دانکن فرمول این محاسبه را دریافت کرد و طی چند هفته بعد، رو شروع کرد به یادگیری؛ از اصول ابتدایی اکسل (Excel) گرفته تا نوشتن فرمول‌های «تقریباً پیچیده» و تودرتوی ایف (IF) در اکسل، و ساخت یک محاسبه‌گر که هر وقت می‌خواست راجع به حقوق بازنشستگی یکی از سیاستمداران بنویسد از آن محاسبه‌گر استفاده می‌کرد. او می‌گوید: «این کار درهای تازه‌ای را به رویم باز کرد.»

دانکن کار خود را باکسل و گوگل‌شیتس (Google Sheets) شروع کرد و حال در اِس‌کیو‌اِل (SQL) و پایتون کد می‌نویسد. او همواره به دنبال بهترین ابزارهای در دسترس است و برای انجام هرچه سریع‌تر کارها به دنبال «روش‌های فوری» می‌گردد. به عنوان مثال، او برای گرفتن اطلاعات از وبسایت‌ها در عرض چند دقیقه، از webscraper.io استفاده می‌کند.

زمانی که دانکن روزنامه‌نگاری داده تدریس می‌کند، سؤالی که بیش از همه از او می‌شود، این است: «اگر داده‌ای در اختیار دارید که قابل اعتماد نیست، چطور می‌توانید همچنان از روزنامه‌نگاری داده در این خصوص استفاده کنید؟»

توصیه او این است که افراد به دنبال منابع خبری سوم قابل اعتمادی باشند که همین داده را جمع‌آوری می‌کنند و یا راهی پیدا کنند تا دیتابیس خود را بسازند. به گفته او حتی در بریتانیا، آمار دولتی بر اساس تخمین‌های تقریبی است. او می‌گوید داشتن ذهن انتقادی و زیر سؤال بردن اعدادی که مقامات در اختیار ما قرار می‌دهند، بخش مهمی از کار است.

دانکن می‌گوید: «به عنوان یک داده‌نگار، باید استانداردهای بالاتری برای اعداد قائل باشید.» او می‌افزاید بخشی از کارش  به عنوان ویراستار بخش «پروژه‌های مرتبط با داده» این است که زمانی که اعداد، داستانی را که فرض خبرنگار بوده بازگو نمی‌کنند، از انتشار گزار‌ش‌ و مواردی که حاوی نتایج نادرست است، جلوگیری کند.

او توضیح می‌دهد: «آمار همیشه حاوی بخش‌های خاکستری است.» به گفته او روزنامه‌نگاران داده، افراد دانشگاهی نیستند و کارشان انجام تحقیقات بررسی شده نیست، اما گزارش‌های داده محور این خبرنگاران باید کماکان دقیق باشد و فرضشان باید از محک بررسی‌های دقیق سربلند بیرون بیاید.

دانکن می‌گوید: «دیگر نیازی نیست به مجموعه‌ داده‌های موجود اتکا کنیم، چرا که می‌توانیم دیتابیس خود را بسازیم. فکر کنم در حال حاضر این، نقطه قوت داده‌گاری داده است.»

هم‌اکنون، تیم کوچک داده‌نگاران گاردین مدام مشغول تولید گزارش‌ها و مصورسازی داده‌های روزآمد هستند. در دوران شیوع کرونا، روزنامه‌نگاران حوزه مصورسازی گاردین با استفاده از داده‌های «دفتر آمار کار» توانستند نشان دهند که کسانی که توانایی مالی بیشتری دارند، به سبب شغلشان، بیش از بقیه امکان دورکاری دارند. 

گاردین همچنین در دسامبر ۲۰۲۲ یک گزارش برهم‌کنشی (interactive) منتشر کرد و به بررسی تأثیر تأخیر ارائه خدمات NHS یا «سرویس سلامت ملی» بریتانیا بر بیماران پرداخت. در یک پروژه داده‌محور دیگر، این روزنامه نگاهی داشت به این موضوع که سیاستمداران زن نسبت به همتایان مرد خود بیشتر مورد آزار آنلاین قرار می‌گیرند. گاردین در یک دیتابیس برهم‌کنشی دیگر، نشان داد که تغییرات اقلیمی چه اثری بر یخچال‌های طبیعی سراسر جهان دارد.

دانکن معتقد است داده‌نگارانی که عضو تیم اویند، «متخصصان جامع علوم هستند که می‌توانند مهارت‌هایشان را برای تحقیق بر هر موضوعی به کار بگیرند».

به همین دلیل، به گفته او، داده‌نگاران معمولاً برای انجام یک پروژه با خبرنگار یک حوزه تخصصی -- مثل خبرنگار سرویس اجتماعی یا سلامت -- همکاری می‌کنند. او می‌گوید: «از نظر من، همکاری کلید اصلی است و به خبرنگاری ما عمق بسیار می‌دهد.»


تصویر از آنسپلش، عکاس: اسکات وب. 

این مطلب، بخشی است از مجموعه منابع جعبه ابزار آموزش خبرنگاری محاسباتی.