روزنامه گاردین مدتها پیش از اینکه عباراتی چون دادهنگاری و خبرنگاری محاسباتی فراگیر شوند، داده و محاسبات را در روزنامهنگاری بهکار میگرفت.
روزنامه گاردین با نام «منچستر گاردین»، صد سال پیش تأسیس شد. دفتر این روزنامه بریتانیایی در دهه ۱۹۴۰ به لندن منتقل و تبدیل شد به یک سازمان خبری بینالمللی که روزنامهنگارانش در جایجای جهان مستقر بودند. گاردین حضور گستردهای در ایالات متحده دارد و یک بازوی غیرانتفاعی هم دارد.
شرکت «تراست اسکات» هرچند در اصل یک مرکز غیرانتفاعی به حساب نمیآید، تنها مالک گاردین است و تمامی سود این روزنامه به آن منتقل میشود. لیز فروگِن، از اعضای پیشین هیأت مدیره گاردین، سال ۲۰۱۶ در این خصوص گفت: «نقش این شرکت آن است که اطمینان حاصل کند روزنامهنگاری بهعنوان اولویت نهایی تمامی این ساز و کارها باقی میماند.»
تراست اسکات در واقع صندوقی است که به روزنامهنگاران گاردین این امکان را میدهد تا خطر کنند و زمانشان را بر طرحهای پژوهشی متمرکز کنند. به کمک همین «صندوق» است که تمامی مقالات وبسایت گاردین به رایگان در دسترس خوانندگان قرار میگیرد. بخش اعظم درآمد این سازمان به طور مستقیم از محل اشتراک این روزنامه حاصل میشود.
روزنامه گاردین مدتها پیش از اینکه عباراتی نظیر ر دادهنگاری و خبرنگاری محاسباتی فراگیر شوند، داده و محاسبات را در روزنامهنگاری بهکار گرفت.
بیش از یک دهه پیش، سایمون راجرز، ویراستار پیشین بخش داده گاردین شروع کرد به جمعآوری داده و انتشار آن در وبسایت «دیتابلاگ». به گفته پاملا دانکِن، ویراستار «پروژههای مرتبط با داده»، ایده راجرز این بود که این وبسایت منبعی باشد برای روزنامهنگاران علاقمند تا آنها بتوانند دادههای مورد نیاز خود را به سرعت به دست بیاورند. او میگوید: «نیمی از دشواری خبرنگاری داده، پیدا کردن محل نگهداری اطلاعات و دسترسی سریع به آنهاست.»
دیتابلاگ در ابتدا بیشتر یک مخزن اطلاعاتی بود که در کنار جذب روزنامهنگاران، توجه برنامهنویسان توسعهدهنده (developers)، دانشمندان حوزه داده و حامیان دادههای آزاد را به خود جلب میکرد، بهگونهای که آنها همه برای رسیدن به اهداف خود از این وبسایت استفاده میکردند.
از مخزن اطلاعات تا محرکی برای تولید گزارش
کارکرد این وبسایت از زمانی آغاز به تغییر کرد که راجرز شروع کرد به تشویق تحریریه گاردین به تهیه گزارشهای دادهمحور. آن زمان به عنوان مثال گاردین در گزارشی به بررسی جزء به جزء دادههای مرتبط با مخارج دولت پرداخت.
دانکن در مقالهای که پیشتر منتشر کرده و در آن به بررسی سیر تکامل تیم گاردین پرداخته، نوشته بود که سال ۲۰۱۰، زمانی که ویکیلیکس دادههای مرتبط با جنگ افغانستان را منتشر کرد، تیم گاردین این اطلاعات را که نزدیک به ۹۰ هزار پرونده بود، بررسی کرد. بر اساس همین اطلاعات درز کرده، گاردین چندین مقاله منتشر کرد و در کنار آن، نقشهای از رویدادهای کلیدی را در اختیار خوانندگان قرار داد تا با استفاده از آن بتوانند اطلاعات مورد نظرشان را از روی این نقشه به صورت اسپردشیت (spreadsheet) بارگذاری کنند.
به گفته دانکن، سال ۲۰۱۱ سالی بود که نحوه فعالیت خبرنگاران داده این تحریریه بار دیگر دستخوش تغییراتی شد. پس از کشته شدن یک جوان در بریتانیا، اعتراضات سراسری از ششم تا یازدهم اوت آن سال در بریتانیا به راه افتاد. آن زمان راجرز و گروهی از روزنامهنگاران، کارآموزان و دانشگاهیان، دیتابیسی ساختند تا بر اساس آن بتوانند داستان اعتراضهای لندن را روایت کنند. آنها اطلاعات تأیید شده مرتبط با شورش را از فایلهای پیدیاف دریافت میکردند و به صورت دستی وارد دیتابیس میکردند. بر همین اساس و به کمک جداول گوگل فیوژن (Google Fusion tables) آنها نقشهای از تمامی اعتراضها در سراسر کشور ساختند. خوانندگان هم میتوانستند با این دادهها کار کنند و هم در صورت تمایل، این اطلاعات را بارگذاری کنند.
آن هنگام بود که روشن شد دیتابلاگ تنها محل آرشیو دادههای جالب نیست و دادهنگاران داده میتوانند فعالیتهایی فراتر از ارائه آمار و ارقام بکنند. داده میتوانست هسته اصلی یک گزارش باشد. اطلاعات برگرفته از داده و افشاگریهای داده میتوانست محور روایت گزارش را تعیین کند.
دانکن میگوید: «موضوع فقط در اختیار داشتن داده نیست. موضوع، تفسیر، تحلیل و جان دادن به داده است.»
سال ۲۰۱۵، اندکی پس از آنکه دانکن به گاردین پیوست، دیتابلاگ و گروه «پروژههای مرتبط با داده» (گروهی که دانکن ویراستار آن بود) با هم تلفیق شدند و یک گروه سه نفره را تشکیل دادند. این تیم به یکی از بخشهای اساسی روزنامه گاردین تبدیل شد و از آن پس، «داده و خبر دو بخش مجزا از هم نبودند».
به گفته دانکن، دادهنگاری طی سالهای اخیر تغییر کرده و از تحلیل دادههای دولتی تبدیل شده به بکارگیری خبرنگاری محاسباتی برای ساختن دیتابیسهای تازه. تلاقی برنامهنویسی و خبرنگاری به گفته دانکن در حال حاضر «قویتر از همیشه» به چشم میآید.
ساخت دیتابیس و قدرت محاسبه
دانکن فعالیت خود در حوزه روزنامهنگاری داده را از ایرلند آغاز کرد. حدود سال ۲۰۱۰، دولت ایرلند دچار دگرگونی جدی شده بود. آن زمان دانکن میخواست بداند سیاستمدارانی که دولت را ترک میکنند قرار است چقدر حقوق بازنشستگی بگیرند. اطلاعات پیرامون مبلغ حقوق بازنشستگی یک امر خصوصی به حساب میآمد و مؤسسات دولتی حاضر نمیشدند مبلغ دقیق را به دانکن بگویند. اما نحوه محاسبه میزان این بازنشستگیها موضوع محرمانهای نبود.
دانکن فرمول این محاسبه را دریافت کرد و طی چند هفته بعد، رو شروع کرد به یادگیری؛ از اصول ابتدایی اکسل (Excel) گرفته تا نوشتن فرمولهای «تقریباً پیچیده» و تودرتوی ایف (IF) در اکسل، و ساخت یک محاسبهگر که هر وقت میخواست راجع به حقوق بازنشستگی یکی از سیاستمداران بنویسد از آن محاسبهگر استفاده میکرد. او میگوید: «این کار درهای تازهای را به رویم باز کرد.»
دانکن کار خود را باکسل و گوگلشیتس (Google Sheets) شروع کرد و حال در اِسکیواِل (SQL) و پایتون کد مینویسد. او همواره به دنبال بهترین ابزارهای در دسترس است و برای انجام هرچه سریعتر کارها به دنبال «روشهای فوری» میگردد. به عنوان مثال، او برای گرفتن اطلاعات از وبسایتها در عرض چند دقیقه، از webscraper.io استفاده میکند.
زمانی که دانکن روزنامهنگاری داده تدریس میکند، سؤالی که بیش از همه از او میشود، این است: «اگر دادهای در اختیار دارید که قابل اعتماد نیست، چطور میتوانید همچنان از روزنامهنگاری داده در این خصوص استفاده کنید؟»
توصیه او این است که افراد به دنبال منابع خبری سوم قابل اعتمادی باشند که همین داده را جمعآوری میکنند و یا راهی پیدا کنند تا دیتابیس خود را بسازند. به گفته او حتی در بریتانیا، آمار دولتی بر اساس تخمینهای تقریبی است. او میگوید داشتن ذهن انتقادی و زیر سؤال بردن اعدادی که مقامات در اختیار ما قرار میدهند، بخش مهمی از کار است.
دانکن میگوید: «به عنوان یک دادهنگار، باید استانداردهای بالاتری برای اعداد قائل باشید.» او میافزاید بخشی از کارش به عنوان ویراستار بخش «پروژههای مرتبط با داده» این است که زمانی که اعداد، داستانی را که فرض خبرنگار بوده بازگو نمیکنند، از انتشار گزارش و مواردی که حاوی نتایج نادرست است، جلوگیری کند.
او توضیح میدهد: «آمار همیشه حاوی بخشهای خاکستری است.» به گفته او روزنامهنگاران داده، افراد دانشگاهی نیستند و کارشان انجام تحقیقات بررسی شده نیست، اما گزارشهای داده محور این خبرنگاران باید کماکان دقیق باشد و فرضشان باید از محک بررسیهای دقیق سربلند بیرون بیاید.
دانکن میگوید: «دیگر نیازی نیست به مجموعه دادههای موجود اتکا کنیم، چرا که میتوانیم دیتابیس خود را بسازیم. فکر کنم در حال حاضر این، نقطه قوت دادهگاری داده است.»
هماکنون، تیم کوچک دادهنگاران گاردین مدام مشغول تولید گزارشها و مصورسازی دادههای روزآمد هستند. در دوران شیوع کرونا، روزنامهنگاران حوزه مصورسازی گاردین با استفاده از دادههای «دفتر آمار کار» توانستند نشان دهند که کسانی که توانایی مالی بیشتری دارند، به سبب شغلشان، بیش از بقیه امکان دورکاری دارند.
گاردین همچنین در دسامبر ۲۰۲۲ یک گزارش برهمکنشی (interactive) منتشر کرد و به بررسی تأثیر تأخیر ارائه خدمات NHS یا «سرویس سلامت ملی» بریتانیا بر بیماران پرداخت. در یک پروژه دادهمحور دیگر، این روزنامه نگاهی داشت به این موضوع که سیاستمداران زن نسبت به همتایان مرد خود بیشتر مورد آزار آنلاین قرار میگیرند. گاردین در یک دیتابیس برهمکنشی دیگر، نشان داد که تغییرات اقلیمی چه اثری بر یخچالهای طبیعی سراسر جهان دارد.
دانکن معتقد است دادهنگارانی که عضو تیم اویند، «متخصصان جامع علوم هستند که میتوانند مهارتهایشان را برای تحقیق بر هر موضوعی به کار بگیرند».
به همین دلیل، به گفته او، دادهنگاران معمولاً برای انجام یک پروژه با خبرنگار یک حوزه تخصصی -- مثل خبرنگار سرویس اجتماعی یا سلامت -- همکاری میکنند. او میگوید: «از نظر من، همکاری کلید اصلی است و به خبرنگاری ما عمق بسیار میدهد.»
تصویر از آنسپلش، عکاس: اسکات وب.
این مطلب، بخشی است از مجموعه منابع جعبه ابزار آموزش خبرنگاری محاسباتی.