Who’s got dirt: что если компьютеры смогут проводить трансграничные расследования?

АвторFriedrich Lindenberg
Jun 1, 2015 в Журналистика данных

В последние годы много говорится о трансграничной журналистике расследования. Работая с Африканской сетью Центров журналистских расследований (ANCIR), я имел возможность наблюдать этот процесс, когда два репортера из Проекта журналистских расследований Италии (IRPI) приехали в Южную Африку в поисках информации об экономических интересах итальянской мафии в этой стране.

Сесилия Анеси из IRPI и Хадиджа Шарифе из ANCIR часами расспрашивали друг друга о разных людях:

– Ты знаешь N?

– Да, он занимается недвижимостью в Кейптауне.

– Он член итальянской Коза Ностра. У нас много судебных документов о его деятельности в девяностых годах.

Постепенно обе журналистки начали вырабатывать общее понимание сети, связывающей членов мафии, политиков и бизнесменов, о которых они говорили.

Этот процесс требует большой работы и связан с решением важной проблемы – как включать актуальную местную информацию о каждой стране в транснациональные расследования. Осваивающие этот процесс организации, такие как Международный центр журналистских расследований (ICIJ) и Центр по исследованию коррупции и организованной преступности (OCCRP), являются авторами наиболее убедительных журналистских расследований в этой отрасли.

Поддерживая такого рода глубокие расследования, я принимал участие в ряде проектов по работе с базами данных для журналистов-расследователей. Целью таких проектов было сделать информацию в разных странах – от Германии до Южной Африки и Мозамбика – доступной для широкой общественности. В ситуации, когда использование открытых государственных данных становится все более популярным, во многих странах и областях деятельности большие данные становятся все более доступными.

К сожалению, использование таких баз данных также требует знания дополнительного контекста: если вы ищете информацию о политиках в Чили, воспользуйтесь сайтом Poderopedia, в Южной Африке – сайтом Siyazana. Информацию о компаниях можно найти на OpenCorporates, все базы данных также перечислены в Investigative Dashboard. Информацию об общественных контрактах в Европе, кроме данных о Словении и Словакии, которые имеют лучшие базы данных в своих собственных странах, можно найти на TED. Вы записываете? Эта информация быстро становится сложной и запутанной, а ситуация меняется каждый месяц.

Разве Интернет и открытые данные не должны упрощать ситуацию, а не запутывать ее? Разве работа по сбору данных из разных источников не подходит для компьютеров больше, чем для людей?

Если мы хотим использовать открытые данные в расследовательской журналистике, мы должны упростить для людей доступ к ним. Мы должны сделать так, чтобы наши инструменты для работы с данными могли связываться друг с другом, задавать друг другу те самые вопросы, которые журналисты задают в ходе трансграничных расследований: "Ты знаешь X? Что ты можешь мне о них рассказать?"

Создание такой общей функции – API для данных, которую мы назвали Who’s got dirt? ("У кого есть информация?"), – одна из целей проекта Influence Mapping, финансируемого фондом "Открытое общество". Эта группа объединяет программистов, исследователей и журналистов, совместно разрабатывающих способ сопоставления информации о людях и компаниях, полученной из нескольких источников.

Основатели группы: Американская ассамблея при Колумбийском университете, OpenCorporates, LittleSis.org, Poderopedia, OpenNorth.ca и Grano Project, над разработкой которого я работал в рамках стипендиальной программы, – сфокусированы на проблеме открытого обмена данными. В расследовательских проектах различные варианты такой системы могут быть использованы также для работы в таких конфиденциальных ситуациях, как утечка данных. В этом случае нас будут интересовать не наборы данных, а просто возможность узнать, является ли информация доступной – и с кем можно связаться.

Как это будет работать на практике? В ходе хакатона Canvas, организованного в декабре компанией Al Jazeera, я сотрудничал с группой разработчиков, дизайнеров и журналистов, работавшей над созданием прототипа такой программы – Newsclip.se – это инструмент для журналистов, ведущих расследовательские проекты. Этот инструмент может сканировать записи, пока вы их делаете, находит упоминания названий компаний и имен людей, а затем ищет соответствующую информацию в открытых базах данных. Это даст журналистам возможность сделать свои расследования более глубокими.

Пока существует только демоверсия Newsclip.se, но Who’s got dirt? позволит использовать много других инструментов расследования – от таких анализирующих сеть инструментов, как detective.io, до списков наблюдения, постоянно отслеживающих информацию о собственниках компаний, судебных процессах, правах на землю и добычу ископаемых или семейных отношениях.

Если нам удастся развить это направление, то возможно, что трансграничная журналистика скоро получит младшего брата – компьютерную программу: инструмент для расследования, опирающийся на разные базы данных.

Основное изображение пользователя Discos Konfort, лицензия СС сайта Flickr.