Почему журналистам важно знать о метаданных

Автор Mariano Blejman
Oct 30, 2018 в Miscellaneous

В наше время, когда мы знаем, что Dropbox имеет доступ к информации, находящейся в наших файлах, и Google делится нашей персональной информацией АНБ и ФБР, журналистам нужны новые навыки, чтобы не оставлять за собой следов или не позволить другим отслеживать анонимные источники.

Информация о наших данных называется "метаданные". Когда мы делаем фотографию, в ней содержится информация о камере, времени, когда фотография была сделана и, возможно, об имени того, кто сделал фото, если на вашей камере включены функции геолокации и распознавания лиц. Так что, если вы снимаете фото в наше время, это гораздо больше, чем просто фото. Они содержат много информации.

В ходе мероприятия Media Party, организованного Hacks/Hackers Буэнос-Айрес, Даниэль Фогельман из компании InfoByte провёл семинар по методам поиска и очистки метаданных. В ходе семинара Фогельман учил журналистов, как обнаружить и удалить информацию из файлов в формате PDF, JPG и HTML, чтобы нечаянно не оставить её где-нибудь.

Каждый раз, когда мы отправляем документы, в дополнение к содержимому документа мы отправляем информацию о компьютере, на котором он был обработан, и об операционной системе. Если программа зарегистрирована, вы найдете свое имя в окне “Свойства” файла. Когда мы посылаем email, мы не просто отправляем и получаем информацию. Все вместе мы также демонстрируем закономерности того, как мы взаимодействуем с обществом и друг с другом.

Частично эта информация была обнаружена в ходе эксперимента Immersion, проведённого Массачусетском технологическом институте (MIT), наглядно продемонстрировавшего, как контент аккаунтов Gmail может быть использован для получения информации о коммуникационных моделях и поведении.

Исследователей MIT вдохновил случай Эдварда Сноудена, продемонстрировавший важность метаданных, которые отслеживаются американскими разведслужбами. В основном, как было сказано много раз, при общении через Gmail - у которого есть доступ к такого рода данным - можно быстро узнать о группах, с которыми общается пользователь, его родственниках, друзьях, контактах, одним словом, обо всём, что можно вывести из наших данных.

На прошедшей в конце июня конференции Knight-MIT Civic Media у входа в медиа-лабораторию был установлен огромный экран, демонстрирующий данные о тех, кто осмеливался просто поделиться своими именами пользователей и паролями — прекрасная иллюстрация того, как быстро компьютер может найти данные о пользователях.

Документы, которые создают журналисты, содержат метаданные, и все эти данные, не являющиеся контентом, содержат сведения. Судебные документы содержат метаданные: номер суда, имя судьи, название и количество страниц. Но мы не можем жить без метаданных. Мы не можем послать электронное письмо, не зная, куда, или сделать фотографию, не оставляя информации о том, какой камерой она была снята. Мы не можем говорить по мобильному телефону без того, чтобы система знала, где мы находимся.

Метаданные, конечно, также могут быть источником информации для журналистского расследования. В MIT во время хакатона, организованного Knight-Mozilla Open News, Волдо Джаквит, представитель платформы State Decoded и Чейс Дэвис из New York Times провели проект под названием Judgmental.

Идея проекта заключается в том, чтобы анализировать правовые документы формата PDF, автоматически находить метаданные, создавать API и интерактивно запрашивать документы. Участники хакатона создали прототип за два дня. Они нашли способ поиска государственных документов с метаданными, которые могут быть использованы для юридических расследований, основанный на нахождении маркировки документов.

Удаление такого большого объёма метаданных при проведении журналистских расследований - сложная и трудоемкая задача. Лучший способ сделать это - начать с изучения самого себя.

Так что начните обращать внимание на то, какую информацию вы оставляете позади себя. Проведите поиск по своему имени в поисковой системе Google, создавая или редактируя документ, обращайте внимание на секцию "информация"; старайтесь понять, как другие люди видят вашу информацию, откройте ваши фотографии на разных компьютерах и попытайтесь понять, какую информацию о вас они несут.

Стипендиат программы Knight International Journalism Мариано Блейман - редактор и предприниматель в сфере медиа, специализирующийся в области дата-журналистики.

Контент, связанный с глобальными инновациями в сфере медиа, относящийся к проектам и партнерам стипендиальной программы Knight International Journalism получает поддержку фонда Джона С. и Джеймса Л. Найтов и был отредактирован Дженнифер Доррох.

Изображение: скринграб Immersion.