Можно ли бороться с дипфейками посредством подхода C2PA?

...

Поддельный цифровой контент и дипфейки создают всё больше угроз для пользователей. Мировое сообщество предлагает различные способы распознавания подделок. Один из них — стандарт C2PA, позволяющий встраивать метаданные для проверки изображений и другого медиаконтента на следы ИИ.

Введение
Как мир противостоит цифровым подделкам
Как C2PA помогает выявлять подлинность контента и бороться с фейками?
Вопросы, которые важно решить
Уязвимости и способы обхода: можно ли подделать метаданные?
Выводы

Введение

В 2023 году количество случаев мошеннических действий, которые были совершены с использованием дипфейков (deepfake), то есть подделки видео, изображений, голоса и так далее, увеличилось в 31 раз в сравнении с прошлым годом. Суммы ущерба также растут. Есть повод подробнее рассказать о современной ситуации с цифровыми подделками и о С2РА.

Весной Anti-Malware.ru анализировал, в чём опасность голосовых дипфейков и атак с их использованием.

Как мир противостоит цифровым подделкам

Большую работу против поддельного цифрового контента ведёт объединение C2PA (Coalition for Content Provenance and Authenticity, «коалиция по происхождению и подлинности контента»). Его поддерживают Microsoft, OpenAI и другие компании. Социальные сети и медиаплатформы готовы широко внедрять инновации, которые предлагает C2PA, для распознавания поддельного контента. В чём суть?

Если раньше при распознавании видеодипфейка можно было опираться на весьма заметные признаки, такие как отсутствие моргания или зубов, слабая мимика, лишние пальцы и пр., то теперь не всё так просто. Технологии продвинулись настолько, что даже экспертам трудно определить дипфейк без дополнительных технологий-помощников.

Впрочем, количество подделок в цифровой сфере сейчас таково, что всё равно нет никакой возможности обращаться к экспертам для определения подлинности контента. Необходимо автоматизировать этот процесс.

Основная идея C2PA заключается в том, чтобы добавлять и защищать метаданные, которые указывают на происхождение и историю изменения контента. Это означает, что любые манипуляции с файлом — например, редактирование в Photoshop или сжатие — будут зафиксированы в метаданных, которые можно проверить. Эти сведения содержат:

Информацию об авторе и дате создания файла.
Данные о месте съёмки.
Отметки об изменениях, таких как применение фильтров, сжатие или редактирование.

Как C2PA помогает выявлять подлинность контента и бороться с фейками?

Подход C2PA ещё называют цифровой подписью для изображений, потому что он позволяет выявлять уникальные идентификаторы и таким образом подсвечивать «безликий» контент, сгенерированный нейросетью.

Аналогом этой технологии можно считать IPTC. Она позволяла добавлять теги к контенту, однако их было легче отредактировать и заменить.

Кратко о сути процесса аутентификации C2PA:

Берётся некоторый цифровой объект (фото или видео), к которому при создании прикрепляются метаданные. Это набор технической и нетехнической информации о контенте. В число технических характеристик часто включают цветовой профиль, выдержку, параметры камеры на момент фотосъёмки и т. д. К нетехническим данным относят местоположение, обозначение производителя контента и др.
Метаданные становятся частью доступной информации об изображении, включая то, было ли оно обрезано, сжато, обработано в редакторе. Эти сведения должны будут вносить и закреплять сами приложения для обработки контента. К примеру, Adobe уже добавила поддержку метаданных C2PA в Photoshop и Lightroom. Каждое утверждение об изменении изображения фиксируется цифровой подписью.
Всю информацию о происхождении контента и историю его изменений можно смотреть в специальном документе «Manifest», который актуализируется по мере обновления файла.
К изображению добавляется информация о его оригинальном происхождении, то есть даже после редактирования можно узнать, к примеру, каким был фокус камеры на момент съёмки и какое устройство использовалось, даже если изображение обработано с применением эффекта расфокусировки.
Дополнительно составляется и фиксируется вся история контента, начиная от момента его создания и включая все попытки изменения.
Осуществляется привязка метаданных к контенту. Есть два способа: жёсткая привязка, которая делает данные неотделимыми от контента, и гибкая привязка, допускающая некоторые изменения или манипуляции.

Вопросы, которые важно решить

Многие социальные платформы планируют присоединиться к отслеживанию контента. Google собирается внедрить C2PA в результаты поиска изображений и рекламные системы, рассматривает возможность её интеграции в YouTube.

Однако у этого подхода, как считают эксперты, есть существенный недостаток: для его внедрения необходимо будет перестраивать алгоритмы социальных сетей. Это сложно и требует расходов. Откуда возьмутся деньги? Возможно, перемены будут профинансированы за счёт самих пользователей — через механизм оплаты доступа к «верифицированному» контенту (по крайней мере, в самом начале).

Ещё один важный пласт вопросов связан с безопасностью. Как, например, передавать данные о геолокации, если речь идёт о публикации снимков рядовыми пользователями, которые зачастую делают их из своего дома? Да и вообще, как защищать всю дополнительную информацию о файлах? Ведь тот же ракурс съёмки является одним из признаков творчества, эти сведения нельзя раскрывать и их защищает авторское право.

Также важно единообразие подходов к верификации. Если каждая соцсеть и каждый сервис будут пользоваться своими собственными, может возникнуть неразбериха — а ведь подходы к определению подлинности есть далеко не только у C2PA. Так, «Яндекс» предложил технологию Yandex Vision, анализирующую «картинки» и делающую пометки об авторстве ИИ. В начале июля компания объявила, что изображения, которые были созданы нейросетью YandexART для применения в рекламе, будут промаркированы. Свой подход есть и у YouTube, который помечает плашкой «Altered or Synthetic Content» созданные с помощью ИИ видеоролики; впрочем, пока пользователи включают её по своему усмотрению.

Однако даже несмотря на то, что единого подхода у разных соцсетей нет, применяемые ими меры наверняка могут снизить количество поддельного цифрового контента. Было бы хорошо также внедрить механизм взаимодействия с пользователями: после поступления жалобы на определённые файлы проверять их на предмет специальных доработок.

Уязвимости и способы обхода: можно ли подделать метаданные?

В настоящее время подход C2PA хорош, но для его работы нужны «тепличные» условия. Он будет неплохо работать в идеальной модели с честными людьми, но если кто-то захочет сменить имя учётной записи в операционной системе, сделать это будет нетрудно. Даже возможность сохранить скриншот оригинального изображения уже изменит данные о его создателе при публикации. Поэтому в «боевых» условиях этот подход в своём нынешнем виде может оказаться не очень рабочим.

Технология C2PA может помочь в борьбе с неопытными мошенниками или же при отслеживании авторских прав на контент, но в данный момент многие эксперты сходятся во мнении, что на текущем этапе развития она не сможет обеспечить полной защиты от дипфейков.

Помимо этого у технологии C2PA есть ряд других недостатков, актуальных на данный момент:

Ограниченная поддержка устройств. Только несколько моделей камер от брендов Leica и Sony поддерживают стандарт C2PA. Неясно, будут ли Apple и Google применять функции C2PA в iPhone и устройствах на базе Android.
Проблемы совместимости программного обеспечения. Не все графические редакторы поддерживают C2PA. Например, Affinity Photo и GIMP пока не имеют такой возможности.
Отсутствие широкого внедрения. Большинство крупных онлайн-платформ ещё не отображают данные C2PA.
Потенциальные проблемы с конфиденциальностью. Внедрение такой системы может вызвать опасения у пользователей.
Необходимость отраслевого сотрудничества. Эффективность подхода C2PA зависит от того, сколько ведущих компаний по обработке, публикации, распространению контента будут согласны сотрудничать.

Однако все эти недостатки могут быть устранены, если к конвенции присоединится большое количество участников (в первую очередь социальные сети и мессенджеры), а сами технологии будут усовершенствованы.

Выводы

Иллюзий испытывать не стоит. Конвенция C2PA предлагает решение для распознавания фотоподделок, которые процветали ещё в девяностые. Нынешние дипфейки работают не со статичными файлами, у которых могут быть метаданные. Сейчас это — потоковые аудио и видео, где распознавать подделки нужно «на лету».

C2PA не спасла бы бизнесмена из Гонконга и 250 млн рублей в РФ: она лишь может немного облегчить жизнь людям, чьи лица «прифотошопили» к неприличным фото. Для борьбы с актуальными видами дипфейков нужны более современные решения — и здесь слово за провайдерами голосовой и видеосвязи, а среди них львиную долю занимают мессенджеры и соцсети. Именно в их руках — защита будущего спокойствия пользователей.

Полезные ссылки:

Технологии Deepfake как угроза информационной безопасности

В чём опасность голосовых дипфейков и атак с их использованием

Могут ли дипфейки сделать биометрическую идентификацию бесполезной?