Атака Trojan Puzzle заставляет ИИ-помощника предлагать ненадежный код

Атака Trojan Puzzle заставляет ИИ-помощника предлагать ненадежный код

Атака Trojan Puzzle заставляет ИИ-помощника предлагать ненадежный код

Команда исследователей из Microsoft и двух американских университетов разработала новый способ отравления данных для ИИ-моделей, призванных ускорить работу программиста. Атака Trojan Puzzle способна обеспечить не только успешное внедрение потенциально опасного кода, но также обход средств статического и сигнатурного анализа, используемых для очистки проектов от уязвимостей.

Нейросетевые помощники программиста вроде Copilot от GitHub и ChatGPT разработки OpenAI работают как системы автозавершения кода, предлагая новые строки и функции с учетом смыслового контекста создаваемого софта. Для обучения таких ассистентов используются образцы кода, доступные в публичных репозиториях.

Поскольку загрузки в подобных источниках редко проверяются должным образом, злоумышленник имеет возможность провести атаку на ИИ-помощника по методу отравления данных — внедрить уязвимый или вредоносный код в обучающие наборы данных и тот будет воспроизведен в предложениях программисту.

Прежние исследования, посвященные подобным атакам, полагались (PDF) в основном на прямое внесение потенциально опасной полезной нагрузки в предназначенные для тренинга данные. В этом случае статический анализатор с легкостью обнаружит и удалит ненадежный код.

Для обхода таких инструментов можно спрятать вредоносный пейлоад в строках документации (докстрингах) и использовать фразу-триггер для активации — анализаторы игнорируют заключенные в тройные кавычки докстринги, а ИИ-модель воспринимает их как обучающие данные и воспроизводит пейлоад в своих подсказках.

В этом случае положение спасет сигнатурный анализ, однако новое исследование показало, что такой фильтр тоже небезупречен. Атака Trojan Puzzle (PDF) способна преодолеть и этот барьер, так как позволяет скрыть вредоносный пейлоад более надежным образом.

С этой целью исследователи использовали особые маркеры (template token, токены шаблона) и фразу-триггер, активирующую полезную нагрузку. Были также созданы три «плохих» образца кода, заменяющие токен произвольным словом (shift, (__pyx_t_float_, befo на рисунке ниже). Слово затем добавляется к заглушке в триггере, и в ходе обучения ИИ-модель привыкает ассоциировать такой участок с маскированной областью пейлоада.

 

При парсинге триггера полезная нагрузка будет воспроизведена даже в том случае, когда слово-заместитель не использовалось в ходе тренинга (например, render). Умный помощник автоматически заменит его уже знакомым токеном; если заполнитель содержит скрытую часть пейлоада, при генерации предложения вредоносный код воспроизведется целиком.

 

Для испытаний из 18 310 репозиториев было собрано 5,88 Гбайт Python-кода в качестве набора данных для обучения. Были также подготовлены вредоносные файлы для вброса с таким пейлоадом, как XSS, path traversal и десериализация недоверенных данных — их внедряли по 160 на каждые 80 тыс. файлов исходного кода, используя прямую инъекцию, докстринги и Trojan Puzzle.

После цикла тренинга доля вредоносных предложений от ИИ составила 30, 19 и 4% соответственно, однако результаты Trojan Puzzle оказалось возможным улучшить до 21% троекратным повторением обучения.

AM LiveПодписывайтесь на канал "AM Live" в Telegram, чтобы первыми узнавать о главных событиях и предстоящих мероприятиях по информационной безопасности.

Россияне определили идеального голосового помощника

Как показало исследование разработчика голосовых помощников, проведенное совместно с исследовательским центром «Позиция», идеальный голосовой помощник должен быть вежливым, спокойным и звонить днем.

Опрос был проведен среди жителей городов с населением свыше миллиона человек. В нем приняли участие 1233 респондента.

Как показали результаты, почти две трети (61%) россиян регулярно сталкиваются с голосовыми роботами на горячей линии. 40% опрошенных предпочитают звонить на горячую линию днём с 12:00 до 18:00, 29% — вечером с 18:00 до 22:00.

Принимать входящие звонки от роботизированных операторов колл-центров россияне также в большинстве случаев предпочитают днём (44%) или вечером (31%).

В голосе робота более чем трети россиян (34%) нравится вежливость. На втором месте идет схожесть голоса с человеческим (28%). Третье и четвертое места разделили официальность и четкое произношение слов, которые набрали по 25%.

Как оказалось, тембр голоса для россиян не имеет большого значения. Так ответили 40%. Оставшиеся разделились почти поровну между мужскими и женскими, правда последние набрали чуть больше голосов. По данным международных исследований, предпочтительным является женский голос.

Половина опрошенных считает, что обращение робота к абоненту по имени и отчеству никак не влияет на повышение доверия к машине. По мнению трети такое обращение располагает к доверительной коммуникации.

Но при этом полностью доверяют голосовому помощнику важную информацию 25% россиян. Около 40% опрошенных не доверяют голосовому ассистенту на горячей линии важную информацию, а больше трети – лишь отдельные тезисы.

Для 43% россиян важно, чтобы робот в разговоре признавался, что он робот. 33% респондентов ответили, что это не важно. Для оставшихся опрошенных этот факт не имеет значения.

«Для реализации голосового агента разработчики используют собственную экспертизу для выбора под каждый конкретный сценарий не только наиболее конверсионного диктора, но и такие важные параметры как: темп речи, ненавязчивость, а также лояльность и доброжелательность при общении с абонентом, — отметил коммерческий директор Neuro.net Александр Лошкарев. — Голосовой помощник должен быть не только голосом бренда и следовать внутреннему регламенту компании при коммуникации, но и быть настоящим помощником, способным решить любой вопрос абонента. Индивидуальная разработка голосовых агентов под требования заказчиков позволяет решить все эти вопросы и адаптировать робота под любую вариативность в диалоге».

AM LiveПодписывайтесь на канал "AM Live" в Telegram, чтобы первыми узнавать о главных событиях и предстоящих мероприятиях по информационной безопасности.

RSS: Новости на портале Anti-Malware.ru