Легко взламываемые модели ИИ показывают, что меры защиты не работают

Вероника Дубровская 21 Мая 2024 - 20:31

...

Легко взламываемые модели ИИ показывают, что меры защиты не работают

В новом отчете британского Института безопасности ИИ говорится, что основные модели искусственного интеллекта легко взламываются, а меры их защиты не работают.

Четыре общедоступные большие языковые модели (Large Language Models, LLM) чрезвычайно уязвимы для «джейлбрейка» — эксплуатации багов, позволяющей заставить модели ИИ выполнять то, что разработчики им делать запретили.

LLM тщательно настраиваются для безопасного публичного пользования. Их обучают избегать вредных реакци1 и токсичных результатов, используя меры предосторожности.

Однако исследователи обнаружили возможность обойти защиту с помощью простых атак.

В качестве наглядного образца можно привести инструкцию для пользователя, согласно которой система должна начинать свой ответ со слов, которые предполагают выполнение вредоносного запроса, например: «Конечно, я рад помочь».

Специалисты использовали подсказки в соответствии с отраслевым стандартом контрольного тестирования. В ходе исследования специалисты обнаружили, что некоторым моделям ИИ даже не требовался джейлбрейк, чтобы выдать нестандартный ответ.

А вот когда использовался джейлбрейк, каждая модель отвечала как минимум один раз из пяти попыток. Три модели в 100% случаев давали ответы на вводящие в заблуждение запросы.

Анализ протестированных моделей показал, что они остаются уязвимы для базовых джейлбрейков, а некоторые LLM выдают вредные результаты без каких-либо попыток обойти защиту. Какие именно модели были исследованы, специалисты не сообщили.

В институте также оценили возможности моделей ИИ выполнять определенные задачи для проведения основных методов кибератак. Несколько LLM смогли решить задачи, которые исследователи назвали «хакерскими на уровне средней школы», но немногие смогли выполнить более сложные действия «университетского уровня».

Следующая главная новость »

Резервные копии не работают? Расскажем в эфире AM Live, как делать по уму. Регистрируйтесь! »

Екатерина Быстрова 11 Февраля 2026 - 10:22

Windows Эксплойты Уязвимости программ Уязвимость нулевого дня Домашние пользователи Корпорации Microsoft

Февральские патчи Microsoft устранили 6 уже используемых уязвимостей

Microsoft выпустила февральский пакет патчей. В рамках этого Patch Tuesday разработчики закрыли 58 уязвимостей, включая шесть активно эксплуатируемых 0-day и ещё три публично раскрытых дыры. Пять уязвимостей получили статус критических.

Среди исправленных проблем — 25 возможностей повышения привилегий, 12 проблем удалённого выполнения кода, а также ошибки обхода защитных механизмов, раскрытия информации, отказа в обслуживании и подмены (спуфинг).

Наиболее серьёзная часть обновления — шесть уязвимостей нулевого дня, которые уже использовались злоумышленниками. Три из них были также публично раскрыты до выхода исправлений.

Среди наиболее опасных:

CVE-2026-21510 — обход защитных механизмов Windows Shell. Эксплуатация возможна через специально подготовленную ссылку или файл-ярлык. Уязвимость позволяет обойти SmartScreen и системные предупреждения, потенциально отключая механизм Mark of the Web.
CVE-2026-21513 — обход защиты в MSHTML Framework. Деталей атаки Microsoft не раскрывает, но уязвимость позволяла обойти встроенные механизмы безопасности.
CVE-2026-21514 — обход защит в Microsoft Word. Для эксплуатации нужно убедить пользователя открыть вредоносный файл Office. Ошибка позволяла обходить OLE-митигирующие механизмы в Microsoft 365 и Office.
CVE-2026-21519 — повышение привилегий в Desktop Window Manager. Успешная эксплуатация давала атакующему права SYSTEM.
CVE-2026-21525 — отказ в обслуживании в Windows Remote Access Connection Manager. Эксплойт ранее был обнаружен специалистами ACROS Security.
CVE-2026-21533 — повышение привилегий в службах Remote Desktop. По данным CrowdStrike, эксплойт позволял модифицировать конфигурацию службы и добавлять нового пользователя в группу администраторов.

Microsoft не уточняет, использовались ли отдельные уязвимости в рамках одной кампании.

Обновление Secure Boot

Помимо устранения уязвимостей, Microsoft начала развёртывание новых сертификатов Secure Boot взамен сертификатов 2011 года, срок действия которых истекает летом 2026 года. Распространение будет поэтапным: устройства получат обновлённые сертификаты только после подтверждения стабильной установки обновлений.

Февральский пакет стал одним из наиболее заметных в этом году именно из-за количества активно эксплуатируемых 0-day — шесть одновременно закрытых «живых» уязвимостей встречаются не так часто. Полный список пропатченных дыр приводим ниже:

Затронутый компонент	CVE-идентификатор	CVE-наименование	Степень риска
.NET	CVE-2026-21218	.NET Spoofing Vulnerability	Важная
Azure Arc	CVE-2026-24302	Azure Arc Elevation of Privilege Vulnerability	Критическая
Azure Compute Gallery	CVE-2026-23655	Microsoft ACI Confidential Containers Information Disclosure Vulnerability	Критическая
Azure Compute Gallery	CVE-2026-21522	Microsoft ACI Confidential Containers Elevation of Privilege Vulnerability	Критическая
Azure DevOps Server	CVE-2026-21512	Azure DevOps Server Cross-Site Scripting Vulnerability	Важная
Azure Front Door (AFD)	CVE-2026-24300	Azure Front Door Elevation of Privilege Vulnerability	Критическая
Azure Function	CVE-2026-21532	Azure Function Information Disclosure Vulnerability	Критическая
Azure HDInsights	CVE-2026-21529	Azure HDInsight Spoofing Vulnerability	Важная
Azure IoT SDK	CVE-2026-21528	Azure IoT Explorer Information Disclosure Vulnerability	Важная
Azure Local	CVE-2026-21228	Azure Local Remote Code Execution Vulnerability	Важная
Azure SDK	CVE-2026-21531	Azure SDK for Python Remote Code Execution Vulnerability	Важная
Desktop Window Manager	CVE-2026-21519	Desktop Window Manager Elevation of Privilege Vulnerability	Важная
Github Copilot	CVE-2026-21516	GitHub Copilot for Jetbrains Remote Code Execution Vulnerability	Важная
GitHub Copilot and Visual Studio	CVE-2026-21523	GitHub Copilot and Visual Studio Code Remote Code Execution Vulnerability	Важная
GitHub Copilot and Visual Studio	CVE-2026-21256	GitHub Copilot and Visual Studio Remote Code Execution Vulnerability	Важная
GitHub Copilot and Visual Studio	CVE-2026-21257	GitHub Copilot and Visual Studio Elevation of Privilege Vulnerability	Важная
GitHub Copilot and Visual Studio Code	CVE-2026-21518	GitHub Copilot and Visual Studio Code Security Feature Bypass Vulnerability	Важная
Mailslot File System	CVE-2026-21253	Mailslot File System Elevation of Privilege Vulnerability	Важная
Microsoft Defender for Linux	CVE-2026-21537	Microsoft Defender for Endpoint Linux Extension Remote Code Execution Vulnerability	Важная
Microsoft Edge (Chromium-based)	CVE-2026-1861	Chromium: CVE-2026-1861 Heap buffer overflow in libvpx	Неизвестно
Microsoft Edge (Chromium-based)	CVE-2026-1862	Chromium: CVE-2026-1862 Type Confusion in V8	Неизвестно
Microsoft Edge for Android	CVE-2026-0391	Microsoft Edge (Chromium-based) for Android Spoofing Vulnerability	Средняя
Microsoft Exchange Server	CVE-2026-21527	Microsoft Exchange Server Spoofing Vulnerability	Важная
Microsoft Graphics Component	CVE-2026-21246	Windows Graphics Component Elevation of Privilege Vulnerability	Важная
Microsoft Graphics Component	CVE-2026-21235	Windows Graphics Component Elevation of Privilege Vulnerability	Важная
Microsoft Office Excel	CVE-2026-21261	Microsoft Excel Information Disclosure Vulnerability	Важная
Microsoft Office Excel	CVE-2026-21258	Microsoft Excel Information Disclosure Vulnerability	Важная
Microsoft Office Excel	CVE-2026-21259	Microsoft Excel Elevation of Privilege Vulnerability	Важная
Microsoft Office Outlook	CVE-2026-21260	Microsoft Outlook Spoofing Vulnerability	Важная
Microsoft Office Outlook	CVE-2026-21511	Microsoft Outlook Spoofing Vulnerability	Важная
Microsoft Office Word	CVE-2026-21514	Microsoft Word Security Feature Bypass Vulnerability	Важная
MSHTML Framework	CVE-2026-21513	MSHTML Framework Security Feature Bypass Vulnerability	Важная
Power BI	CVE-2026-21229	Power BI Remote Code Execution Vulnerability	Важная
Role: Windows Hyper-V	CVE-2026-21244	Windows Hyper-V Remote Code Execution Vulnerability	Важная
Role: Windows Hyper-V	CVE-2026-21255	Windows Hyper-V Security Feature Bypass Vulnerability	Важная
Role: Windows Hyper-V	CVE-2026-21248	Windows Hyper-V Remote Code Execution Vulnerability	Важная
Role: Windows Hyper-V	CVE-2026-21247	Windows Hyper-V Remote Code Execution Vulnerability	Важная
Windows Ancillary Function Driver for WinSock	CVE-2026-21236	Windows Ancillary Function Driver for WinSock Elevation of Privilege Vulnerability	Важная
Windows Ancillary Function Driver for WinSock	CVE-2026-21241	Windows Ancillary Function Driver for WinSock Elevation of Privilege Vulnerability	Важная
Windows Ancillary Function Driver for WinSock	CVE-2026-21238	Windows Ancillary Function Driver for WinSock Elevation of Privilege Vulnerability	Важная
Windows App for Mac	CVE-2026-21517	Windows App for Mac Installer Elevation of Privilege Vulnerability	Важная
Windows Cluster Client Failover	CVE-2026-21251	Cluster Client Failover (CCF) Elevation of Privilege Vulnerability	Важная
Windows Connected Devices Platform Service	CVE-2026-21234	Windows Connected Devices Platform Service Elevation of Privilege Vulnerability	Важная
Windows GDI+	CVE-2026-20846	GDI+ Denial of Service Vulnerability	Важная
Windows HTTP.sys	CVE-2026-21240	Windows HTTP.sys Elevation of Privilege Vulnerability	Важная
Windows HTTP.sys	CVE-2026-21250	Windows HTTP.sys Elevation of Privilege Vulnerability	Важная
Windows HTTP.sys	CVE-2026-21232	Windows HTTP.sys Elevation of Privilege Vulnerability	Важная
Windows Kernel	CVE-2026-21231	Windows Kernel Elevation of Privilege Vulnerability	Важная
Windows Kernel	CVE-2026-21222	Windows Kernel Information Disclosure Vulnerability	Важная
Windows Kernel	CVE-2026-21239	Windows Kernel Elevation of Privilege Vulnerability	Важная
Windows Kernel	CVE-2026-21245	Windows Kernel Elevation of Privilege Vulnerability	Важная
Windows LDAP - Lightweight Directory Access Protocol	CVE-2026-21243	Windows Lightweight Directory Access Protocol (LDAP) Denial of Service Vulnerability	Важная
Windows Notepad App	CVE-2026-20841	Windows Notepad App Remote Code Execution Vulnerability	Важная
Windows NTLM	CVE-2026-21249	Windows NTLM Spoofing Vulnerability	Важная
Windows Remote Access Connection Manager	CVE-2026-21525	Windows Remote Access Connection Manager Denial of Service Vulnerability	Средняя
Windows Remote Desktop	CVE-2026-21533	Windows Remote Desktop Services Elevation of Privilege Vulnerability	Важная
Windows Shell	CVE-2026-21510	Windows Shell Security Feature Bypass Vulnerability	Важная
Windows Storage	CVE-2026-21508	Windows Storage Elevation of Privilege Vulnerability	Важная
Windows Subsystem for Linux	CVE-2026-21237	Windows Subsystem for Linux Elevation of Privilege Vulnerability	Важная
Windows Subsystem for Linux	CVE-2026-21242	Windows Subsystem for Linux Elevation of Privilege Vulnerability	Важная
Windows Win32K - GRFX	CVE-2023-2804	Red Hat, Inc. CVE-2023-2804: Heap Based Overflow libjpeg-turbo	Важная