Минцифры приступило к разработке порядка сбора датасетов у бизнеса

Минцифры приступило к разработке порядка сбора датасетов у бизнеса

Минцифры приступило к разработке порядка сбора датасетов у бизнеса

Минцифры в рамках реализации требований закона об обезличивании персональных данных начало работу над регламентацией порядка сбора властями таких датасетов у бизнес-структур. Перечень оснований уже находится на стадии черновика.

По данным «Коммерсанта», документ вышел 30 октября. Речь идет о черновике распоряжения правительства, которое устанавливает перечень оснований для запроса ведомствами данных у компаний.

Всего их шесть, в том числе чрезвычайные ситуации природного и техногенного характера, а также социальные исследования для нужд госуправления.

Требование для компаний передавать правительству наборы обезличенных данных содержит закон 233-ФЗ о порядке оборота обезличенных персональных данных.

Бизнес также получит возможность анализировать собранные датасеты, не покидая периметра государственной системы, где они хранятся. Однако их выгрузка запрещена.

Пресс-служба Ассоциации больших данных в комментарии для «Коммерсанта» увидела в нынешней редакции проекта распоряжения риски избыточных затрат на широкий спектр запросов и компрометации данных клиентов операторов персональных данных:

«Процедура запросов и цели/методы объединения данных должны быть конкретизированы для каждого конкретного случая и проходить процедуры оценки риска деобезличивания и обсуждений с участием специалистов в области обезличивания и бизнес-сообщества».

Эксперты, которых опросило издание, также указывали на риски: правительство будет иметь право запрашивать у бизнеса любые данные. Нормативная база же должна устанавливать четкие правила игры с учетом интересов всех сторон.

В самом Минцифры заверили «КоммерсантЪ», что черновик от 30 октября не является итоговой версией и он будет серьезно доработан. Кроме того, представители ведомства пообещали сделать так, чтобы реализация требований не привела к значительным затратам для бизнеса.

Anti-Malware Яндекс ДзенПодписывайтесь на канал "Anti-Malware" в Telegram, чтобы первыми узнавать о новостях и наших эксклюзивных материалах по информационной безопасности.

Мошенников, освоивших ИИ, выдают артефакты на фейковых сайтах

Проведенное в «Лаборатории Касперского» исследование показало, что поддельные сайты, созданные с помощью ИИ, могут содержать следы использования таких онлайн-сервисов, которые мошенники поленились или забыли вычистить.

Рост доступности больших языковых моделей (БЯМ, LLM) способствует, в числе прочего, увеличению количества злоупотреблений.

Использование инструментов на их основе позволяет поставить генерацию контента, в том числе вредоносного, на поток, однако ИИ-помощников нельзя оставлять без присмотра, о чем не знают или забывают обманщики.

В ходе анализа на фишинговых и скамерских сайтах эксперты обнаружили такие артефакты, как ответы чат-ботов, в которых сработала встроенная защита; лексикон, характерный для известных LLM; служебные пометки со ссылкой на ИИ-сервис.

Так, из-за больших масштабов автоматизации или кривых рук на созданных ИИ страницах зачастую можно встретить извинения чат-бота, которому этикет не позволяет выполнить запрос. Взамен он предлагает «сделать что-то похожее», и это тоже попадает в паблик.

 

В данном примере присутствуют и другие свидетельства фейка — диакритический знак в слове «Login» и буква «ɱ» вместо «m» в заголовке (замена по методу тайпсквоттинга).

Использование LLM, по словам экспертов, могут также выдать характерные слова и фразы. Чат-боты OpenAI, например, часто употребляют delve («штудировать»), а конструкции вроде in the ever-evolving / ever-changing world / landscape («в изменчивом /развивающемся мире / ландшафте») использует множество нейросетей.

Предательский отказ ассистента подчиниться и другие маркеры изредка встречаются также в мегатегах поддельных сайтов. В примере ниже исследователи обнаружили еще один признак мошенничества — имя «bolygon» в URL имитации легитимного Polygon.

 

«Злоумышленники активно изучают возможности применения больших языковых моделей в разных сценариях автоматизации, но, как видно, иногда допускают ошибки, которые их выдают, — отметил руководитель группы исследований и ML-разработок в Kaspersky Владислав Тушканов. — Однако подход, основанный на определении поддельной страницы по наличию тех или иных “говорящих слов”, ненадёжен. Поэтому пользователям нужно обращать внимание на подозрительные признаки, например логические ошибки и опечатки на странице. Важно убедиться, что адрес сайта совпадает с официальным».

Anti-Malware Яндекс ДзенПодписывайтесь на канал "Anti-Malware" в Telegram, чтобы первыми узнавать о новостях и наших эксклюзивных материалах по информационной безопасности.

RSS: Новости на портале Anti-Malware.ru