
Сфера конфиденциальных вычислений (таких, которые позволяют нескольким участникам производить совместные математические расчёты без раскрытия входных данных друг другу) демонстрирует быстрый рост. Они востребованы во многих секторах и отраслях экономики. А как обстоит дело с внедрением этой концепции в России?
- Введение
- Теория конфиденциальных вычислений: от «миллионеров» до криптопротоколов
- Как работают конфиденциальные вычисления: технологии и реализация
- Примеры внедрения конфиденциальных вычислений в России: финтех, ДЭГ, медицина
- Основные барьеры для внедрения конфиденциальных вычислений
- Выводы
Введение
Теоретические основы конфиденциальных вычислений были заложены не так давно. Интересно, что в начале 1980-х почти одновременно были сформулированы «задача о двух миллионерах» (самая первая задача конфиденциального вычисления) и «Конвенция о защите физических лиц при автоматизированной обработке персональных данных» (она же Страсбургская конвенция), которая заложила основу законодательства по защите личных данных. Насколько эти события связаны и связаны ли вообще, выяснить не удалось, но такое совпадение во многом символично. Хотя полное решение этой задачи появилось только в середине нулевых уже нового века.
Однако концепция конфиденциальных вычислений оказалась по-настоящему востребована сейчас, со становлением экономики данных. Для решения многих задач — включая электронное голосование, скоринг, защиту от фрода, проведение разного рода исследований, — нужны знания, а не данные как таковые.
Например, ответ на вопрос, является ли паспорт действительным, может быть только «да» или «нет». Он не включает серию, номер и адрес регистрации, которые можно использовать против владельца, взяв на него микрокредит.
В России интерес к концепции конфиденциальных вычислений начал расти с августа 2024 года, когда был окончательно принят обновленный закон, который регламентирует порядок оборота и обработки обезличенных персональных данных. Это сняло главные регуляторные препятствия для развития рассматриваемой концепции в России.
Хотя такой подход успешно применялся и до того, например, в ходе дистанционного электронного голосования, которое практикуется в России с 2019 года. С ноября 2023 года в рамках «Ассоциации ФинТех» действует рабочая группа, которая занимается соответствующей проблематикой в финансовой сфере. Хотя некоторые компании, пусть и на уровне экспериментов, пытались внедрять данные технологии намного раньше.
С резким ужесточением законодательства об обороте персональных данных, которое вступает в силу в конце мая, практический интерес к этой теме вырастет ещё сильнее. Хотя и раньше Россия не была в числе отстающих по части внедрения конфиденциальных вычислений.
Теория конфиденциальных вычислений: от «миллионеров» до криптопротоколов
Основы конфиденциальных вычислений заложил китайско-американский математик Эндрю Яо Цичжи. В 1982 году он сформулировал «задачу о двух миллионерах» (SMP в английской аббревиатуре, от Socialist Millionaires' Problem, также используется термин Tierce problem, рис. 1). Есть два миллионера, Боб и Алиса. Задача состоит в том, чтобы определить, кто из них богаче, при этом не получая данные об их счетах и активах.
Рисунок 1. Статья Эндрю Яо Цичжи, где он сформулировал «задачу о двух миллионерах»
Для успешного решения этой проблемы необходимо обеспечить такой порядок обмена данными, чтобы он соответствовал следующим условиям.
- Отсутствие утечки информации: если предположить, что Алиса и Боб добросовестно следуют протоколу, они не должны знать ничего, кроме того, совпадают их секреты или нет.
- Конфиденциальность. Никто другой не должен узнать секреты Алисы и Боба. Любой, способный произвольно вмешиваться в их общение, должен узнать не больше, чем тот, кто не предпринимает ничего.
- Безопасность. Если Алиса или Боб не следуют протоколу, они не должны узнать секрет собеседника.
- Простота. И Алиса, и Боб не должны тратить большое количество ресурсов при использовании протокола.
- Удаленность. Алиса и Боб не должны присутствовать в одном и том же месте, чтобы выяснить, совпадают ли их секреты.
В 1986 году сам Эндрю Яо Цичжи предложил решение этой задачи. В 1996 году оно было дополнено для ряда частных случаев, а в 2001 году появилось более эффективное решение, актуальное и поныне. Через несколько лет корректность протокола, предложенного Эндрю Яо Цичжи, доказали окончательно. Лекцию профессора МГУ Андрея Миронова о рассматриваемой задаче и ее решениях можно прослушать здесь.
К настоящему времени для решения задачи конфиденциальных вычислений существует два подхода. Один из них опирается в большей степени на программные средства, другой — на аппаратные. Второй больше продвигают крупные производители чипов, в том числе AMD и Intel. Его реализация обходится дороже, и новый виток торговых войн рискует усилить дефицит на рынке и поднять стоимость процессоров еще больше. Программный подход более демократичен и развивается во многих странах, в том числе и в России.
Как работают конфиденциальные вычисления: технологии и реализация
И программные, и аппаратные методы сводятся к тому, чтобы обеспечить доступ к данным только с разрешения владельца. Причём даже тогда, когда у потенциального злоумышленника есть физический доступ к серверу. Для этого используется сочетание различных технологий (рис. 2), включая криптосредства, системы маскирования, обезличивания и генерации данных, а также организации доверенной вычислительной среды.
Рисунок 2. Технические решения, используемые в конфиденциальных вычислениях
Ключевой технологией конфиденциальных вычислений является криптопротокол, который позволяет нескольким участникам производить вычисления и иные операции с тайными данными каждого из них, чтобы ни один из них не получил доступа к данным, принадлежащим другим.
Для решения этой задачи также используется и гомоморфное шифрование, но у него есть целый ряд критически значимых недостатков. Оно требует большого объёма вычислительных ресурсов, что замедляет процесс обмена данными. Протокол защищённых вычислений позволяет использовать быстрые реализации с меньшей длиной основного поля.
Как подчеркнул в своём выступлении на сессии «Технологии повышения конфиденциальности — как внедрять и как регулировать» конференции First Russian Data Forum вице-президент «Газпромбанка» Алексей Фёдоров, гомоморфное шифрование подвержено квантовой угрозе, тогда как конфиденциальные вычисления можно реализовать и на основе новейших квантовых или постквантовых алгоритмов.
По оценке президента Академии криптографии, замглавы Минцифры Александра Шойтова, «квантовая угроза» уже на горизонте 10 лет из сугубо теоретической станет вполне реальной, так что уже сейчас необходимо начинать переход на новые технологии криптозащиты.
Директор по развитию бизнеса и работе с партнерами «КриптоПро» Павел Луцик также обратил внимание на то, что в реальных проектах часто используется несколько криптопротоколов. Например, в российской системе дистанционного электронного голосования применяется 5 различных технологий шифрования, в том числе гомоморфное (рис. 3).
Рисунок 3. Техническая платформа дистанционного электронного голосования
Есть примеры российских решений в области разработки программно-аппаратных комплексов, которые реализуют задачи конфиденциальных вычислений в рамках корпоративного контура или интрасети. Так, о комплексе «Криптоанклав» (рис. 4), разработанном для госзаказчиков и крупнейших банков рассказал заместитель руководителя направления «Т1 Искусственный Интеллект» в «Холдинге Т1» Сергей Карпович.
Рисунок 4. Архитектура платформы конфиденциальный вычислений от Т1
Примеры внедрения конфиденциальных вычислений в России: финтех, ДЭГ, медицина
Как отметил Павел Луцик, выступая на сессии «Технологии повышения конфиденциальности — как внедрять и как регулировать» конференции First Russian Data Forum, технологии конфиденциальных вычислений уже применяются там, где нужны знания — результат обработки данных, а не сами данные как таковые. Это, по его мнению, все, что связано с проведением электронных голосований, банковского и страхового скоринга, антифрода, инвентаризаций, а также защищённой мобильной электронной подписи, которая обеспечивает невозможность её использования в случае потери, кражи или компрометации устройства.
Перспективными сферами применения Павел Луцик назвал подсчёт выпуска и продаж товаров определённых категорий, организация показа контекстной рекламы, а также объединение информации, в том числе разнородной. Последняя задача, по мнению Павла Луцика, наиболее актуальна при организации обмена данными между научными и лечебными учреждениями. Именно так можно обеспечить медицинскую науку данными реальных пациентов и при этом сохранить врачебную тайну.
Алексей Фёдоров поделился опытом практического использования технологий конфиденциальных вычислений с 2016 года. С этого времени «Газпромбанк» применяет решение на основе технологий постквантового распределения ключей для защиты сервисов дистанционного банковского обслуживания. Фёдоров также подчеркнул, что именно финансовый сектор является основным драйвером внедрения конфиденциальных вычислений как в мире, так и в России.
Павел Луцик назвал примером успешной реализации концепции конфиденциальных вычислений систему дистанционного электронного голосования, которое используется в России с 2019 года.
Директор по монетизации данных «Т-Банка» Евгений Исупов назвал конфиденциальные вычисления залогом успешного обмена данными с партнёрами, причём это единственная возможность формировать доверие в условиях конкурентной среды. Сергей Карпович назвал отсутствие доверия основной проблемой во многих отраслях. Особенно он выделил промышленность, для которой критически важно добиться сохранности ноу-хау.
Руководитель направления развития антифрод-продуктов телеком-оператора Т2 Алексей Воронин заявил, что именно использование конфиденциальных вычислений позволило совершить прорыв в обмене данными между участниками системы «Антифрод» и сделать важный шаг вперёд при взаимодействии с банками. А такой обмен в нынешних обстоятельствах необходим, без него невозможно создать работающую систему антифрода, которая бы объединила ресурсы банков, операторов связи и правоохранительных органов.
Сергей Карпович рассказал о том, что объединение данных позволяет достичь прямого экономического эффекта. В качестве примера он привёл китайский опыт, где за счёт сбора и обработки данных о пациентах снизили осложнения при проведении кардиологических операций на 48%.
Основные барьеры для внедрения конфиденциальных вычислений
Как отметил генеральный директор «Ассоциации ФинТех» Максим Григорьев, препятствия для внедрения конфиденциальных вычислений делятся на три группы:
- Организационные. Неготовность компаний из-за внутренних сложностей и специфики бизнес-процессов.
- Технические. Прежде всего, связанные со сложностями обработки неструктурированных данных.
- Юридические. Прежде всего, регуляторные барьеры и устаревшие стандарты.
По мнению директора по аналитике АНО «Цифровая экономика» Карена Казаряна, которое он высказал в ходе сессии «Доступ к государственным данным — новые возможности», главным препятствием для внедрения любых современных технологий обмена данными, в том числе конфиденциальных вычислений, является то, что многие процессы передачи информации до сих пор ориентированы на бумажный документооборот. Это касается как государственной, так и локальной нормативной базы, прежде всего, в госсекторе. Однако и в коммерческом секторе, как подчеркнул Карен Казарян, данная проблема также стоит довольно остро.
Вместе с тем он все же был довольно оптимистичен, поскольку и государство, и бизнес требует ускорения процессов передачи данных и принятия решений, что приводит к постепенному устранению данных коллизий, как только встает задача предоставления необходимой информации за 1 рабочий день, а не за 30.
Павел Луцик назвал в числе главных сложностей формирование модели угроз и обоснование криптостойкости алгоритмов шифрования. Они находятся на стыке организационных и технических проблем.
Евгений Исупов среди технических сложностей назвал, помимо работы с неструктурированными данными, также необходимость поддерживать разные криптопротоколы при обмене информацией с различными партнерами. Однако тут, по почти солидарному мнению участников дискуссии, очень сильно может помочь организация общенациональной биржи данных. С такой инициативой, апеллируя к опыту Китая, выступила президент «Ассоциации больших данных» Анна Серебряникова в ходе пленарной сессии «Рынок данных: вчера, сегодня, завтра». Однако министр цифрового развития, связи и массовых коммуникаций Максут Шадаев назвал централизацию хранения данных, особенно конфиденциальных, усилением рисков.
Что касается регулирования, точнее, его отсутствия, то первый вице-премьер Дмитрий Григоренко на открытии конференции Data Fusion заявил:
«Все технологии родились вне правил. Любым регулированием мы не должны ограничить развитие технологий».
Дмитрий Григоренко, курирующий ИТ в правительстве, является горячим сторонником использования экспериментальных правовых режимов (ЭПР), или регуляторных песочниц. С 27 июня данный режим можно будет использовать в отношении любых новых технологий, которые находятся вне действующего регулирования, в том числе и конфиденциальных вычислений.
Более серьезной сложностью, как предупредил руководитель GR-проектов «Ассоциации больших данных» Марат Тахавиев, наряду с тем, что сама технология находится в «серой зоне» с точки зрения регуляторики, является отсутствие общепринятых стандартов. По его оценке, это является издержкой того, что сама технология молодая, и даже техническая терминология, как обратил внимание Сергей Карпович, не вполне устоялась, об отсутствии такого понятия в законодательстве можно даже не напоминать. «Ассоциация больших данных» уже разработала 5 проектов стандартов и начала работу по их утверждению.
Начальник управления — вице-президент (управление развития интеллектуальной собственности, департамент операционной модели цифрового развития) «Банка ВТБ» Наталия Оленева в выступлении на другой сессии конференции назвала главным препятствием для внедрения конфиденциальных вычислений отсутствие стимула их внедрять. По крайней мере, когда речь идёт о защите персональных данных. Хотя использование данных технологий позволит решить многие насущные задачи.
Выводы
Технологии конфиденциальных вычислений в России вполне успешно внедряются. При этом Россия в их внедрении не отстаёт от стран Европы, зарубежного Дальнего Востока и США, а в отдельных аспектах даже опережает за счёт быстрого устранения рудиментов традиционных подходов, обусловленных бумажным документооборотом. И сложности в России те же, что и в остальном мире, и связаны они по большей части с тем, что сама технология очень молода, и в ней даже не сформировалась устоявшаяся терминология.