В «Холдинге Т1» появилось новое направление, связанное с развитием искусственного интеллекта. Об этом было заявлено в рамках конференции Data Fusion 2024 в Москве в середине апреля. За кажущейся простотой анонса стоит очень важная задача, крайне значимая для сохранения технологической безопасности России.
- Введение
- У каждой страны свой подход к развитию ИИ
- Отечественный искусственный интеллект
- Языковые модели и системы машинного обучения как стимулы развития ИИ
- «Холдинг Т1» и ИИ
- Блиц-интервью с Сергеем Голицыным, руководителем направления «Т1 Искусственный интеллект»
- Выводы
Введение
В рамках Международной конференции по машинному обучению, анализу данных и технологиям искусственного интеллекта Data Fusion 2024, прошедшей 18 апреля в Москве, генеральный директор «Холдинга Т1» Алексей Фетисов объявил о выделении в составе компании отдельного направления, нацеленного на развитие ИИ для промышленного внедрения, и о намерении войти к 2026 году в число пяти ведущих российских компаний, специализирующихся на разработке решений в области ИИ.
Рисунок 1. Data Fusion 2024
Уровень наукоёмких технологий, в том числе из области ИИ, развитие больших моделей и формирование инфраструктуры и технологий для доступа к огромным объёмам информации отражают сегодня способность любой страны участвовать в гонке за технологический суверенитет и безопасность. От реализации этих требований зависят шансы на технологическое лидерство в будущем.
Россия уже участвует в этой гонке. Сразу поставлена цель не просто быть потребителем технологий, а находиться в первых рядах среди тех, кто способен совершать прорывы. В стране уже работает немало крупных команд по этому направлению. У всех на слуху достижения таких компаний, как «Сбер» и «Яндекс». В последнее время стали активно появляться новые игроки, готовые к широкому внедрению технологий ИИ, такие как МТС. Но этот список явно должен расширяться. Почему? Об этом пойдёт речь ниже.
У каждой страны свой подход к развитию ИИ
Несмотря на популярность темы развития ИИ, правильный путь в этом процессе до сих пор неясен. Это касается не только России, но и всего мира.
Во-первых, ИИ рассматривается сегодня как стратегическое направление для достижения технологического превосходства в будущем. Все участвующие страны сохраняют строгий баланс между публичной доступностью новых технологий (ради привлечения новых идей и участников) и закрытостью, связанной с рисками для национальной безопасности или развития бизнеса.
Во-вторых, до сих пор нет однозначного мнения относительно принципиальной целесообразности и нужной степени внедрения ИИ в различных областях. Нет чёткой модели того, как поведёт себя гражданское общество в результате внедрения ИИ, какие угрозы, против которых ещё нет «противоядия», могут возникнуть.
В результате многие разработки ведутся до сих пор по наитию. Нет однозначного мнения в отношении того, как должен вести себя регулятор. В каждой стране наблюдаются свои особенности. Высказываются полярные мнения: от установки жёстких ограничений на развитие технологий ИИ до предоставления карт-бланша.
Рисунок 2. Количество патентов по части ИИ в различных странах (AI Index Report 2024)
Скажем, Евросоюз сильно озабочен неопределённостью последствий внедрения ИИ и его влияния на общество. В результате разработано законодательство, которое накладывает очень строгие практические ограничения. Поэтому в странах ЕС много ярких научных и исследовательских работ в области ИИ, но при этом практически нет, например, результатов по части развития больших языковых моделей, которые рассматриваются сегодня как флагманское направление ИИ.
В условиях свободных экономик, конечно, протекают «альтернативные» процессы, поэтому следы изысканий европейских учёных затем обнаруживаются в других странах (прежде всего США и государствах Юго-Восточной Азии). Однако само явление симптоматично.
Необходимо также отметить многочисленные слухи, связанные с применением ИИ для военных целей и для обеспечения национальной безопасности. Эти данные часто засекречены, а официальные результаты не публикуются.
Конечно, интересна позиция России. У всех на слуху многочисленные инициативы Минцифры, стимулирующие развитие ИИ в стране. Но насколько полно они охватывают современные мировые тренды? В конце концов, РФ находится сейчас в условиях ограничений на распространение аппаратных ускорителей, необходимых для развития больших языковых моделей.
Как бы то ни было, все без исключения участники рынка, в том числе в России, отмечают, что внедрение достижений ИИ обещает большие перспективы экономического роста. В то же время пугающе выглядят прогнозы грядущих изменений на рынке труда, в образовании, в сфере этики и безопасности.
Процесс внедрения ИИ идёт полным ходом.
Отечественный искусственный интеллект
Развитию ИИ в России уделяется сейчас много внимания. Но какие собственные наукоёмкие разработки в области ИИ готовы предложить российские компании сегодня? Что именно необходимо выпускать, чтобы не остаться на обочине прогресса новых технологий?
Прежде всего следует отметить роль правительства РФ. В своих постановлениях оно чётко ставит цель обеспечить технологический суверенитет по таким направлениям, как создание генеративного ИИ и больших языковых моделей.
В феврале Минпромторг России объявил о развёртывании проектного офиса для поддержки службы «цифровых атташе» на базе Федерального центра развития ИИ. Контрагентами являются уже 35 стран мира, включая Аргентину, Индию, ОАЭ, Бразилию и др. Россия демонстрирует, что готова экспортировать свои ИИ-технологии.
Надо отметить, что реальная работа над технологиями на базе ИИ в России ведётся давно. Например, в начале апреля на «Днях Рунета» Александр Крайнов, директор по развитию технологий ИИ в «Яндексе», рассказал, что поиск похожих изображений с помощью компьютерного зрения компания реализовала ещё в 2014 году.
В целом, стратегия развития ИИ в России оформилась к 2019 году. Важно отметить, что мы сделали это синхронно или почти одновременно со многими другими странами мира.
Рисунок 3. Принятие национальных доктрин развития ИИ в различных странах
Несмотря на произошедший разрыв с Западом, российские компании идут по тому же пути, что и мировые лидеры. Например, ИИ «Сбера» для генерации картинок по заданному описанию появился вследствие создания форка модели DALL-E, получившего название ruDALL-E. Результатом стало появление широко известного в стране сервиса Kandinsky.
Генеративная модель GPT-3 была также «приземлена» в России в 2019 году. В частности, «Яндекс» построил на её основе большую языковую модель YandexGPT (YaGPT). Появилось и приложение «Шедеврум», которое позволяет генерировать картинки, тексты и короткие видеоролики, просматривать публикации других пользователей, ставить им лайки, делиться в соцсетях или пересылать в мессенджерах.
Языковые модели и системы машинного обучения как стимулы развития ИИ
Резкое ускорение развития ИИ, начавшееся с 2019 года, связывают именно с большими языковыми моделями (LLM) — крупными нейросетями, включающими в себя миллиарды параметров и обученными на различных наборах данных. Этот качественный перелом в развитии технологий был связан с осознанием того, что данные являются неотъемлемой частью процесса совершенствования ИИ. Развитие LLM становится особенно важным для решения сложных практических задач.
Создание значимых моделей машинного обучения также существенно для развития систем ИИ. По данным из доклада AI Index Report 2024, в 2023 году в сегменте промышленных ML-систем появился 51 новый элемент (значимый проект). Для сравнения, в сегменте научных ML-разработок таких элементов только 15. Следует отметить в этом контексте рост сотрудничества между бизнесом и академическими структурами, результатом которого стало появление в 2023 году 21 совместного проекта в области машинного обучения.
Россия пока слабо представлена в этом направлении разработок. Выделяются в первую очередь проекты в США (61 модель), ЕС и Великобритании (25 моделей), а также в Китае (15 моделей).
Рисунок 4. Количество значимых ML-моделей по странам, 2003–2023 гг.
«Холдинг Т1» и ИИ
Глобальные тренды свидетельствуют о том, что России сейчас важно получить новых вендоров, которые будут заниматься разработкой промышленных ИИ-решений и их масштабированием. До сих пор соответствующая ниша была полупустой. Анонс, с которого мы начали этот текст, выглядит явно своевременным и крайне полезным для развития ИИ в стране.
Как рассказал Алексей Фетисов, ссылаясь на экспертные оценки, объём рынка решений в области ИИ вырастет в России до 352 млрд рублей к 2026 году, и около 220 млрд рублей из них будет приходиться на специализированное ПО.
Принимая во внимание эти перспективы развития рынка, в «Холдинге Т1» создали новое направление искусственного интеллекта, которое консолидировало накопленную экспертизу по части работы с большими данными и разработки платформ хранения информации, а также построения аналитических и рекомендательных систем для крупного бизнеса. Новую структуру возглавил Сергей Голицын, ранее занимавший позицию заместителя руководителя департамента анализа данных и моделирования.
Рисунок 5. Алексей Фетисов (слева) и Сергей Голицын на Data Fusion 2024
Новая структура «Холдинга Т1» уже начала разработку продуктово-сервисной экосистемы ИИ. По словам Алексея Фетисова, наиболее перспективными на текущий момент отраслями для внедрения технологий ИИ видятся сферы финансов и розничной торговли, транспорта и ресурсодобычи, телекома и госуправления. Ожидается, что органический рост бизнеса холдинга по направлению ИИ превысит 30 % в течение 2024–2026 гг.
Блиц-интервью с Сергеем Голицыным, руководителем направления «Т1 Искусственный интеллект»
Какие направления развития ИИ вы считаете сейчас наиболее интересными, коммерчески выгодными, важными для бизнеса «Т1»? Какие из них уже присутствуют в вашей дорожной карте?
С. Г.: Последние несколько лет развитие искусственного интеллекта находится в центре повышенного внимания. Разработка решений с использованием ИИ является важным для «Холдинга Т1» направлением деятельности. Мы считаем, что наиболее востребованными из них будут предиктивная и текстовая аналитика, компьютерное зрение, различные оптимизационные решения и виртуальные агенты.
В фокусе нашего внимания — разработка моделей машинного обучения как сервиса, прикладные решения и продукты для автоматизации клиентского сервиса и контроля безопасности коммерческих и жилых объектов, а также видео- и текстовая аналитика. Мы хотим предложить рынку принципиально новый уровень технологических продуктов и сервисов в области больших данных и ИИ «под ключ».
В продуктовое портфолио «Холдинга Т1» входит 13 решений, которые успешно используются в компаниях разного профиля и госструктурах. В их числе — системы видеоаналитики и распознавания документов, модули BI-отчётности, цифровые ассистенты.
На какие направления развития собственной технологической базы по части ИИ в «Т1» сейчас обращают внимание в первую очередь?
С. Г.: В развитии технологической базы искусственного интеллекта мы делаем упор на практику объединения машинного обучения и операционных процессов наших клиентов. «Холдинг Т1» разработал собственную систему для упрощения и ускорения цикла разработки, тестирования, развёртывания и мониторинга ML-моделей. Мы придерживаемся принципов автоматизации, непрерывной интеграции и доставки ПО, чтобы создавать более эффективные и масштабируемые решения.
Например, процесс обработки данных включает в себя очистку, преобразование и агрегирование информации для её подготовки к использованию в моделях машинного обучения. Мы применяем распределённые системы хранения данных (в частности, на базе HDFS), которые позволяют обеспечить высокую доступность и масштабируемость.
Мы рекомендуем нашим клиентам создавать различные виды озёр данных (data lakes) для хранения неструктурированной информации и обеспечения большей гибкости. В своей работе также используем различные инструменты оркестровки (Airflow) для создания автоматизированных конвейеров данных, которые позволяют быстро перемещать сведения из разных источников к языковым моделям искусственного интеллекта. Всё это позволяет быстро тиражировать наши решения, включая большие языковые модели (LLM), в узкоспециализированные базы данных наших клиентов.
Если говорить про прикладное использование LLM, то мы выстраиваем работу в соответствии с направлениями деятельности клиентов. Так, в университетах и других образовательных учреждениях большие языковые модели могут использоваться для создания персонализированных обучающих материалов, которые адаптируются под уровень знаний студента. В бизнесе LLM могут применяться для анализа больших объёмов данных, предсказания тенденций рынка и принятия стратегических решений, а также для автоматизации рутинных задач.
«Холдинг Т1» активно занимается исследованием адаптации больших языковых моделей к реальным промышленным системам. В одном из проектов мы применяли квантование — особый метод преобразования (сжатия) нейронной сети. Это позволило уменьшить используемый объём памяти, и в дальнейшем модель будет использовать меньше параметров для обновления.
На что следует обращать внимание на этапах разработки и эксплуатации ИИ, если мы хотим обеспечить безопасность? Какие инициативы регулятора в этой области вы считаете важными и почему? Какие ИБ-инициативы в области ИИ предпринимает «Т1»?
С. Г.: В процессе разработки и применения технологий ИИ всегда необходимо помнить о нескольких важных факторах. Прежде всего, качество и эффективность моделей связаны с объёмом доступных данных. В настоящий момент много внимания уделяется созданию экосистем и партнёрств в области БД.
Также важно уделять большое внимание безопасности и защите информации. В России сейчас ведётся обсуждение технологий обмена данными и подходов к их регулированию. В последние два года активно разрабатываются методы конфиденциальной обработки, которые позволяют создавать сервисы ИИ без доступа участников разработки к самим данным. Существующие юридические вопросы будут решены с поддержкой регулятора уже в ближайшее время.
«Холдинг Т1» поддерживает создание среды безопасной обработки данных и разработал специализированный программно-аппаратный комплекс «Криптоанклав» — платформу защищённых вычислений. Это уникальное для России решение, которое позволяет загружать данные из разных источников с помощью механизмов машинного обучения без фактического доступа к самой информации. Это открывает большие возможности, например, для разработки антифрод-решений, сервисов с персонифицированными предложениями и целевыми рекламными сообщениями. «Криптоанклав» может масштабироваться на широкий круг отраслей: от финансов и ретейла до аэрокосмической индустрии.
Выводы
Несмотря на трудности, с которыми сталкиваются российские компании при развитии систем ИИ, это направление остаётся приоритетным как для правительства в лице Минцифры, так и для бизнес-сообщества.
Объявление о создании нового направления искусственного интеллекта в бизнес-структуре «Холдинга Т1» указывает на то, что компания намерена консолидировать накопленный опыт и знания, чтобы обеспечить внедрение технологий на базе ИИ в различных отраслях экономики России. Это важная инициатива, нацеленная на сохранение технологической безопасности страны.