
«Яндекс» 3 апреля заявил о начале публичного бета-тестирования сервиса «Нейроэксперт». Это первый российский продукт класса «генерация, дополненная поиском» (Retrieval Augmented Generation, RAG). Насколько он пригоден для практического использования? В каких сценариях он наиболее эффективен?
- Введение
- Как работает сервис «Нейроэксперт» от «Яндекса»?
- «Нейроэксперт» как ассистент для шопинга
- Пересказ объемных документов с помощью «Нейроэксперта»
- Обработка информации из разных источников в «Нейроэксперте»
- Выводы
Введение
В мире существует около 30 продуктов, которые относятся к классу RAG. Наиболее популярны среди них Google NotebookLM, Perplexity Spaces и инструмент Projects в ChatGPT. Все они были представлены в 2024 году, причем в виде готовых к использованию, по крайней мере, на декларативном уровне, релизных версий.
Как утверждает «Яндекс», RAG сервисов от российских разработчиков до 3 апреля 2025 года не существовало. Так что «Нейроэксперт», публичное бета-тестирование которого началось в этот день, стал первым в своем роде.
Как заявил «Яндекс», сервис использует последнюю версию большой языковой модели YandexGPT 5 Pro. Для сравнения, новая версия «Яндекс.Документов», которую мы тестировали в январе, использует YandexGPT 4.
Также в нем применяются другие технологии компании для извлечения данных, включая оптическое распознавание текстов (OCR), анализ речи (ASR), а также визуальная языковая модель для работы с инфографикой и диаграммами.
«“Нейроэксперт” будет полезен тем, кто работает с большим количеством информации. Например, преподаватели могут создавать из своих лекций и других материалов базы знаний и делиться ими со студентами. Учащиеся смогут искать в этих базах знаний ответы на вопросы при подготовке к экзаменам. Ещё сервис можно использовать, например, если нужно подготовить отчёт, а цифры из исследования содержатся в одной из множества презентаций. “Нейроэксперт” поможет их найти без необходимости пересматривать все материалы», — такими, по мнению «Яндекса», являются типовые сценарии использования сервиса.
Как работает сервис «Нейроэксперт» от «Яндекса»?
Сервис бесплатен, по крайней мере, на момент бета-тестирования. Но для входа требуется авторизация в сервисах «Яндекса».
После авторизации пользователь попадает в главное окно сервиса (рис. 1 и 2). В целом все очень похоже на зарубежные аналоги, разве что чуть отличается терминология. Контейнеры, с которыми работает сервис, называются «проекты», а не «блокноты», как у Google.
Преимуществом российского сервиса также является поддержка большего количества форматов документов. Офисные документы для работы с NotebookLM, например, придется конвертировать в простой текст, HTML или PDF. Также зарубежные продукты не работают с российскими видеохостингами.
Рисунок 1. Десктопный интерфейс «Нейроэксперта»
Рисунок 2. Мобильный интерфейс «Нейроэксперта»
После открытия нового проекта его надо наполнить данными (рис. 3). В этом качестве могут выступать веб-страницы, документы с локальных и сетевых дисков в типовых офисных форматах и PDF, аудио- и видеоролики, как локальные, так и со стриминговых сервисов.
После загрузки документа «Нейроэксперт» анализирует его содержимое и выдает выжимку из него. Обработка происходит практически в реальном времени: двухчасовое видео эфира АМ Live сервис «переваривал» около трех минут. Столько же ушло на то, чтобы «прочитать» отсканированную книгу в 500 страниц. С текстовыми документами, даже объемными, продукт от «Яндекса» справляется практически мгновенно. От мощности клиентского устройства скорость обработки не зависит, всё происходит в облаке.
Внизу находится окно, в котором пользователь может вводить текст запросов. Также сервис пытается предсказывать типовые вопросы пользователей на основании анализа содержимого документов. Как утверждают разработчики, никакой посторонней информации сервис не добавляет.
Пока количество проектов ограничено 10. Сам проект может включать не более 25 документов. Однако разработчики обещают, что после завершения тестирования эти ограничения будут сняты. Делиться базами знаний пользователи могут уже сейчас.
Рисунок 3. Открытый проект «Нейроэксперта»
Коммерческие пользователи «Яндекс 360» могут развернуть «Нейроэксперт» внутри корпоративного контура. Однако при таком сценарии скорость обработки «тяжелого» контента может снизиться. Зарубежные сервисы такой возможности не представляют, по крайней мере, российским пользователям.
«Нейроэксперт» как ассистент для шопинга
Такой сценарий разработчики считают одним из типичных для «бытового» использования сервиса. Однако результаты автора этих строк, скажем так, не впечатлили.
Попытка, что называется, «в лоб» получить подборку товаров по заданному критерию оказалась неудачной. Такие попытки не дали результатов ни на одном из трех крупнейших маркетплейсов, включая «Яндекс Маркет», OZON и Wildberries. Gemini от Google с такой задачей вполне успешно справлялся.
Причем от уровня цен и количества представленных товаров результат не зависел. Единственной категорией, где «Нейроэксперт» предлагал хоть какие-то варианты, были смартфоны стоимостью до 20 тыс. рублей. И то выбор был ограничен лишь одной моделью от Samsung.
Если же подбирать ссылки на описания, то процесс может стать уже довольно трудоемким, особенно речь идет о товарах, где предложение велико. Из-за лимита на число загружаемых файлов потребуются довольно значительные усилия по входному контролю всего предложения в магазинах и маркетплейсах.
Даже если собрать подборку из товарных описаний, то далеко не факт, что результат, который выдаст «Нейроэксперт», будет бесспорным. Плюс ко всему, сервис далеко не всегда может найти информацию о цене на товар в описании, особенно если речь идет о разных комплектациях (компьютеры, автомобили) или разных видах упаковки (чай, кофе, средства для стирки и т. д.).
Результаты будут значительно лучше, если помимо описаний товаров, включить независимые обзоры и отзывы. Но тут уже сильно сказываются ограничения на 25 документов в одном проекте.
Кроме того, «знаний» сервиса может оказаться недостаточно для выдачи правильных рекомендаций. Например, во время знакомства с сервисом у меня сложилось впечатление, что он не распознаёт хитрости изготовителей и продавцов. Например, когда смартфону, планшету или ноутбуку указывают явно завышенные характеристики, которых устройство просто не может иметь из-за специфики используемого в нем процессора или системы на чипе (SoC).
Так, процессор Intel Celeron N5095 не может адресовать более 16 ГБ оперативной памяти, но при этом компьютеры с 24 и даже 32 ГБ ОЗУ не редкость, и они продаются по существенно более высоким ценам. Еще более остра проблема с планшетами от малоизвестных китайских компаний, построенных на устаревших SoC 8-10-летней давности, которые «не видят» больше 3 ГБ оперативной памяти и не поддерживают разрешение экрана выше 1280×800.
Также сервис явно «перестраховывается», когда речь идет о товарах, на выбор которых влияют личные предпочтения. Это, например, пищевые продукты, одежда и обувь (рис. 4). Впрочем, тут такая осторожность вполне оправданна.
Рисунок 4. «Нейроэксперт» пытается выбрать чай
Кроме того, похоже, что сервис в большей степени ориентируется на оценки и отзывы в описаниях товара, чем его характеристики, а также репутацию брендов. Впрочем, многие при шопинге ведут себя точно так же.
Пересказ объемных документов с помощью «Нейроэксперта»
Об экспоненциальном росте объемов информации говорят уже не один год и даже не одно десятилетие. И многим приходится «переваривать» данные в больших объемах. Еще в поздние 80-е студенту технического вуза чтобы «честно» прочитать только обязательную литературу за 5-летний курс обучения понадобилось бы около 100 лет.
За последние без малого 40 лет стало только хуже. И объёмы информации выросли, и процесс обучения для очень многих профессий, в том числе связанных с ИТ и ИБ, стал практически непрерывным и постоянным. Изменились и источники информации. Если в 80-е основная масса знаний были в текстовом виде, то сейчас значительные объемы приходятся на аудио и видео. Причем среди этого объема стало больше малоценных, а то и вовсе бесполезных данных, изучение которых является, по большому счету, пустой тратой времени. И вот тут сервисы вроде «Нейроэксперта» могут оказаться очень полезными.
Сервис после загрузки документа, аудио или видео выдает его краткое содержание (рис. 5). В качестве примера я выбрал видео с одного из эфиров AM Live.
В целом сервис вполне справился с тем, чтобы кратко пересказать то, что обсуждали эксперты в эфире. Причем ушло на это намного меньше (чуть больше 20 минут), чем потребовалось бы на просмотр всей записи. Так что полезность вполне очевидна.
Рисунок 5. «Нейроэксперт» при работе с объемным документом
Сервис может работать и с документами на иностранных языках. Судя по всему, сервис использует «Яндекс Переводчик», так что перечень языков очень большой, вплоть до довольно экзотических. Причем качество перевода на русский язык лучше, чем у зарубежных сервисов. Хотя чем более распространен язык и чем он ближе к родному, тем результат будет лучше.
Текст на английском, французском, немецком, испанском языке сервису вполне «по зубам». Тут выигрыш по времени будет еще больше, так как на изучение незнакомого языка уходят месяцы, и это в лучшем случае, а иногда не избежать и дополнительных расходов на услуги переводчика. Однако использование диалектов, сленга или просто сильный акцент могут поставить сервис в тупик (как, впрочем, и человека, даже являющегося носителем языка). Так, мне удалось отправить «Нейроэксперта» в нокаут аудиофайлом, который содержал диалог на диалекте немецкого.
«Ложкой дегтя» являются то, что сервис (как, впрочем, и человек) может «ослышаться», из-за чего имена и фамилии спикеров или названия компаний могут воспроизводиться неточно. Также очень часто он допускает ошибки в транслитерации (воспроизведении иностранных слов, в том числе географических названий и имен).
Обработка информации из разных источников в «Нейроэксперте»
Очень часто приходится обрабатывать информацию из разных источников: результаты исследований, пресс-релизы, корпоративные блоги, всевозможную отчетность, а также всяческого рода вебинары, записи онлайн-совещаний и тому подобное. Все эти документы также могут объемными, не исключено, что и на разных языках. И тоже стоит задача получить некую выжимку из их содержимого, причем, как всегда, как можно скорее. Неплохо было бы также, чтобы искусственный интеллект мог бы взять на себя группировку информации и простейшую аналитику.
Но реальность не в полной мере соответствовала ожиданиям. Аналитические способности «Нейроэксперта» показались мне довольно слабыми. По крайней мере, при разборе информации из серии вебинаров, проведённых Минпромторгом и АНО «Цифровая экономика» по перспективам целевых рынков разных стран для российских ИТ и ИБ-компаний, которые хотят на них выйти. Эти вебинары довольно короткие, обычно около получаса, но их довольно много, уже без малого 30.
С оценкой содержимого вебинаров сервис уверенно справился. Он выдал короткую выжимку, где приводились особенности каждой страны, какие российские продукты будут интересны на ее рынке, каковы возможные препятствия и местная специфика, которую надо учитывать. Однако все же лучше проявлять терпение, поскольку анализ содержимого объемных документов, а также аудио и видео, занимает некоторое время, а «Нейроэксперт» часто оценивает свои способности излишне оптимистично. По беглым наблюдениям, 10 минут на разбор содержимого 15 роликов средней продолжительностью около 30 минут, но при этом насыщенных бизнес-презентациями, значимыми для содержания, оказалось достаточно.
То, что документы могут быть на разных языках, препятствием не является. Но надо иметь в виду, что сервис, как и переводчика-человека, может поставить в тупик использование жаргонизмов, просто сильный акцент или разговор на малознакомом системе диалекте.
Но при попытках провести даже простейший анализ, например, привести общие черты стран, относящихся к одному региону, возникали сложности, часто непреодолимые. Также «Нейроэксперт» допускал ошибки, которые простительны разве что для безнадежного двоечника. Например, он отнес Сербию к странам СНГ, и упорно отказывался считать Кубу страной Латинской Америки. Впрочем, ошибки являются одним из основных рисков при использовании искусственного интеллекта.
Но в целом, несмотря на слабые аналитические способности, сервис помог сэкономить очень много времени на получение «выжимки» из данных, которые содержались в 15 видео. Только на их просмотр ушел бы целый рабочий день, тогда как с помощью «Нейроэксперта» задача была решена за час с небольшим. Так что выигрыш во времени очевиден.
Выводы
Данный сервис оставляет не вполне однозначное впечатление. Ряд его возможностей действительно позволяет сэкономить немало времени на ознакомление с различными материалами, особенно если речь идет о видео и аудио, которые сложно «читать по диагонали», или о материалах на неизвестных иностранных языках.
Но надо иметь в виду, что аналитические способности «Нейроэксперта» существенно ограничены, и знать содержимое документов, пусть и поверхностно, лишним не будет. Также стоит иметь в виду, что аудио и видео на языке, который отличается от канонического (жаргон, диалект, с сильным акцентом), сервис может «не понять».
А вот что касается «бытового» использования, то сервис будет не очень хорошим помощником, по крайней мере, на его нынешней стадии развития и при существующих ограничениях. Например, в качестве ассистента для покупок сервис не слишком «разгружает» пользователя. Плюс ко всему, он работает довольно поверхностно и не знает о целом ряде нюансов товаров, особенно высокотехнологичных.