Появление китайского чат-бота DeepSeek обвалило акции американских компаний на рынке, а затем вылилось в крупную кибератаку. Действительно ли китайский ИИ настолько хорош, что может обойти ChatGPT от OpenAI?
- Введение
- Кибератака и проблемы с регистрацией
- Разница в архитектуре
- Обработка текста и перевод
- Парсинг новостей
- Математические способности
- Программирование
- Защита от вредоносных запросов
- Выводы
Введение
Конкуренция в области искусственного интеллекта и нейросетей становится всё более ожесточённой, поскольку страны осознают их огромное значение в формировании будущего. ИИ и нейросети принципиально меняют правила игры в широком спектре отраслей, включая финансы, СМИ, инфобез, военное дело, здравоохранение, транспорт, производство.
Особое значение нейросети имеют в сфере культурной и информационной войны. ИИ-алгоритмы могут продвигать определённые культурные продукты или идеи, формируя общественное мнение.
Соперничество между США и Китаем в сфере искусственного интеллекта набирает обороты, поскольку обе страны осознают решающее значение этой технологии для национальной безопасности, экономического прогресса и культурного влияния.
Новый этап этой конкуренции начался в январе 2025 года, когда китайский стартап DeepSeek добился значительных успехов. Компания разработала чат-бота, который способен соперничать с ведущими западными аналогами, такими как ChatGPT.
Чат-бот увидел свет 10 января 2025 года и уже к 27 января обогнал ChatGPT, став самым скачиваемым бесплатным iOS-приложением в Соединённых Штатах. Это вылилось в обвал акций технологических гигантов США и Европы — общие потери составили около триллиона долларов. Особенно досталось Nvidia: компания потеряла около 600 миллиардов рыночной капитализации за одни сутки. В тот же день, 27 января, DeepSeek столкнулась с крупной кибератакой. Сегодня я попробую разобраться, чем же этот китайский ИИ столь примечателен.
Кибератака и проблемы с регистрацией
Естественно, при таком ажиотаже появилось много желающих попробовать DeepSeek в деле (я в их числе), но всё оказалось не так-то просто. По «загадочному» совпадению, 27 января 2025 года, когда акции технологических компаний стали падать из-за появления нового игрока, DeepSeek стал жертвой масштабной кибератаки. Из-за этого сервис временно приостановил регистрацию новых пользователей. На сайте было размещено честное объявление: из-за постоянных атак на сервис регистрация временно недоступна.
Рисунок 1. Ограничение на регистрацию из-за кибератаки
Возможность использования DeepSeek сохранялась у тех, кто успел зарегистрироваться до кибератаки. К сожалению, я не успел. Когда я пытался пройти регистрацию, мне банально не приходил код на почту. Пришлось идти обходным путём — через аккаунт Google.
Разница в архитектуре
DeepSeek, как и ChatGPT, является т. н. большой языковой моделью (Large Language Model, LLM) со всеми характерными для них сильными сторонами и рисками. Ряд экспертов даже призвали к осторожности в использовании DeepSeek, так существует риск сбора данных и их передачи третьим лицам.
Две нейросети воплощают собой два различных подхода к разработке искусственного интеллекта, каждый из которых имеет уникальные архитектурные особенности. DeepSeek R1 использует архитектуру Mixture of Experts (MoE), разделяющую модель на 256 независимых «экспертных» модулей, каждый из которых специализируется на конкретных задачах, таких как математика, лингвистика или программирование. При обработке запроса задействуются только восемь наиболее подходящих «экспертов», что приводит к значительной экономии ресурсов и повышению точности.
ChatGPT более «громоздкий»: он работает как единая структура, активируя все свои 175 млрд параметров для каждого запроса, что требует существенных вычислительных ресурсов даже для простых задач.
Кроме того, DeepSeek R1 пропускает обширную фазу предварительной подготовки, характерную для ChatGPT (откуда и название GPT — Generative Pre-trained Transformer), и напрямую использует обучение с подкреплением, что позволяет эффективно обучаться посредством решения реальных проблем.
Это приводит к снижению затрат на обучение и сокращению сроков разработки. Обучение языковой модели DeepSeek обошлось всего лишь в 6 миллионов долларов, в то время как расходы на создание ChatGPT оцениваются в более чем 100 миллионов долларов. А если принять во внимание, что технологические гиганты, скорее всего, завышали цену, пользуясь своей монополией, то обвал на рынке акций неудивителен.
Но если обучение DeepSeek столь сильно упрощено, не отразится ли это на качестве её работы? Для этого я решил проверить её способности на практике и сравнить с ChatGPT.
Обработка текста и перевод
Я начал с простых, рутинных задач. Допустим, мне надо не написать текст с нуля, а отредактировать, сократить или изменить. Если сравнивать качество обработки русского или английского текста у DeepSeek и ChatGPT, то разница почти не видна: обе нейросети успешно решают эту задачу.
При переписывании (рерайте) и редактировании нейросети могут использовать свои знания о языковых структурах и стилях, чтобы переформулировать или улучшить написанное, что требует меньших вычислительных ресурсов и менее сложных логических операций — в то время как создание оригинального текста с нуля является более сложной задачей, требует более глубокого понимания контекста, а также значительных вычислительных мощностей и комплексных алгоритмических решений. Пока что человек понимает контекст гораздо лучше, чем машина.
Следующий уровень — это перевод. С переводом с русского на английский и наоборот DeepSeek также справляется не хуже, чем ChatGPT. Перевод требует глубокого понимания не только слов и грамматики, но и контекста, культурных особенностей и нюансов языка. Нейросети должны уметь распознавать идиоматические выражения, метафоры, понимать контекст и сохранять смысл оригинала, что может быть сложной задачей.
Если текст пестрит узкоспециализированной терминологией или содержит множество метафор и идиом, тогда обе нейросети уже могут начать допускать ошибки, но если это формальный текст, то с ним они справляются хорошо. Скорее всего, разница между двумя нейросетями в обработке и переводе может проявиться в случае с более «экзотическими» языками. Если бы я знал китайский или японский, я бы мог лучше судить о качестве перевода, но я владею только русским и английским.
Парсинг новостей
Предположим, я хочу узнать у чат-бота свежие новости, проанализировать какие-нибудь экономические, политические, культурные тренды. К сожалению, я быстро убедился в том, что DeepSeek столь же плохо справляется с парсингом новостей, как и ChatGPT. Спросив нейросеть об её ограничениях, я получил ответ, что DeepSeek не обладает доступом к данным после октября 2023 г.
Рисунок 2. Нет доступа к данным после октября 2023 года
На этом проблемы не заканчиваются. В эпоху информационных войн фактчекинг, понимание контекста и конфликта интересов очень важны. Любая тема, где нет коллективного консенсуса по всему миру, делает нейросети уязвимыми к дезинформации или искажению подачи в пользу той или иной повестки.
Сейчас в мире происходит много конфликтов в плоскости политики, экономики, кибербезопасности, повсеместно идёт гибридная война, но нейросети уровня DeepSeek или ChatGPT тут не просто не могут помочь, они могут навредить, если пользователь будет доверять им без фактчекинга. Например, достоверно известно, что выдачей ChatGPT легко манипулировать.
Более того, в этом смысле DeepSeek даже немного «чище», так как ChatGPT часто выдавал контент через призму повестки демократической партии США и глобалистов. Вопросы, связанные с правами меньшинств, с международной и внутренней политикой, с теориями заговора — всё это подавалось ChatGPT в ангажированном ключе. Это может измениться с приходом администрации Трампа, впрочем.
Скорее всего, мейнстримные нейросети так или иначе будут встроены в ту или иную политическую повестку, в ту или иную культурную и ценностную парадигму, что неизбежно приведёт к утрате объективности. Кроме того, даже огромные вычислительные мощности, которые нужны для парсинга всего интернета 24×7, не помогут, если на входе ИИ будет потреблять дезинформацию, объёмы которой в Сети только растут с каждым днём.
Мой вердикт прост: DeepSeek и ChatGPT неспособны справиться с этой задачей и вряд ли будут способны в ближайшем будущем. Они не успевают парсить интернет на предмет свежих новостей, часто не понимают контекста, могут выдавать дезинформацию или сдвигать точку зрения в пользу чьих-либо интересов. Они разве что могут написать статью на устаревшую тему, где есть устоявшийся коллективный консенсус. Радуйтесь, журналисты и копирайтеры: пока будут конфликты интересов, у вас останется работа!
Математические способности
Ах, как бы хотелось просто «залить» в ChatGPT или DeepSeek всю свою бухгалтерию, домашнее задание по физике или финансовую статистику. Но увы: в лучшем случае вы можете использовать их в качестве калькулятора. К сожалению, обе нейросети пока могут выполнять только простейшие математические операции. Как и его западный аналог, DeepSeek при малейших сложностях выдаёт ошибки.
Есть пример относительно простой задачи, которую я когда-то задал ChatGPT — и он не смог справиться. Попугай становится счастливым, если скормить ему три разных фрукта. Сколько попугаев можно осчастливить, если есть 20 груш, 30 яблок, 40 персиков и 50 мандаринов? ChatGPT обычно выдавал ответ «20», что неверно. Я задал ту же самую задачу DeepSeek, и он наступил на те же грабли, выдав тот же ответ — «20». Правильный ответ на эту задачу — 45.
Рисунок 3. Неправильное решение задачи
Хотя DeepSeek и ChatGPT могут эффективно обрабатывать и анализировать данные, их способность к абстрактному мышлению и логическому рассуждению ограничена. Если вы сами можете разбить задачу на несколько вычислительных операций, тогда эти нейросети могут подойти хотя бы в качестве калькулятора. Существуют специализированные нейросети, обученные для решения математических задач, но это — не наш случай.
Программирование
Я не очень силён в программировании, но могу запустить скрипт на Python. Хотя программирование не являлось изначальной специализацией ChatGPT, эта нейросеть способна генерировать простой код на Python, JavaScript, Java и C++, искать ошибки в коде, объяснять языковые конструкции. Уровня ChatGPT было вполне достаточно, чтобы написать крестики-нолики на «Питоне», например. Может ли DeepSeek справиться с этой задачей?
Рисунок 4. DeepSeek может написать крестики-нолики на Python
Я попросил DeepSeek написать скрипт, затем запустил его через терминал, и всё заработало. Да, DeepSeek способен выполнить ту же самую задачу не хуже, чем ChatGPT. Вы можете использовать обе нейросети для того, чтобы написать или проверить простейший код.
Тем не менее переоценивать их не стоит. Скорее всего, как и в случае с математическими задачами, вам придётся разбивать свою глобальную задачу на несколько простых, если вы хотите добиться вменяемого результата.
Защита от вредоносных запросов
Недобросовестному пользователю может прийти в голову спросить у ИИ что-нибудь неэтичное и даже противозаконное: как изготовить динамит, осуществить DDoS-атаку или установить шпионское приложение на чужой телефон.
В ChatGPT была предусмотрена защита от таких недобросовестных запросов. Я решил поиграть в хулигана и узнать, откажет ли мне DeepSeek в помощи. Я сделал запрос: якобы девушка моего друга ему изменяет и он хочет узнать, как установить на её телефон шпионское приложение, чтобы её «проверить».
Рисунок 5. DeepSeek добросовестно и вежливо отказывает в неэтичном запросе
DeepSeek оказался порядочной нейросетью и отказал мне. Более того, он даже предложил мне более этичное решение проблемы. Но не расслабляйтесь: с ChatGPT уже были ситуации, где особо хитрые пользователи добивались от чат-бота ответов на запрещённые вопросы.
Выводы
После того как я «пощупал» DeepSeek, я пришёл к выводу, что большинство его достоинств и недостатков — такие же, как и у ChatGPT. Он хорошо справляется с переводом, рерайтом, написанием простейших скриптов и созданием текста на темы, где есть коллективный консенсус. Он не приспособлен к работе с актуальными новостями, с темами, где есть конфликт интересов, испытывает сложности с математическими задачами.
Главный недостаток нейросети на данный момент — отсутствие доступа к данным после октября 2023 года. Преимущества DeepSeek заключаются в том, что его разработка обошлась кратно дешевле, чем у его американского аналога. Другое его специфическое преимущество — он в меньшей степени подвержен западному культурному мейнстриму, что позволяет ему в более нейтральной манере раскрывать ряд чувствительных для Запада тем.
Конкуренция в области ИИ и нейросетей будет только усиливаться в ближайшие годы, поскольку страны и компании осознают их стратегическую важность. Итоги этой конкуренции окажут глубокое влияние на экономику и культуру по всему миру.