DeepSeek V4: Китайский ШИ-стартап переходит на железо Huawei, игнорируя санкции США

DeepSeek отказывается от NVIDIA в новой модели языка. Источник: AI

Китайский стартап DeepSeek, ставший в последнее время головной головной болью для Кремниевой долины, готовит очередной «сюрприз». Пока западные гиганты вроде OpenAI и Google соревнуются в количестве сожженных миллиардов на закупку железа от NVIDIA, разработчики из Ханчжоу решили пойти по пути полного импортозамещения. Новая речевая модель DeepSeek V4, по данным источников, будет полностью построена на китайской аппаратной платформе.

Прощание с NVIDIA и ставка на Ascend

Согласно информации издания The Information, следующее поколение нейросети от DeepSeek не просто будет частично использовать местные чипы, а полностью переедет на экосистему Huawei. Речь идет об использовании сотен тысяч чипов Ascend 950PR. Это выглядит как логический ответ на жесткие ограничения США, запрещающие поставку передовых ускорителей NVIDIA в Китай.

DeepSeek уже имеет опыт работы с «железом» Huawei, но переход на полный цикл обучения модели такого масштаба на не-NVIDIA архитектуре – это серьезный вызов. Ранее такие гиганты как Alibaba Group, ByteDance и Tencent также начали массово закупать Ascend 950PR, что свидетельствует о формировании мощного внутреннего рынка, который пытается игнорировать санкционное давление.

Триллион параметров и переписанный код

Технические аппетиты DeepSeek V4 поражают: архитектура модели предполагает использование почти триллиона параметров. Чтобы заставить такую ​​махину работать на китайских чипах, компании пришлось в течение нескольких месяцев сотрудничать не только с Huawei, но и Cambricon — еще одним крупным игроком на рынке микросхем КНР. Инженеры буквально переписывали основные компоненты кода и проводили бесконечные тесты, чтобы адаптировать алгоритмы под специфическую архитектуру Ascend.

DeepSeek V4 позиционируется как прямой конкурент ChatGPT, специализируясь на написании кода, сложных математических вычислениях и логических усмотрениях. Учитывая, что предыдущие версии модели демонстрировали поразительную эффективность при значительно меньших затратах на обучение, чем у американских коллег, V4 может стать настоящим «диким кардом» в мире ИИ.

Когда ждать и что дальше

Официальный релиз DeepSeek V4 ожидается уже в ближайшие недели. Более того, стартап не планирует останавливаться и уже работает над еще двумя обновлениями, которые должны появиться до конца 2026 года. Для промышленности это важный сигнал: если DeepSeek удастся показать результаты уровня GPT-4 или Claude 3.5 на чисто китайском железе, миф о незаменимости NVIDIA для обучения больших языковых моделей будет окончательно разрушен.

Пока ни DeepSeek, ни Huawei не предоставили официальных комментариев, но рынок уже воспринимает это сотрудничество как свершившийся факт. Это не просто «импортозамещение» ради галочки, а попытка создать полностью автономный технологический стек, который не будет зависеть от политических решений в Вашингтоне.

Пока китайские разработчики создают автономные системы, западные корпорации пытаются превратить ИИ в ежедневного помощника. К примеру, Microsoft Copilot все еще ищет баланс между профессиональным инструментом и дорогой игрушкой для развлечений.