Иллюстративный образ. Источник: Далл-э
Команда QWEN официально представила QWEN3-Coder-это самый мощный Codgenerator при поддержке подхода «агента». Основной звездой линии является QWEN3-CODER-480B-A35B-Instruct. Это гибридная модельная смесь экспертов с 480 миллиардами параметров (35 миллиардов активных одновременно), что способно работать с контекстом до 256 000 токенов, родных для 1 миллиона токенов с экстраполяцией. В тестах она показывает результаты записей среди открытых моделей в агентском кодировании, агентском браузере-США и агентском инструменте в Claude Sonnet 4.
Что такое кодирование «агента»
QWEN3-Coder был создан не только для генерации кода, но и для полноценной работы в качестве «агента», который может планировать, использовать инструменты, получать обратную связь и принимать решения. В реальных задачах (например, Swe-Bench) он взаимодействует с несколькими этапами, которые требуют трудного обучения с длинным горизонтом (RL Long Horizon). Для этого команда QWEN подняла масштабируемую систему из 20 000 параллельных носителей на основе Alibaba Cloud.
QWEN3-CODER Возможности
- Обучен на 7,5 трлн токенов, где 70% код создает код
- Поддержка гигантского контекста до 1 миллиона токенов (с пряжей)
- Использование обучения подкрепления (код RL) для реальных задач для повышения производительности кода
- Интеграция с инструментами разработчиков — QWEN Code (CLI), Claude Code и даже Openai SDK
- Способность работать как через API, так и в местной среде
Инструменты и API
Инструмент CLI на основе CLI на основе QWEN CLI доступен с кодом Gemini. Это позволяет легко использовать QWEN3-Coder в своих собственных проектах, при поддержке пользовательских отраслей и функций. Он также обеспечивает работу через Claude Code и прямой доступ API через Alibaba Cloud Model Studio.
Почему все это
QWEN3-Coder позиционируется как универсальное генерацию веб-сайта с агентом кодирования для сложных многоэтапных задач в разработке. Команда QWEN планирует выпустить больше моделей, чтобы сократить затраты на развертывание и исследовать возможности для «самостоятельного развития» агентов.
О QWEN
QWEN -это ряд крупных языковых моделей и агентских решений команды Alibaba (QWEN Team), предназначенная для создания текста, кода, анализа данных и многоэтапных сценариев с использованием инструментов. Последняя версия, QWEN3-Coder, построенная на архитектуре смеси экспертов с 480 миллиардами параметров (35 миллиардов активных), поддерживает до 256 000 токенов контекста и до 1 миллиона с экстраполяцией и демонстрирует результаты на уровне закрытых моделей. Агентное кодирование, браузер-США и инструмент-США. Модель интегрирована с OpenAI SDK, CLI-Tools (QWEN Code, Claude Code), API Alibaba Cloud и поддерживает Ecosystems Github и обнимающего лица, используя обучение подкреплению в реальном коде и эффективности.
Источник: qwenlm.github.io/blog/qwen3-coder/