Команда Alibaba Qwen официально представила Qwen3-Coder-Next — открытую модель, специально оптимизированную для работы в качестве автономного кодинг-агента. Главная фишка релиза: невероятная эффективность. Модель с 3 млрд активных параметров (на базе архитектуры MoE) выдает результаты, сопоставимые с гигантами, которые в 10–20 раз больше её по размеру.
Архитектура и «мозги» агента
Qwen3-Coder-Next построена на базе Qwen3-Next-80B-A3B. Разработчики использовали гибридную систему внимания (Hybrid Attention) и архитектуру MoE (Mixture of Experts). Но секрет успеха не в количестве параметров, а в методе обучения.
Вместо простого скармливания текста, модель обучали через «сигналы агентности»:
- Использование крупномасштабных исполняемых задач.
- Взаимодействие с реальной средой (Environment Interaction).
- Обучение с подкреплением (Reinforcement Learning) на основе фидбека от выполнения кода.
Что это значит для вайбкодеров?
Для тех, кто привык собирать проекты через Cursor или Windsurf, это отличные новости. Модель заточена под длинные цепочки рассуждений (long-range reasoning) и, что критически важно, под восстановление после ошибок исполнения. Она умеет пользоваться инструментами и понимает, почему код не запустился в терминале.
Цифры и бенчмарки
Результаты тестов впечатляют, особенно в разрезе стоимости инференса:
- SWE-Bench Verified: В связке с фреймворком SWE-Agent модель преодолела порог в 70%.
- Эффективность: На бенчмарке SWE-Bench-Pro версия с 3B активных параметров идет вровень с моделями, имеющими в 10–20 раз больше весов.
- Универсальность: Высокие показатели в TerminalBench 2.0 и Aider подтверждают, что модель готова к «грязной» работе в консоли и правке реальных репозиториев.
Иерархия экспертов
В процессе обучения Alibaba дистиллировала знания из узкоспециализированных экспертов в одну компактную модель. В Qwen3-Coder-Next «зашиты» компетенции в:
- Software Engineering;
- QA и тестировании;
- Web / UX разработке.
«Мы считаем, что автономное использование инструментов и управление сложными задачами — это ключ к созданию лучших программирующих агентов», — заявляет команда Qwen. В ближайших планах разработчиков — еще больше прокачать принятие решений и поддержку сложных многошаговых задач.
Модель уже доступна на Hugging Face и ModelScope, что делает её идеальным кандидатом для локального запуска в качестве бэкенда для ваших AI-инструментов.