Долгое время разрыв между локальными моделями и «фронтирными» API (Claude, GPT) оставался болезненным: для серьезного рефакторинга или агентской работы приходилось платить за подписку. С релизом семейства Qwen 3.6 от Alibaba Cloud ситуация на рынке open-weight моделей радикально изменилась.
Главный бенчмарк: Reddit в шоке
На этой неделе в сообществе r/LocalLLaMA завирусился тест: генерация сложной анимации на HTML Canvas в режиме zero-shot без сторонних библиотек. Результаты Qwen 3.6 сравнивали с тяжеловесами: Claude 4.6 Sonnet, GPT-5.4 и Gemini 3.1 Pro.
Итог: версия Qwen 3.6 27B в квантовании Q4_K_M, запущенная на древней видеокарте RX 5700 XT (8 ГБ), показала результат на уровне топовых платных моделей. Это значит, что железо пятилетней давности теперь тянет кодинг уровня «фронтиров».
Состав линейки Qwen 3.6
Alibaba представила несколько вариантов под разные задачи вайбкодеров:
- Qwen 3.6-4B: «карманная» модель, выдающая 60–80 токенов в секунду даже на CPU. Подходит для простых скриптов и автодополнения.
- Qwen 3.6-27B (Dense): основная рабочая лошадка. Именно она стала фаворитом тестов благодаря балансу веса и качества кода.
- Qwen 3.6-35B-A3B (MoE): архитектура Mixture-of-Experts, оптимизированная для более сложных логических цепочек.
- Claude-distilled variant: специальная версия, обученная на ответах Claude для улучшения «человечности» и структуры кода.
Что это значит для вайбкодеров
Если вы используете Cursor, Windsurf или другие AI-IDE, Qwen 3.6 становится реальной альтернативой платным API. Модель отлично справляется с отладкой TypeScript и агентским использованием инструментов (tool use).
Пока сообщество обсуждает 3.6, разработчики уже тизерят версию 3.7. Но даже текущего релиза достаточно, чтобы окончательно закрыть вопрос «можно ли кодить локально без потери качества».