Если вы платите за Claude Opus 4.7 по $5 за миллион входных токенов и $25 за выходных, то к лету 2026 у вас появилось два прямых конкурента в той же лиге. Qwen3.7 Max от Alibaba и MiniMax M3 показывают близкий результат на SWE-bench Verified, при это…
10+ лет в маркетинге, 300+ клиентских проектов: сайты, реклама, боты. Создатель GoBanana (228K+ пользователей, 11.6 млн ₽ выручки) и VibeCoderz. Делаю AI-продукты сам через Claude Code, Cursor, Windsurf и консультирую тех, кто хочет так же.
Об авторе →Claude Code: новый CLI-агент от Anthropic
Anthropic выпустила Claude Code — терминальный AI-агент для разработчиков. Инструмент работает прямо в командной строке и умеет писать, редактировать и запускать код.
Zcode AI: Полный гид по визуальному интерфейсу для Claude Code и AI-агентов
Узнайте, как использовать Zcode для управления Claude Code, Gemini и Codex в едином GUI. Настройка провайдеров, MCP-серверов и визуальный вайбкодинг.
YouTube-канал с монетизацией из любой точки мира: Пошаговый гайд 2026
Инструкция по созданию YouTube-канала: обход блокировок SMS, настройка расширенных функций через виртуальные номера и правила безопасности для монетизации.
Windsurf Code Maps: Как глубоко понимать архитектуру проекта перед написанием кода
Полный гайд по Windsurf Code Maps, модели Sway 1.5 и Sway Grep. Узнайте, как визуализировать архитектуру кода и ускорить разработку в 13 раз.
Vk Fast Cash Strategy
Аудитория ВКонтакте — это те же люди, что и в Instagram, но 'социальный контракт' площадки другой. Если Instagram — это 'дорогой ресторан' с демонстрацией успеха, то VK — это 'душевная шашлычная'. Здесь не работает глянцевый 'успешный успех
Если вы платите за Claude Opus 4.7 по $5 за миллион входных токенов и $25 за выходных, то к лету 2026 у вас появилось два прямых конкурента в той же лиге. Qwen3.7 Max от Alibaba и MiniMax M3 показывают близкий результат на SWE-bench Verified, при этом стоят в 4-16 раз меньше. В статье разберем цифры по бенчмаркам, сравним цены, покажем, как подключить обе модели через OpenRouter, и честно скажем, где Opus все еще выигрывает.
TL;DR. Qwen3.7 Max выдает 80.4% SWE-bench Verified за $1.25 / $3.75 на OpenRouter. MiniMax M3 идет на 80.5% за $0.30 / $1.20, open-weights, с контекстом до 1 миллиона токенов. У Claude Opus 4.7 показатель 87.6% за $5 / $25. Разрыв в качестве на стандартных задачах в пределах 7 процентных пунктов, разница в цене кратная.

Обновлено: июнь 2026.
Открытые модели из Китая догнали Opus по SWE-bench в пределах одного процентного пункта, при этом стоят в 4-16 раз дешевле. Раньше такой выбор стоял только между «дорого и сильно» или «дешево и слабо».
На SWE-bench Verified три модели сейчас в одной точке: Gemini 3.1 Pro дает 80.6%, MiniMax M3 идет на 80.5%, Qwen3.7 Max выдает 80.4%. У Claude Opus 4.7 показатель 87.6%. Разрыв 7 пунктов, цена в 4-16 раз ниже. Год назад между фронтиром и open-weights была пропасть в 20+ пунктов.
Год назад картина была простая. Хотите фронтир, берите Claude или GPT и платите. Хотите экономить, берите DeepSeek и принимайте, что качество просядет процентов на 15-20. В июне 2026 эта схема поломалась.

Сразу три модели (Qwen3.7 Max, MiniMax M3 и DeepSeek V4 Pro Max) показывают около 80% на SWE-bench Verified. Это в пределах одного процентного пункта от Gemini 3.1 Pro и в семи пунктах от Opus 4.7. При этом MiniMax M3 на OpenRouter стоит $0.30 за миллион входных токенов. Для сравнения, Opus 4.7 стоит $5. Разница в 16 раз.
Главный сдвиг здесь в open-weights. Qwen Coder 480B можно поставить себе на железо, MiniMax M3 тоже открыт. То есть лучшие нейросети для программирования теперь не упираются в подписку одного вендора.
Qwen3.7 Max это флагман Alibaba, выпущен в июне 2026. Контекст 1M токенов, нативная совместимость с протоколом Anthropic API, лидерство в агентных бенчмарках типа MCP Atlas.
Qwen3.7 Max на Terminal Bench 2.0 показывает 69.7% и обгоняет DeepSeek V4 Pro Max (67.9%) и Opus 4.6 Max (65.4%). На SWE-bench Pro vendor получает 60.6%, на MCP Atlas доходит до 76.4%. Артефакт публичного теста Alibaba: модель оптимизировала GPU-ядро автономно за 35 часов, 1 580 tool calls, 10-кратное ускорение без участия человека.
Главная фишка Qwen3.7 Max в нативной поддержке протокола Anthropic API. Это значит, что Claude Code, OpenClaude и любой Anthropic-совместимый агентный фреймворк можно перенастроить на эндпоинт Qwen без переписывания кода. Сменили base URL и работаете с теми же инструментами, но платите в шесть раз меньше.

Модель обучалась как агент. Не «отвечать одним хорошим сообщением», а удерживать длинные цепочки tool calls по десяткам часов без коллапса. В тестах команда YouTube-канала Sider AI собрала на Qwen3.7 Max 3D-модель древнего китайского здания за 8 минут 53 секунды, 18 успешных tool calls подряд. Тот же промпт у Kimi K2.6 и MiMo занимал 2-3 часа.
Есть нюанс. Модель вербозная. Artificial Analysis намерил в среднем 97 миллионов токенов за прогон тестового набора. У медианной модели этот показатель 24 миллиона. На длинных задачах счет растет быстрее, чем по табличке цен. Об этом подробнее в разделе про подвохи.

Сильнее всего модель проявляет себя в трех сценариях. Первый сценарий, это длинные агентные циклы с MCP и кастомными tools, где важно не потерять контекст за десятки шагов. Второй сценарий, это отладка сложной инфраструктуры, когда модель должна понять архитектуру и найти причину поломки. Третий сценарий, это frontend-проекты со сложным UI: тестировщики отдельно отмечают, что Qwen3.7 Max добавляет screen shake, комбо и физические эффекты там, где Kimi и MiMo дают только «гладкий геймплей без физики».
MiniMax M3 это китайский open-weights флагман, вышел 31 мая 2026. SWE-bench Verified 80.5% при цене $0.30 / $1.20 на OpenRouter. Контекст 1M на вход, до 512K на выход. Мультимодальный.
Цена входных токенов MiniMax M3 равна $0.30 за миллион. Это в 16 раз дешевле Opus 4.7 ($5) и в 4 раза дешевле Qwen3.7 Max ($1.25). При этом на SWE-bench Verified обе модели показывают 80.5% и 80.4%. Разница в одну десятую процента. Веса модели открыты, можно self-host на своем железе.

MiniMax M3 сейчас самая аккуратная по балансу цена/качество модель на момент июня 2026. По сути это open-weight-версия Gemini 3.1 Pro по результатам на SWE-bench, только в 6-7 раз дешевле.
Главная особенность здесь в том, что модель действительно открыта. У Qwen есть Coder 480B как open-weight, но флагман Qwen3.7 Max остается API-only. MiniMax M3 открыт целиком: можно поднять на собственных GPU и платить только за инфраструктуру. Для команд с большими объемами генерации это меняет экономику.
В тестах через Claude Code разработчики отмечают улучшение в фазе планирования. M3 проводит интервью на согласование требований. Раньше это умел только Opus. На задачах сегментации клиентов M3 может пропустить тонкие nuances, которые Opus замечает, но за разницу в 16 раз по цене этим часто можно поступиться.

Opus 4.8 в плане разработки добавляет инженерные решения вроде детерминированных пороговых значений и AI-fallback, чтобы не сжигать лишние токены. MiniMax M3 такие надстройки не предложит. Если задача требует архитектурного дизайна с экономией ресурсов на инференс, это работа для Opus. Также Opus стабильнее на анализе разреженных данных: например, найти редкие паттерны в логах или сегментировать клиентов по неочевидным признакам.

Если задача звучит как рутинный код, длинные агентные циклы, frontend с эффектами или работа на больших объемах, выбирайте Qwen или MiniMax. Если задача требует сложного архитектурного дизайна, разреженных данных или production-критичных систем, Opus все еще впереди.
На MCP Atlas Qwen3.7 Max обгоняет Opus 4.6 Max: 76.4% против 75.8%. На Software Engineering Bench Pro vendor: Qwen берет 60.6%, Opus 4.6 Max берет 57.3%. То есть на специфике агентного кодинга китайские модели уже лидируют. На SWE-bench Verified и общем интеллекте (AA Index) Opus впереди на 4-7 пунктов.
Разберем по сценариям. Если вы пишете Telegram-бота на Python с интеграцией внешних API, это работа, с которой Qwen3.7 Max справится без вопросов. Один из тестов показал: модель прошла серию из четырех последовательных усложняющихся задач по кодингу без ошибок в логике и синтаксисе, нашла бесплатный API без авторизации и собрала рабочий бот.
Если задача звучит как «отрефакторить legacy-кодбазу на 200 тысяч строк с противоречивыми требованиями», нужен Opus или Fable 5. Здесь важна способность модели держать в голове противоречия и предлагать компромиссы. Бюджетные модели тут чаще выдают код, который компилируется, но не учитывает всех нюансов.
Промежуточный сценарий выглядит как e-commerce приложение типа Shopify-анализатора. Тестировщики на YouTube собирали такое приложение на M3 и на Opus 4.8. Результат: M3 экономит средства, но требует больше «babysitting», ручного контроля и правок. Для команды это вопрос, что дороже: токены или время разработчика.
OpenRouter работает как маршрутизатор между API многих моделей с единым ключом. Подключение Qwen или MiniMax к Cursor, Claude Code или Cline занимает 5 минут. Нужны base URL, API-ключ и слаг модели.
Минимальное пополнение на OpenRouter составляет $5. Для Cursor это сотни запросов, для Claude Code хватит на десятки часов работы. У OpenRouter есть тариф с 1 000 запросов в день при покупке 10 кредитов и бесплатный тир с 50 запросами в день. Прямое подключение к Alibaba требует $25 минимального пополнения.
Универсальная схема такая. Идете на openrouter.ai, регистрируетесь, кладете $5-10 на баланс. Создаете API-ключ в разделе Keys. Дальше идет настройка в конкретном инструменте.
В Cursor открываете Settings → Models. Включаете «Custom OpenAI API». В поле Base URL вставляете https://openrouter.ai/api/v1. В Name пишете, например, qwen-3.7-max. В API Key вставляете ключ из OpenRouter. В Model name указываете слаг qwen/qwen3-max (точное имя проверяйте на openrouter.ai/models). Сохраняете и переключаете модель в чате. После этого лимиты Cursor вас не касаются. Вы платите OpenRouter поминутно.
Claude Code ожидает протокол Anthropic, а OpenRouter отдает OpenAI-формат. Нужен прокси, например claude-code-router (открытый GitHub-проект). Устанавливаете его локально, в конфиге указываете OpenRouter base URL и слаг minimax/minimax-m3. Claude Code думает, что обращается к Sonnet, на самом деле работает MiniMax M3. У Qwen3.7 Max этот трюк не нужен. Модель нативно совместима с Anthropic API. Просто меняете base URL.
Cline и Roo Code поддерживают OpenRouter из коробки. В настройках расширения выбираете провайдера OpenRouter, вставляете ключ, выбираете модель из выпадающего списка. Никаких прокси и подмен. Это самый быстрый способ начать тестировать обе модели без перенастройки рабочей среды.

Сводная таблица для выбора. Цены приведены на OpenRouter, по состоянию на 17 июня 2026.
| Модель | SWE-bench Verified | Цена input ($/1M) | Цена output ($/1M) | Контекст | Особенности |
|---|---|---|---|---|---|
| Claude Opus 4.7 | 87.6% | $5 | $25 | 1M | Лучший на сложных задачах |
| Claude Sonnet 4.6 | 79.6% | $3 | $15 | 1M | Баланс цена/качество |
| Gemini 3.1 Pro | 80.6% | $2 | $12 | 1M | Мультимодальность, long-context |
| Qwen3.7 Max | 80.4% | $1.25 | $3.75 | 1M | Нативный Anthropic API, агенты |
| MiniMax M3 | 80.5% | $0.30 | $1.20 | 1M | Open-weights, self-host |
| DeepSeek V4 Flash | ~79% | $0.14 | $0.28 | 1M | Самый дешевый сильный кодер |
Что видно из таблицы. Если просто посчитать «сколько стоит миллион выходных токенов на проект с SWE-bench около 80%», MiniMax M3 дает результат в 20 раз дешевле Opus. На объеме 50 миллионов выходных токенов в месяц это разница $60 против $1 250. Деньги, которые можно вернуть в продукт.
Qwen3.7 Max вербозная и съедает в 4 раза больше токенов на тот же ответ. MiniMax M3 на сложных задачах требует больше ручного контроля. Opus все еще стабильнее на production-критичных кейсах.

Artificial Analysis намерил у Qwen3.7 Max в среднем 97 миллионов токенов за прогон теста против медианных 24 миллионов. Это значит, что реальная стоимость прогона на длинных агентных задачах может вырасти в 3-4 раза по сравнению с цифрой из прайса. У MiniMax M3 этой проблемы нет, но качество планирования на нюансных задачах ниже.
Главный подвох с Qwen в вербозности. На бумаге $1.25 за миллион токенов выглядит как «в 4 раза дешевле Opus». На практике, если модель генерирует в 4 раза больше токенов на ту же задачу, экономия исчезает. Пока этот эффект сильнее всего на длинных агентных циклах с десятками tool calls. На обычном кодинге разница умереннее.
MiniMax M3 в e-commerce и data-задачах может пропустить тонкости. В тесте с сегментацией клиентов Opus сразу предложил отдельный анализ ордеров под win-back, predictive upsell и VIP-сегменты. M3 эту структуру воспроизвел частично, пришлось дополнительно подсказывать. Для команды разработчиков это означает: бюджет, который вы экономите на API, частично перетекает в часы программиста.
И еще одно. Qwen и MiniMax это китайские модели. Для российских команд это плюс: оплата через OpenRouter работает с любых карт без VPN, есть сервисы вроде Заруб для пополнения рублями от 100 рублей. Для команд с compliance-требованиями по jurisdiction обработки данных нужно проверять, через какие провайдеры маршрутизирует OpenRouter.
Максим: «Сделал. Получил цифру. GoBanana собрали за 6-8 часов, продукт принес 12 миллионов рублей. Когда токены жгутся круглые сутки, цена модели становится не теорией, а прямым минусом в P&L. Шесть раз дешевле на том же качестве, это другие проекты, которые ты можешь себе позволить запустить. На этом костер и горит.»

MiniMax M3 стоит $0.30 за миллион входных токенов и $1.20 за выходных на OpenRouter. SWE-bench Verified равен 80.5%, на уровне Gemini 3.1 Pro. Если нужно еще дешевле и можно поступиться 1-2 пунктами SWE-bench, берите DeepSeek V4 Flash за $0.14 / $0.28.
Можно через расширение BlackBox в VS Code, там бесплатный безлимитный доступ к MiniMax M3/M27. Или через Open Code (Code Gen) в рамках временной акции. Для Claude Code напрямую нужен локальный claude-code-router, который транслирует OpenAI-формат OpenRouter в Anthropic-формат.
В тире фронтира идут: Claude Opus 4.7 и 4.8, Claude Sonnet 4.6, Gemini 3.1 Pro, Qwen3.7 Max, MiniMax M3, DeepSeek V4 Pro Max и Flash. Год назад 1M контекста был эксклюзивом премиум-моделей. В 2026 это стандарт от $0.14 до $10 за миллион токенов.
Cursor Pro дает 500 запросов в месяц за $20. На OpenRouter с $10 кредитов можно получить около 1 000 запросов в день при подключении Qwen3.7 Max или DeepSeek. Если у вас лимиты Cursor кончаются за две недели, переход экономит в разы. Если хватает с запасом, Cursor проще в поддержке.
Технически да, лицензии MIT (DeepSeek) и open-weights (MiniMax M3) разрешают коммерческое использование. По compliance зависит от ваших правил обработки данных. Если код содержит чувствительную IP, лучше self-host MiniMax M3 на своих GPU или использовать на open-weights через локальную инфраструктуру.
Начните с Claude Sonnet 4.6 через Cursor или claude.ai. Это самый стабильный опыт с минимумом настроек. Когда упретесь в лимиты или счет, попробуйте Qwen3.7 Max через OpenRouter. MiniMax M3 хорош, но требует больше ручного контроля и для новичка может быть избыточен.
По агентным бенчмаркам в июне 2026 лидером выступает Qwen3.7 Max (MCP Atlas 76.4%, Terminal Bench 2.0 69.7%). Дальше идут Kimi K2.6 и Claude Opus 4.7. MiniMax M3 ровный по агентному стеку, но не лидер. Для длинных автономных циклов с большим числом tool calls выбирайте Qwen.
SWE-bench Verified. Стандартизированный бенчмарк для оценки качества AI на реальных задачах программирования. 80% означает, что модель решает 8 из 10 задач из набора. Опубликован Princeton, валидирован сообществом.
OpenRouter. Сервис-маршрутизатор между API десятков AI-моделей с единым ключом и единым форматом оплаты. Альтернатива прямым подпискам на каждый вендор.
Open-weights. Модель, веса которой опубликованы. Можно скачать и запустить на собственном железе. Не путать с open-source, где открыт еще и код обучения.
Anthropic API protocol. Формат запросов, который ожидает Claude. Если модель его поддерживает нативно (как Qwen3.7 Max), ее можно подключить к любому Anthropic-совместимому инструменту простой сменой base URL.
MCP (Model Context Protocol). Стандарт от Anthropic для подключения внешних инструментов к AI-моделям. Через MCP модель получает доступ к файловой системе, базам данных, API, браузеру.
Tool calls. Обращения модели к внешним инструментам через API. Современные агентные модели делают сотни и тысячи tool calls в одном цикле без потери контекста.
Vendor harness vs Scale SEAL. Два способа замера бенчмарков. Vendor это настройка от создателей модели, обычно показывает лучший результат. Scale SEAL это стандартизированный замер, более жесткий и сопоставимый между моделями.

Если выбираете между Claude и альтернативами, начните с теста на своих задачах. Подключите Qwen3.7 Max и MiniMax M3 через OpenRouter к привычному инструменту, Cursor, Claude Code, Windsurf или Aider. Прогоните 5-10 типичных задач из вашего workflow и посмотрите на счет.
Если разбираетесь, какая модель ии для программирования подходит под ваш стек, смотрите полный каталог AI-инструментов на VibeCoderz. Там 70+ IDE и AI-агентов с обзорами, бенчмарками и реальными кейсами.
Если хотите разобрать конкретно вашу задачу или собрать стек под продукт, запишитесь на консультацию к Максиму. Опыт NeuroScribe (65 000 пользователей), GoBanana (200 000+ пользователей, 12 млн рублей выручки) и VibeCoderz, это про то, как использовать модели по факту, а не по маркетинговым обещаниям вендора.
Обновлено: июнь 2026. Цены и бенчмарки проверены по OpenRouter, Artificial Analysis и SWE-bench Leaderboard на 17 июня 2026.