Цены на ИИ для программирования в июне 2026 разошлись в 100 раз. Сверху Claude Fable 5 по $10 на вход и $50 на выход за миллион токенов. Снизу NVIDIA Nemotron 3 Super с бесплатным тиром. Между ними DeepSeek V4 Flash за $0.14, который занимает первое…
10+ лет в маркетинге, 300+ клиентских проектов: сайты, реклама, боты. Создатель GoBanana (228K+ пользователей, 11.6 млн ₽ выручки) и VibeCoderz. Делаю AI-продукты сам через Claude Code, Cursor, Windsurf и консультирую тех, кто хочет так же.
Об авторе →Claude Code: новый CLI-агент от Anthropic
Anthropic выпустила Claude Code — терминальный AI-агент для разработчиков. Инструмент работает прямо в командной строке и умеет писать, редактировать и запускать код.
Zcode AI: Полный гид по визуальному интерфейсу для Claude Code и AI-агентов
Узнайте, как использовать Zcode для управления Claude Code, Gemini и Codex в едином GUI. Настройка провайдеров, MCP-серверов и визуальный вайбкодинг.
YouTube-канал с монетизацией из любой точки мира: Пошаговый гайд 2026
Инструкция по созданию YouTube-канала: обход блокировок SMS, настройка расширенных функций через виртуальные номера и правила безопасности для монетизации.
Windsurf Code Maps: Как глубоко понимать архитектуру проекта перед написанием кода
Полный гайд по Windsurf Code Maps, модели Sway 1.5 и Sway Grep. Узнайте, как визуализировать архитектуру кода и ускорить разработку в 13 раз.
Vk Fast Cash Strategy
Аудитория ВКонтакте — это те же люди, что и в Instagram, но 'социальный контракт' площадки другой. Если Instagram — это 'дорогой ресторан' с демонстрацией успеха, то VK — это 'душевная шашлычная'. Здесь не работает глянцевый 'успешный успех
Цены на ИИ для программирования в июне 2026 разошлись в 100 раз. Сверху Claude Fable 5 по $10 на вход и $50 на выход за миллион токенов. Снизу NVIDIA Nemotron 3 Super с бесплатным тиром. Между ними DeepSeek V4 Flash за $0.14, который занимает первое место по использованию в OpenRouter Programming Collection. Ниже разбор. Что реально нужно для каждого типа задач, где экономить безопасно, а где переплата окупается за неделю.
TL;DR. В июне 2026 рынок ИИ для программирования делится на 4 тира. Топ за качество: Claude Fable 5 ($10/$50) и Opus 4.8 ($5/$25). Премиум: Sonnet 4.6, Gemini 3.1 Pro, Qwen3.7 Max. Лучшее value: DeepSeek V4 (от $0.14) и MiniMax M3. Бесплатно: Nemotron 3 Super, Gemini Flash Lite, self-host DeepSeek. Подписка IDE против прямого API дает разницу в 3-5 раз.

Обновлено: июнь 2026. Цены и бенчмарки сверены с OpenRouter, SWE-bench Verified Leaderboard и официальными прайсами провайдеров на 10 июня.

Базовая цена интеллекта продолжает падать. То, что стоило $60 за миллион токенов три года назад, сейчас обходится в 6 центов. Но активные пользователи платят больше, чем раньше.
В 2026 году рынок резко расслоился. Закрытые модели верхнего тира (Claude, GPT-5, Gemini) держат премиум-цену за качество. Открытые веса от китайских и американских лабораторий (DeepSeek, Qwen, MiMo, MiniMax, Nemotron) роняют пол до десятков центов за миллион токенов. Разрыв между топом и базой составляет около 70-кратной разницы по input и 60-кратной по output.
Парадокс в том, что обычный разработчик при этом стал платить больше. Подписки IDE прячут реальную стоимость токенов за фиксированной ценой. Cursor в июне 2025 года сменил безлимитные запросы на кредитный пул, и эффективное использование за те же $20 упало примерно вдвое. GitHub Copilot в 2026 году тоже перешел на пул AI-кредитов. Anthropic называет реальную нагрузку плотного дневного кодинга в районе $13 в день, то есть $150-250 в месяц на плане за $20. Кто-то эту разницу годами оплачивал из своего кармана.
Полная сводка по 12 моделям с привязкой к SWE-bench Verified. Цены указаны как input/output за 1M токенов через OpenRouter.
Ниже единая таблица. Все цифры с openrouter.ai/models и swe-bench leaderboard, сверка от 10 июня 2026. Колонка SWE-bench Verified показывает процент решенных задач на стандартизированном бенчмарке Python-кода, остальные колонки помогают сопоставить цену и контекст.
| Модель | Цена input | Цена output | SWE-bench Verified | Контекст |
|---|---|---|---|---|
| Claude Fable 5 | $10 | $50 | 95.0% | 1M |
| Claude Opus 4.8 | $5 | $25 | 88.6% | 1M |
| Claude Opus 4.7 | $5 | $25 | 87.6% | 1M |
| GPT-5.5 | $5 | $30 | ~82.6% | 1.05M |
| Claude Sonnet 4.6 | $3 | $15 | 79.6% | 1M |
| GPT-5.4 | $2.50 | $15 | ~80% | 1.1M |
| Gemini 3.1 Pro | $2 | $12 | 80.6% | 1M |
| Qwen3.7 Max | $1.25 | $3.75 | 80.4% | 1M |
| Kimi K2.6 | $0.75 | $3.50 | 80.2% | 128K |
| DeepSeek V4 Pro Max | $0.435 | $0.87 | 80.6% | 1M |
| MiniMax M3 | $0.30 | $1.20 | 80.5% | 1M |
| DeepSeek V4 Flash | $0.14 | $0.28 | ~79% | 1M |
| Nemotron 3 Super | $0.09 | $0.45 (есть free) | n/a | 1M |
| Gemini 3.1 Flash Lite | $0.10 | $0.40 | n/a | 1M |
Открытые веса (DeepSeek, MiniMax, Qwen3 Coder, Nemotron) подняли пол. Между MiniMax M3 за $0.30 и Gemini 3.1 Pro за $2 разница в SWE-bench Verified всего 0.1 пункта. По факту это седьмикратная разница в цене за идентичный результат. Закрытые лидеры держат разрыв только в верхнем тире.

Однозначного «лучшего» нет. Под каждый бюджет существует разумный выбор, главное не платить за то, чем не пользуешься.
Здесь стоит разнести по тирам. Если выкладывать все в линейку, сравнивать яблоки с апельсинами. Поэтому ниже разделение по реальному кошельку и задачам.
Claude Fable 5 за $10 на вход и $50 на выход. Первая Mythos-class модель для публики. На SWE-bench Verified показывает 95%, что на 6-7 пунктов выше Opus 4.8. На сложных архитектурных задачах разница ощутима: меньше итераций, меньше переделок, экономия времени разработчика. Подписчики Anthropic Pro/Max получали ее бесплатно до 22 июня. Альтернатива в этом же тире, Claude Opus 4.8 за $5/$25, дает 88.6% и параллельные субагенты до 1000 штук. Это инструмент для крупных кодовых баз, рефакторинга и автономных пайплайнов.
Claude Sonnet 4.6 за $3/$15. Лучший Sonnet, 79.6% по SWE-bench Verified, контекст 1M. Закрывает 90% ежедневных задач без обращения к Opus. Рядом Gemini 3.1 Pro за $2/$12 с 80.6% и сильной мультимодальностью. Qwen3.7 Max за $1.25/$3.75 называют рациональной альтернативой Opus 4.8 за одну шестую цены. По бенчмаркам Qwen дотягивает до Gemini, по качеству frontend-кода выигрывает у DeepSeek.
Здесь самое интересное. DeepSeek V4 Pro Max за $0.435/$0.87 показывает те же 80.6%, что и Gemini 3.1 Pro. Открытые веса под MIT, можно self-host. MiniMax M3 за $0.30/$1.20 дает 80.5% по тем же бенчмаркам. Kimi K2.6 за $0.75/$3.50, по данным OpenRouter, лидирует по weekly tokens, то есть это самая используемая модель в мире на июнь 2026.
DeepSeek V4 Flash за $0.14/$0.28, первое место в OpenRouter Programming Collection. Подходит для bulk-задач: автогенерация тестов, миграции, рефакторинг по шаблону. Claude Haiku 4.5 за $1/$5 при cost-per-solved-point $0.13 (лидер по этой метрике). GPT-5.4 Mini за $0.75/$4.50. Хороший резерв для агентов, где важна скорость и предсказуемая цена.

Полностью бесплатно работают free-тиры NVIDIA Nemotron на OpenRouter и self-host открытых моделей. Условно бесплатно: Gemini CLI с лимитом 1000 запросов в день и GitHub Copilot Free для студентов.
NVIDIA Nemotron 3 Super (120B / 12B active) и Nemotron 3 Nano (30B / 3B active) выложены на OpenRouter с free-тиром. Контекст у Super 1M, у Nano 256K. На AIME-2025 и LiveCodeBench Llama 3.3 Nemotron Super показывает 82.71 и 73.58 соответственно. Это лучший открытый бюджетный агент на лето 2026 по нашей оценке.
Второй путь это self-host. DeepSeek V4 Flash и Pro Max идут под MIT-лицензией, то есть их разрешено крутить хоть на домашнем сервере, хоть в коммерческом продукте. Архитектура V4 Flash (284B total / 13B active MoE) запускается на одной H100 80GB или связке RTX 4090. Qwen3 Coder 480B тоже open-weights и специализирован чисто на код.
Третий путь, условно бесплатный, это free-тиры провайдеров. Gemini CLI дает 1000 запросов в день, чего хватает на спокойного разработчика. GitHub Copilot Free доступен студентам и опенсорс-мейнтейнерам.
Лиза: Прикинь, для одной ниши на Текст Заводе я собрала 90 листов Excel и полтора миллиона ключей. Раньше это занимало недели вручную. Codex выгребает всю частотность и находит запросы, до которых я бы сама не додумалась, можно на 30 минут отойти. Когда инструмент закрывает 4 часа работы за 5,5 минут, спор о цене закрывается сам собой.


При легком использовании выгоднее подписка ($10-20 в IDE). При интенсивной работе с агентами и многофайловыми задачами прямой API через OpenRouter экономит в 3-5 раз.
GitHub Copilot Pro за $10 в месяц с GPT-5.4 Mini и автодополнением, по данным GitHub, держит 4.7 млн платных подписчиков. Самая мягкая «стена использования»: нет жестких rolling-windows, нет кредитного пула. Подходит соло-разработчикам и тем, кто пишет 1-3 часа в день.
Cursor за $20 это $20-кредит, которые сгорают по API-ставкам, если вручную выбрать Claude или GPT-5 для сложной задачи. Windsurf за $15 дает 500 промптов и 1500 flow-кредитов. После того как Cursor в 2025 году сменил безлимит на кредиты, часть сообщества мигрировала именно сюда. По LogRocket power rankings на март 2026 Windsurf обогнал Cursor по совокупной оценке.
Claude Code это терминальный агент, который работает 5-часовыми rolling-окнами и недельным потолком. По независимым замерам тратит в 5.5 раз меньше токенов, чем Cursor, на идентичных задачах. За $20 хватает на пару серьезных дней. На Max-тире ($100-200) стена исчезает, но цена против $20-стикера множится на 5-10.
Прямой API через OpenRouter с DeepSeek V4 Flash, MiniMax M3 или Qwen3.7 Plus дает оплату по факту. Никаких rolling-windows, никаких пулов, цена жестко считается за токены. Подключается к Cline, Aider, Continue.dev, Roo Cline или прямо в Claude Code через router. Минус: считать токены придется самому.
Реальная экономика ИИ-кода считается не в месяц, а в стоимость одной задачи. Чем сложнее агент и длиннее контекст, тем меньше осмыслено платить флэт-рейт.
Концепция cost-per-task пришла из обсуждений с теми, кто крутит агентов сутками. Простая модель: умножить среднюю длину контекста на цену input, прибавить ожидаемый объем output, умноженный на цену output, и добавить thinking-токены (у моделей вроде Opus и GPT-5.5 они скрытые, но оплачиваются по выходной ставке).

Пример. Многошаговый рефакторинг с 50 итерациями и контекстом 200K токенов на каждой. Через Claude Opus 4.8: 200000 × 50 × $5 / 1M = $50 input, плюс примерно $25 output. Итого ~$75 за одну задачу. Через DeepSeek V4 Flash: $1.40 input, $0.70 output. Итого ~$2 за ту же задачу при чуть худшем качестве. Разница в 35-40 раз.
Здесь и появляется ключевое правило, на котором сходятся все опытные ребята: подбирать модель под задачу, а не под бренд. Простые правки, тесты, миграции, генерация документации = бюджетные модели типа DeepSeek Flash или Qwen3.7 Plus. Архитектурные решения, отладка крупных багов, рефакторинг межсервисный = Opus 4.8 или Fable 5. Промежуточный middle-ground = Sonnet 4.6 или Gemini 3.1 Pro.
Каждый игрок занимает свою нишу. Claude доминирует на vendor-бенчмарках и agentic-задачах. GPT-5.5 лидирует в Terminal-Bench. DeepSeek дает лучшее value. Qwen силен на frontend и в agentic coding.

Сильные стороны видно по бенчмаркам и реальным юзкейсам, не по маркетингу. Ниже честная карта.
| Модель | Где реально сильна |
|---|---|
| Claude Fable 5 | сложные архитектурные задачи, безопасность, длинный контекст 1M |
| Claude Opus 4.8 | параллельные субагенты (до 1000), рефакторинг, agentic workflows |
| Claude Sonnet 4.6 | ежедневный кодинг, лучший баланс цена/качество |
| GPT-5.5 | Terminal-Bench 2.0 (82.7%, #1 в мире), CLI-задачи, написание тестов |
| Gemini 3.1 Pro | мультимодальность, контекст 1M, frontend и UI |
| DeepSeek V4 Flash | bulk-задачи, агенты с миллионами вызовов, tool calling |
| Qwen3.7 Max | agentic coding, frontend, цена $1.25/$3.75 за уровень Opus |
| MiniMax M3 | open-weights с 80.5% SWE-bench, лучший value в multimodal |
| Kimi K2.6 | long-horizon агенты, batch-нагрузки, объем (1.36T weekly tokens на OR) |
Любопытная деталь. DeepSeek V4 Flash при цене в 70 раз ниже Fable 5 дает около 79% SWE-bench Verified. Разница в качестве примерно 16 пунктов на стандартизированном бенчмарке. На практике эта разница чувствуется на верхних 20% сложных задач, в нижних 80% видна слабо.

Главные ловушки: скрытые thinking-токены, повторная отправка всего контекста в каждом сообщении, цикл агента без супервизии. Один разработчик сжег $6000 за ночь по такому сценарию.
Первая ловушка это скрытые thinking-tokens. Современные модели генерируют скрытую цепочку рассуждений, которую пользователь не видит, но оплачивает по выходной ставке. На ответе в три строки внутри может уйти несколько тысяч токенов размышлений. У Claude Fable 5 это $0.50 за 10000 thinking-токенов, у Opus 4.8 половина от этого.
Вторая ловушка, контекст. У модели нет памяти между запросами. На каждом новом сообщении IDE пересылает всю историю заново. Если разговор разросся до 200 итераций, каждая следующая реплика тащит в API весь стек. Один разработчик отправил агента проверять pull request каждые 30 минут на ночь. К утру цикл 46 раз пересобрал контекст и сжег $6000.
Третья ловушка это команды без потолка. Spend caps и hard limits на агентах должны стоять по умолчанию. Никогда не оставлять автономный цикл без супервизии на ночь, иначе утром получите счет, как контрактору за месяц работы. Cursor, Windsurf, Replit и Claude Code в 2025-2026 годах все по очереди вводили лимиты и кредитные пулы именно из-за таких сценариев.
Четвертая, для российского рынка. Прямая оплата OpenAI, Anthropic, Google невозможна без зарубежных карт. Решения: OpenRouter с криптой или картами третьих стран, российские прокси-провайдеры (BotHub, ProxyAPI), self-host открытых моделей. У DeepSeek и Qwen работают официальные API без блокировок.

Новичкам и легким пользователям GitHub Copilot за $10. Активным разработчикам Cursor + Claude Sonnet 4.6. Тяжелым пользователям связка Claude Code + DeepSeek для рутины. Бюджетникам OpenRouter + DeepSeek V4 Flash.
| Кто вы | Что брать | Цена в месяц |
|---|---|---|
| Соло-разработчик, 1-3 часа в день | GitHub Copilot Pro | $10 |
| Маркетолог-вайбкодер, нерегулярно | Cursor + auto mode | $20 |
| Разработчик с ежедневным кодингом | Cursor + Sonnet 4.6 в Auto | $20 |
| Архитектор крупных проектов | Claude Code + Opus 4.8 / Fable 5 | $100-200 |
| Команда из 10 человек | Cursor Teams vs Claude Code Premium | $400 vs $1250 |
| Бюджетный путь с агентами | OpenRouter + DeepSeek V4 Flash | $5-30 по факту |
| Полная независимость | Self-host DeepSeek V4 / Qwen3 Coder | железо + электричество |
В каталоге Claude Code, Cursor, Windsurf и GitHub Copilot лежат подробные обзоры каждого инструмента с тарифами, плюсами и реальными кейсами. Полный список AI IDE и редакторов в каталоге инструментов. Если хочется делегировать выбор стека под конкретный проект, агенты по нишам подбирают пакет под профессию.
Максим: Веб-версию GoBanana собрал за 3 часа после выхода новой модели. Суммарно на продукт ушло 6-8 часов вайбкодинга, дальше он принес 12 млн рублей выручки без рубля на рекламу. Расходы на API там копеечные по сравнению с этой математикой. Когда модель закрывает задачу за один проход, спор о $50 за миллион токенов закрывается на стадии счета.
Среди платных лидирует DeepSeek V4 Flash: $0.14 за 1M входных токенов и $0.28 за выходные. У NVIDIA Nemotron 3 Super и Nano есть бесплатные тиры на OpenRouter. Для редкого использования бесплатный тир Gemini CLI дает до 1000 запросов в день.
Да. NVIDIA выложила Nemotron 3 Super и Nemotron 3 Nano с free-тиром на OpenRouter. DeepSeek V4 Flash и Pro Max лежат под MIT-лицензией, их можно запустить на своем железе. Qwen3 Coder 480B тоже open-weights и специализирован чисто на код.
Зависит от объема. Если кодишь меньше 2 часов в день, подписка Cursor или GitHub Copilot за $10-20 покрывает все. При интенсивной работе с агентами OpenRouter с DeepSeek или Qwen выходит в 3-5 раз дешевле. Cursor с июня 2025 перешел на кредитную систему.
Fable 5 показывает 95% на SWE-bench Verified против 88.6% у Opus 4.8. Разница в 6.4 пункта означает примерно в полтора раза меньше итераций на сложных задачах. Для архитектурных решений и больших рефакторингов окупается, для рутины переплата.
Модель читает ваш промпт одним проходом, а ответ генерирует по одному токену. Каждый новый токен требует пересчета всего контекста. Поэтому output стоит в 3-5 раз дороже input у всех провайдеров. У Fable 5 разрыв пятикратный, у DeepSeek двойной.
GitHub Copilot за $10 с GPT-5.4 Mini дает мягкие лимиты и сильное автодополнение. Для проектов посложнее Claude Sonnet 4.6 через Cursor закрывает 90% задач за $20. Не нужно сразу хвататься за Opus или Fable 5, переплата вырастет в 3-5 раз без видимой пользы.
Открытые веса под MIT позволяют разворачивать модель на своих серверах, в том числе для коммерции. Минус: при работе через китайские API данные уходят за пределы РФ. Для проектов с чувствительными данными (финансы, медицина, корпоративные базы) лучше выбрать локальный деплой или европейские провайдеры.
Токен — единица текста, по которой модель считает цену. В среднем 1 токен это 3-4 символа в русском или английском. 1M токенов это примерно 750 страниц A4.
Input/output цена — стоимость токенов на вход (ваш промпт + контекст) и на выход (ответ модели). Output обычно в 3-5 раз дороже input.
SWE-bench Verified — стандартизированный бенчмарк, на котором модели решают реальные GitHub-issues из открытых Python-проектов. Считается самым честным замером способности писать код.
Context window — максимальный объем токенов, которые модель удерживает в памяти за один запрос. У топ-моделей 2026 года это 1M.
Thinking-токены — скрытая цепочка рассуждений, которую модели типа Opus или GPT-5.5 генерируют перед ответом. Не видны пользователю, но оплачиваются по выходной ставке.
Open-weights — модель, чьи веса опубликованы в открытом доступе. Под MIT или Apache 2.0 их можно крутить на своем железе и встраивать в коммерческие продукты.
Self-host — запуск модели на собственном сервере без обращения к API провайдера. Платите за железо и электричество, никаких лимитов на запросы.
Usage wall — точка, в которой подписка фактически перестает быть подпиской и начинает считать токены по факту. У Cursor, Windsurf и Claude Code устроена по-разному.
SWE-bench Pro — продвинутый вариант SWE-bench с более сложными задачами. Лидер на стандартизированном harness, GPT-5.4, держит 59.1%.
Agentic coding — режим, в котором модель сама планирует, читает файлы, пишет код, запускает тесты и реагирует на ошибки. По данным Anthropic, агент жрет примерно в 4 раза больше токенов, чем обычный чат.

Если задача срочная и нужна персональная карта стека под ваш проект, запишитесь на консультацию к Максиму. За 30-40 минут он соберет конкретный набор инструментов и моделей под бюджет, тип кода и команду. Если хочется поковыряться самостоятельно, начните с каталога AI IDE и сравните живые обзоры под свою задачу.
Обновление: июнь 2026.