Дата релиза: 18 мая 2026 Статус: Live в Cursor прямо сейчас. Первая неделя — двойной included usage.
10+ лет в маркетинге, 300+ клиентских проектов: сайты, реклама, боты. Создатель GoBanana (228K+ пользователей, 11.6 млн ₽ выручки) и VibeCoderz. Делаю AI-продукты сам через Claude Code, Cursor, Windsurf и консультирую тех, кто хочет так же.
Об авторе →Cursor vs Windsurf 2026: честное сравнение двух лидеров рынка AI IDE
Cursor и Windsurf — два самых популярных AI IDE на рынке. Оба — форки VS Code, оба запускают агентов, оба работают с многофайловыми правками. Но они построены на противоположных философиях: Cursor даёт вам контроль и ждёт одобрения, Windsurf действуе…
AI IDE: что это такое и чем они отличаются от обычных редакторов кода
AI IDE — это среда разработки, где нейросеть встроена в ядро редактора, а не прикручена плагином сбоку. Вы описываете задачу на русском языке, агент читает весь проект, составляет план, пишет код в нескольких файлах одновременно, запускает тесты и са…
Бесплатные AI IDE в 2026: 5 вариантов которые реально работают без подписки
Курсор — отличный инструмент. Но $20 в месяц, которые превращаются в $60-200 при интенсивном использовании, — это вопрос юнит-экономики для каждого, кто строит проекты самостоятельно. Хорошая новость: бесплатные альтернативы в 2026 году перестали быт…
AI IDE с агентом как IDE-агент отличается от автодополнения и зачем это вайбкодеру
AI IDE с агентом: это не просто «умное автодополнение». Агент читает файловую систему, запускает команды в терминале, правит несколько файлов одновременно и сам исправляет ошибки по результатам тестов. Разница примерно такая: автодополнение — это отв…
JetBrains AI IDE какие инструменты работают с IntelliJ PyCharm и WebStorm в 2026
JetBrains строит открытую AI-экосистему: выбираете IntelliJ, PyCharm или WebStorm — и подключаете тот AI-инструмент, который нужен. Встроенный JetBrains AI Assistant с локальными моделями, агент Junie, Windsurf Cascade как плагин, GitHub Copilot — вс…
Создать сайт с ИИ бесплатно какие сервисы реально работают без оплаты
Создать сайт с помощью ИИ бесплатно в 2026 году реально. Но не для всего: Лендинг или портфолио: Bolt.new(1M токенов в месяц) или Lovable (5 сообщений в день). Полноценное приложение с базой данных: только за деньги или с Firebase-кредитами $300 на 9…

Дата релиза: 18 мая 2026
Статус: Live в Cursor прямо сейчас. Первая неделя — двойной included usage.
Сегодня Cursor выкатил Composer 2.5. Твит с анонсом набрал 400K+ просмотров за несколько часов — Элон Маск ретвитнул с комментарием «Try it out! (Partially trained on Colossus 2)». CEO Michael Truell написал лаконично: «Significant step up from Composer 2. This is the very start of our work with SpaceXAI.»
По бенчмаркам — ничья с Claude Opus 4.7 на SWE-bench и Terminal-Bench. По цене — в 7 раз дешевле за задачу. Разбираем всё по порядку.
Официально Cursor называет три направления улучшений: интеллект, работа на длинных задачах и следование инструкциям. Но за этим стоят конкретные технические решения.
| Параметр | Composer 2 | Composer 2.5 |
|---|---|---|
| Интеллект | Frontier-level | Значительно выше |
| Длительные задачи | Хорошо | Существенно лучше |
| Следование инструкциям | Стандартное | Более надёжное |
| Effort calibration | Базовая | Улучшенная |
| Выбор инструментов | Стандартный | Более точный |
| Синтетических задач в RL | — | В 25 раз больше |
Самое важное изменение — не в списке фич, а в подходе к обучению. Cursor впервые показал, куда ушёл вычислительный бюджет: 85% всего compute — собственное обучение поверх базы Kimi K2.5. Месяц назад было ~75%. Доля базовой модели сокращается с каждым релизом.

Максим: «Меня в Composer 2.5 больше всего интересует один факт: Sam Whitmore тестировал его неделю до релиза и не замечал разницы с GPT-5.5, на котором обычно работает. Это не маркетинг — это живой кейс. Я сразу поставил обновление.»

Отдельной таблицы с "Composer 2.5 vs всё" Cursor не публиковал — но данные есть.
| Бенчмарк | Composer 1 | Composer 1.5 | Composer 2 | Composer 2.5 | Δ 2→2.5 |
|---|---|---|---|---|---|
| CursorBench | 38.0 | 44.2 | 61.3 | 63.2 | +1.9 |
| Terminal-Bench 2.0 | 40.0 | 47.9 | 61.7 | 69.3 | +7.6 🚀 |
| SWE-bench Multilingual | 56.9 | 65.9 | 73.7 | 79.8 | +6.1 |
Скачок на Terminal-Bench 2.0 за два месяца — +7.6 пункта. Это серьёзно.
Terminal-Bench 2.0 — автономные терминальные задачи:
| Модель | Score |
|---|---|
| GPT-5.5 | 82.7% |
| Composer 2.5 | 69.3% |
| Claude Opus 4.7 | 69.4% |
| Composer 2 | 61.7% |
Composer 2.5 и Opus 4.7 — буквально ничья с разницей 0.1 п.п. GPT-5.5 впереди на 13 пунктов.
SWE-bench Multilingual — баги в реальных кодовых базах:
| Модель | Score |
|---|---|
| Claude Opus 4.7 | 80.5% |
| Composer 2.5 | 79.8% |
| GPT-5.5 | 77.8% |
| Composer 2 | 73.7% |
Здесь Composer 2.5 обходит GPT-5.5 и вплотную к Opus 4.7 — разница 0.7 п.п.

CursorBench v3.1 — внутренний бенчмарк Cursor:
| Модель | Score |
|---|---|
| Opus 4.7 (max) | 64.8% |
| Composer 2.5 | 63.2% |
| Opus 4.7 (xhigh, default) | 61.6% |
| GPT-5.5 (default) | 59.2% |
| Composer 2 | 61.3% |
⚠️ Важно: CursorBench — внутренний бенчмарк Cursor. Независимая верификация ограничена, держите это в уме. Результаты Opus 4.7 и GPT-5.5 — из заявлений разработчиков, не собственные замеры Cursor.

Это главный аргумент Composer 2.5. При сопоставимом качестве — разрыв в стоимости кратный.
| Вариант | Input ($/1M) | Output ($/1M) |
|---|---|---|
| Composer 2.5 Standard | $0.50 | $2.50 |
| Composer 2.5 Fast (default) | $3.00 | $15.00 |
| Claude Opus 4.7 | $15.00 | $75.00 |
| GPT-5.5 Standard | $15.00 | $60.00 |
| GPT-5.4 | $2.50 | $15.00 |
Цена за задачу на CursorBench:
| Модель | $/задача |
|---|---|
| Composer 2.5 | ~$1 |
| GPT-5.5 | ~$5-6 |
| Claude Opus 4.7 | ~$7 |
В 7 раз дешевле Opus 4.7 за задачу при паритетном качестве.
Один разработчик в типичный день (200K input + 50K output):
Команда из 20 инженеров в месяц (10M output-токенов):
| Модель | $/месяц |
|---|---|
| Composer 2.5 Standard | $25 |
| Composer 2.5 Fast | $150 |
| GPT-5.5 | $600 |
| Claude Opus 4.7 | $750 |
Годовая разница между Composer 2.5 Standard и Opus 4.7 — $8 700 с одной команды.

Дело не только в цене за токен. Composer 2.5 тратит меньше токенов на задачу за счёт трёх вещей:
Self-summarization. Когда контекст достигает лимита, модель паузит, сжимает весь контекст до ~1 000 токенов и продолжает работу. Ошибки компакшена снижены на 50% относительно Composer 2. Это не обрезка — это умная упаковка: RL-награда покрывает всю цепочку включая саммари, модель учится что важно сохранить, а что можно выбросить. Composer 2 прошёл 170 ходов на задаче make-doom-for-mips, сжав 100 000+ токенов до 1 000. Несколько frontier-моделей на той же задаче упали.
Effort calibration. Модель не думает дольше, чем нужно. На простом запросе — минимальный thinking. На сложном — полный ресурс. Раньше модели часто «переусердствовали» на тривиальных задачах.
Точный tool selection. Не перебирает инструменты наугад. Выбирает нужный сразу.
Комбинация «дешевле за токен + меньше токенов на задачу» и даёт итоговый множитель ~10× vs Opus 4.7 per task.
Cursor впервые подробно раскрыл тренировочный стек. Это интересно само по себе.
Composer 2.5 построен на том же open-source чекпоинте что и Composer 2 — Moonshot Kimi K2.5. 1.04 триллиона параметров, 32 млрд активных (архитектура MoE). Коммерческое партнёрство через Fireworks AI.
Что изменилось — доля собственного обучения: 85% всего вычислительного бюджета, против ~75% в Composer 2.
Ключевая инновация этого релиза. Раньше поведенческие ошибки модели было сложно исправить точечно — стандартный RL-объектив слишком грубый для тонких паттернов вроде «не перебирай лишние инструменты» или «объясняй что делаешь».
Cursor решил это так:
Это позволяет точечно чинить misuse инструментов, плохие коммуникационные паттерны и ошибки effort calibration.
Muon — оптимизатор с ортогонализацией градиентов через полярное разложение (Newton-Schulz итерации). Применяется на уровне attention head и per expert. Асинхронная ортогонализация: пока одна задача ждёт коммуникацию, оптимизатор продвигает другие — сеть и compute перекрываются. На 1T-параметрной модели: 0.2 секунды на шаг оптимизатора.
Раздельные HSDP-разметки для expert weights и non-expert weights: эксперты — широкий sharding mesh, non-эксперты — узкие FSDP-группы. Позволяет CP=2 и EP=8 работать на 8 GPU вместо 16.
По precision: forward pass — кастомный NVFP4 (матчится с инференсом), backward pass — стандартный MXFP8 для стабильности. Router replay во время тренировки устраняет numerical mismatch между трейнером и инференс-движком.
Это самая громкая часть анонса — и самая важная для понимания куда движется Cursor.
Самый большой AI-суперкомпьютер в мире, расположен в Мемфисе:
Cursor прямо пишет в блоге:
«Together with SpaceXAI, we're training a significantly larger model from scratch, using 10× more total compute. With Colossus 2's million H100-equivalents and our combined data and training techniques, we expect this to be a major leap in model capability.»
Это будет не на базе Kimi — модель с нуля, с десятикратным вычислительным бюджетом относительно Composer 2.5.

Почему это важно структурно: Cursor исторически зависел от Anthropic (Claude) и OpenAI — двух компаний, которые сейчас строят прямые конкурирующие продукты. Claude Code уже перешёл $2.5 млрд run rate. Доступ к Colossus ломает эту зависимость: Cursor получает суверенную тренировочную инфраструктуру.
Несколько фактов, которые помогают понять масштаб:
Последний факт — показательный. CEO Michael Truell ещё в феврале написал про «третью эру» разработки: не tab autocomplete, не synchronous agents, а автономные агенты в облачных VM, которые получают задачу и сами доводят до PR.
| План | Цена | Что даёт |
|---|---|---|
| Hobby | Бесплатно | ~2 000 комплишенов + 50 запросов/мес |
| Pro | $20/мес | Отдельный пул Composer |
| Pro+ | $60/мес | Расширенный пул |
| Ultra | $200/мес | Максимальный пул |
| Business | $40/чел/мес | Per-token billing |
Первая неделя Composer 2.5 — удвоенный included usage. Сейчас хороший момент тестировать.

@ file references — конкретные файлы, не «сделай всё»Несколько показательных цитат из X в день релиза:
Sam Whitmore: «composer 2.5 is really really great. I had it on last week for some testing, forgot that it was on, & totally didn't realize I wasn't on gpt 5.5 (my usual) for a while. the team did a fantastic job!!»
Alex Volkov: «Great to see their ack. to the Kimi base + how much they moved the model forward! This isn't the one they are training on XAI Colossus, that one is coming and would likely slap hard!»
Elon Musk — ретвит с «Try it out! (Partially trained on Colossus 2)»
На Hacker News про Composer 2 писали: «'Just' Kimi K2.5 with RL — people really misunderstand how difficult it is to achieve these results with RL. Cursor's research team is highly respected within the industry.» С 2.5 аргумент ещё сильнее: 85% compute — собственное обучение.
Отдельная история — прозрачность про базу. Когда вышел Composer 2, Cursor не указал Kimi K2.5 в блоге — комьюнити само нашло это в API request headers. Теперь Cursor прямо пишет в анонсе: «built on the same open-source checkpoint as Composer 2, Moonshot's Kimi K2.5.» Co-founder Aman Sanger тогда признал: «it was a miss to not mention the Kimi base». Урок усвоен.
MoE (Mixture of Experts) — архитектура нейросети, где из общего числа параметров активируется только часть на каждый запрос. Kimi K2.5: 1.04T параметров всего, 32B активных. Это позволяет иметь большую модель без пропорционального роста вычислений на инференсе.
RL (Reinforcement Learning) — обучение с подкреплением. Модель получает задачу, выполняет, получает оценку — и учится делать лучше. Ключевой метод тренировки Composer.
SWE-bench Multilingual — бенчмарк на resolution реальных GitHub Issues в нескольких языках программирования. Один из самых честных измерителей coding capability.
Terminal-Bench 2.0 — бенчмарк автономных задач в терминале. Измеряет способность агента работать в bash-среде без IDE.
Self-summarization — механизм сжатия контекста внутри длинной задачи. Модель сама паузит, упаковывает контекст до ~1K токенов и продолжает работу.
Speculative decoding — техника ускорения инференса: маленькая драфт-модель предсказывает следующие токены, большая — валидирует пачками. Даёт ~2× пропускную способность.
Colossus 2 — суперкомпьютерный кластер xAI в Мемфисе. 200K GPU сейчас, дорожная карта — 1M H100-эквивалентов.
Окт 2025 — Composer 1: первый agentic coding model (Cursor 2.0)
Фев 2026 — Composer 1.5: 20× RL scale-up, thinking model
Мар 2026 — Composer 2: Kimi K2.5 база, 61.3 CursorBench
Апр 2026 — SpaceXAI partnership, доступ к Colossus
Май 2026 — Composer 2.5: 25× synthetic tasks, частично на Colossus 2
??? — Next-gen: модель с нуля, 10× compute, Colossus 2 full scaleНужно что-то делать чтобы получить Composer 2.5?
Нет. Обновление автоматическое — просто откройте Cursor. На первой неделе included usage удвоен.
Composer 2.5 заменяет Claude и GPT внутри Cursor?
Для coding-задач — во многих случаях да. Для нетехнических задач (написать текст, объяснить концепцию) — нет. Co-founder Aman Sanger прямо говорил: «It won't help you do your taxes. It won't write poems.»
Что за история с Kimi K2.5 как базой?
Kimi K2.5 — open-source модель от китайской компании Moonshot AI. Cursor использует её как стартовую точку, а потом применяет собственный continued pretraining и RL. 85% вычислительного бюджета — собственное обучение Cursor. Партнёрство коммерческое и авторизованное, через Fireworks AI.
Чем Composer 2.5 Fast отличается от Standard?
Одинаковый интеллект, разная скорость. Fast — быстрее для интерактивных сессий ($3/$15 за 1M токенов). Standard — дешевле для фоновых задач ($0.50/$2.50). Fast стоит по умолчанию.
Когда выйдет следующая большая модель Cursor?
Официально — дата не называется. Cursor и SpaceXAI тренируют модель с нуля с 10× compute на Colossus 2. По темпу релизов серии (2 месяца между 2 и 2.5) — ориентировочно осень 2026.
Composer 2.5 работает только в Cursor IDE?
Да. Это не standalone API — модель заточена под Cursor и его инструменты: semantic search, file edits, shell commands, browser control, sub-agents.
Что такое «третья эра» по Truell?
Первая эра — tab autocomplete. Вторая — synchronous agents (разговариваешь с агентом в режиме промпт-ответ). Третья — автономные агенты в облачных VM, которые сами берут задачу, кодят, тестируют и приносят готовый PR. 35% мёрджнутых PR в самом Cursor уже создаются так.
Composer 2.5 — это реально уровень Opus 4.7 по большинству coding-задач, в 7 раз дешевле за задачу и с намётками на то, что будет дальше. Следующая модель — с нуля, с 10× compute — потенциально другой разговор.
Для вайбкодера вывод простой: если работаете в Cursor — обновление уже у вас, попробуйте прямо сейчас пока удвоенный usage. Если ещё не пробовали Cursor — хороший момент зайти.
Посмотреть полный обзор Cursor в каталоге. Сравнить с Claude Code и другими инструментами — каталог AI IDE. Разобраться какой стек подойдёт под ваши задачи — запишитесь на консультацию к Максиму.
Обновлено: 18 мая 2026, день релиза. Источники: официальный блог Cursor, The Decoder, OfficeChai, DataCamp, Hacker News, X/Twitter.