2 июня 2026 в GitHub Copilot тихо появилась новая модель в пикере — MAI-Code-1-Flash. Первая собственная кодинг-модель Microsoft, обученная прямо внутри Copilot. Не GPT, не Claude — своя.
10+ лет в маркетинге, 300+ клиентских проектов: сайты, реклама, боты. Создатель GoBanana (228K+ пользователей, 11.6 млн ₽ выручки) и VibeCoderz. Делаю AI-продукты сам через Claude Code, Cursor, Windsurf и консультирую тех, кто хочет так же.
Об авторе →Claude Code: новый CLI-агент от Anthropic
Anthropic выпустила Claude Code — терминальный AI-агент для разработчиков. Инструмент работает прямо в командной строке и умеет писать, редактировать и запускать код.
Zcode AI: Полный гид по визуальному интерфейсу для Claude Code и AI-агентов
Узнайте, как использовать Zcode для управления Claude Code, Gemini и Codex в едином GUI. Настройка провайдеров, MCP-серверов и визуальный вайбкодинг.
YouTube-канал с монетизацией из любой точки мира: Пошаговый гайд 2026
Инструкция по созданию YouTube-канала: обход блокировок SMS, настройка расширенных функций через виртуальные номера и правила безопасности для монетизации.
Windsurf Code Maps: Как глубоко понимать архитектуру проекта перед написанием кода
Полный гайд по Windsurf Code Maps, модели Sway 1.5 и Sway Grep. Узнайте, как визуализировать архитектуру кода и ускорить разработку в 13 раз.
Vk Fast Cash Strategy
Аудитория ВКонтакте — это те же люди, что и в Instagram, но 'социальный контракт' площадки другой. Если Instagram — это 'дорогой ресторан' с демонстрацией успеха, то VK — это 'душевная шашлычная'. Здесь не работает глянцевый 'успешный успех
title: "MAI-Code-1-Flash в GitHub Copilot: бьёт Claude Haiku и стоит дешевле — полный разбор"
description: "Microsoft выпустила MAI-Code-1-Flash — собственную кодинг-модель в Copilot. SWE-Bench 71.6% vs 66.6% у Haiku, -60% токенов, $0.75/1M. Разбираем бенчмарки, цены и как включить прямо сейчас."
keywords: "mai-code-1-flash, mai code 1 flash github copilot, microsoft кодинг модель, copilot новая модель 2026, mai-code vs claude haiku, github copilot model picker"
canonical: "https://vibecoderz.ru/blog/mai-code-1-flash-github-copilot-razbor"2 июня 2026 в GitHub Copilot тихо появилась новая модель в пикере — MAI-Code-1-Flash. Первая собственная кодинг-модель Microsoft, обученная прямо внутри Copilot. Не GPT, не Claude — своя.

На SWE-Bench Verified: 71.6% против 66.6% у Claude Haiku. На SWE-Bench Pro: 51.2% против 35.2% — разрыв +16 процентных пунктов. При этом дешевле Haiku и потребляет до 60% меньше токенов.
Разбираем что это, как работает и стоит ли переключаться.
Попробовать: VS Code → Copilot → model picker → MAI-Code-1-Flash
GitHub Changelog: github.blog/changelog/2026-06-02-mai-code-1-flash
Data Card: microsoft.ai/pdf/MAI-Code-1-Flash-Data-Card.PDF
Обзор всего семейства MAI: vibecoderz.ru/blog/microsoft-mai-modeli-build-2026
TL;DR: Microsoft платила OpenAI и Anthropic за каждый токен в Copilot. Теперь сделала свою модель — обучила прямо в production-среде Copilot, чтобы она работала именно там лучше всего.
Большинство AI-моделей для кодинга обучают на абстрактных датасетах — GitHub, Stack Overflow, синтетические задачи. Потом интегрируют в IDE и смотрят что получается.
Microsoft сделала иначе. MAI-Code-1-Flash обучалась прямо внутри production-инструментария GitHub Copilot: file editing, terminal calls, context retrieval, inline chat flows. Модель с первого дня знает как устроен Copilot — потому что она в нём и жила во время обучения.
Из официального анонса: «The model was trained directly with GitHub Copilot harnesses used in production. This allows it to learn how to interact with surrounding tools and systems in agentic coding tasks, making it uniquely well suited to real-world Copilot workflows.»
Это архитектурное решение, которое объясняет почему модель так хорошо работает именно в Copilot — и почему те же бенчмарки могут не воспроизвестись в других IDE.
TL;DR: Sparse MoE: 137B тотальных параметров, 5B активных. Контекст 256K. Данные до мая 2026, частично синтетические через GPT-4o и GPT-5.

Архитектура — Sparse Mixture of Experts. Тотальных параметров: 137 миллиардов. Активных в каждый момент: 5 миллиардов. Контекстное окно: 256K токенов.
Здесь важен нюанс, который Microsoft так и не прокомментировала официально: в Data Card написано 137B, в анонсе — 5B. Скорее всего имелось в виду 5B активных при 137B тотальных. Путаница реальная — держи в голове при сравнении с другими моделями.
Что в данных:
→ Унаследованная база от MAI-Thinking-1 + code-specific mid-training
→ Обучена на данных до мая 2026
→ Синтетические данные генерировались GPT-4o и GPT-5 для labeling и quality classification
→ Copilot-промпты пользователей — только для RL rollouts и reward model, не для supervised fine-tuning
→ Фильтрация: убраны PII, изображения, tool traces, safety-контент
Тот факт что Microsoft использовала GPT-5 для генерации синтетических данных — ирония, которую в индустрии заметили. «Обучили собственную модель с помощью OpenAI». Технически — не дистилляция, но близко к тому.
TL;DR: На SWE-Bench MAI-Code-1-Flash бьёт Claude Haiku на всех фронтах. На internal adversarial benchmark — 85.8%, но это internal. SOTA по SWE-Bench Pro не достигнут.

Официальные цифры Microsoft:
| Бенчмарк | MAI-Code-1-Flash | Claude Haiku 4.5 |
|---|---|---|
| SWE-Bench Verified | 71.6% | 66.6% |
| SWE-Bench Pro | 51.2% | 35.2% |
| Terminal Bench 2 | 54.8% | 41.6% |
| SWE-Bench Multilingual | 65.5% | 62.7% |
| Adversarial Benchmark (internal) | 85.8% | — |
Разрыв на SWE-Bench Pro впечатляет — +16 процентных пунктов. Это не погрешность, это существенная разница.
Но есть контекст, который важен:
SWE-Bench Pro 51.2% — не SOTA. Kimi K2.6 показывает ~58.6% на том же бенчмарке. MAI-Code-1-Flash не лучшая кодинг-модель в мире. Она лучший «everyday кодер» в своём ценовом сегменте — и это честная позиция.
Adversarial Benchmark — internal. Microsoft построила собственный бенчмарк из 186 вопросов в 34 категориях — специально чтобы отличить реальный reasoning от паттерн-матчинга:
→ Инвертированные классические задачи
→ Невозможные задачи (модель должна отказаться)
→ Недоопределённые сценарии
→ Einstellung traps — ловушки привычных паттернов
85.8% звучит хорошо. Но на Einstellung traps — ниже 50%. Microsoft честно это указала. Это значит: модель умеет думать, но в ловушку привычных решений попадает так же как конкуренты.
Независимых воспроизведений adversarial benchmark пока нет.
TL;DR: Модель сама решает сколько «думать». Простые задачи — коротко и быстро. Сложные — глубже. Итог: до 60% меньше токенов по сравнению с Haiku на тех же задачах.
Это ключевое отличие от большинства моделей.
Обычная модель генерирует примерно одинаковый объём текста независимо от сложности задачи. Попросил переименовать переменную — получил столько же рассуждений, сколько при рефакторинге модуля.
MAI-Code-1-Flash калибрует глубину под задачу:
| Задача | MAI-Code-1-Flash | Claude Haiku |
|---|---|---|
| Простой rename | ~80 токенов | ~200 токенов |
| Multi-file feature | ~500 токенов | ~1200 токенов |
| Bug fix с root cause | ~350 токенов | ~800 токенов |
Для повседневного кодинга, где 80% задач — это небольшие правки — экономия реальная. До 60% меньше токенов = до 60% дешевле при usage-based billing.
При этом на сложных задачах модель не срезает углы — она выдаёт столько, сколько нужно.
TL;DR: $0.75/1M input — дешевле Claude Haiku. Cached input: $0.075/1M. Output: $4.50/1M. При usage-based billing Copilot — меньше токенов × меньше цена = реальная экономия.
| MAI-Code-1-Flash | Claude Haiku 4.5 | |
|---|---|---|
| Input (1M токенов) | $0.75 | дороже |
| Cached input | $0.075 | — |
| Output (1M токенов) | $4.50 | — |
Microsoft перешла на usage-based billing в Copilot с 1 июня. Это значит: платишь за фактически использованные токены, а не фиксированную подписку (или в дополнение к ней).

Если модель тратит 60% меньше токенов И стоит дешевле за токен — для активного пользователя это заметная разница на счёте.
Важно: это «lightweight» тир. MAI-Code-1-Flash позиционируется как быстрый рабочий инструмент для everyday-задач, не замена frontier-моделям (GPT-5, Claude Opus) для сложнейших задач.
TL;DR: VS Code → model picker → MAI-Code-1-Flash. Доступна на всех планах включая Free. Rollout идёт с ~10% пользователей — если не видишь, подожди несколько дней.
Шаг 1. Открой VS Code с установленным GitHub Copilot.
Шаг 2. Найди model picker — иконка модели в правом нижнем углу или в панели Copilot Chat.
Шаг 3. В списке найди MAI-Code-1-Flash → выбери.
Шаг 4. Можно оставить на auto picker — Copilot сам будет выбирать между моделями под задачу. Или зафиксировать MAI-Code-1-Flash как дефолт.
Если модели нет в пикере: rollout идёт постепенно, начиная с ~10% пользователей и расширяясь. Обычно занимает несколько дней до полного охвата. Просто проверяй периодически.
CLI и API: «coming later» — пока только через VS Code.
Доступна на всех планах: Free, Pro, Pro+, Max.
TL;DR: Для everyday-задач — да, попробуй. Для сложного рефакторинга и архитектурных задач — пока держи frontier-модели. Оптимально: auto picker + понять когда что использовать.
Честный ответ зависит от того как ты используешь Copilot.
MAI-Code-1-Flash выигрывает, если:
→ Большинство задач — небольшие правки, рефакторинг, именование, дебаг
→ Работаешь в GitHub Copilot (обучена именно под него)
→ Важна скорость — модель быстрее на простых задачах
→ Хочешь экономить на usage-based billing
Оставайся на Claude/GPT, если:
→ Сложные архитектурные задачи с большим контекстом
→ Multi-step агентные задачи с разветвлённой логикой
→ Задачи где важен максимальный reasoning (MAI-Thinking-1 здесь лучше, но в Private Preview)
Лучший сценарий: включить auto picker. Copilot сам выбирает модель под задачу — MAI-Code-1-Flash для рутины, frontier-модели для сложного. Ты получаешь скорость и экономию там где это работает, без потери качества там где нужна мощь.
TL;DR: Бесплатная качественная кодинг-модель прямо в Copilot Free — это апгрейд без доплаты. Меньше токенов на рутинные задачи = дольше работаешь в рамках плана.

Лиза сократила время анализа видео с 4 часов до 5,5 минут скриптом. Такая же логика здесь: не менять инструмент, а оптимизировать расходы внутри него.
Для вайбкодера на Free-плане: раньше лимиты кончались быстро, потому что GPT-4o/Claude тратили много токенов даже на простые правки. MAI-Code-1-Flash на тех же задачах тратит до 60% меньше — значит лимиты растянутся дольше.
Для тех кто платит: меньше токенов при usage-based billing = реальная экономия на счёте. Особенно если половину рабочего дня занимают небольшие правки и дебаг.
Единственное что важно понять: это модель для Copilot. Не универсальная, не для всех IDE одинаково хорошая. Именно в GitHub Copilot — в VS Code, в GitHub.com — она показывает максимум.
Попробовать: VS Code → Copilot → model picker → MAI-Code-1-Flash
GitHub Changelog: github.blog/changelog/2026-06-02-mai-code-1-flash
Data Card: microsoft.ai/pdf/MAI-Code-1-Flash-Data-Card.PDF
Обзор всего семейства MAI: vibecoderz.ru/blog/microsoft-mai-modeli-build-2026
Каталог AI-IDE и инструментов: vibecoderz.ru/category/ai-ide
Вопросы по стеку и инструментам — к Максиму: t.me/maxnagovitsyn
MAI-Code-1-Flash доступна бесплатно?
Да, на всех планах Copilot включая Free. Расходует меньше токенов — значит в рамках бесплатного плана работает дольше.
Чем она лучше Claude Haiku?
На SWE-Bench Verified: 71.6% vs 66.6%. На SWE-Bench Pro: 51.2% vs 35.2% (+16 п.п.). Плюс до 60% меньше токенов и дешевле по цене за токен.
Работает в JetBrains / Vim / других редакторах?
Пока нет, только VS Code. CLI и API анонсированы как «coming later».
Это заменит GPT-5 и Claude в Copilot?
Для everyday-задач — постепенно да. Для сложных архитектурных и агентных задач Copilot по-прежнему будет использовать frontier-модели.
Что такое adversarial benchmark и почему он важен?
Внутренний бенчмарк Microsoft из 186 вопросов, специально разработанный чтобы поймать модель на паттерн-матчинге вместо реального reasoning. 85.8% accuracy — хорошо, но на Einstellung traps ниже 50%. Независимого воспроизведения пока нет.
Можно ли одновременно использовать несколько моделей в Copilot?
Через auto picker — Copilot сам переключается. Вручную — только одна модель выбрана как активная в данный момент.
Данные из моих промптов использовались для обучения?
Только если ты не отказался от участия в программе улучшения Copilot. И только для RL и reward model — не для supervised fine-tuning. Прямо указано в Data Card.
MAI-Code-1-Flash — собственная кодинг-модель Microsoft в GitHub Copilot. Sparse MoE, 137B/5B параметров, 256K контекст.
Sparse Mixture of Experts (MoE) — архитектура с большим числом параметров, из которых в каждый момент активна только часть. Быстрее и дешевле в инференсе.
SWE-Bench Verified / Pro — стандартные бенчмарки качества AI на реальных инженерных задачах (GitHub Issues).
Terminal Bench — бенчмарк для оценки качества AI в терминальных задачах.
SWE-Bench Multilingual — вариант SWE-Bench для задач на нескольких языках программирования.
Adversarial Benchmark — внутренний бенчмарк Microsoft, включающий невозможные задачи, инвертированные задачи и Einstellung traps.
Einstellung trap — когнитивная ловушка: решение задачи привычным способом, даже когда существует более простой метод.
Адаптивная длина ответа — способность модели самостоятельно калибровать объём генерации под сложность задачи.
Usage-based billing — оплата по фактически использованным токенам, введена в Copilot с 1 июня 2026.
Model picker — интерфейс выбора AI-модели в VS Code Copilot.
Production harness — инструментарий реальной production-среды. MAI-Code-1-Flash обучалась прямо в production harness Copilot.
Вайбкодинг — создание продуктов с помощью AI без глубоких технических знаний.