Китайский стартап MiniMax официально представил M2.1 — обновленную версию своей ИИ-модели, заточенную под сложные задачи программирования и работу автономных агентов. Разработчики заявляют о значительном скачке в производительности по сравнению с октябрьским релизом M2, особенно в части мультиязычности и понимания UI.
Что нового в M2.1?
Основной упор в обновлении сделан на расширение стека и «агентские» способности. Модель демонстрирует продвинутые навыки написания кода на Rust, Java, Golang, C++, Kotlin, Objective-C, TypeScript и JavaScript.
Для вайбкодеров особенно интересны два аспекта:
- Проектирование интерфейсов: M2.1 лучше понимает эстетику и логику UI для веба, Android и iOS.
- Следование сложным инструкциям: Модель фокусируется не просто на синтаксической корректности, но и на соблюдении нюансов в ТЗ, что критично для работы в связке с AI-агентами.
Бенчмарк VIBE и сравнение с лидерами
Вместе с релизом MiniMax представила собственный бенчмарк VIBE (Visual and Interactive Benchmark for Execution). Он оценивает модель в роли «агента-верификатора», проверяя интерактивную логику и визуальную составляющую приложений. M2.1 набрала в нем средний балл 88.6, показав лучшие результаты в категориях Web (91.5) и Android (89.7).
По заявлениям компании, в многоязычных сценариях M2.1 уже обходит Anthropic Claude Sonnet 4.5 и вплотную приближается к показателям Claude Opus 4.5.
«Наши пользователи полагаются на MiniMax как на инструмент уровня frontier-моделей за долю их стоимости. Тесты показывают, что M2.1 отлично справляется со всем: от архитектуры и оркестрации до код-ревью и деплоя», — отметил Скотт Брайтеннотер, CEO Kilo Code Inc.
Технические детали и доступность
Модель показала результат 88 баллов на MMLU и 22.0 на HLE (сложный академический тест без использования инструментов), что ставит её в один ряд с топовыми проприетарными решениями от OpenAI и Google.
Для разработчиков M2.1 доступна через API MiniMax, а также планируется публикация весов на HuggingFace. Флагманский сервис компании, MiniMax Agent, уже переведен на новую архитектуру.