Новости
Последние обновления инструментов, релизы и важные события из мира вайб-кодинга
Загрузка...
Последние обновления инструментов, релизы и важные события из мира вайб-кодинга
Новая модель GLM-5.1 установила рекорд на SWE-Bench Pro, обойдя GPT-5 и Claude 4.6, и способна на 8-часовую автономную работу.
10+ лет в маркетинге, 300+ клиентских проектов: сайты, реклама, боты. Создатель GoBanana (228K+ пользователей, 11.6 млн ₽ выручки) и VibeCoderz. Делаю AI-продукты сам через Claude Code, Cursor, Windsurf и консультирую тех, кто хочет так же.
Об авторе →GLM-5.1 от Z.ai: новый лидер SWE-bench Pro, обученный без NVIDIA
Модель GLM-5.1 заняла первое место в сложнейшем бенчмарке для инженеров, используя железо Huawei вместо привычных H100. Разбираемся, как работает «break-and-repair» и почему это важно для вайбкодинга.
Z.ai представила GLM-5.1: автономный кодинг до 8 часов подряд
Новая open-source модель GLM-5.1 обходит решения от OpenAI и Anthropic на SWE-Bench Pro и поддерживает непрерывные циклы разработки.
Z.ai представила GLM-5.1: AI-агенты теперь могут кодить автономно часами
Китайская компания Z.ai выпустила open-source модель GLM-5.1, способную поддерживать высокую производительность на протяжении сотен итераций без потери контекста.
Zhipu AI выпустила GLM-5.1: опенсорс-модель для 8-часовых кодинг-сессий
Китайский технологический гигант Z.ai представил GLM-5.1 — флагманскую модель для агентной разработки, способную автономно работать над задачами до 8 часов подряд.
Z.ai представила GLM-5 Turbo: ускоренная модель для AI-агентов
Китайский стартап Z.ai выпустил GLM-5 Turbo — проприетарную версию своей флагманской модели, оптимизированную для работы в автономных агентах и OpenClaw-сценариях.
Claude Code: новый CLI-агент от Anthropic
Anthropic выпустила Claude Code — терминальный AI-агент для разработчиков. Инструмент работает прямо в командной строке и умеет писать, редактировать и запускать код.
Команда Z.AI анонсировала выход GLM-5.1 — флагманской open-weight модели с 754 миллиардами параметров, созданной специально для «агентского инжиниринга». В отличие от классических LLM, оптимизированных под короткие диалоги, GLM-5.1 заточена под длительные автономные сессии и решение сложных инженерных задач.
Главная новость для вайбкодеров: GLM-5.1 показала результат 58.4 на SWE-bench Pro, официально став SOTA-решением (State-of-the-Art). Модель обошла таких гигантов, как GPT-5, Claude Opus 4.6 и Gemini 3.1 Pro.
Но цифры в бенчмарках — не самое интересное. Разработчики заявляют, что модель способна поддерживать до 8 часов непрерывного автономного выполнения задач. Это критически важно для инструментов вроде Cursor или Windsurf, когда агенту нужно не просто написать кусок кода, а провести глубокий рефакторинг или отладить сложную систему в реальном времени.
Модель построена на базе архитектуры glm_moe_dsa. Использование Mixture of Experts (MoE) позволяет активировать только часть параметров при каждом проходе, что делает инференс такой махины на 754B значительно быстрее и дешевле, чем у плотных (dense) моделей аналогичного размера.
Технология DSA помогает сохранять точность при работе с длинным контекстом, а новая инфраструктура асинхронного обучения с подкреплением (Reinforcement Learning) позволила модели развить «устойчивое суждение». Это значит, что GLM-5.1 реже «галлюцинирует» в середине длинных рабочих цепочек, чем модели, обученные стандартным одношаговым RL.
Появление open-weight модели такого уровня — это мощный сигнал рынку.
GLM-5.1 уже доступна для тестирования и обещает стать новым стандартом для open-source инструментов разработки.