Новости
Последние обновления инструментов, релизы и важные события из мира вайб-кодинга
Загрузка...
Последние обновления инструментов, релизы и важные события из мира вайб-кодинга
Модель GLM-5.1 заняла первое место в сложнейшем бенчмарке для инженеров, используя железо Huawei вместо привычных H100. Разбираемся, как работает «break-and-repair» и почему это важно для вайбкодинга.
10+ лет в маркетинге, 300+ клиентских проектов: сайты, реклама, боты. Создатель GoBanana (228K+ пользователей, 11.6 млн ₽ выручки) и VibeCoderz. Делаю AI-продукты сам через Claude Code, Cursor, Windsurf и консультирую тех, кто хочет так же.
Об авторе →Z.AI представила GLM-5.1: open-weight модель на 754B параметров для AI-агентов
Новая модель GLM-5.1 установила рекорд на SWE-Bench Pro, обойдя GPT-5 и Claude 4.6, и способна на 8-часовую автономную работу.
Z.ai представила GLM-5.1: автономный кодинг до 8 часов подряд
Новая open-source модель GLM-5.1 обходит решения от OpenAI и Anthropic на SWE-Bench Pro и поддерживает непрерывные циклы разработки.
Z.ai представила GLM-5.1: AI-агенты теперь могут кодить автономно часами
Китайская компания Z.ai выпустила open-source модель GLM-5.1, способную поддерживать высокую производительность на протяжении сотен итераций без потери контекста.
Zhipu AI выпустила GLM-5.1: опенсорс-модель для 8-часовых кодинг-сессий
Китайский технологический гигант Z.ai представил GLM-5.1 — флагманскую модель для агентной разработки, способную автономно работать над задачами до 8 часов подряд.
Z.ai представила GLM-5 Turbo: ускоренная модель для AI-агентов
Китайский стартап Z.ai выпустил GLM-5 Turbo — проприетарную версию своей флагманской модели, оптимизированную для работы в автономных агентах и OpenClaw-сценариях.
Claude Code: новый CLI-агент от Anthropic
Anthropic выпустила Claude Code — терминальный AI-агент для разработчиков. Инструмент работает прямо в командной строке и умеет писать, редактировать и запускать код.
Компания Z.ai представила обновление своей флагманской модели — GLM-5.1. Главная сенсация даже не в том, что она возглавила рейтинг SWE-bench Pro, а в «железе», на котором её готовили. Впервые модель такого уровня была полностью обучена без участия NVIDIA или AMD.
Весь процесс обучения проходил на кластере из 100 000 чипов Huawei Ascend 910B с использованием фреймворка MindSpore. Это доказывает, что технологический суверенитет в AI возможен, а для нас, вайбкодеров, это означает появление еще одного мощного игрока на рынке опенсорсных агентов.
GLM-5.1 — это архитектура MoE (Mixture of Experts) с внушительными параметрами:
GLM-5.1 — это не просто «умный чат», а полноценный агент. Ключевое изменение по сравнению с версией 5.0 — это асинхронное обучение с подкреплением (RL). Z.ai разделили этапы генерации и обучения, что позволило модели справляться с задачами, требующими сотен вызовов инструментов на протяжении многих часов.
Согласно тестам METR, модель способна на 8 часов непрерывной автономной работы над одной задачей. Она использует стратегию «break-and-repair»: разбивает сложную проблему на подзадачи, ставит эксперименты, анализирует вывод терминала и умеет откатываться назад, если зашла в тупик. В качестве демо Z.ai показали, как агент с нуля собирает окружение рабочего стола Linux и оптимизирует векторную БД через 600+ итераций.
Для тех, кто привык кодить через Cursor или Windsurf, GLM-5.1 может стать отличной альтернативой Claude 3.5 Sonnet. Благодаря архитектуре Dynamic Sparse Attention (DSA), модель эффективно работает с длинным контекстом, не «съедая» всю память при инференсе.
Тот факт, что модель с лицензией MIT выдает 58.4 на SWE-bench Pro (тест на исправление реальных багов в реальных репозиториях), означает, что скоро мы увидим еще более автономных и дешевых локальных агентов, способных фиксить легаси-код без нашего участия.