Новости
Последние обновления инструментов, релизы и важные события из мира вайб-кодинга
Загрузка...
Последние обновления инструментов, релизы и важные события из мира вайб-кодинга
Китайский гигант Zhipu AI представил скоростную версию флагмана GLM-5.1. Модель выдает стабильные 400 TPS, поддерживает MCP и контекст 200K.
10+ лет в маркетинге, 300+ клиентских проектов: сайты, реклама, боты. Создатель GoBanana (228K+ пользователей, 11.6 млн ₽ выручки) и VibeCoderz. Делаю AI-продукты сам через Claude Code, Cursor, Windsurf и консультирую тех, кто хочет так же.
Об авторе →Zhipu AI выпустила GLM-5.1: 8 часов автономного кодинга и победа над Opus 4.6
Китайский гигант представил модель GLM-5.1, которая работает автономно до 8 часов и обходит топовые западные нейронки в SWE-bench Pro.
Релиз GLM-5.1: Zhipu AI вплотную приблизилась к Claude в кодинге
Китайский гигант Zhipu выпустил обновление GLM-5.1. Модель показала значительный скачок в тестах на написание кода, догоняя Claude Opus 4.6.
Рекордные 400 токенов в секунду: Zhipu представила GLM-5.1 High-Speed
Китайская Zhipu выпустила API GLM-5.1 High-Speed, который выдает 400 токенов/с — это в 3-4 раза быстрее GPT-4o и Claude 3.5 Sonnet.
Рекордные 400 токенов в секунду: Zhipu представила GLM-5.1 Highspeed
Китайская Zhipu запустила API GLM-5.1-highspeed, который выдает 400 токенов в секунду без потери качества модели. Это меняет правила игры для AI-агентов.
Релиз GLM-5.1: Open-weight модель от Z.ai обошла GPT-5.4 в кодинге
Китайская Z.ai выпустила GLM-5.1 — MoE-модель на 754B параметров, которая на релизе возглавила SWE-Bench Pro, опередив топовые проприетарные модели.
Эпоха Open-Weight: GLM-5.1 обошла GPT-5.4 и Claude 4.6 в кодинге
За 60 дней рынок AI-моделей изменился навсегда: GLM-5.1 от Z.ai возглавила рейтинг SWE-Bench Pro, а релизы Llama 4 и Gemma 4 стерли грань между открытыми и закрытыми моделями.
Zhipu AI выпустила GLM-5.1-highspeed — специальную версию своего флагмана, оптимизированную под экстремальную пропускную способность. Главная цифра релиза — 400 токенов в секунду (TPS). Для сравнения: это вдвое быстрее, чем показатели Gemini 3.5 Flash в аналогичных сценариях.
Такой скачок стал возможен благодаря движку TileRT. Разработчики внедрили микропланирование задач на уровне тайлов и передачу данных на уровне регистров, минуя медленную запись в глобальную память (Global Memory). Это не просто пиковый показатель, а стабильная скорость для продакшн-нагрузок.
Когда мы строим сложные агентские циклы (agentic loops), где один агент вызывает другого, задержка (latency) становится критическим фактором. При 400 TPS ответ на 1000 токенов приходит за ~2.5 секунды. В привычных флагманах это занимает 5–7 секунд.
Для тех, кто использует MCP-инструменты и сложные пайплайны генерации кода, GLM-5.1-highspeed превращает ожидание «пока допишет» в мгновенный результат. Модель также поддерживает режим глубокого рассуждения (thinking mode) на той же высокой скорости, что позволяет использовать её в задачах, требующих сложной логики, не жертвуя временем отклика.
Сейчас модель доступна на платформе bigmodel.cn и через DashScope. Если у вас уже есть ключи для Qwen на Alibaba Cloud, вы можете достучаться до GLM-5.1 через тот же эндпоинт.