Новости
Последние обновления инструментов, релизы и важные события из мира вайб-кодинга
Загрузка...
Последние обновления инструментов, релизы и важные события из мира вайб-кодинга
Команды vLLM и TorchSpec представили EAGLE 3.1 — новую версию алгоритма, которая решает проблему «дрейфа внимания» и удваивает скорость генерации в длинных контекстах.
10+ лет в маркетинге, 300+ клиентских проектов: сайты, реклама, боты. Создатель GoBanana (228K+ пользователей, 11.6 млн ₽ выручки) и VibeCoderz. Делаю AI-продукты сам через Claude Code, Cursor, Windsurf и консультирую тех, кто хочет так же.
Об авторе →MiniMax-M3: Убийца GPT-5.5 с открытыми весами и ценой в 10 раз ниже
Китайский стартап MiniMax представил модель M3, которая обходит GPT-5.5 и Gemini 3.1 Pro в кодинге, предлагая контекст 1 млн токенов и демпинговые цены.
Constellation запускает Gate AI: защитный шлюз для AI-агентов с блокчейн-аудитом
Новый инструмент Gate AI защищает от промпт-инъекций и создает неизменяемый лог запросов через блокчейн. Релиз намечен на июнь 2026 года.
Mistral выпустила Leanstral: open-source модель для верификации кода на Lean 4
Mistral AI представила Leanstral — специализированный ИИ-агент для формальной верификации доказательств. Модель обходит Claude Sonnet 4.6 в бенчмарках при в разы меньшей стоимости.
Dazzly интегрировал MCP в ChatGPT: создание сайтов через чат-интерфейс
Конструктор сайтов Dazzly запустил приложение для ChatGPT на базе протокола MCP. Теперь управлять контентом и деплоить изменения можно напрямую через диалог с нейросетью.
Krea 2: запуск собственной базовой модели с нативным переносом стиля
Krea представила Krea 2 — свою первую проприетарную модель, которая наступает на пятки GPT Image 2 и меняет правила игры в работе со стилями.
Blitzy привлек $200 млн: новый лидер SWE-bench Pro с оценкой в $1.4 млрд
Стартап Blitzy стал «единорогом», установив рекорд в 66.5% на SWE-bench Pro и пообещав пятикратное ускорение разработки для Enterprise-сектора.
Команды vLLM, TorchSpec и EAGLE представили обновление одного из самых популярных алгоритмов спекулятивного декодирования — EAGLE 3.1. Если вы используете локальные LLM или строите свои инференс-сервисы, это обновление напрямую влияет на задержку (latency) и пропускную способность ваших моделей.
Главная беда спекулятивного декодирования (когда маленькая модель-черновик «угадывает» токены для большой модели) — это деградация на длинных дистанциях. Разработчики обнаружили эффект attention drift: чем глубже спекуляция, тем сильнее модель-черновик отвлекается от системного промпта и фокусируется на собственных свежесгенерированных токенах.
В версии 3.1 это решили архитектурно:
На практике это делает работу черновика похожей на рекурсивный вызов, а не просто на нагромождение слоев, что стабилизирует генерацию.
Для тех, кто гоняет Cursor или свои агенты на собственных инстансах vLLM, профит очевиден:
Вместе с релизом обновился и фреймворк TorchSpec. Теперь обучать собственные модели-черновики под конкретные задачи стало проще и дешевле. Это открывает путь к созданию узкоспециализированных «ускорителей» для кодинговых моделей, которые будут понимать ваш стек лучше универсальных решений.