Новости
Последние обновления инструментов, релизы и важные события из мира вайб-кодинга
Загрузка...
Последние обновления инструментов, релизы и важные события из мира вайб-кодинга
В IDE Windsurf появился режим Arena Mode для слепого тестирования LLM на реальном контексте вашего проекта. Теперь выбрать лучший агент Cascade можно на практике, а не по бенчмаркам.
10+ лет в маркетинге, 300+ клиентских проектов: сайты, реклама, боты. Создатель GoBanana (228K+ пользователей, 11.6 млн ₽ выручки) и VibeCoderz. Делаю AI-продукты сам через Claude Code, Cursor, Windsurf и консультирую тех, кто хочет так же.
Об авторе →Windsurf 2.0: интеграция с Devin и новый командный центр для агентов
Cognition превращает Windsurf в хаб для управления ИИ-агентами. Встречайте нативную интеграцию с Devin и Kanban-доску для контроля задач.
Windsurf 2.0: Запуск Agent Command Center и глубокая интеграция с Devin
Крупное обновление IDE Windsurf 2.0 превращает редактор в центр управления роем AI-агентов с поддержкой Devin и Kanban-доской задач.
Windsurf 2.0: интеграция с Devin и новый Agent Command Center
Windsurf представил масштабное обновление 2.0 с нативной поддержкой Devin и Kanban-панелью для управления облачными и локальными агентами.
Windsurf представил Adaptive: умный роутер моделей и безлимит для Max-тарифа
Команда Windsurf выпустила крупное обновление: интеллектуальный выбор моделей Adaptive, прозрачные цены в интерфейсе и отмена дневных лимитов для профи.
Claude Code: новый CLI-агент от Anthropic
Anthropic выпустила Claude Code — терминальный AI-агент для разработчиков. Инструмент работает прямо в командной строке и умеет писать, редактировать и запускать код.
Endava и Cognition масштабируют агентную разработку в Windsurf и Devin
Глобальный IT-гигант Endava расширяет партнерство с Cognition для внедрения Windsurf и Devin в корпоративные процессы. Узнайте, как агентная разработка становится стандартом индустрии.
Разработчики из Windsurf решили, что синтетические бенчмарки больше не отражают реальность, и представили Arena Mode. Это встроенный в IDE инструмент, который позволяет сравнивать работу разных LLM в режиме «слепого тестирования» прямо на вашем рабочем коде.
Вместо того чтобы гадать, какая модель лучше справится с рефакторингом или дебагом, вы запускаете два агента Cascade параллельно.
Для тех, кто строит продукты с помощью AI-агентов, выбор модели часто превращается в лотерею. Arena Mode решает главную проблему внешних тестов — отсутствие контекста. Как отметила DevRel лид проекта: «Ваша кодовая база — это и есть настоящий бенчмарк».
Система позволяет тестировать как конкретные пары моделей, так и группы (например, «быстрые» против «умных»). Это помогает понять, стоит ли переплачивать за контекстное окно Claude 3.5 Sonnet или для текущей задачи достаточно условной GPT-4o mini.
Помимо «Арены», в обновлении появился Plan Mode. Теперь Cascade сначала задает уточняющие вопросы и строит структурированный план действий, и только после вашего одобрения приступает к написанию кода. Это значительно снижает количество галлюцинаций при работе над сложными фичами.
На данный момент Arena Mode доступна бесплатно для всех групп моделей на ограниченный период. В будущем Windsurf планирует добавить детальные рейтинги по языкам программирования и типам задач, а также внедрить командные лидерборды для крупных организаций.