Команда Jules представила важное обновление архитектуры своего AI-агента — вспомогательную систему Planning Critic. Теперь каждый план действий, не требующий прямого одобрения пользователем, проходит через «второе мнение» перед началом выполнения.
Как работает Planning Critic
Основная проблема автономных AI-агентов — галлюцинации или неоптимальные пути решения на этапе планирования. Чтобы минимизировать риск ошибок, Jules теперь использует двухступенчатую схему:
- Основной агент формирует план решения задачи.
- Planning Critic (вторичный агент) проводит жесткий аудит и уточняет предложенные шаги.
Только после того, как критик подтвердит жизнеспособность стратегии, Jules приступает к написанию и выполнению кода.
Результаты в цифрах
По данным разработчиков, внедрение дополнительного этапа проверки привело к следующим результатам:
- Снижение частоты отказов (failure rates) на 9.5%.
- Значительное повышение качества путей выполнения (execution paths).
- Незначительное увеличение времени на этапе планирования, которое полностью компенсируется отсутствием необходимости исправлять ошибки в процессе.
Что это значит для вайбкодеров
Для тех, кто привык делегировать агентам целые фичи, это большой шаг в сторону «автономности без присмотра». Если раньше за AI-агентом приходилось перепроверять каждый шаг, чтобы он не ушел в бесконечный цикл правок, то теперь Jules делает это сам.
Использование архитектуры «агент-критик» становится стандартом индустрии. Для нас это означает более предсказуемый результат при работе со сложными репозиториями, где цена ошибки в плане может стоить часа потраченного времени на дебаг.