Компания Groq, известная своими сверхбыстрыми чипами LPU для инференса, поделилась результатами внедрения AI-агентов от Factory. Для вайбкодеров этот кейс интересен прежде всего тем, как профессиональные команды оптимизируют свои воркфлоу, отказываясь от медленных «frontier-only» инструментов в пользу гибкости и скорости.
Проблема медленных циклов
Даже в Groq столкнулись с тем, что большинство современных AI-инструментов привязаны к конкретным тяжелым моделям. Это создает огромные задержки (latency) и мешает «бесшовному» общению с кодом. Инженерам Groq требовался инструмент, который позволит использовать их собственный быстрый инференс и переключаться между моделями на лету.
Droid CLI: Модельный агностицизм в действии
Выбор пал на Droid — CLI-агент от Factory. Основная фишка Droid — полная независимость от провайдеров (model-agnostic).
Бен Клигер, Head of Agents в Groq, отмечает:
«Droid — исключительный CLI. Он быстрый, интуитивный и работает со всеми моделями, которые я использую. В связке с быстрым инференсом Groq это открывает новые юзкейсы для AI-агентов в моем цикле разработки».
Реальные цифры и результаты
Переход на Droid позволил Groq реализовать концепцию «dogfooding» (использование собственного продукта): они ускоряют работу агентов с помощью своих же LPU. Результаты впечатляют:
- В 5 раз быстрее выполняются короткие, оперативные задачи.
- В 3 раза быстрее идет разработка фич средней сложности.
Как это меняет воркфлоу вайбкодера?
Главное изменение — это возможность параллелизации. Инженеры Groq запускают несколько инстансов Droid одновременно для разных задач: один фиксит тесты, другой ищет баг в телеметрии, третий отвечает на вопросы по кодовой базе.
Что именно делегируют агентам:
- Анализ падений CI и работу с покрытием тестами.
- Обновление инструментов отладки и телеметрии.
- Быстрый поиск по кодовой базе («Где лежит X?» или «Какая БД отвечает за Y?»).
- Мелкие правки конфигураций.
Для сообщества VibeCoderz это важный сигнал: будущее не за ожиданием ответа от одной «самой умной» модели, а в оперативной работе с CLI-агентами, которые поддерживают локальный или сверхбыстрый инференс и позволяют не прерывать состояние потока.