ByteDance выкатила масштабный апдейт для своего AI-редактора Trae. Главный фокус сделан на функции Cue (умный Tab-комплит), которая теперь работает значительно быстрее и точнее. Технический эксперт проекта Цзян Бо поделился деталями того, как команда оптимизировала инструмент для профессиональной разработки.
Прощай, лаг: оптимизация задержки
Для вайбкодера скорость отклика — это всё. Если AI «думает» дольше секунды, магия исчезает. Разработчики Trae признали, что раньше задержка (P50) составляла около 1000 мс, из-за чего рекомендации часто не успевали появиться до того, как пользователь продолжал печатать.
В свежем обновлении latency снизили до 700 мс. Этого добились за счет:
- Перехода с архитектуры MHA на GQA (Grouped-Query Attention), что дало выигрыш в 100-120 мс при сохранении качества.
- Оптимизации предобработки контекста и рендеринга на стороне клиента (еще минус 80-100 мс).
- Удаления «мусорных» токенов при генерации, что сэкономило около 80 мс.
Новая модель Cue-Fusion
Сердцем обновления стала модель Cue-Fusion. Она лучше понимает намерения разработчика благодаря улучшенному контекстному инжинирингу. Теперь нейронка учитывает не только код вокруг курсора, но и:
- Историю редактирования за последние 5 минут;
- Историю просмотров файлов;
- Данные от языковых серверов (LSP).
Это решает проблему «галлюцинаций», когда AI предлагал несуществующие API или методы.
Автоимпорты и кросс-файловые переходы
Для тех, кто пишет на Python, TypeScript и Golang, завезли долгожданные фичи:
- Auto-import: Trae теперь сам добавляет нужные библиотеки при вставке кода, не дожидаясь ошибок линтера.
- Smart Rename: умное переименование переменных и функций теперь работает корректно даже между разными файлами.
«В эпоху вайбкодинга 95% кода может генерироваться агентами, но оставшиеся 5% — это критический вклад человека. Наша задача — сделать этот процесс максимально бесшовным», — отмечают в команде Trae.
Для стабильной работы новых фич убедитесь, что в вашем проекте корректно настроен соответствующий LSP, так как Trae активно использует его данные для повышения точности.