Конспект: Gemini CLI: Полный гид по Agent Skills и Conductor для AI-автоматизации — VibCoderZ - VibeCoderz

Загрузка...

🎯 О чём этот конспект: Разбор масштабного обновления Gemini CLI (v0.23), которое превращает терминальный клиент Google в полноценного AI-агента. Рассматриваются новые функции: Agent Skills для модульного обучения модели, интеграция Conductor для управления контекстом проекта и новые инструменты мониторинга.

👤 Кому будет полезно: Вайбкодерам, разработчикам и AI-энтузиастам, которые предпочитают работать через терминал и хотят использовать возможности Gemini 1.5 Pro/Flash на максимум для автоматизации рутины.

✨ Что получите: Вы научитесь настраивать Gemini CLI, создавать собственные «навыки» (skills) для специфических задач и использовать Conductor для поддержания актуального контекста в больших кодовых базах.

1. Активация Agent Skills: Модульное обучение AI-агента

Контекст: Раньше для каждой специфической задачи приходилось писать длинные системные промпты. С выходом Agent Skills в Gemini CLI (аналог функций Claude Code) вы можете создавать изолированные пакеты знаний и инструкций. Это позволяет модели динамически подгружать нужную экспертизу только тогда, когда это необходимо. Например, можно создать навык для генерации документации Word прямо из терминала или для специфической очистки данных.

Выгода: Повышение точности ответов, экономия токенов за счет модульности и возможность превратить CLI в узкоспециализированного помощника под конкретный стек.

Как применить:

Шаг 1: Обновление и вход в настройки — Установите последнюю версию и откройте меню конфигурации.

npm install -g @google/gemini-cli
gemini
/settings

Шаг 2: Включение Preview-функций — В меню настроек найдите пункт Enable preview features и установите в true. Это откроет доступ к моделям серии Gemini 1.5 и новым функциям.
Шаг 3: Активация Skills — Найдите в настройках параметр agent skills (по умолчанию false) и переключите его в true. Перезапустите CLI.
Шаг 4: Управление навыками — Используйте команду /skills для просмотра списка доступных модулей. Вы можете загружать, перезагружать или отключать их на лету.

Результат: Ваш терминальный агент готов к приему специализированных инструкций, которые не будут захламлять основной чат.

2. Создание собственных навыков через Markdown

Контекст: Создание навыка не требует сложного программирования. Вы можете описать поведение агента в обычном Markdown-файле. Это позволяет структурировать процедурные воркфлоу — например, как именно нужно переименовывать файлы, как связывать заметки в Knowledge Graph или какие правила безопасности Firebase использовать.

Выгода: Возможность автоматизировать сложные многошаговые процессы (например, реорганизацию сотен неструктурированных файлов) менее чем за 30 минут с минимальными затратами.

Как применить:

Шаг 1: Создание файла навыка — Создайте файл skills.md в директории агента или используйте встроенный редактор.
Шаг 2: Структурирование инструкции — Оформите навык по следующему шаблону:

# Skill Name: [Название навыка]
Description: [Краткое описание, когда Gemini должен использовать этот навык]
 
Instructions:
1. [Шаг 1 инструкции]
2. [Шаг 2 инструкции]
...

Шаг 3: Установка через Extension Marketplace — Вы также можете устанавливать готовые навыки (например, для Firebase или SpecFlow) через команду установки расширений:

/extensions install [название-расширения]

Результат: У вас есть библиотека переиспользуемых навыков, которые Gemini активирует автоматически при обнаружении соответствующей задачи.

3. Gemini Conductor: Управление контекстом в Brownfield-проектах

Контекст: Главная проблема AI-инструментов — потеря контекста в больших, уже существующих (brownfield) проектах. Gemini Conductor решает это, вынося контекст проекта из истории чата в постоянные Markdown-файлы, которые хранятся прямо в вашем репозитории. Это превращает ваш код в «единый источник истины» для AI, включая цели продукта, архитектуру и стек технологий.

Выгода: Рост качества генерации кода в сложных проектах, где AI обычно «галлюцинирует» из-за нехватки знаний о структуре проекта.

Как применить:

Шаг 1: Установка Conductor — Выполните команду установки расширения в терминале:

/extensions install conductor

Шаг 2: Инициализация — После установки запустите процесс настройки. Если предложат клонировать репозиторий для конфигурации — соглашайтесь (Yes).
Шаг 3: Запуск трека планирования — Используйте команду /conductor для создания нового плана или обновления спецификаций проекта.

/conductor plan "Добавить систему аутентификации через Clerk"

Результат: Агент создаст и будет поддерживать spec документы, которые служат долгосрочной памятью для всех последующих правок кода.

4. Мониторинг и визуальные улучшения (Stats & Wrapped)

Контекст: При активной работе с AI-агентами важно контролировать расход токенов и эффективность взаимодействия. В обновлении v0.23 добавлены инструменты для глубокого анализа использования Gemini CLI, включая годовой отчет (аналог Spotify Wrapped).

Выгода: Прозрачность расходов и понимание того, какие модели и языки вы используете чаще всего.

Как применить:

Шаг 1: Просмотр текущей статистики — Введите команду внутри CLI для получения сводки по текущей сессии и общим показателям.

/stats

Шаг 2: Запуск годового отчета (Wrapped) — Чтобы увидеть свою активность за последние 365 дней (токены, сообщения, сессии, самая длинная серия дней), выполните:

npx gemini-wrapped

Шаг 3: Работа с изображениями (для Windows) — Теперь можно вставлять скриншоты прямо в терминал для анализа AI, используя комбинацию:

Alt + V

Результат: Вы полностью контролируете потребление ресурсов и можете визуально взаимодействовать с агентом (мультимодальность в терминале).

FAQ

В: Как включить модель Gemini 1.5 Pro в CLI? О: Нужно зайти в /settings, включить Preview features, и тогда в списке доступных моделей появятся актуальные версии 1.5 Pro и Flash.

В: Чем Agent Skills лучше обычного системного промпта? О: Skills — это модульная система. Вы можете иметь десятки навыков, но агент будет использовать только нужный в конкретный момент, что не перегружает контекстное окно и делает ответы точнее.

В: Можно ли использовать Gemini CLI бесплатно? О: Да, Google предоставляет щедрый бесплатный уровень (Free Tier) для моделей Gemini через API Key, и CLI позволяет отслеживать лимиты через команду /stats.

В: Где хранятся файлы Conductor? О: Они хранятся прямо в папке вашего проекта в виде Markdown-файлов. Это позволяет версионировать контекст проекта через Git вместе с кодом.

В: Работает ли вставка изображений на Linux или macOS? О: В данном обновлении (v0.23) акцент сделан на поддержку буфера обмена Windows (Alt+V), но автоматическое определение темы фона терминала для корректного отображения работает на всех платформах.

Конспект создан на основе видео «Gemini CLI Just Got A HUGE Update (Agent Skills, Conductor, & More)» канала World of AI. Все права на оригинальный материал принадлежат авторам. Источник: https://www.youtube.com/watch?v=pK-EvgvR_ms