🎯 О чём этот конспект: Разбор масштабного обновления Gemini CLI (v0.23), которое превращает терминальный клиент Google в полноценного AI-агента. Рассматриваются новые функции: Agent Skills для модульного обучения модели, интеграция Conductor для управления контекстом проекта и новые инструменты мониторинга.
👤 Кому будет полезно: Вайбкодерам, разработчикам и AI-энтузиастам, которые предпочитают работать через терминал и хотят использовать возможности Gemini 1.5 Pro/Flash на максимум для автоматизации рутины.
✨ Что получите: Вы научитесь настраивать Gemini CLI, создавать собственные «навыки» (skills) для специфических задач и использовать Conductor для поддержания актуального контекста в больших кодовых базах.
1. Активация Agent Skills: Модульное обучение AI-агента
Контекст: Раньше для каждой специфической задачи приходилось писать длинные системные промпты. С выходом Agent Skills в Gemini CLI (аналог функций Claude Code) вы можете создавать изолированные пакеты знаний и инструкций. Это позволяет модели динамически подгружать нужную экспертизу только тогда, когда это необходимо. Например, можно создать навык для генерации документации Word прямо из терминала или для специфической очистки данных.
Выгода: Повышение точности ответов, экономия токенов за счет модульности и возможность превратить CLI в узкоспециализированного помощника под конкретный стек.
Как применить:
Шаг 1: Обновление и вход в настройки — Установите последнюю версию и откройте меню конфигурации.
npm install -g @google/gemini-cligemini/settings
Шаг 2: Включение Preview-функций — В меню настроек найдите пункт Enable preview features и установите в true. Это откроет доступ к моделям серии Gemini 1.5 и новым функциям.
Шаг 3: Активация Skills — Найдите в настройках параметр agent skills (по умолчанию false) и переключите его в true. Перезапустите CLI.
Шаг 4: Управление навыками — Используйте команду /skills для просмотра списка доступных модулей. Вы можете загружать, перезагружать или отключать их на лету.
Результат: Ваш терминальный агент готов к приему специализированных инструкций, которые не будут захламлять основной чат.
2. Создание собственных навыков через Markdown
Контекст: Создание навыка не требует сложного программирования. Вы можете описать поведение агента в обычном Markdown-файле. Это позволяет структурировать процедурные воркфлоу — например, как именно нужно переименовывать файлы, как связывать заметки в Knowledge Graph или какие правила безопасности Firebase использовать.
Выгода: Возможность автоматизировать сложные многошаговые процессы (например, реорганизацию сотен неструктурированных файлов) менее чем за 30 минут с минимальными затратами.
Как применить:
Шаг 1: Создание файла навыка — Создайте файл skills.md в директории агента или используйте встроенный редактор.
Шаг 2: Структурирование инструкции — Оформите навык по следующему шаблону:
# Skill Name: [Название навыка]Description: [Краткое описание, когда Gemini должен использовать этот навык]Instructions:1. [Шаг 1 инструкции]2. [Шаг 2 инструкции]...
Шаг 3: Установка через Extension Marketplace — Вы также можете устанавливать готовые навыки (например, для Firebase или SpecFlow) через команду установки расширений:
/extensions install [название-расширения]
Результат: У вас есть библиотека переиспользуемых навыков, которые Gemini активирует автоматически при обнаружении соответствующей задачи.
3. Gemini Conductor: Управление контекстом в Brownfield-проектах
Контекст: Главная проблема AI-инструментов — потеря контекста в больших, уже существующих (brownfield) проектах. Gemini Conductor решает это, вынося контекст проекта из истории чата в постоянные Markdown-файлы, которые хранятся прямо в вашем репозитории. Это превращает ваш код в «единый источник истины» для AI, включая цели продукта, архитектуру и стек технологий.
Выгода: Рост качества генерации кода в сложных проектах, где AI обычно «галлюцинирует» из-за нехватки знаний о структуре проекта.
Как применить:
Шаг 1: Установка Conductor — Выполните команду установки расширения в терминале:
/extensions install conductor
Шаг 2: Инициализация — После установки запустите процесс настройки. Если предложат клонировать репозиторий для конфигурации — соглашайтесь (Yes).
Шаг 3: Запуск трека планирования — Используйте команду /conductor для создания нового плана или обновления спецификаций проекта.
/conductor plan "Добавить систему аутентификации через Clerk"
Результат: Агент создаст и будет поддерживать spec документы, которые служат долгосрочной памятью для всех последующих правок кода.
4. Мониторинг и визуальные улучшения (Stats & Wrapped)
Контекст: При активной работе с AI-агентами важно контролировать расход токенов и эффективность взаимодействия. В обновлении v0.23 добавлены инструменты для глубокого анализа использования Gemini CLI, включая годовой отчет (аналог Spotify Wrapped).
Выгода: Прозрачность расходов и понимание того, какие модели и языки вы используете чаще всего.
Как применить:
Шаг 1: Просмотр текущей статистики — Введите команду внутри CLI для получения сводки по текущей сессии и общим показателям.
/stats
Шаг 2: Запуск годового отчета (Wrapped) — Чтобы увидеть свою активность за последние 365 дней (токены, сообщения, сессии, самая длинная серия дней), выполните:
npx gemini-wrapped
Шаг 3: Работа с изображениями (для Windows) — Теперь можно вставлять скриншоты прямо в терминал для анализа AI, используя комбинацию:
Alt + V
Результат: Вы полностью контролируете потребление ресурсов и можете визуально взаимодействовать с агентом (мультимодальность в терминале).
FAQ
В: Как включить модель Gemini 1.5 Pro в CLI? О: Нужно зайти в /settings, включить Preview features, и тогда в списке доступных моделей появятся актуальные версии 1.5 Pro и Flash.
В: Чем Agent Skills лучше обычного системного промпта? О: Skills — это модульная система. Вы можете иметь десятки навыков, но агент будет использовать только нужный в конкретный момент, что не перегружает контекстное окно и делает ответы точнее.
В: Можно ли использовать Gemini CLI бесплатно? О: Да, Google предоставляет щедрый бесплатный уровень (Free Tier) для моделей Gemini через API Key, и CLI позволяет отслеживать лимиты через команду /stats.
В: Где хранятся файлы Conductor? О: Они хранятся прямо в папке вашего проекта в виде Markdown-файлов. Это позволяет версионировать контекст проекта через Git вместе с кодом.
В: Работает ли вставка изображений на Linux или macOS? О: В данном обновлении (v0.23) акцент сделан на поддержку буфера обмена Windows (Alt+V), но автоматическое определение темы фона терминала для корректного отображения работает на всех платформах.
Конспект создан на основе видео «Gemini CLI Just Got A HUGE Update (Agent Skills, Conductor, & More)» канала World of AI. Все права на оригинальный материал принадлежат авторам.Источник: https://www.youtube.com/watch?v=pK-EvgvR_ms