VibeCoderzVibeCoderz
Telegram

Конспекты

Смарт-конспекты YouTube-видео — ключевые идеи и инсайты без необходимости смотреть часовые ролики

Все конспекты
📝 Конспект2026/05/14Смотреть оригинал

Agentic Search: Как ИИ-агенты находят контекст через Shell и SQL

Практическое руководство по созданию агентного поиска: от настройки инструментов до использования Shell и обучения агентов SQL-синтаксису через навыки.

📝

Смарт-конспект

🎯 О чём этот конспект: Разбор концепции «Context Engineering» и перехода от классического RAG к агентному поиску. В видео объясняется, почему 80% успеха контекста зависит от инструментов поиска, и как комбинировать специализированные инструменты (semantic search) с универсальными (shell/bash, SQL) для создания надежных ИИ-систем.

👤 Кому будет полезно: Разработчикам ИИ-агентов, вайбкодерам и инженерам, которые сталкиваются с ограничениями стандартного векторного поиска и хотят научить агентов работать с базами данных и локальными файлами напрямую.

✨ Что получите: Понимание того, как настраивать описания инструментов, использовать «навыки» (agent skills) для обучения агентов сложным синтаксисам (ESQL/SQL) и как интегрировать терминал (bash) для гибкого поиска по файловой системе.

Контекст: Традиционный RAG (Retrieval-Augmented Generation) имеет жесткий пайплайн: запрос пользователя напрямую идет в векторную базу, достаются чанки, и всё это летит в LLM. Это неэффективно, если контекст не нужен или если требуется несколько шагов поиска (multi-hop). Агентный подход превращает поиск в инструмент, который LLM вызывает только при необходимости и может переформулировать запрос, если первый результат был неудачным.

Тайминг: [02:28]

Выгода: Экономия токенов (агент не вызывает поиск зря) и повышение точности ответов за счет итеративного уточнения запросов.

Как применить:

  • Шаг 1: Оберните поиск в инструмент — Вместо прямой функции поиска в коде, создайте описание инструмента (tool definition), чтобы агент сам решал, когда его вызвать.
  • Шаг 2: Добавьте логику рассуждения — Используйте системный промпт, чтобы обязать агента проверять достаточность полученных данных.

2. Проблема «хрупкости» стандартного семантического поиска

Контекст: Семантический поиск (векторный) часто пасует перед специфическими терминами, аббревиатурами или когда нужен точный поиск по ключевым словам. Автор показывает пример: запрос про «GDPA» (опечатка или специфический термин) возвращает нерелевантные данные о моделях «Gemma», так как векторы оказались близки, но смысл потерян.

Тайминг: [21:01], [22:12]

Выгода: Понимание ограничений векторных баз и переход к гибридным методам поиска.

Как применить:

  • Шаг 1: Анализ ошибок — Если агент возвращает «галлюцинации» на основе неверного контекста, проверьте топ-K результатов поиска.
  • Шаг 2: Внедрение точного поиска — Добавьте инструмент, использующий классический Keyword Search (BM25) или прямой доступ к БД через запросы.

3. Обучение агента сложному синтаксису через Agent Skills

Контекст: Дать агенту инструмент execute_sql — это полдела. LLM часто ошибается в синтаксисе конкретных диалектов (например, путает wildcards в SQL и ESQL). Вместо того чтобы раздувать системный промпт, автор предлагает использовать «навыки» (skills) — документацию, которая подгружается в контекст только тогда, когда агент собирается использовать конкретный инструмент.

Тайминг: [28:34], [31:12]

Выгода: Снижение ошибок синтаксиса без перегрузки контекстного окна на каждом запросе.

Как применить:

  • Шаг 1: Создайте файл навыка — Опишите правила синтаксиса в Markdown.
  • Шаг 2: Настройте взаимосвязь — В описании инструмента укажите, что перед вызовом нужно обязательно прочитать «навык».

Пример промпта для описания инструмента:

Always use the 'elasticsearch_esql_skill' to generate a valid ESQL query before calling the 'execute_esql_query' tool. ESQL has specific rules for wildcards (*) and string literals (double quotes).

4. Shell Tool: Терминал как универсальный поисковик

Контекст: «Всё, что нужно агенту — это shell и доступ к файлам». С помощью bash-команд (grep, ls, find) агент может исследовать структуру проекта и искать данные без предварительной индексации в векторную базу. Это делает агента невероятно гибким в задачах кодинга и анализа локальных данных.

Тайминг: [34:44], [38:52]

Выгода: Возможность работать с «сырыми» данными в реальном времени без затрат на эмбеддинги.

Как применить:

  • Шаг 1: Подключите ShellTool — В LangChain это делается одной строкой.
  • Шаг 2: Обеспечьте безопасностьКритически важно: запускайте такого агента только в Docker-контейнере или песочнице (sandbox), так как он может удалить файлы.

Пример использования агентом:

# Агент сам пишет цепочку команд для поиска
ls -R ./session_data | grep "GDPA"
grep -r "regulatory constraints" ./session_data/workshops

5. Стратегия «Low Floor, High Ceiling» (Низкий порог, высокий потолок)

Контекст: Автор рекомендует балансировать набор инструментов. «Low Floor» — это простые специализированные инструменты (например, get_user_by_id), где агент почти не может ошибиться. «High Ceiling» — это мощные общие инструменты (Shell, SQL), которые позволяют решать нетривиальные задачи ценой сложности и риска ошибок.

Тайминг: [46:42]

Выгода: Стабильность системы на простых задачах и гибкость на сложных.

Как применить:

  • Шаг 1: Начните с General Purpose — Дайте агенту Shell или SQL инструмент.
  • Шаг 2: Логируйте поведение — Если видите, что агент делает 5+ вызовов для одной и той же простой задачи, создайте для неё специализированный «быстрый» инструмент.

FAQ

В: Безопасно ли давать агенту доступ к Shell? О: Нет, это крайне рискованно. Автор подчеркивает, что агент должен работать в изолированной среде (Sandbox), так как он может выполнить команду rm -rf /.

В: Почему агент ошибается в SQL-запросах, если он «умный»? О: LLM часто путают синтаксис разных диалектов (PostgreSQL vs MySQL vs ESQL). Помогают «Agent Skills» — краткие инструкции по синтаксису, подгружаемые в момент вызова инструмента.

В: Что лучше: векторный поиск или поиск через Grep в терминале? О: Зависит от задачи. Векторный поиск хорош для поиска по смыслу (синонимы), Grep — для точных совпадений и кодов. Гибридный подход (как в инструменте gina-grep) объединяет оба метода.

В: Как избежать переполнения контекста при использовании многих инструментов? О: Используйте «Progressive Disclosure» (прогрессивное раскрытие). В системном промпте держите только названия и краткие описания, а полные инструкции (skills) подгружайте только при выборе инструмента.

В: Нужно ли переходить с обычного RAG на агентный? О: Если ваш текущий RAG справляется — нет. Агентный поиск нужен там, где требуется сложная логика, фильтрация данных на лету или работа с несколькими источниками (БД + файлы + веб).


Ресурсы и ссылки

  • Elasticsearch — база данных и поисковый движок — https://www.elastic.co/
  • LangChain — фреймворк для создания агентов — https://www.langchain.com/
  • Jina Grep — CLI инструмент для семантического поиска по файлам — упомянут в видео
  • ESQL (Elasticsearch Query Language) — язык запросов, использованный в примерах — упомянут в видео
  • Llama Index (Sam Tools) — альтернативные инструменты поиска — упомянуты в видео

Конспект создан на основе видео «Agentic Search for Context Engineering» канала AI Engineer. Все права на оригинальный материал принадлежат авторам. Источник: https://youtu.be/ynJyIKwjonM

Все конспекты

Редактор конспекта

Максим Наговицын
Максим Наговицын

Маркетинг-стратег, IT-предприниматель, ментор по вайбкодингу

10+ лет в маркетинге, 300+ клиентских проектов: сайты, реклама, боты. Создатель GoBanana (228K+ пользователей, 11.6 млн ₽ выручки) и VibeCoderz. Делаю AI-продукты сам через Claude Code, Cursor, Windsurf и консультирую тех, кто хочет так же.

Об авторе →

Источник

КаналAI Engineer / Philipp Kahr
Конспект добавлен2026/05/14
Смотреть на YouTube

Похожие конспекты

📝 Конспект

Zcode AI: Полный гид по визуальному интерфейсу для Claude Code и AI-агентов

Узнайте, как использовать Zcode для управления Claude Code, Gemini и Codex в едином GUI. Настройка провайдеров, MCP-серверов и визуальный вайбкодинг.

2026/02/28
📝 Конспект

YouTube-канал с монетизацией из любой точки мира: Пошаговый гайд 2024

Инструкция по созданию YouTube-канала: обход блокировок SMS, настройка расширенных функций через виртуальные номера и правила безопасности для монетизации.

2026/02/28
📝 Конспект

Windsurf Code Maps: Как глубоко понимать архитектуру проекта перед написанием кода

Полный гайд по Windsurf Code Maps, модели Sway 1.5 и Sway Grep. Узнайте, как визуализировать архитектуру кода и ускорить разработку в 13 раз.

2026/02/28
📝 Конспект

Vk Fast Cash Strategy

Аудитория ВКонтакте — это те же люди, что и в Instagram, но 'социальный контракт' площадки другой. Если Instagram — это 'дорогой ресторан' с демонстрацией успеха, то VK — это 'душевная шашлычная'. Здесь не работает глянцевый 'успешный успех

2026/02/28
📝 Конспект

Visual Prompt Engineering: Как создавать предсказуемый ИИ-дизайн в Nano Banana и Gemini

Методика Visual Prompt Engineering для создания профессионального дизайна: управление оптикой, текстом и материалами в связке Gemini и Nano Banana Pro.

2026/02/28
📝 Конспект

Viral AI Apps Strategy 2025

Анализ более 100 виральных AI-приложений (Lerna, Cali, Reframe) показывает, что сложность продукта не коррелирует с доходом. Большинство лидеров рынка с выручкой от $300k до $2M в месяц — это простые утилиты с ОДНОЙ ключевой функцией. Весь

2026/02/28

Читать далее