🎯 О чём этот конспект: Разбор системы создания персонального AI-ассистента на базе Claude и принципов Hermes (OpenClaw), который работает автономно 24/7. Автор объясняет, почему не стоит привязываться к готовым фреймворкам, и показывает, как «черепикать» (выбирать лучшие) функции из топовых репозиториев для своей кастомной системы.
👤 Кому будет полезно: Вайбкодерам, разработчикам AI-агентов и тем, кто хочет автоматизировать свои рабочие процессы с помощью LLM без ограничений готовых SaaS-платформ.
✨ Что получите: Методику интеграции функций Hermes (самообучение, память, работа с инструментами) в свою систему через Cursor/Claude, а также готовую архитектуру трехуровневой памяти.
1. Проблема готовых фреймворков и стратегия «Cherry-picking»
Контекст: Популярные open-source проекты вроде Hermes (OpenClaw) быстро развиваются, но часто становятся «черными ящиками». Когда выходит новый крутой инструмент, вам приходится заново настраивать ключи, окружение и переносить память. Автор предлагает не устанавливать Hermes целиком, а использовать AI-агента (Cursor или Claude Code) для анализа чужих репозиториев и внедрения их лучших фишек в вашу собственную, понятную вам архитектуру. Это дает полный контроль над дорожной картой развития вашего ассистента.
Выгода: Гибкость системы, отсутствие привязки к чужому коду и возможность внедрить любую функцию (например, «сны» агента или самогенерацию навыков) за один промпт.
Как применить:
- Шаг 1: Анализ репозитория — [Cursor / Claude Code] — Дайте ссылку на GitHub репозиторий (например, Hermes) и попросите проанализировать его возможности.
- Шаг 2: Выбор фич — [LLM] — Попросите составить список функций, разделенных по сложности внедрения (Easy wins, Medium effort, Big lift).
- Шаг 3: Интеграция — [Cursor] — Используйте промпт для внедрения конкретной функции в ваш проект.
Промпт для анализа и внедрения:
This new repo [URL репозитория] just dropped for Hermes agent.
I'd like you to go through the repo, identify and understand everything that it's offering that is different than what we currently have and what makes it unique.
Give me a bulleted list of those cool features.
After I select the features, you will integrate them into our existing system.Результат: Список уникальных функций (например, Procedural Memory или Sub-agent Delegation), готовых к внедрению.
2. Трехуровневая система памяти (Memory Architecture)
Контекст: Обычные чаты «забывают» контекст. Чтобы агент был по-настоящему личным, ему нужна структура, имитирующая человеческую память. Автор выделяет три критических слоя: ядро личности, оперативная память и долгосрочное хранилище. Это позволяет агенту помнить ваши предпочтения годами, не раздувая контекстное окно до бесконечности.
Выгода: Агент узнает вас на любом устройстве, помнит детали прошлых проектов и не переспрашивает базу.
Структура памяти:
- Уровень 1: Core Memory (Soul.md) — Файл с вашими базовыми данными: имя, предпочтения, стиль общения, ключевые цели.
- Уровень 2: Conversational Buffer — Стек последних 50-100 сообщений для поддержания текущего контекста беседы.
- Уровень 3: Semantic Tier (Pinecone/Vector DB) — Индексация всех прошлых взаимодействий. Агент обращается к этой базе через векторный поиск, когда нужно вспомнить что-то из «прошлого».
Результат: Агент, который эволюционирует вместе с вами и обладает глубоким контекстом вашей жизни и работы.
3. Самогенерирующиеся навыки (Self-Generating Skills)
Контекст: Одна из самых мощных фишек Hermes — способность агента самостоятельно создавать новые инструменты (skills). Если задача сложная или повторяется более 5 раз, агент пишет markdown-файл с описанием алгоритма решения этой задачи. В следующий раз он не тратит токены на «размышления», а просто исполняет готовый навык.
Выгода: Снижение когнитивной нагрузки на модель, экономия токенов и ускорение работы агента со временем.
Как это работает:
- Хранение: Навыки сохраняются как простые
.mdфайлы. - Progressive Disclosure: В системный промпт передаются только названия и краткие описания навыков (по ~30 токенов), чтобы не забивать контекст.
- Auto Nudge: После выполнения сложной задачи агент сам спрашивает: «Стоит ли сохранить эту процедуру как навык?».
Результат: Система, которая обучается в процессе эксплуатации без вашего участия в написании кода.
4. Глубокий ресерч с помощью Firecrawl
Контекст: Обычный поиск через AI часто выдает галлюцинации или поверхностные данные. Для качественного анализа рынка или конкурентов автор использует Firecrawl. Этот инструмент позволяет AI буквально «разговаривать» с сайтами, эффективно обходя защиту и парся контент в чистый markdown, что на 80% дешевле стандартных методов.
Выгода: Получение структурированных данных с любых сайтов (например, Product Hunt) для принятия бизнес-решений.
Как применить:
- Шаг 1: Настройка — Добавьте API ключ Firecrawl в переменные окружения вашего агента.
- Шаг 2: Создание навыка — Используйте голосовой или текстовый промпт для создания автоматизированного процесса исследования.
Промпт для создания навыка ресерча:
Create a skill using Firecrawl. When I ask you to research something, I want you to use Firecrawl and look at the top 3-5 credible resources and come back with a punchy, beautiful, punctuated summary of what you found.
Test it now: Go to Product Hunt, find customer reviews for [Название ниши/продукта] and tell me what the 3-star reviews are saying — what do people like, but want to be better?Результат: Готовый отчет с инсайтами от реальных пользователей, который можно использовать для улучшения своего продукта.
5. Деплой и выбор модели (Infrastructure)
Контекст: Чтобы агент работал 24/7, он должен жить не на вашем ноутбуке. Автор предлагает три варианта: локальный Mac Mini, VPS (требует настройки безопасности) или Railway. Railway — оптимальный выбор для вайбкодеров, так как он легко соединяется с GitHub и не требует глубоких знаний администрирования серверов.
Выгода: Агент доступен через Telegram или Discord в любое время, даже если ваш компьютер выключен.
Рекомендации по моделям:
- GPT-4o/o1: Лучший выбор для логики и интеграций. Можно использовать через OAuth (чат-субскрипция за $20) для экономии.
- Claude 3.5 Sonnet: Идеален для написания кода и работы в Cursor.
- Deepseek: «Скрытая мощь», максимально дешево, но требует осторожности с конфиденциальными данными.
Результат: Стабильно работающая инфраструктура с минимальными затратами на поддержку.
FAQ
В: В чем главное преимущество Hermes перед обычным ChatGPT? О: Hermes — это агент с «фоновым режимом» (background loop). Он может «видеть сны» (рефлексировать над сессиями, пока вы спите), удалять противоречия в своей памяти и самостоятельно создавать новые инструменты для работы, в то время как ChatGPT — это просто реактивный чат.
В: Почему автор советует Railway вместо обычного VPS? О: Railway проще в настройке для тех, кто не хочет возиться с портами, SSH и безопасностью Linux-серверов. Он автоматически деплоит код из вашего репозитория и обеспечивает изоляцию приложения от внешних угроз «из коробки».
В: Как работает «прогрессивное раскрытие» (progressive disclosure) в навыках? О: Чтобы не перегружать контекстное окно модели всеми инструкциями сразу, агент видит только список доступных навыков. Полная инструкция конкретного навыка подгружается в промпт только тогда, когда агент решает его использовать.
В: Можно ли использовать эту систему бесплатно? О: Да, вы можете запустить OpenClaw (основу Hermes) локально или использовать модели через провайдеров с бесплатными лимитами, но для полноценной работы 24/7 и качественных ответов потребуются платные API (OpenAI/Anthropic) или подписка на Railway.
В: Что такое Soul.md? О: Это файл «ядра личности» агента. В нем прописаны ваши фундаментальные данные: как вас зовут, какие у вас бизнес-цели, какой тон общения вы предпочитаете. Это самый приоритетный слой памяти, который определяет поведение AI.
Конспект создан на основе видео «Hermes AI Agent: The 24/7 Productivity Superpower» канала Jack Roberts. Все права на оригинальный материал принадлежат авторам. Источник: https://youtu.be/kpBgBNzb2pY