Конспекты
Смарт-конспекты YouTube-видео — ключевые идеи и инсайты без необходимости смотреть часовые ролики
Загрузка...
Смарт-конспекты YouTube-видео — ключевые идеи и инсайты без необходимости смотреть часовые ролики
Пошаговый гайд по использованию auto-research Андрея Карпатого для обучения музыкальных AI-моделей. Настройка гиперпараметров, BPB и Claude Code.
Маркетинг-стратег, IT-предприниматель, ментор по вайбкодингу
10+ лет в маркетинге, 300+ клиентских проектов: сайты, реклама, боты. Создатель GoBanana (228K+ пользователей, 11.6 млн ₽ выручки) и VibeCoderz. Делаю AI-продукты сам через Claude Code, Cursor, Windsurf и консультирую тех, кто хочет так же.
Об авторе →AI-скиллы: Полный гид по оцифровке навыков для агентов Claude и GPT
Узнайте, как использовать стандарт Skills для AI-агентов. Инструкции по созданию, установке и список лучших готовых скиллов для автоматизации работы.
Агентский бизнес на $5,000/мес: Пошаговый гайд по созданию AI-сотрудников
Как запустить агентство по созданию AI-сотрудников: стек Hermes, Orgo, Composio и стратегия продаж на $5000/мес для вайбкодеров.
DeepSeek V4 в Claude Code: Как экономить на токенах в 10 раз и обходить лимиты
Пошаговый гид по интеграции DeepSeek V4 в Claude Code. Установка DeepSeek TUI, настройка VS Code и стратегия экономии токенов в 10 раз.
Instagram Lead Gen: Как получать 10,000 потенциальных клиентов в месяц через Claude Code
Пошаговый гид по автоматизации лидогенерации в Instagram с помощью Claude Code, Apify и Firecrawl. Сбор email, рассылки и дашборды.
Claude Skills: Как создавать и продавать AI-навыки, зарабатывая на своих знаниях
Пошаговый гид по созданию Claude Skills: от голосовой заметки до пассивного дохода в $3000. Узнайте, как упаковать свою экспертизу в AI-навыки.
Claude Code + Higgsfield: Создание премиальных анимированных сайтов за часы
Пошаговый гайд по созданию анимированных сайтов уровня Apple с помощью Claude Code и Higgsfield MCP. От вайрфреймов до деплоя на Vercel.
Anthropic выпустила Claude Opus 4.7: новый уровень автономности для Claude Code
Обновление флагманской модели Opus 4.7 приносит режим xhigh effort, улучшенное зрение и возможность делегировать сложнейшие задачи без микроменеджмента.
Обновление Claude Code: команда /powerup, фиксы кэша и важные дедлайны
Anthropic выпустила пачку обновлений для Claude Code: интерактивное обучение через /powerup, исправление багов с кэшированием и завершение поддержки Claude Haiku 3.
Обновление Claude Code Q1 2026: Remote Control, Dispatch и новые возможности
Разбираем главные апдейты Claude Code за первый квартал 2026 года: от управления headless-агентами до запуска фоновых воркеров через API.
Claude Code бесплатно 2026: free tier, триал и альтернативы
Короткий ответ: бесплатного тарифа у Claude Code нет. Минимальный вход — Pro за $20 в месяц или API-кредиты примерно на $5. В этой статье разберём, как попробовать инструмент за минимум денег, какие схемы реально работают в 2026 году и что использова…
Claude Code подписка 2026: Pro, Max 5x и Max 20x, цены и лимиты
21 апреля 2026 года Anthropic тихо убрал Claude Code из Pro-плана на своих страницах с ценами. Без анонса, без письма пользователям — просто галочка в таблице сменилась на красный крестик. Разработчики заметили это сами, сравнив архивную версию сайта…
Как пользоваться Claude Code 2026: первый запуск, CLAUDE.md и команды
Claude Code — не просто ещё один AI-ассистент. Это агент, который работает прямо в терминале, читает ваш проект целиком, сам вносит правки в файлы и запускает команды без вашего участия. Разберём пошагово: установка, первый запуск, настройка CLAUDE.m…
🎯 О чём этот конспект: Разбор практического эксперимента по использованию инструмента auto-research Андрея Карпатого для обучения мини-модели генерации музыки. В видео показано, как AI-агент самостоятельно выдвигает гипотезы, меняет гиперпараметры и превращает «хаотичный шум» в осмысленные ирландские фолк-мелодии за короткий цикл обучения.
👤 Кому будет полезно: Вайбкодерам, AI-инженерам и разработчикам, использующим Claude Code или Cursor для автоматизации обучения моделей (LLM) на специфических данных.
✨ Что получите: Пошаговый алгоритм настройки auto-research для работы с нестандартными датасетами, понимание ключевых метрик (BPB) и готовый набор оптимизаций для малых структурированных данных.
Контекст: Для эксперимента используется формат ABC notation — это текстовое представление нот, которое идеально подходит для обучения языковых моделей, так как музыка превращается в последовательность символов. Автор использует форк репозитория auto-research для Windows и датасет Sanderwood’s Irishman (традиционный ирландский фолк). Важно правильно подготовить скрипт prepare.py, чтобы токенизатор корректно обработал музыкальную нотацию.
Выгода: Быстрый старт обучения на специфическом домене (музыка) без ручного написания архитектуры нейросети.
Как применить:
prepare.py под ваш текстовый датасет.# Пример команд для Claude Code
/run git clone https://github.com/karpathy/auto-research.git
/run pip install -r requirements.txt
# Промпт для Claude:
"Adjust the prepare.py script to accommodate the Irishman ABC notation sheet music dataset. Download the data and train the tokenizer."Результат: Готовый к обучению датасет и базовый показатель BPB (в видео старт с 2.08 — это «белый шум»).
Контекст: Главный инсайт эксперимента — для малых и высокоструктурированных датасетов (как ноты) огромные модели работают хуже. AI-агент обнаружил, что увеличение глубины (depth) только замедляет обучение и ухудшает результат. Ключевым фактором стала пропускная способность (throughput): модель должна успеть «увидеть» данные как можно больше раз за отведенное время.
Выгода: Снижение Val BPB с 2.08 до 0.97 (улучшение на 53%) и получение чистой мелодии вместо шума.
Как применить:
Ключевой конфиг победителя:
Результат: Модель, которая генерирует когерентные музыкальные фразы с правильной структурой тактов и аккордами.
Контекст: Автор тестировал гипотезу о том, что для коротких музыкальных фрагментов полное внимание (когда каждое слово «смотрит» на все остальные) избыточно. Была предпринята попытка использовать Sliding Window Attention (скользящее окно), где токен видит только ближайших соседей.
Выгода: Понимание границ применимости локального внимания. В данном эксперименте это не дало профита, что доказывает: даже в коротких мелодиях важны долгосрочные связи (повторы тем, структура всей пьесы).
Как применить:
window_pattern на SSS (все слои со скользящим окном).Результат: Подтверждение того, что музыка требует глобального контекста даже при малом размере модели.
В: Что такое BPB и почему это важно? О: BPB (Bits Per Byte) — это метрика «удивления» модели. Чем она ниже, тем лучше модель предсказывает следующий символ. В видео снижение с 2.0 до 0.97 означало переход от случайного набора букв к структурированной музыке.
В: Почему маленькая модель оказалась лучше большой? О: На малых датасетах большая модель не успевает пройти достаточное количество итераций (optimizer steps) за ограниченное время. Маленькая модель «пробегает» по данным многократно, лучше усваивая закономерности.
В: Что такое ABC notation? О: Это текстовый формат записи музыки, где буквы (A-G) обозначают ноты, а цифры — их длительность. AI-моделям проще работать с таким форматом, чем с бинарными MIDI или аудиофайлами.
В: Как Claude Code помогает в этом процессе? О: Claude Code выступает в роли «оркестратора»: он читает код репозитория, сам запускает эксперименты, анализирует логи, меняет гиперпараметры в файлах и перезапускает обучение, пока не найдет лучший результат.
В: Можно ли запустить это на обычном ноутбуке? О: Да, автор использовал GPU среднего сегмента в ноутбуке. Благодаря оптимизации размера модели (уменьшение batch size и глубины), обучение проходит очень быстро.
Конспект создан на основе видео «AI Agent Optimizes a Model for Sheet Music» канала [Sanderwood]. Все права на оригинальный материал принадлежат авторам. Источник: https://youtu.be/-Ip9EtoBjbk