Конспекты
Смарт-конспекты YouTube-видео — ключевые идеи и инсайты без необходимости смотреть часовые ролики
Загрузка...
Смарт-конспекты YouTube-видео — ключевые идеи и инсайты без необходимости смотреть часовые ролики
Пошаговый гайд по использованию auto-research Андрея Карпатого для обучения музыкальных AI-моделей. Настройка гиперпараметров, BPB и Claude Code.
Маркетинг-стратег, IT-предприниматель, ментор по вайбкодингу
10+ лет в маркетинге, 300+ клиентских проектов: сайты, реклама, боты. Создатель GoBanana (228K+ пользователей, 11.6 млн ₽ выручки) и VibeCoderz. Делаю AI-продукты сам через Claude Code, Cursor, Windsurf и консультирую тех, кто хочет так же.
Об авторе →Graphify: Как создать карту знаний для AI-агентов и экономить до 70% токенов
Пошаговый гайд по Graphify: установка, настройка графа знаний для Claude Code и Cursor, оптимизация контекста и экономия токенов в больших проектах.
Claude 3.5 Sonnet (V2): Создание прибыльных торговых стратегий и AI-трейдинг
Пошаговое руководство по созданию торговых стратегий с Claude 3.5 Sonnet: от Pine Script до автономных AI-агентов на Bybit через MCP.
Unreal Engine 5 + Claude Code: Создание игры с нуля через AI-агентов
Пошаговый гид по настройке Claude Code в UE5 с использованием MCP, Vibe UE и Unreal Claude для автоматизации разработки игр и блюпринтов.
Нейромаркетинг и ИИ: Как внедрить психологические триггеры Apple и Coca-Cola в свой бизнес
Практическое руководство по использованию нейромаркетинга и ИИ для роста чека и конверсии. Разбор 13 триггеров и 5 бизнес-кейсов.
Google Ads + Claude Code: Полная автоматизация аккаунта и стратегия на $730,000
Пошаговый гид по автоматизации Google Ads с помощью Claude Code: создание кампаний, объявлений, лендингов и аудит аккаунта через ИИ-агентов.
Claude Fable 5: Полный гид по использованию самой мощной модели Anthropic
Разбор Claude Fable 5: автономные агенты, создание игр через /goal, автоматизация финансов, маркетинга и продаж через MCP коннекторы.
Экосистема Anthropic 2026: от чат-бота к автономному агенту Claude Code
Разбор взрывного роста Anthropic в 2026 году: 29 релизов за 5 месяцев, переход к многорепозиторному кодингу и автономным агентам.
Anthropic запустила Dynamic Workflows в Claude Code: рой агентов для кодинга
Claude теперь умеет запускать сотни параллельных субагентов для решения сложных задач. Разбираемся, как работает новый механизм оркестрации.
Anthropic представила Claude Opus 4.8: динамические воркфлоу и контроль «усилий»
Крупное обновление Opus 4.8 приносит в Claude Code параллельных субагентов, а в API — возможность менять инструкции на лету без потери кэша.
Плейбук основателя: как построить AI-нативный стартап в 2026
Полный перевод плейбука Anthropic об AI-нативных стартапах. Как ИИ переизобрёл четыре стадии пути основателя — Идея, MVP, Запуск и Масштабирование — и как использовать Claude, Claude Code и Claude Cowork на каждой из них, чтобы сжать кварталы в недели. С разбором ловушек, упражнениями и 18 ответами на частые вопросы.
Claude Code бесплатно 2026: free tier, триал и альтернативы
Короткий ответ: бесплатного тарифа у Claude Code нет. Минимальный вход — Pro за $20 в месяц или API-кредиты примерно на $5. В этой статье разберём, как попробовать инструмент за минимум денег, какие схемы реально работают в 2026 году и что использова…
Claude Code подписка 2026: Pro, Max 5x и Max 20x, цены и лимиты
21 апреля 2026 года Anthropic тихо убрал Claude Code из Pro-плана на своих страницах с ценами. Без анонса, без письма пользователям — просто галочка в таблице сменилась на красный крестик. Разработчики заметили это сами, сравнив архивную версию сайта…
🎯 О чём этот конспект: Разбор практического эксперимента по использованию инструмента auto-research Андрея Карпатого для обучения мини-модели генерации музыки. В видео показано, как AI-агент самостоятельно выдвигает гипотезы, меняет гиперпараметры и превращает «хаотичный шум» в осмысленные ирландские фолк-мелодии за короткий цикл обучения.
👤 Кому будет полезно: Вайбкодерам, AI-инженерам и разработчикам, использующим Claude Code или Cursor для автоматизации обучения моделей (LLM) на специфических данных.
✨ Что получите: Пошаговый алгоритм настройки auto-research для работы с нестандартными датасетами, понимание ключевых метрик (BPB) и готовый набор оптимизаций для малых структурированных данных.
Контекст: Для эксперимента используется формат ABC notation — это текстовое представление нот, которое идеально подходит для обучения языковых моделей, так как музыка превращается в последовательность символов. Автор использует форк репозитория auto-research для Windows и датасет Sanderwood’s Irishman (традиционный ирландский фолк). Важно правильно подготовить скрипт prepare.py, чтобы токенизатор корректно обработал музыкальную нотацию.
Выгода: Быстрый старт обучения на специфическом домене (музыка) без ручного написания архитектуры нейросети.
Как применить:
prepare.py под ваш текстовый датасет.# Пример команд для Claude Code
/run git clone https://github.com/karpathy/auto-research.git
/run pip install -r requirements.txt
# Промпт для Claude:
"Adjust the prepare.py script to accommodate the Irishman ABC notation sheet music dataset. Download the data and train the tokenizer."Результат: Готовый к обучению датасет и базовый показатель BPB (в видео старт с 2.08 — это «белый шум»).
Контекст: Главный инсайт эксперимента — для малых и высокоструктурированных датасетов (как ноты) огромные модели работают хуже. AI-агент обнаружил, что увеличение глубины (depth) только замедляет обучение и ухудшает результат. Ключевым фактором стала пропускная способность (throughput): модель должна успеть «увидеть» данные как можно больше раз за отведенное время.
Выгода: Снижение Val BPB с 2.08 до 0.97 (улучшение на 53%) и получение чистой мелодии вместо шума.
Как применить:
Ключевой конфиг победителя:
Результат: Модель, которая генерирует когерентные музыкальные фразы с правильной структурой тактов и аккордами.
Контекст: Автор тестировал гипотезу о том, что для коротких музыкальных фрагментов полное внимание (когда каждое слово «смотрит» на все остальные) избыточно. Была предпринята попытка использовать Sliding Window Attention (скользящее окно), где токен видит только ближайших соседей.
Выгода: Понимание границ применимости локального внимания. В данном эксперименте это не дало профита, что доказывает: даже в коротких мелодиях важны долгосрочные связи (повторы тем, структура всей пьесы).
Как применить:
window_pattern на SSS (все слои со скользящим окном).Результат: Подтверждение того, что музыка требует глобального контекста даже при малом размере модели.
В: Что такое BPB и почему это важно? О: BPB (Bits Per Byte) — это метрика «удивления» модели. Чем она ниже, тем лучше модель предсказывает следующий символ. В видео снижение с 2.0 до 0.97 означало переход от случайного набора букв к структурированной музыке.
В: Почему маленькая модель оказалась лучше большой? О: На малых датасетах большая модель не успевает пройти достаточное количество итераций (optimizer steps) за ограниченное время. Маленькая модель «пробегает» по данным многократно, лучше усваивая закономерности.
В: Что такое ABC notation? О: Это текстовый формат записи музыки, где буквы (A-G) обозначают ноты, а цифры — их длительность. AI-моделям проще работать с таким форматом, чем с бинарными MIDI или аудиофайлами.
В: Как Claude Code помогает в этом процессе? О: Claude Code выступает в роли «оркестратора»: он читает код репозитория, сам запускает эксперименты, анализирует логи, меняет гиперпараметры в файлах и перезапускает обучение, пока не найдет лучший результат.
В: Можно ли запустить это на обычном ноутбуке? О: Да, автор использовал GPU среднего сегмента в ноутбуке. Благодаря оптимизации размера модели (уменьшение batch size и глубины), обучение проходит очень быстро.
Конспект создан на основе видео «AI Agent Optimizes a Model for Sheet Music» канала [Sanderwood]. Все права на оригинальный материал принадлежат авторам. Источник: https://youtu.be/-Ip9EtoBjbk