Конспекты
Смарт-конспекты YouTube-видео — ключевые идеи и инсайты без необходимости смотреть часовые ролики
Загрузка...
Смарт-конспекты YouTube-видео — ключевые идеи и инсайты без необходимости смотреть часовые ролики
Узнайте, как обучить нейросеть на своих данных с помощью RAG. Разбор векторов, чанкинга, MCP для Cursor и 11 стратегий оптимизации поиска.
AI-скиллы: Полный гид по оцифровке навыков для агентов Claude и GPT
Узнайте, как использовать стандарт Skills для AI-агентов. Инструкции по созданию, установке и список лучших готовых скиллов для автоматизации работы.
Cursor 3 и Composer 2: Полный гид по настройке и параллельному вайбкодингу
Разбор Cursor 3, модели Composer 2 и воркфлоу с параллельными агентами, Git Worktrees и облачным тестированием. Экономия на токенах и ускорение разработки.
Дизайн для вайбкодеров: 9 инструментов, чтобы уйти от AI-вида
9 бесплатных инструментов для улучшения дизайна AI-проектов: Open Design, Referral Styles, Cult UI и другие для создания профессиональных интерфейсов.
Эволюция в AI-генералиста: Как выжить и заработать в эпоху AI-агентов
Пошаговый гайд по переходу в AI-генералиста. 5 уровней обучения, автоматизация контента на 200 млн просмотров и бизнес-идеи для вайбкодеров.
Безопасный код с AI: Как проверять и деплоить приложения без страха
Пошаговое руководство по настройке автоматического AI-код-ревью с помощью Cubik и Cursor BugFinder для безопасного вайбкодинга.
AI-нативности в 2026: Как строить бизнес с доходом в миллионы на одного сотрудника
Разбор стратегии Алекса Хормози по внедрению AI-агентов. Как перейти от промптов к автономному бизнесу и масштабировать доход в одиночку.
Cursor 3 «Glass»: прощай Composer, привет мультиагентная оркестрация
Cursor представил версию 3 под кодовым названием Glass. Главное изменение — замена привычного Composer на мощное окно агентов для параллельной работы.
Cursor v3: AI-агенты вместо привычных IDE — что нового в версии 2026 года
Cursor v3 совершает революцию в разработке, внедряя мультиагентные воркафлоу и глубокое понимание контекста всего репозитория.
Обновление Cursor 3.1: Плиточный режим для агентов и улучшенный голос
В версии Cursor 3.1 появился плиточный интерфейс для одновременной работы нескольких агентов и обновленный голосовой ввод с надежной транскрипцией.
Claude Code подписка 2026: Pro, Max 5x и Max 20x, цены и лимиты
21 апреля 2026 года Anthropic тихо убрал Claude Code из Pro-плана на своих страницах с ценами. Без анонса, без письма пользователям — просто галочка в таблице сменилась на красный крестик. Разработчики заметили это сами, сравнив архивную версию сайта…
Как пользоваться Claude Code 2026: первый запуск, CLAUDE.md и команды
Claude Code — не просто ещё один AI-ассистент. Это агент, который работает прямо в терминале, читает ваш проект целиком, сам вносит правки в файлы и запускает команды без вашего участия. Разберём пошагово: установка, первый запуск, настройка CLAUDE.m…
Anthropic Claude 2026: все модели — Opus 4.7, Sonnet 4.6, Haiku 4.5
Anthropic выпустил Claude Opus 4.7 16 апреля 2026 года. Результат на SWE-Bench Pro — 87.6%. Это делает нейросеть Anthropic Claude лучшей публично доступной моделью для агентного кодинга прямо сейчас. При этом цена не изменилась: $5 за миллион входящи…
🎯 О чём этот конспект: Подробный разбор технологии RAG, которая позволяет «дообучать» нейросети на ваших локальных данных (коде, PDF, документации) без изменения весов модели. В видео рассматривается принцип работы векторов, практическая реализация на JavaScript и настройка локального RAG-агента в редакторе Cursor.
👤 Кому будет полезно: Вайбкодерам, разработчикам и AI-энтузиастам, которые хотят, чтобы AI-агенты понимали контекст их специфических проектов, стилистику кода или внутренние документы компании.
✨ Что получите: Вы научитесь подключать свои файлы к AI-агентам, поймете механику векторного поиска и сможете внедрить одну из 11 стратегий оптимизации контекста для повышения точности ответов нейросети.
Контекст: Нейросеть (LLM) — это «мозги», обученные на общих данных интернета. Она не знает специфику вашего проекта, политики вашей компании или вашего уникального стиля написания кода. RAG (Retrieval-Augmented Generation) решает проблему ограниченного контекстного окна и отсутствия актуальных данных. Вместо того чтобы пытаться «засунуть» весь проект в промпт, мы создаем внешнюю базу знаний, из которой нейросеть берет только нужные кусочки в момент запроса.
Выгода: Экономия токенов, возможность работы с огромными репозиториями и получение максимально персонализированных ответов.
Как это работает (схема):
Результат: Нейросеть отвечает на основе ваших данных, а не галлюцинирует.
Контекст: Поиск по ключевым словам (как в Ctrl+F) неэффективен для AI. Если вы ищете «удаленная работа», обычный поиск не найдет абзац про «домашний офис». Для этого используется семантический поиск через эмбеддинги — перевод текста в математические векторы (наборы чисел).
Выгода: Система понимает смысл запроса, даже если слова не совпадают.
Основные правила эффективного RAG:
Контекст: Для понимания механики важно увидеть, как данные превращаются в векторы и попадают в промпт программно.
Как применить:
chromadb для хранения векторов и openai для генерации.import { ChromaClient, DefaultEmbeddingFunction } from 'chromadb';
import OpenAI from 'openai';
const client = new ChromaClient();
const embedder = new DefaultEmbeddingFunction();
// Создаем коллекцию для документов компании
const collection = await client.getOrCreateCollection({
name: "company_policies",
embeddingFunction: embedder,
});
// Добавляем документы (в реальности это чтение файлов)
await collection.add({
ids: ["id1", "id2"],
documents: [
"Политика удаленки: можно работать из дома 3 дня в неделю.",
"Стиль кода: используем только функциональные компоненты и Tailwind."
],
});
// Поиск по смыслу
const results = await collection.query({
queryTexts: ["Как мы работаем из дома?"],
nResults: 1,
});
// Формирование промпта для LLM
const context = results.documents[0].join("\n");
const userQuestion = "Какая у нас политика удаленки?";
const prompt = `Используй следующий контекст для ответа: ${context}\n\nВопрос: ${userQuestion}`;
// Далее отправляем prompt в OpenAI API...Результат: Готовый скрипт, который находит нужный смысл в базе и «подсказывает» его нейросети.
Контекст: Редактор Cursor поддерживает протокол MCP (Model Context Protocol), что позволяет подключить локальный RAG-сервер для индексации ваших PDF-инструкций или старых репозиториев.
Как применить:
mcp-local-rag, устанавливаем зависимости и билдим проект.Settings -> Features -> MCP Servers.Конфиг для добавления (тип stdio):
# Команда для запуска (пример)
node /путь/к/проекту/mcp-local-rag/dist/index.js
# Переменные окружения (Env Vars)
LOCAL_RAG_DIRECTORY="/путь/к/вашим/pdf_и_коду"Результат: Теперь в чате Cursor можно спросить: «Как в моем стиле написать этот компонент?», и агент сам просканирует локальную базу через query_document.
Контекст: Базовый RAG часто ошибается. Для сложных задач используются продвинутые методы фильтрации и обработки запросов.
В: Можно ли использовать RAG бесплатно?
О: Да, используя локальные модели эмбеддингов и векторные базы типа ChromaDB или FAISS. В примере с Cursor используется локальный MCP-сервер, который работает на вашей машине.
В: Что лучше: дообучение (Fine-tuning) или RAG?
О: Для большинства задач вайбкодинга RAG лучше. Fine-tuning дорогой, сложный и модель быстро устаревает. RAG позволяет обновлять знания, просто закинув новый файл в папку.
В: Какой оптимальный размер чанка?
О: Обычно это 300–500 токенов (или символов, в зависимости от модели). Важно делать «нахлест» (overlap) между чанками в 10–15%, чтобы смысл не терялся на границах разреза.
В: Зачем нужны векторы, если можно просто дать файл нейросети?
О: Если файл огромный (например, документация React), он не влезет в контекстное окно или сделает запрос очень дорогим. Векторы позволяют найти 2–3 нужных абзаца из тысячи страниц.
В: Как RAG помогает в написании кода?
О: Вы можете индексировать свои лучшие проекты. Когда вы просите Cursor написать функцию, он сначала посмотрит через RAG, как вы называете переменные и какие библиотеки используете, и выдаст код в вашем стиле.
Конспект создан на основе видео «Что такое RAG? 11 стратегий обучения нейросети на своих данных» канала Антон Ларичев. Все права на оригинальный материал принадлежат авторам. Источник: https://www.youtube.com/watch?v=JkoMVJNBVC0