2026/06/2410 мин чтения

Бот поддержки с RAG 2026: научи ИИ отвечать по твоей базе знаний

Обычный чат-бот отвечает по скриптам или галлюцинирует. Бот поддержки с RAG берет ответ прямо из твоих документов - FAQ, инструкций, политик - и не придумывает ничего лишнего. Здесь разберем, как собрать такого бота с нуля: Supabase pgvector для хран…

Содержание (15)+

All Posts

Автор

Максим Наговицын

Маркетинг-стратег, IT-предприниматель, ментор по вайбкодингу

2026/06/24

10+ лет в маркетинге, 300+ клиентских проектов: сайты, реклама, боты. Создатель GoBanana (228K+ пользователей, 11.6 млн ₽ выручки) и VibeCoderz. Делаю AI-продукты сам через Claude Code, Cursor, Windsurf и консультирую тех, кто хочет так же.

Об авторе →

Читать далее

📢 Новость

Claude Code: новый CLI-агент от Anthropic

Anthropic выпустила Claude Code — терминальный AI-агент для разработчиков. Инструмент работает прямо в командной строке и умеет писать, редактировать и запускать код.

2026/02/27

📝 Конспект

Zcode AI: Полный гид по визуальному интерфейсу для Claude Code и AI-агентов

Узнайте, как использовать Zcode для управления Claude Code, Gemini и Codex в едином GUI. Настройка провайдеров, MCP-серверов и визуальный вайбкодинг.

2026/02/28

📝 Конспект

YouTube-канал с монетизацией из любой точки мира: Пошаговый гайд 2026

Инструкция по созданию YouTube-канала: обход блокировок SMS, настройка расширенных функций через виртуальные номера и правила безопасности для монетизации.

2026/02/28

📝 Конспект

Windsurf Code Maps: Как глубоко понимать архитектуру проекта перед написанием кода

Полный гайд по Windsurf Code Maps, модели Sway 1.5 и Sway Grep. Узнайте, как визуализировать архитектуру кода и ускорить разработку в 13 раз.

2026/02/28

📝 Конспект

Vk Fast Cash Strategy

Аудитория ВКонтакте — это те же люди, что и в Instagram, но 'социальный контракт' площадки другой. Если Instagram — это 'дорогой ресторан' с демонстрацией успеха, то VK — это 'душевная шашлычная'. Здесь не работает глянцевый 'успешный успех

2026/02/28

Компонент	Вариант	Цена	Когда выбирать
Векторная БД	Supabase pgvector	Бесплатно до 500 МБ	MVP, стартапы, до 500K документов
Векторная БД	Pinecone	$70+/мес	Миллиарды векторов, субмс-латентность
Embeddings	OpenAI text-embedding-3-small	$0.02 за 1M токенов	Если нужна максимальная точность
Embeddings	GTE-small (Hugging Face)	Бесплатно	95% проектов, разница в качестве <2%
Embeddings	DeepSeek V4 Pro Max	$0.435/$0.87 за 1M	Баланс цена/качество, MIT-лицензия
Генерация ответа	Claude Sonnet 4.6	$3/$15 за 1M	Лучший баланс для поддержки
Генерация ответа	Claude Opus 4.8	$5/$25 за 1M	Сложные кейсы, юридический контент
Генерация ответа	DeepSeek V4 Pro Max	$0.435/$0.87	Экономия на масштабе

Компонент

Вариант

Цена

Когда выбирать

Векторная БД

Supabase pgvector

Бесплатно до 500 МБ

MVP, стартапы, до 500K документов

Векторная БД

Pinecone

$70+/мес

Миллиарды векторов, субмс-латентность

Embeddings

OpenAI text-embedding-3-small

$0.02 за 1M токенов

Если нужна максимальная точность

Embeddings

GTE-small (Hugging Face)

Бесплатно

95% проектов, разница в качестве <2%

Embeddings

DeepSeek V4 Pro Max

$0.435/$0.87 за 1M

Баланс цена/качество, MIT-лицензия

Генерация ответа

Claude Sonnet 4.6

$3/$15 за 1M

Лучший баланс для поддержки

Генерация ответа

Claude Opus 4.8

$5/$25 за 1M

Сложные кейсы, юридический контент

Генерация ответа

DeepSeek V4 Pro Max

$0.435/$0.87

Экономия на масштабе

Q: Как изменить тарифный план? A: Зайдите в Личный кабинет -> раздел "Подписка" -> нажмите "Изменить план". Изменение вступит в силу с следующего расчетного периода. Q: Как оформить возврат? A: Возврат оформляется в течение 14 дней с момента покупки. Напишите на support@example.com с темой "Возврат", укажите номер заказа.

-- Включаем расширение CREATE EXTENSION IF NOT EXISTS vector; -- Таблица для базы знаний CREATE TABLE knowledge_base ( id BIGSERIAL PRIMARY KEY, content TEXT NOT NULL, category TEXT, embedding VECTOR(1536), -- 1536 для OpenAI, 384 для GTE-small created_at TIMESTAMPTZ DEFAULT NOW() ); -- Индекс для быстрого поиска CREATE INDEX ON knowledge_base USING ivfflat (embedding vector_cosine_ops) WITH (lists = 100);

CREATE OR REPLACE FUNCTION search_knowledge( query_embedding VECTOR(1536), match_threshold FLOAT DEFAULT 0.7, match_count INT DEFAULT 5 ) RETURNS TABLE(content TEXT, similarity FLOAT) LANGUAGE SQL STABLE AS $$ SELECT content, 1 - (embedding <=> query_embedding) AS similarity FROM knowledge_base WHERE 1 - (embedding <=> query_embedding) > match_threshold ORDER BY similarity DESC LIMIT match_count; $$;

import { createClient } from '@supabase/supabase-js' import OpenAI from 'openai' import { readFileSync } from 'fs' const supabase = createClient( process.env.SUPABASE_URL!, process.env.SUPABASE_SERVICE_KEY! ) const openai = new OpenAI({ apiKey: process.env.OPENAI_API_KEY! }) // Разбиваем текст на чанки function splitIntoChunks(text: string, chunkSize = 500, overlap = 100): string[] { const chunks: string[] = [] let start = 0 while (start < text.length) { const end = Math.min(start + chunkSize, text.length) chunks.push(text.slice(start, end)) start += chunkSize - overlap } return chunks } // Генерируем embedding для чанка async function getEmbedding(text: string): Promise<number[]> { const response = await openai.embeddings.create({ model: 'text-embedding-3-small', input: text, }) return response.data[0].embedding } // Основная функция загрузки async function ingestFAQ(filePath: string, category: string) { const content = readFileSync(filePath, 'utf-8') const chunks = splitIntoChunks(content) console.log(`Загружаем ${chunks.length} чанков из ${filePath}`) for (const chunk of chunks) { const embedding = await getEmbedding(chunk) await supabase.from('knowledge_base').insert({ content: chunk, category, embedding, }) } console.log('Готово!') } // Запуск ingestFAQ('./faq.md', 'general')

import Anthropic from '@anthropic-ai/sdk' import { createClient } from '@supabase/supabase-js' import OpenAI from 'openai' const claude = new Anthropic({ apiKey: process.env.ANTHROPIC_API_KEY! }) const supabase = createClient(process.env.SUPABASE_URL!, process.env.SUPABASE_ANON_KEY!) const openai = new OpenAI({ apiKey: process.env.OPENAI_API_KEY! }) async function answerQuestion(userQuestion: string): Promise<string> { // 1. Превращаем вопрос в embedding const questionEmbedding = await openai.embeddings.create({ model: 'text-embedding-3-small', input: userQuestion, }) // 2. Ищем похожие фрагменты в базе const { data: relevantChunks } = await supabase.rpc('search_knowledge', { query_embedding: questionEmbedding.data[0].embedding, match_threshold: 0.7, match_count: 5, }) if (!relevantChunks || relevantChunks.length === 0) { return 'К сожалению, я не нашел ответа в базе знаний. Обратитесь к живому специалисту поддержки.' } // 3. Формируем контекст из найденных фрагментов const context = relevantChunks .map((chunk: { content: string }) => chunk.content) .join('\n\n---\n\n') // 4. Отправляем в Claude Sonnet 4.6 const response = await claude.messages.create({ model: 'claude-sonnet-4-6', max_tokens: 1024, system: `Ты - бот поддержки. Отвечай только на основе предоставленной базы знаний. Если в базе нет ответа на вопрос - честно скажи об этом и предложи обратиться к специалисту. Не придумывай информацию. Отвечай кратко и по делу. База знаний: ${context}`, messages: [ { role: 'user', content: userQuestion } ], }) return response.content[0].type === 'text' ? response.content[0].text : 'Ошибка формирования ответа.' }

import { Bot } from 'grammy' import { answerQuestion } from './rag-engine' const bot = new Bot(process.env.TELEGRAM_BOT_TOKEN!) bot.on('message:text', async (ctx) => { const question = ctx.message.text // Показываем, что обрабатываем await ctx.replyWithChatAction('typing') try { const answer = await answerQuestion(question) await ctx.reply(answer, { parse_mode: 'HTML' }) } catch (error) { await ctx.reply('Произошла ошибка. Попробуйте позже.') console.error('RAG error:', error) } }) bot.start()

Создай TypeScript-проект: бот поддержки с RAG для Telegram. Стек: - Supabase pgvector - векторная база знаний - OpenAI text-embedding-3-small - embeddings - Anthropic Claude Sonnet 4.6 (claude-sonnet-4-6) - генерация ответов - Grammy - Telegram Bot framework - Node.js + TypeScript Структура проекта: /src /ingest.ts - загрузка FAQ в Supabase /rag.ts - поиск + генерация ответа /bot.ts - Telegram бот /faq - папка для markdown-файлов базы знаний /.env.example /README.md Требования: 1. Функция splitIntoChunks(text, chunkSize=500, overlap=100) 2. SQL-схема: CREATE TABLE knowledge_base с полями id, content, category, embedding vector(1536) 3. SQL-функция search_knowledge с параметрами query_embedding, match_threshold=0.7, match_count=5 4. System prompt для Claude: отвечать только из базы знаний, при отсутствии ответа - направлять к специалисту 5. Telegram бот с typing indicator и обработкой ошибок 6. .env.example с переменными: SUPABASE_URL, SUPABASE_SERVICE_KEY, SUPABASE_ANON_KEY, OPENAI_API_KEY, ANTHROPIC_API_KEY, TELEGRAM_BOT_TOKEN Создай полный рабочий код всех файлов. После генерации покажи инструкцию по запуску.

Модель	MTEB Score	Размерность	Цена	Латентность
OpenAI text-embedding-3-small	62.26	1536	$0.02/1M токенов	~50 мс
OpenAI text-embedding-3-large	64.6	3072	$0.13/1M токенов	~80 мс
GTE-small (open-source)	61.36	384	Бесплатно	100–200 мс (Edge)
DeepSeek Embedding	~63	1536	$0.05/1M токенов	~60 мс

Модель

MTEB Score

Размерность

Цена

Латентность

OpenAI text-embedding-3-small

62.26

1536

$0.02/1M токенов

~50 мс

OpenAI text-embedding-3-large

64.6

3072

$0.13/1M токенов

~80 мс

GTE-small (open-source)

61.36

384

Бесплатно

100–200 мс (Edge)

DeepSeek Embedding

~63

1536

$0.05/1M токенов

~60 мс

Компонент	Бесплатный вариант	Платный вариант
Supabase pgvector	До 500 МБ хранилища	$25/мес - 8 ГБ
Embeddings	GTE-small через Edge Functions	OpenAI ~$0.02/1M токенов
LLM-ответы	Claude Sonnet 4.6 нет free tier	~$3/$15 за 1M токенов
Telegram бот	Бесплатно	Бесплатно
Хостинг	Railway free tier	Railway ~$5/мес

Компонент

Бесплатный вариант

Платный вариант

Supabase pgvector

До 500 МБ хранилища

$25/мес - 8 ГБ

Embeddings

GTE-small через Edge Functions

OpenAI ~$0.02/1M токенов

LLM-ответы

Claude Sonnet 4.6 нет free tier

~$3/$15 за 1M токенов

Telegram бот

Бесплатно

Хостинг

Railway free tier

Railway ~$5/мес

Бот поддержки с RAG 2026: научи ИИ отвечать по твоей базе знаний

Автор

Читать далее

Бот поддержки с RAG 2026: научи ИИ отвечать по твоей базе знаний

Автор

Читать далее

Что такое RAG и зачем это боту поддержки?

Как работает RAG-бот изнутри?

Какой стек выбрать в 2026?

Шаг 1. Как подготовить базу знаний?

Шаг 2. Как настроить Supabase pgvector?

Шаг 3. Как загрузить FAQ в базу?

Шаг 4. Как подключить Claude Sonnet 4.6 для ответов?

Шаг 5. Как добавить бот поддержки в Telegram?

Промпт для Windsurf: собери все за один сеанс

Как сравнить модели для embeddings?

Какие частые ошибки ломают RAG-бот?

Для кого подходит RAG-бот поддержки?

Сколько стоит запустить RAG-бот?

FAQ по RAG-ботам поддержки

Глоссарий