Чат бот поддержки на ИИ закрывает 80% типовых вопросов клиентов без менеджера, если правильно собрать базу знаний и подключить RAG-поиск. Не нужно нанимать ночную смену и отвечать руками на «а сколько у вас стоит» в сотый раз. Ниже соберем такого бот…
10+ лет в маркетинге, 300+ клиентских проектов: сайты, реклама, боты. Создатель GoBanana (228K+ пользователей, 11.6 млн ₽ выручки) и VibeCoderz. Делаю AI-продукты сам через Claude Code, Cursor, Windsurf и консультирую тех, кто хочет так же.
Об авторе →Claude Code: новый CLI-агент от Anthropic
Anthropic выпустила Claude Code — терминальный AI-агент для разработчиков. Инструмент работает прямо в командной строке и умеет писать, редактировать и запускать код.
Zcode AI: Полный гид по визуальному интерфейсу для Claude Code и AI-агентов
Узнайте, как использовать Zcode для управления Claude Code, Gemini и Codex в едином GUI. Настройка провайдеров, MCP-серверов и визуальный вайбкодинг.
YouTube-канал с монетизацией из любой точки мира: Пошаговый гайд 2026
Инструкция по созданию YouTube-канала: обход блокировок SMS, настройка расширенных функций через виртуальные номера и правила безопасности для монетизации.
Windsurf Code Maps: Как глубоко понимать архитектуру проекта перед написанием кода
Полный гайд по Windsurf Code Maps, модели Sway 1.5 и Sway Grep. Узнайте, как визуализировать архитектуру кода и ускорить разработку в 13 раз.
Vk Fast Cash Strategy
Аудитория ВКонтакте — это те же люди, что и в Instagram, но 'социальный контракт' площадки другой. Если Instagram — это 'дорогой ресторан' с демонстрацией успеха, то VK — это 'душевная шашлычная'. Здесь не работает глянцевый 'успешный успех
Обновлено: июнь 2026.
Чат бот поддержки на ИИ закрывает 80% типовых вопросов клиентов без менеджера, если правильно собрать базу знаний и подключить RAG-поиск. Не нужно нанимать ночную смену и отвечать руками на «а сколько у вас стоит» в сотый раз. Ниже соберем такого бота с нуля через Windsurf, базу в Supabase и Claude Sonnet 4.6 либо DeepSeek V4 Flash по выбору, разберем логику передачи сложных диалогов живому оператору и посчитаем, во сколько обойдется месяц работы на 1000 диалогов.
TL;DR. Бот поддержки в Telegram на ИИ собирается за вечер. BotFather дает токен, Supabase хранит FAQ с эмбеддингами, RAG ищет релевантные ответы, модель Claude Sonnet 4.6 ($3/$15 за 1M токенов) или DeepSeek V4 Flash ($0.14/$0.28) формирует ответ. Сложные диалоги уходят менеджеру по триггеру.
Бот закрывает 60-80% повторяющихся вопросов сам, остальное эскалирует менеджеру с историей диалога. Освобождает поддержку от рутины и работает 24/7 без оплаты ночных смен.
Около 70% обращений в саппорт. Это «где мой заказ», «как оплатить», «во сколько вы работаете», «верните деньги». Все ответы есть в FAQ, политике возврата и описании сервиса. Бот техподдержки с RAG-поиском по этим документам отвечает на такие вопросы за 2-3 секунды, не путается в фактах и не уходит на больничный.

Раньше чат-бот был выбором из готовых конструкторов вроде ManyChat или Salebot. Они работали по сценариям. Пользователь жмет кнопку, получает заранее заготовленный текст. Шаг влево, шаг вправо, и бот ломается, отправляя в человеческую поддержку даже простой вопрос.
С 2025 года ситуация поменялась. LLM научились надежно отвечать по своей базе знаний, не выдумывая факты. Принцип простой. Бот не помнит ответ, он находит его в вашей документации и пересказывает своими словами. Это и есть RAG-архитектура.
Для российского бизнеса есть бонус. Telegram остается самым массовым каналом коммуникации с клиентами. Сделать бот поддержки в телеграмме сейчас проще, чем разворачивать виджет на сайте.
RAG это поиск по вашим документам перед ответом. Бот находит релевантные куски FAQ через векторный поиск, потом LLM пересказывает их в формате ответа клиенту.
RAG (Retrieval-Augmented Generation) состоит из двух этапов. Сначала система ищет в базе знаний 3-5 кусков текста, максимально похожих на вопрос клиента по смыслу, не по словам. Потом передает эти куски модели вместе с вопросом и инструкцией «ответь только по этому контексту, не выдумывай».
Без RAG модель отвечает из своих знаний. Это опасно. Claude или GPT не знают, что у вас офис на Лиговке и доставка по СПб бесплатная при заказе от 3000 рублей. Они придумают что-то правдоподобное, и клиент придет к вам с этим в руках.
С RAG модель отвечает только на основе ваших документов. Если в FAQ нет ответа, бот честно скажет «я не нашел этого в базе, передаю менеджеру». Это критично для доверия. Клиент видит, что бот не фантазирует.
Технически работает так. Каждый кусок документа переводится в вектор, массив из 1536 чисел через эмбеддинг-модель. Вопрос клиента тоже становится вектором. Дальше Supabase pgvector находит ближайшие куски по косинусному расстоянию. Это и есть «поиск по смыслу».

Минимальный стек: BotFather для регистрации, Supabase с pgvector для базы знаний, Claude Sonnet 4.6 или DeepSeek V4 Flash для генерации ответов, Windsurf для разработки.
Бот собирается из четырех компонентов. Первый, токен от BotFather. Бесплатно и занимает 2 минуты. Второй, Supabase для хранения векторов FAQ, бесплатный тариф вытянет до 500 МБ данных. Третий, модель: Claude Sonnet 4.6 за качество или DeepSeek V4 Flash за экономию. Четвертый, Windsurf для написания кода голосом.
| Компонент | Что делает | Сколько стоит |
|---|---|---|
| BotFather | Регистрирует бота, выдает токен | Бесплатно |
| Supabase pgvector | Хранит FAQ + эмбеддинги, ищет похожее | $0 на старте, $25/мес на росте |
| Эмбеддинги (OpenAI text-embedding-3-small) | Превращают текст в векторы | $0.02 за 1M токенов |
| Claude Sonnet 4.6 | Формирует ответы (премиум) | $3 input / $15 output за 1M токенов |
| DeepSeek V4 Flash | Формирует ответы (бюджет) | $0.14 / $0.28 за 1M токенов |
| Windsurf | Среда разработки | $15/мес или бесплатный тариф |
Разница в выборе модели сильная. На 1000 диалогов в месяц со средним контекстом 5000 токенов и ответом 200 токенов Claude обойдется примерно в $18, DeepSeek в $0.74. При этом качество ответов на типовых вопросах поддержки у DeepSeek V4 Flash достаточное: 79% на SWE-bench и неплохое следование инструкциям.
Для большинства проектов начинать имеет смысл с DeepSeek. Если на тестах увидите, что бот путается в сложных формулировках, переключитесь на Sonnet. Это две строчки в коде.
BotFather это официальный инструмент Telegram для регистрации ботов. Через него получаете токен, который нужен для подключения вашего кода к Telegram API.
BotFather работает как привратник Telegram-ботов. Открываете чат с @BotFather, отправляете команду /newbot, придумываете имя и юзернейм (должен заканчиваться на _bot), получаете уникальный API-токен вида 1234567890:ABCdef.... Этот токен и есть ключ ко всем функциям бота, его нельзя никому показывать.Поехали по шагам. Открываете Telegram, ищете @BotFather в поиске. Стартуете чат кнопкой START.
Отправляете /newbot. BotFather спрашивает имя бота, это то, что увидят пользователи. Например, «Support Pro». Потом запрашивает юзернейм, внутренний идентификатор. Должен быть уникальным во всем Telegram и заканчиваться на _bot. Например, support_pro_bot.
Если юзернейм свободен, BotFather пришлет сообщение с токеном. Скопируйте его сразу в безопасное место. Если случайно засветили, отправьте /revoke и получите новый.
Полезные команды для настройки бота, которые стоит сразу выполнить:
/setdescription для описания, которое видит пользователь до старта диалога/setabouttext для краткого описания в профиле/setuserpic для аватарки/setcommands для списка команд бота, появляется в меню TelegramКоманды лучше сразу настроить минимум три: start для приветствия, help для справки, human для вызова менеджера.
Supabase это бэкенд с PostgreSQL и встроенным расширением pgvector для векторного поиска. Бесплатного тарифа хватит на стартап, все работает через SQL и REST API.
Регистрируетесь на supabase.com, создаете проект. В разделе Database активируете расширениеvector. Создаете таблицуfaqс полями: id, question (текст), answer (текст), embedding (vector(1536)), metadata (jsonb). В metadata сложите категорию вопроса и теги, пригодится для метафильтрации.
Структура таблицы это половина успеха. Не делайте одну общую таблицу на 500 строк. Разбейте FAQ на логические разделы: «Оплата», «Доставка», «Возврат», «Технические вопросы», «О компании». Эти категории записывайте в поле metadata.
Зачем нужны метаданные. Когда клиент спрашивает «а вы работаете в субботу», бот не должен искать ответ в разделе «Возврат денег». Метафильтрация позволяет сузить поиск до релевантной категории и поднять точность ответа.
Чанкинг это отдельная боль. Не загружайте целые документы как один кусок. Длинные тексты разбейте на смысловые фрагменты по 200-500 токенов. Каждый чанк должен быть самодостаточным, чтобы по нему было понятно, о чем речь, без соседних кусков.
Кейс из практики разработки чат-ботов для отелей. Одну Google-доку с описанием 14 отелей нельзя резать механически по абзацам. Нужно в каждый чанк зашить контекст: «отель Х, номер делюкс с балконом, описание удобств». Иначе модель не поймет, к какому отелю относится «балкон с видом на сад».
После того как таблица готова, нужно загрузить вопросы и сгенерировать для каждого эмбеддинг. На Python это выглядит примерно так:
text-embedding-3-smallЧерез Windsurf этот скрипт пишется голосом за полчаса. Попросите ассистента: «напиши Python-скрипт, который читает CSV с FAQ, генерирует эмбеддинги через OpenAI text-embedding-3-small и заливает в Supabase в таблицу faq». На третьей итерации все встанет на место.
RAG-поиск делается одним SQL-запросом к Supabase. Эмбеддинг вопроса клиента сравнивается с эмбеддингами FAQ через оператор косинусного расстояния, возвращаются топ-5 самых релевантных кусков.
В Supabase создаете RPC-функцию match_faq, которая принимает вектор вопроса и возвращает топ-N подходящих ответов с дистанцией. Из приложения вызываете ее через клиент Supabase. Получаете 3-5 фрагментов FAQ. Это и есть контекст для LLM, по которому модель построит ответ.
SQL для функции примерно такой: SELECT id, question, answer, 1 - (embedding <=> query_embedding) AS similarity FROM faq WHERE 1 - (embedding <=> query_embedding) > 0.7 ORDER BY embedding <=> query_embedding LIMIT 5.
Параметр 0.7 это порог релевантности. Если ни один кусок не набрал больше 0.7 похожести, значит в базе нет ответа. Бот в этом случае сразу передает диалог менеджеру, не пытаясь ничего придумать. Это критично для доверия.
Лиза: «Раньше анализ контента вручную занимал 4 часа: смотрела 15-20 видео для одной контентной единицы. Написала скрипт в Google Таблицах с транскрибацией и разбором по 15 критериям. 4 часа превратились в 5,5 минут. С ботом поддержки та же история, рутину забирает скрипт, человек подключается только там, где нужна голова».
Внутри Telegram-бота поток такой. Пользователь пишет сообщение. Код берет текст, генерирует для него эмбеддинг (одно API-обращение к OpenAI). Делает запрос к Supabase через RPC-функцию. Получает 3-5 фрагментов. Формирует промпт для LLM в виде «Контекст: [фрагменты]. Вопрос: [сообщение]. Ответь только по контексту, не выдумывай». Отправляет в Claude или DeepSeek. Возвращает ответ пользователю.
Для большинства задач поддержки достаточно DeepSeek V4 Flash. Он в 20 раз дешевле Claude и справляется с типовыми ответами. Claude Sonnet 4.6 берите, если нужны сложные многоходовые диалоги.
На 1000 диалогов в месяц со средним контекстом 5000 токенов DeepSeek V4 Flash обойдется в $0.74, Claude Sonnet 4.6 в $18. Разница в 24 раза. На простых FAQ-вопросах качество DeepSeek сравнимо с Sonnet: пересказать готовый контекст обе модели умеют отлично.
Где Sonnet 4.6 реально выигрывает:
Где хватает DeepSeek V4 Flash:
Подключение к OpenRouter позволяет переключать модели одной строкой. Запустите бота на DeepSeek, через неделю работы проанализируйте логи диалогов. Посмотрите, где ответы получились плохими. Если такие диалоги однотипные (например, эмоциональные обращения), переключайте только их на Sonnet через простой роутинг.
Полный обзор моделей и их применений лежит в каталоге AI IDE на портале.
Передача оператору срабатывает по трем триггерам: низкая релевантность RAG-поиска, команда /human от пользователя или ключевые слова-маркеры в сообщении (жалоба, юрист, директор).
Бот не должен мучить клиента, если не знает ответа. Если RAG вернул фрагменты с похожестью ниже 0.7, сразу пишет «передаю менеджеру» и помечает чат как требующий внимания. Менеджер видит этот чат в админ-панели или в отдельном Telegram-канале для команды.
Архитектура передачи простая. В Supabase делаете таблицу escalations с полями user_id, chat_id, last_message, status (new/in_progress/resolved), created_at. Когда срабатывает триггер эскалации, создаете запись в этой таблице и отправляете уведомление в служебный канал поддержки.
Менеджер открывает чат с клиентом напрямую (бот делится username клиента или ссылкой на tg://user?id=...) или отвечает через бота, который перенаправляет сообщения. Второй вариант проще для масштабирования, но клиент видит, что говорит с ботом-посредником.

Список триггеров, по которым стоит сразу звать человека:
/human от пользователяГлавное правило: не прятать кнопку «позвать человека». Если клиент написал «жалоба», не вступайте в дискуссии, передавайте сразу. Попытки бота отговорить клиента от менеджера ведут к негативу.
Если у вас в команде есть агент техподдержки, настройте, чтобы бот отдавал ему чаты с полной историей переписки. Это сократит время на разбор ситуации.
Windsurf пишет код голосом и сам разворачивает приложение через интеграции с Vercel, Railway или Fly.io. Бот поднимается за 10-15 минут, дальше работает в фоне на сервере.
Деплой это последний шаг, на котором обычно спотыкаются новички. С Windsurf этой проблемы нет: попросите ассистента «задеплой бота на Railway, настрой переменные окружения для токена Telegram, ключа Supabase и OpenAI». IDE сама создаст конфигурацию, подключит репозиторий и поднимет приложение.
Бесплатных вариантов хостинга для Telegram-бота хватает. Railway дает 500 часов в месяц на стартовом плане. Fly.io имеет небольшой бесплатный лимит, обычно достаточный для пет-проекта. Render тоже подойдет.
Что положить в переменные окружения:
TELEGRAM_BOT_TOKEN для токена от BotFatherSUPABASE_URL и SUPABASE_ANON_KEY из настроек проекта SupabaseOPENAI_API_KEY для эмбеддинговOPENROUTER_API_KEY для Claude или DeepSeek через OpenRouterMANAGER_CHAT_ID для ID канала или чата эскалацийТестировать бот удобно через polling-режим на этапе разработки (ваш сервер сам опрашивает Telegram). На продакшене лучше переходить на webhook, чтобы Telegram сам присылал обновления на ваш URL. Webhook требует HTTPS, но это уже встроено в Railway и Vercel.
Бот поддержки клиентов на ИИ дешев в эксплуатации, работает 24/7 без выходных, отвечает за секунды и не путается в фактах благодаря RAG. Масштабируется без найма новых сотрудников.
При 1000 диалогах в месяц бот техподдержки обходится примерно в $5-20 за инфраструктуру и API (с DeepSeek). Один оператор поддержки в РФ стоит 60-80 тысяч рублей в месяц и обрабатывает 200-300 диалогов в день. Бот закрывает основной поток рутины, человек подключается на сложное.
Что бот делает лучше человека:
Что выигрывает бизнес на длинной дистанции:
В кейсе нашего проекта GoBanana запускали бота за 3 часа после выхода новой модели. 200 000+ пользователей. Подобный подход с быстрой сборкой работает и в поддержке.
Бот не справится с эмоциональными жалобами, претензиями к юристам, нестандартными ситуациями и техническими сбоями вашего сервиса. На таких диалогах нужна экспертиза и эмпатия живого менеджера.
Любой бот, даже на Claude Opus 4.7, упирается в потолок там, где нужна реальная ответственность. Если клиент пишет «вы списали деньги дважды и не возвращаете уже две недели», бот может только зафиксировать обращение и эскалировать. Решение проблемы за человеком и за процессом, а не за моделью.

Слабые места ИИ-ботов поддержки честно:
Эти ограничения решаются настройкой триггеров эскалации и постоянным улучшением базы знаний. Раз в неделю смотрите логи провальных диалогов и добавляйте в FAQ то, что бот не закрыл.
На запуск уходит 6-15 часов работы вайбкодера и около $5-30 на первый месяц инфраструктуры. На 1000 диалогов в месяц с DeepSeek V4 Flash общая стоимость держится в районе $10-15 ежемесячно.
Если умеете работать с Windsurf или другим AI IDE, бот техподдержки собирается за 1-2 рабочих дня. Если нанимаете разработчика, рассчитывайте на 15-25 тысяч рублей за MVP. Дальше операционные расходы небольшие: основная статья это вызовы LLM и эмбеддинги, все остальное в бесплатных тарифах.

| Статья расходов | На 1000 диалогов в месяц | На 10000 диалогов |
|---|---|---|
| Хостинг Railway | $0 (free tier) | $5-10 |
| Supabase | $0 | $25 |
| Эмбеддинги OpenAI | $0.10 | $1.00 |
| DeepSeek V4 Flash | $0.74 | $7.40 |
| Claude Sonnet 4.6 (альтернатива) | $18 | $180 |
| Итого с DeepSeek | $0.84 | $43 |
| Итого с Sonnet | $18 | $215 |
На реальных проектах есть еще затраты на разработку и поддержку базы знаний. Это не деньги, а время: раз в неделю кто-то смотрит логи и обновляет FAQ. Час-два в неделю обычно хватает на старте.
С нулевым опытом в коде и через Windsurf от 6 до 15 часов работы, можно сделать за выходные. Если есть опыт с Python или Node.js, реально уложиться в один рабочий день. Дольше всего займет подготовка базы знаний: 50-100 вопросов с ответами писать руками или собирать из существующей документации.
Да, оба сервиса дают REST API. Бот может создавать сделки при эскалации, обновлять статусы заказов, читать историю клиента. Интеграция добавляет 4-8 часов к разработке. Через Windsurf или Claude Code такие коннекторы пишутся голосом за один заход.
Нет, Telegram Bot API полностью бесплатный. Платить нужно только за хостинг бота (от $0), векторную базу (от $0) и API нейросетей (от $0.14 за 1M токенов). Сам Telegram не берет деньги ни за создание бота, ни за отправку сообщений, ни за количество подписчиков.
При правильной настройке RAG бот не отвечает «из головы». Если в базе нет информации с похожестью выше 0.7, он передает менеджеру. Раз в неделю смотрите логи: какие вопросы пришли, как ответил бот, не было ли ложных ответов. Найденные ошибки правятся обновлением FAQ или промпта.
Через Windsurf или Cursor IDE голосом. Опишите ассистенту: «прочитай PDF с FAQ, разбей на куски по 500 токенов, добавь категорию в metadata, залей в Supabase в таблицу faq». На второй-третьей итерации работающий скрипт готов. Без кода совсем пока никак, но порог входа сильно снизился.
Три универсальных. Команда /human, ключевые слова жалоб (юрист, суд, директор, возврат, мошенники) и низкая релевантность RAG-поиска три раза подряд. Дальше тюнингуете под свою нишу. В e-commerce добавляют запросы про возврат, в SaaS про технические сбои.
Да. Telegram Bot API дает доступ к аудиофайлам, дальше прогоняете их через OpenAI Whisper или другую модель ASR (около $0.006 за минуту). Получается текст, дальше обычный flow. Голосовые увеличивают конверсию: клиенту проще наговорить вопрос, чем печатать.
Бот поддержки в Telegram на ИИ это не «прорывная технология будущего», а рабочий инструмент, который собирается за выходные и окупается за месяц. Стек простой: BotFather, Supabase, Claude или DeepSeek, Windsurf. Логика передачи менеджеру решается тремя триггерами.
Поделюсь лайфхаком: не пытайтесь сразу закрыть 100% вопросов автоматом. Начните с трех категорий: график работы, цены, контакты. Запустите бота. Через неделю смотрите, какие реальные вопросы пришли. Добавляйте в FAQ только то, что встретилось хотя бы дважды. За месяц соберете базу, которая реально закрывает 60-80% потока без участия людей.
Если хотите ускорить процесс или нужна помощь с архитектурой под вашу нишу, запишитесь на консультацию к Максиму. За час разберем, какие именно вопросы закрывать ботом первыми, как считать экономику и какую модель выбрать под вашу нагрузку. Все обзоры инструментов для сборки лежат в каталоге AI IDE на VibeCoderz.

Обновлено: июнь 2026. Команда VibeCoderz.