BasedHardware /
omi
AI, который видит ваш экран, слушает разговоры и говорит вам, что делать.
Форки
1.6k
Звёзды
8.5k
Issues
0
Omi — это open source платформа для носимого AI, который анализирует экран и аудио в реальном времени. Помогает строить персональных ИИ-ассистентов для жизни и бизнеса.
Что делает
Omi — это мозг для носимых устройств. Он подключается к тому, что вы слышите и видите, а затем выдает подсказки или резюме. Разработчики создали систему, которая работает как ваш персональный ассистент, постоянно находящийся рядом.
Проект объединяет мобильное приложение, носимые гаджеты и облачную инфраструктуру для обработки данных. Он собирает контекст, чтобы вы не забывали детали встреч и принимали решения быстрее. Это готовая база для создания умных помощников.
Как работает
Система использует комбинацию Flutter для мобильного интерфейса и Python для бэкенда. Она захватывает потоки данных с микрофона или экрана, отправляет их в LLM для анализа и возвращает пользователю готовый ответ.
В основе лежат API для транскрипции звука и распознавания визуальных образов. Весь процесс автоматизирован: от получения сырых данных до отправки уведомлений с рекомендациями. Это модульная архитектура, которую легко масштабировать под конкретные задачи.
Кому подходит
Разработчикам, которые создают AI-продукты на Flutter и нуждаются в готовом коде для работы с голосом.
Энтузиастам, собирающим собственные умные девайсы (очки, кулоны) с поддержкой AI.
Фаундерам SaaS, желающим добавить функционал «второго мозга» в свои приложения.
Тем, кто хочет автоматизировать ведение заметок и анализ рабочих созвонов.
Основные возможности
Запись и транскрипция разговоров в реальном времени.
Визуальный анализ контента на экране пользователя.
Поддержка кастомных персон для общения с AI.
Кроссплатформенность благодаря использованию Flutter.
Интеграция с носимыми устройствами для сбора данных.
Автоматическое создание резюме встреч и диалогов.
Как установить
Для начала работы нужно склонировать репозиторий и настроить зависимости для Flutter.
git clone https://github.com/BasedHardware/omi.git
cd omi
flutter pub getПосле этого потребуется настроить ключи API для используемых моделей и запустить сборку под вашу платформу.
Как применить в своём продукте
Вы можете использовать Omi как основу для своего AI-стартапа. Например, оберните логику обработки аудио в отдельный микросервис и продавайте его как B2B-решение для записи корпоративных встреч.
Также можно встроить Omi как фичу в существующее приложение для продуктивности. Пользователь будет получать советы от «умного агента», который анализирует его текущую активность в браузере или на мобильном устройстве.
Создать нишевого бота для врачей, который фиксирует симптомы пациента во время приема.
Разработать обучающий тренажер, который подсказывает правильные ответы во время звонков по продажам.
Интегрировать функции анализа экрана в CRM для автоматического заполнения карточек клиентов.
Подводные камни
Главная сложность — приватность данных. Поскольку система постоянно слушает и смотрит, вам нужно продумать шифрование и хранение записей, чтобы не нарушить законы о защите информации.
Стоимость API-запросов к LLM может быстро расти при высокой нагрузке. Обязательно настройте лимиты на использование токенов, иначе бюджет на инфраструктуру выйдет из-под контроля.
Частые вопросы
Нужно ли покупать специальное оборудование для работы с Omi?
Проект поддерживает работу через мобильное приложение, поэтому начинать можно с обычного смартфона. Специальные носимые устройства (кулоны, очки) расширяют возможности сбора данных, но не являются обязательным требованием для запуска базового функционала на этапе разработки.
Насколько сложно интегрировать свои LLM?
Архитектура проекта достаточно гибкая для замены провайдеров моделей. Вы можете перенаправить API-запросы на свои локальные инстансы через Ollama или использовать другие облачные решения, если стандартные настройки вас не устраивают.
Подходит ли Omi для создания сложных AI-агентов?
Да, база позволяет строить агентов с памятью и контекстом. Вы можете использовать текущую инфраструктуру как фундамент, надстраивая сверху логику принятия решений и интеграции с внешними сервисами через API.
Топики
Похожие репозитории
Onyx — это self-hosted платформа для создания AI-чата с RAG и поиском по документам. Заменяет ChatGPT Enterprise внутри компании.
Amical — это open source приложение для диктовки, которое превращает голос в текст локально. Идеально для тех, кто хочет ускорить набор текста без облачных подписок.
OpenBB — это швейцарский нож для финансовых данных. Он объединяет рыночные показатели в один API для твоих AI-агентов.
Kelivo — это кроссплатформенный чат-клиент на Flutter для работы с LLM. Позволяет запускать чат-ботов на iOS, Android и десктопе.
Данные обновлены: 16 апреля 2026 г.