OpenWhispr /
openwhispr
Приложение для диктовки с локальными (Nvidia Parakeet/Whisper) и облачными (BYOK) моделями. Приватность и кроссплатформенность.
Форки
343
Звёзды
2.5k
Issues
0
OpenWhispr — кроссплатформенный софт для транскрибации голоса. Работает локально через Whisper/Parakeet или через облачные API с вашими ключами.
Что делает
OpenWhispr превращает вашу речь в текст прямо на компьютере. Вы можете диктовать заметки, транскрибировать аудиофайлы или превращать голосовые сообщения в структурированные данные. Приложение работает как полноценный диктофон с поддержкой нескольких движков распознавания.
Вайб-кодеры используют его, чтобы не зависеть от облачных сервисов, где ваши данные улетают на серверы компаний. Здесь всё остается в контуре вашего устройства. Вы сами выбираете, какой моделью пользоваться в текущий момент.
Как работает
Программа объединяет локальные движки, такие как Nvidia Parakeet и Whisper, с облачными API (OpenAI, Anthropic, Groq, Gemini). Вы просто вставляете свой API-ключ в настройки, и приложение начинает слать запросы в облако. Локальные модели требуют наличия мощного железа, особенно если вы планируете обрабатывать длинные записи без задержек.
Кому подходит
Разработчикам SaaS, которым нужно внедрить функцию записи голоса в свой продукт.
Вайб-кодерам, которые строят локальные AI-агенты для автоматизации заметок.
Тем, кто работает с конфиденциальными данными и не хочет отправлять их в облака.
Владельцам мощных ПК с видеокартами Nvidia, желающим использовать Parakeet бесплатно.
Основные возможности
Локальная транскрибация без интернета через Whisper.
Поддержка облачных моделей через BYOK (Bring Your Own Key).
Кроссплатформенность: работает на Windows, macOS и Linux.
Интеграция с Nvidia Parakeet для быстрого распознавания на GPU.
Приватность: данные не покидают устройство при использовании локальных моделей.
Удобный интерфейс для управления записями и транскриптами.
Как установить
Скачайте готовый бинарный файл из официального релиза GitHub для вашей ОС. Для запуска локальных моделей убедитесь, что драйверы GPU обновлены.
# Для пользователей macOS (через Homebrew)
brew install --cask openwhispr
# Для других систем используйте установщик с GitHub ReleasesПросто запустите скачанный файл — интерфейс появится в системном трее.
Как применить в своём продукте
Вы можете использовать OpenWhispr как основу для своего AI-сервиса. Например, оберните логику транскрибации в API и сделайте микро-SaaS для автоматического протоколирования встреч. Это отличная альтернатива дорогим платным API.
Встроить как модуль для голосового ввода в ваше веб-приложение.
Использовать для создания автоматических субтитров к видео на локальной машине.
Создать бота, который переводит голосовые сообщения в задачи для Notion или Jira.
Подводные камни
Локальные модели требуют много оперативной памяти и ресурсов видеокарты. Если у вас слабый ноутбук, транскрибация будет идти медленно или вовсе зависать. При использовании облачных моделей вы платите за каждый запрос по своему API-ключу — следите за лимитами, чтобы не получить неожиданный счет от OpenAI или Anthropic.
Частые вопросы
Нужно ли платить за использование приложения?
Само приложение бесплатно, так как это open source проект. Однако, если вы выбираете облачные модели (OpenAI, Anthropic и другие), вы платите за использование их API напрямую провайдеру по вашему личному ключу.
Можно ли использовать OpenWhispr без видеокарты Nvidia?
Да, вы можете использовать облачные модели или стандартные версии Whisper, которые работают на процессоре. Но скорость распознавания будет значительно ниже, чем при использовании GPU.
Где хранятся мои записи?
Все аудиофайлы и транскрипты сохраняются локально на вашем компьютере. При использовании локальных моделей данные вообще не покидают устройство, что гарантирует максимальную приватность.
Топики
Похожие репозитории
Mumble — это open-source движок для организации голосовой связи с минимальной задержкой. Идеален для встраивания в проекты, где критична скорость передачи голоса.
Amical — это open source приложение для диктовки, которое превращает голос в текст локально. Идеально для тех, кто хочет ускорить набор текста без облачных подписок.
Pake превращает любой сайт в полноценное десктопное приложение. Это быстрее и легче Electron-аналогов.
KeePassXC — это оффлайн-менеджер паролей с открытым кодом. Он хранит логины и секреты локально, обеспечивая полную приватность данных.
Данные обновлены: 16 апреля 2026 г.