PowerBeef /
QwenVoice
Vocello is a local-first voice generation app for Apple Silicon Macs. Vocello 2.0.0 (macOS 26+) is the stable release; QwenVoice v1.2.3 remains the macOS 15 fallback.
Форки
28
Звёзды
283
Issues
0
QwenVoice — локальный движок для генерации голоса на Apple Silicon, работающий без интернета. Позволяет клонировать голоса и озвучивать текст прямо на девайсе.
Что делает
Инструмент превращает текст в живую речь, используя ресурсы твоего Mac или iPhone. Он работает полностью в офлайне, поэтому данные не улетают на сторонние серверы. Это важно для приватных проектов или приложений, где задержка сети критична.
Проект опирается на архитектуру MLX. Это позволяет использовать мощь чипов Apple Silicon по максимуму. Ты получаешь качественный синтез речи без подписки на платные API вроде ElevenLabs.
Как работает
Система использует библиотеку MLX для запуска моделей генерации голоса прямо на железе Apple. Она оптимизирована под конкретную архитектуру процессоров M1/M2/M3/M4. Вся обработка аудио происходит локально, поэтому не нужно платить за GPU-часы в облаке.
Кому подходит
Разработчикам iOS-приложений, которым нужен дешевый или бесплатный TTS.
Авторам локальных AI-агентов, работающих на macOS.
Тем, кто строит приватные продукты без передачи данных на сервер.
Вайб-кодерам, собирающим инструменты для macOS на SwiftUI.
Основные возможности
Генерация речи из текста в локальном режиме.
Поддержка Apple Silicon для ускорения вычислений.
Клонирование голоса для персонализации аудио.
Работа без доступа к интернету.
Интеграция с экосистемой macOS и iOS.
Оптимизация под современные версии macOS.
Как установить
Для запуска на macOS используй установку через Swift Package Manager или сборку проекта из исходников в Xcode.
git clone https://github.com/PowerBeef/QwenVoice
cd QwenVoice
# Открой проект в Xcode и нажми RunУбедись, что у тебя установлена актуальная версия Xcode и macOS 15+.
Как применить в своём продукте
Ты можешь встроить этот движок в любое приложение на SwiftUI, чтобы добавить функцию озвучки без расходов на API. Просто оберни логику в свой сервис и вызывай метод генерации аудио по нажатию кнопки.
Создать локальную читалку для книг или заметок с кастомными голосами.
Добавить голосовой отклик в офлайн-ассистента для macOS.
Использовать для озвучки персонажей в инди-играх под Apple Silicon.
Подводные камни
Главный минус — привязка к железу Apple. Если твой пользователь сидит на старом Intel Mac, ничего не заработает. Также учти, что локальные модели потребляют оперативную память. На устройствах с 8 ГБ ОЗУ могут быть тормоза при генерации длинных текстов.
Частые вопросы
Нужно ли платить за использование API?
Нет, всё работает локально на твоем устройстве. Ты не платишь за токены или время генерации, так как весь процесс обработки ложится на твой процессор и графический чип Apple.
Работает ли это на Windows или Linux?
Нет, проект заточен исключительно под Apple Silicon. Он использует специфические библиотеки MLX от Apple, поэтому на других системах запустить его не получится.
Можно ли клонировать любой голос?
Технически — да, но качество зависит от исходного аудиофайла. Используй чистые записи без фонового шума для лучшего результата.
Топики
Похожие репозитории
CodeEdit — это полноценный open-source редактор кода для macOS, созданный как альтернатива Xcode. Легкий, быстрый и бесплатный.
MochiDiffusion запускает Stable Diffusion локально на чипах Apple Silicon. Это дает генерацию картинок прямо на Mac без облачных API и подписок.
CopilotForXcode — это плагин, который приносит автодополнение кода уровня GitHub Copilot прямо в среду разработки Xcode для macOS.
Passepartout — open source клиент для OpenVPN и WireGuard на Swift. Помогает быстро встроить VPN-функционал в свои iOS/macOS продукты.
Данные обновлены: 3 июня 2026 г.