kitlangton /
Hex
VOICE → WORDS: инструмент для преобразования голоса в текст. Перевод аудио в слова с использованием современных AI-технологий.
Форки
157
Звёзды
2.3k
Issues
0
Hex — это macOS-утилита для перевода голоса в текст на базе Whisper. Превращает аудио в слова прямо на твоём Mac.
Что делает
Hex забирает аудиопоток и превращает его в текст. Он работает как локальный транскрибатор. Тебе не нужно отправлять записи на сторонние серверы, чтобы получить расшифровку.
Программа использует мощь Apple Silicon. Она обрабатывает данные прямо на устройстве. Это быстро и безопасно для конфиденциальных разговоров.
Как работает
Инструмент построен на базе архитектуры Whisper от OpenAI. Он использует SwiftUI для интерфейса и Swift для логики обработки звука. Hex выполняет инференс нейросети локально, используя ресурсы твоего Mac.
Кому подходит
Разработчикам, которые делают инструменты для продуктивности под macOS.
Вайб-кодерам, которым нужно быстро внедрить транскрибацию в свой десктопный софт.
Тем, кто строит локальные AI-приложения без привязки к облачным API.
Пользователям, которым важна приватность данных при обработке аудио.
Основные возможности
Локальная транскрибация аудио в текст.
Использование движка Whisper.
Нативная интеграция с macOS.
Минималистичный интерфейс для быстрого запуска.
Работа без интернет-соединения.
Как установить
Для сборки проекта тебе понадобится Xcode и установленные инструменты командной строки. Клонируй репозиторий и открой его в Xcode.
git clone https://github.com/kitlangton/Hex.git
open Hex.xcodeprojПосле открытия нажми кнопку `Build` в Xcode, чтобы скомпилировать приложение под свою версию macOS.
Как применить в своём продукте
Ты можешь использовать Hex как референс для создания собственного AI-ассистента. Вместо того чтобы переизобретать велосипед, возьми этот код за основу своего модуля распознавания речи.
Встроить функцию записи и расшифровки встреч в свой SaaS-продукт.
Создать локальный AI-блокнот, который пишет за пользователем.
Использовать код как базу для обучения или дообучения моделей на специфических терминах.
Обернуть функционал в CLI-утилиту для автоматизации обработки аудио-файлов в папках.
Подводные камни
Приложение сильно нагружает процессор и оперативную память во время транскрибации. Если у тебя старый Mac, процесс может идти медленно. Также учитывай размер моделей Whisper — они занимают несколько гигабайт на диске.
Частые вопросы
Нужно ли платить за API OpenAI для работы Hex?
Нет. Hex использует локальные модели Whisper. Ты не платишь за токены или запросы к облачным серверам. Всё работает на железе твоего компьютера.
Насколько точно он распознает русский язык?
Это зависит от версии модели Whisper, которую ты выберешь для работы. Базовые модели справляются неплохо, но для сложной терминологии может потребоваться донастройка.
Можно ли использовать Hex в коммерческом проекте?
Да, проект имеет открытую лицензию. Ты можешь использовать его код в своих продуктах, но обязательно проверяй требования лицензии самого репозитория перед релизом.
Топики
Похожие репозитории
Petal — это нативное приложение для macOS, которое переводит голос в текст прямо на устройстве. Идеально для быстрой транскрипции без передачи данных в облако.
SwiftyCrow — это macOS-утилита для перевода текста с экрана в реальном времени. Работает полностью локально через Apple Vision и Translation.
CodeEdit — это полноценный open-source редактор кода для macOS, созданный как альтернатива Xcode. Легкий, быстрый и бесплатный.
MochiDiffusion запускает Stable Diffusion локально на чипах Apple Silicon. Это дает генерацию картинок прямо на Mac без облачных API и подписок.
Данные обновлены: 3 июня 2026 г.