joewongjc /
type4me
Голосовой ввод для macOS: распознавание в реальном времени, оптимизация текста через LLM и локальное хранение данных.
Форки
137
Звёзды
1.2k
Issues
0
Голосовой ввод для macOS с локальной обработкой и AI-редактированием. Превращай речь в чистый текст без отправки данных в облако.
Что делает
Type4me превращает голос в текст прямо на твоем Mac. Он слушает микрофон в реальном времени и сразу выводит распознанные фразы в любое текстовое поле. Это работает как системная клавиатура, но для голоса.
Инструмент не просто переводит звук в текст, он умеет дорабатывать результат через LLM. Если ты надиктовал сумбур, AI приведет его в порядок, исправит ошибки и расставит знаки препинания. Все данные хранятся локально.
Как работает
Программа использует нативные API macOS для распознавания речи. После получения сырого текста она отправляет его на локальную модель или подключенный API для постобработки. Весь процесс происходит внутри системы, без передачи аудио на внешние серверы.
Кому подходит
Тем, кто устал печатать длинные отчеты и хочет диктовать их на ходу.
Разработчикам, которые собирают AI-ассистентов для macOS и ищут готовый движок ввода.
Пользователям, которые боятся утечек данных и ценят приватность локального софта.
Людям с высокой скоростью речи, которым нужен быстрый транскрибер без задержек.
Основные возможности
Распознавание голоса в реальном времени.
Локальное хранение всех записей и данных.
Интеграция с LLM для улучшения качества текста.
Работает в любом приложении macOS.
Минималистичный интерфейс для быстрого доступа.
Как установить
Скачай готовый релиз из GitHub или собери проект через Xcode, если хочешь внести правки в код.
git clone https://github.com/joewongjc/type4me
open type4me.xcodeprojПосле открытия в Xcode нажми Command+R для сборки и запуска приложения на своем Mac.
Как применить в своём продукте
Ты можешь использовать этот проект как базу для создания узкоспециализированных инструментов. Например, сделай на его основе бота для автоматического заполнения CRM или тикет-системы прямо голосом.
Встроить как модуль голосового ввода в свой SaaS для продуктивности.
Использовать для создания локального «второго мозга», который записывает мысли сразу в базу данных.
Обернуть в скрипт для автоматической транскрибации встреч в Zoom или Google Meet.
Подводные камни
Главная сложность — зависимость от системного движка распознавания Apple. Если macOS плохо понимает твой акцент, качество текста будет низким. Также учитывай нагрузку на процессор при активном использовании LLM для коррекции текста — старые Mac могут греться.
Частые вопросы
Нужно ли платить за API нейросетей?
Зависит от настроек. Если подключишь облачные модели, плата будет списываться по их тарифам. Если используешь локальные LLM через Ollama или аналоги, это бесплатно.
Работает ли это без интернета?
Да, базовое распознавание речи в macOS работает офлайн. Если не подключать внешние API для обработки текста, приложение остается полностью автономным.
Можно ли настроить свои промпты для обработки текста?
Да, это одна из фишек для продвинутых пользователей. Ты можешь задать системную инструкцию, чтобы AI правил текст в нужном тебе стиле или формате.
Похожие репозитории
IINA — это мощный видеоплеер для macOS на базе MPV. Идеальное решение, если нужно встроить качественный медиа-движок в свой проект или просто заменить стандартные плееры.
Stats — это open source монитор ресурсов для macOS, который живет в строке меню. Показывает всё: от нагрузки на CPU до температуры датчиков и скорости сети.
UTM запускает Windows, Linux и другие ОС на macOS и iOS. Это эмулятор для запуска полноценных виртуальных машин без необходимости джейлбрейка.
MonitorControl превращает любой сторонний монитор в нативный Apple Display. Управляй яркостью и звуком через клавиатуру Mac или шорткаты.
Данные обновлены: 3 июня 2026 г.