Real-Time Voice Translator - голосовой перевод с задержкой
Универсальный переводчик голоса для Windows, который работает с любым приложением - Zoom, Discord, игры, браузер. Не плагин и не расширение, а системное решение на уровне ОС с задержкой менее 300 миллисекунд.
Два параллельных пайплайна обеспечивают двунаправленный перевод: ваша речь переводится и подаётся на виртуальный микрофон для собеседника, а его речь перехватывается из системного аудио, переводится и воспроизводится в наушники. Поддержка любых языковых пар.
Под капотом - streaming speech recognition, LLM-перевод с кешированием, нейросетевой синтез речи, voice activity detection и низкоуровневая интеграция с аудио-подсистемой Windows. 1500+ строк production-кода.
Стек: Python, Streaming STT, LLM Translation, Neural TTS, VAD, WASAPI, Virtual Audio Driver
Два параллельных пайплайна обеспечивают двунаправленный перевод: ваша речь переводится и подаётся на виртуальный микрофон для собеседника, а его речь перехватывается из системного аудио, переводится и воспроизводится в наушники. Поддержка любых языковых пар.
Под капотом - streaming speech recognition, LLM-перевод с кешированием, нейросетевой синтез речи, voice activity detection и низкоуровневая интеграция с аудио-подсистемой Windows. 1500+ строк production-кода.
Стек: Python, Streaming STT, LLM Translation, Neural TTS, VAD, WASAPI, Virtual Audio Driver