Real-Time Voice Translator - голосовий переклад із затримкою
Універсальний голосовий перекладач для Windows, який працює з будь-яким додатком - Zoom, Discord, ігри, браузер. Не плагін і не розширення, а системне рішення на рівні ОС із затримкою менше 300 мілісекунд.
Два паралельні пайплайни забезпечують двонаправлений переклад: ваше мовлення перекладається та подається на віртуальний мікрофон для співрозмовника, а його мовлення перехоплюється із системного аудіо, перекладається та відтворюється у навушники. Підтримка будь-яких мовних пар.
Під капотом - streaming speech recognition, LLM-переклад із кешуванням, нейромережний синтез мовлення, voice activity detection та низькорівнева інтеграція з аудіо-підсистемою Windows. 1500+ рядків production-коду.
Стек: Python, Streaming STT, LLM Translation, Neural TTS, VAD, WASAPI, Virtual Audio Driver
Два паралельні пайплайни забезпечують двонаправлений переклад: ваше мовлення перекладається та подається на віртуальний мікрофон для співрозмовника, а його мовлення перехоплюється із системного аудіо, перекладається та відтворюється у навушники. Підтримка будь-яких мовних пар.
Під капотом - streaming speech recognition, LLM-переклад із кешуванням, нейромережний синтез мовлення, voice activity detection та низькорівнева інтеграція з аудіо-підсистемою Windows. 1500+ рядків production-коду.
Стек: Python, Streaming STT, LLM Translation, Neural TTS, VAD, WASAPI, Virtual Audio Driver