Real-Time Voice Translator - голосовий переклад із затримкою

AI та машинне навчання 25 000 UAH
Робота 1 з 10
Універсальний голосовий перекладач для Windows, який працює з будь-яким додатком - Zoom, Discord, ігри, браузер. Не плагін і не розширення, а системне рішення на рівні ОС із затримкою менше 300 мілісекунд.

Два паралельні пайплайни забезпечують двонаправлений переклад: ваше мовлення перекладається та подається на віртуальний мікрофон для співрозмовника, а його мовлення перехоплюється із системного аудіо, перекладається та відтворюється у навушники. Підтримка будь-яких мовних пар.

Під капотом - streaming speech recognition, LLM-переклад із кешуванням, нейромережний синтез мовлення, voice activity detection та низькорівнева інтеграція з аудіо-підсистемою Windows. 1500+ рядків production-коду.

Стек: Python, Streaming STT, LLM Translation, Neural TTS, VAD, WASAPI, Virtual Audio Driver
Деталі
  • Додано:
200

Фрилансер

  • Проєктів 6
  • Оцінка 4.7
  • Рейтинг 2 642
Зареєструйтеся

Якщо у вас є акаунт, авторизуйтеся

Показники

  • Останній візит: 17 годин 21 хвилина тому