Real-Time Voice Translator - голосовой перевод с задержкой

AI и машинное обучение 25 000 UAH
Работа 1 из 10
Универсальный переводчик голоса для Windows, который работает с любым приложением - Zoom, Discord, игры, браузер. Не плагин и не расширение, а системное решение на уровне ОС с задержкой менее 300 миллисекунд.

Два параллельных пайплайна обеспечивают двунаправленный перевод: ваша речь переводится и подаётся на виртуальный микрофон для собеседника, а его речь перехватывается из системного аудио, переводится и воспроизводится в наушники. Поддержка любых языковых пар.

Под капотом - streaming speech recognition, LLM-перевод с кешированием, нейросетевой синтез речи, voice activity detection и низкоуровневая интеграция с аудио-подсистемой Windows. 1500+ строк production-кода.

Стек: Python, Streaming STT, LLM Translation, Neural TTS, VAD, WASAPI, Virtual Audio Driver
Детали
  • Добавлена:
198

Фрилансер

  • Проектов 6
  • Оценка 4.7
  • Рейтинг 2 642
Зарегистрируйтесь

Если у вас есть аккаунт, авторизуйтесь

Показатели

  • Последний визит: 8 часов 25 минут назад