Tłumacz głosowy w czasie rzeczywistym - tłumaczenie głosowe z opóźnieniem

AI i uczenie maszynowe 2107 PLN
Praca 1 z 10
Uniwersalny tłumacz głosu dla systemu Windows, który działa z każdą aplikacją - Zoom, Discord, gry, przeglądarka. Nie jest to wtyczka ani rozszerzenie, lecz systemowe rozwiązanie na poziomie OS z opóźnieniem poniżej 300 milisekund.

Dwa równoległe potoki zapewniają dwukierunkowe tłumaczenie: twoja mowa jest tłumaczona i podawana na wirtualny mikrofon dla rozmówcy, a jego mowa jest przechwytywana z systemowego audio, tłumaczona i odtwarzana w słuchawkach. Wsparcie dla dowolnych par językowych.

Pod maską - streamingowe rozpoznawanie mowy, tłumaczenie LLM z buforowaniem, syntezator mowy oparty na sieciach neuronowych, wykrywanie aktywności głosu oraz niskopoziomowa integracja z systemem audio Windows. Ponad 1500 linii kodu produkcyjnego.

Stos: Python, Streaming STT, Tłumaczenie LLM, Neuronalny TTS, VAD, WASAPI, Wirtualny Sterownik Audio
Szczegóły
  • Dodana:
198

Freelancer

  • Zleceń 6
  • Ocena 4.7
  • Ranking 2 642
Zarejestruj się

Jeśli masz konto, zaloguj się

Wskaźniki

  • Ostatnia wizyta: 6 godzin 23 minuty temu