Tłumacz głosowy w czasie rzeczywistym - tłumaczenie głosowe z opóźnieniem

AI i uczenie maszynowe 2107 PLN

Praca 1 z 10

Uniwersalny tłumacz głosu dla systemu Windows, który działa z każdą aplikacją - Zoom, Discord, gry, przeglądarka. Nie jest to wtyczka ani rozszerzenie, lecz systemowe rozwiązanie na poziomie OS z opóźnieniem poniżej 300 milisekund.

Dwa równoległe potoki zapewniają dwukierunkowe tłumaczenie: twoja mowa jest tłumaczona i podawana na wirtualny mikrofon dla rozmówcy, a jego mowa jest przechwytywana z systemowego audio, tłumaczona i odtwarzana w słuchawkach. Wsparcie dla dowolnych par językowych.

Pod maską - streamingowe rozpoznawanie mowy, tłumaczenie LLM z buforowaniem, syntezator mowy oparty na sieciach neuronowych, wykrywanie aktywności głosu oraz niskopoziomowa integracja z systemem audio Windows. Ponad 1500 linii kodu produkcyjnego.

Stos: Python, Streaming STT, Tłumaczenie LLM, Neuronalny TTS, VAD, WASAPI, Wirtualny Sterownik Audio