Tłumacz głosowy w czasie rzeczywistym - tłumaczenie głosowe z opóźnieniem
Uniwersalny tłumacz głosu dla systemu Windows, który działa z każdą aplikacją - Zoom, Discord, gry, przeglądarka. Nie jest to wtyczka ani rozszerzenie, lecz systemowe rozwiązanie na poziomie OS z opóźnieniem poniżej 300 milisekund.
Dwa równoległe potoki zapewniają dwukierunkowe tłumaczenie: twoja mowa jest tłumaczona i podawana na wirtualny mikrofon dla rozmówcy, a jego mowa jest przechwytywana z systemowego audio, tłumaczona i odtwarzana w słuchawkach. Wsparcie dla dowolnych par językowych.
Pod maską - streamingowe rozpoznawanie mowy, tłumaczenie LLM z buforowaniem, syntezator mowy oparty na sieciach neuronowych, wykrywanie aktywności głosu oraz niskopoziomowa integracja z systemem audio Windows. Ponad 1500 linii kodu produkcyjnego.
Stos: Python, Streaming STT, Tłumaczenie LLM, Neuronalny TTS, VAD, WASAPI, Wirtualny Sterownik Audio
Dwa równoległe potoki zapewniają dwukierunkowe tłumaczenie: twoja mowa jest tłumaczona i podawana na wirtualny mikrofon dla rozmówcy, a jego mowa jest przechwytywana z systemowego audio, tłumaczona i odtwarzana w słuchawkach. Wsparcie dla dowolnych par językowych.
Pod maską - streamingowe rozpoznawanie mowy, tłumaczenie LLM z buforowaniem, syntezator mowy oparty na sieciach neuronowych, wykrywanie aktywności głosu oraz niskopoziomowa integracja z systemem audio Windows. Ponad 1500 linii kodu produkcyjnego.
Stos: Python, Streaming STT, Tłumaczenie LLM, Neuronalny TTS, VAD, WASAPI, Wirtualny Sterownik Audio