Tekst w audio (TTS)
Micro-TTS — aplikacja kliencka do generowania syntezy mowy na podstawie API.
Możliwości:
Nowoczesny minimalistyczny interfejs (Windows, HTML UI przez pywebview)
Wsparcie dla 30 głosów z wyborem płci
Wybór stylu wymowy (tone prompt, niestandardowe wprowadzenie)
Generacja do 20 fragmentów audio (każdy blok — osobny wav)
Wsparcie dla języków: rosyjski, ukraiński, angielski, 24 języki
Natychmiastowy licznik bajtów (kontrola limitu 5000/16000)
Elastyczna konfiguracja przez plik config.json (klucz API, model API)
Wszystkie głosy i parametry — przez osobny plik voices.json
Bezpieczne przechowywanie konfiguracji, łatwa przekazywalność innemu użytkownikowi
Jak to działa:
Uruchamiasz plik exe, interfejs pojawia się od razu (bez konsoli).
Wprowadzasz tekst, wybierasz głos, w razie potrzeby ustawiasz styl.
Generujesz audio (każdy blok — osobny plik).
Możesz wybrać folder do zapisania.
Rezultat:
Gotowe pliki audio w wybranym folderze
Wysokiej jakości głosy
Implementacja techniczna:
Python 3.10, PyWebView, API, wsparcie dla kompilacji do exe (PyInstaller)
Cały UI — dynamiczny HTML, wszystkie ustawienia przez konfigurację
Zrzuty ekranu interfejsu, przykładowa struktura konfiguracji i pełny plik voices.json — w załączniku.
#tts #python #voice #windows #ai #audiogeneration #pywebview
Możliwości:
Nowoczesny minimalistyczny interfejs (Windows, HTML UI przez pywebview)
Wsparcie dla 30 głosów z wyborem płci
Wybór stylu wymowy (tone prompt, niestandardowe wprowadzenie)
Generacja do 20 fragmentów audio (każdy blok — osobny wav)
Wsparcie dla języków: rosyjski, ukraiński, angielski, 24 języki
Natychmiastowy licznik bajtów (kontrola limitu 5000/16000)
Elastyczna konfiguracja przez plik config.json (klucz API, model API)
Wszystkie głosy i parametry — przez osobny plik voices.json
Bezpieczne przechowywanie konfiguracji, łatwa przekazywalność innemu użytkownikowi
Jak to działa:
Uruchamiasz plik exe, interfejs pojawia się od razu (bez konsoli).
Wprowadzasz tekst, wybierasz głos, w razie potrzeby ustawiasz styl.
Generujesz audio (każdy blok — osobny plik).
Możesz wybrać folder do zapisania.
Rezultat:
Gotowe pliki audio w wybranym folderze
Wysokiej jakości głosy
Implementacja techniczna:
Python 3.10, PyWebView, API, wsparcie dla kompilacji do exe (PyInstaller)
Cały UI — dynamiczny HTML, wszystkie ustawienia przez konfigurację
Zrzuty ekranu interfejsu, przykładowa struktura konfiguracji i pełny plik voices.json — w załączniku.
#tts #python #voice #windows #ai #audiogeneration #pywebview