Transkrypcja audio
narzędzie, które potrafi nagrywać dźwięk z mikrofonu lub przyjmować gotowy plik audio, a następnie wykonywać automatyczną transkrypcję za pomocą modelu sieci neuronowej. Celem projektu jest uproszczenie procesu uzyskiwania tekstu z audio, na przykład dla stenogramów, wywiadów, notatek lub automatycznego przygotowywania dokumentów na podstawie komentarzy głosowych. Kluczowe wymagania: łatwość uruchomienia, wsparcie dla linii poleceń, stabilna praca i integracja modelu OpenAI Whisper.
Potrzebne do zamówienia:
Pliki audio do testów (jeśli trzeba sprawdzić na jego przykładzie) — opcjonalnie
Preferencje dotyczące formatu wyjściowego tekstu (txt, json, podział według czasu itp.)
Wyjaśnienie, czy będzie używane tylko nagranie z mikrofonu, tylko pliki audio, czy oba warianty
System operacyjny, dla którego potrzebna jest kompilacja lub instrukcja (Windows/Linux/Mac)
Język(i) audio (do wyboru odpowiedniego modelu Whisper)
Potrzebne do zamówienia:
Pliki audio do testów (jeśli trzeba sprawdzić na jego przykładzie) — opcjonalnie
Preferencje dotyczące formatu wyjściowego tekstu (txt, json, podział według czasu itp.)
Wyjaśnienie, czy będzie używane tylko nagranie z mikrofonu, tylko pliki audio, czy oba warianty
System operacyjny, dla którego potrzebna jest kompilacja lub instrukcja (Windows/Linux/Mac)
Język(i) audio (do wyboru odpowiedniego modelu Whisper)