Transkrypcja dźwięku z rozbiciem autorów i wielomodularną kontrolą

AI i uczenie maszynowe, Python — podano nieprawidłowe kategorie?

252 PLN

Zlecenie jest tłumaczone automatycznie. Zaloguj się lub zarejestruj się, żeby zobaczyć oryginał * Opis projektu : Szukamy deweloperów w Python z doświadczeniem w pracy z API do rozpoznawania mowy i uczenia się maszynowego w celu modernizacji istniejącego skryptu transkrypcji.Projekt ma na celu stworzenie zaawansowanego systemu, który optymalizuje proces transkrypcji plików audio z rozbiciem na autorów rozmowy.System będzie korzystać z kilku usług rozpoznawania mowy (Google Cloud Speech-to-Text, Whisper, Microsoft Azure Speech), a także wykorzystywać uczenie maszynowe, aby poprawić jakość i dokładność transkrypcji.Główne zadania projektu: 1 .** Modyfikacja istniejącego skryptu:** - Integracja API różnych usług rozpoznawania mowy: Google Cloud Speech-to-Text, Whisper i Microsoft Azure Speech w celu poprawy jakości rozpoznawania.(Wydaje mi się, że potrzebne są inne modele) - Rozwijanie logiki wyboru najlepszego serwisu dla konkretnego fragmentu dźwięku na podstawie jakości i wartości.2 .* Opracowanie mechanizmu długich fragmentów: * Automatyczne rozbiórki dźwięku na długie i krótkie fragmenty.(Już istnieje) - Przetwarzanie długich fragmentów za pomocą rozszerzonych możliwości wybranych usług rozpoznawania.3 .**Integracja i optymalizacja GPT do analizy kontekstu:** - Integracja modelu GPT w celu sprawdzenia i poprawy jakości transkrypcji poprzez analizę kontekstu rozmowy.(JestPrzegląd dla testów) - Opracowanie algorytmów przetwarzania zwracanych przez model wniosków GPT w celu dostosowania i uzupełnienia otrzymanej transkrypcji.Cztery** Testowanie i weryfikacja systemu:** - przeprowadzenie kompleksowego testowania systemu na różnych rodzajach materiałów audio.Analiza dokładności, prędkości i kosztów transkrypcji uzyskanych za pomocą różnych usług i algorytmów.5 .* Rozwój interfejsu użytkownika: * - Tworzenie prostego i intuicyjnie zrozumiałego interfejsu do uruchomienia skryptów i przeglądania wyników.(podejmowane są do rozpatrzenia) # # Wymagania dotyczące kwalifikacji: - znajomość języka programowania Python i co najmniej 3 lata doświadczenia w pracy.Doświadczenie w pracy z API rozpoznawania mowy (Google Cloud Speech-to-Text, Whisper, Microsoft Azure Speech) i innymi usługami w chmurze.Doświadczenie w pracy z nauką maszynową, zwłaszcza z modelami przetwarzania języka naturalnego, takimi jak GPT-3.Zrozumienie zasad przetwarzania i analizy danych audio.- umiejętność analizowania i rozwiązywania trudnych zadań.- Dbałość o szczegóły i dążenie do wysokiej jakości wykonania pracy.# # # Oczekuje się wyników: Do końca projektu deweloper musi dostarczyć gotowy system zdolny do: - automatycznie rozbić dźwięk na fragmenty i określić autorów mówienia.- optymalne rozdzielenie fragmentów między różnymi usługami rozpoznawania w celu uzyskania najlepszych wyników.- Użyj GPT do analizy kontekstu i poprawienia dokładności transkrypcji.- dostarczanie raportów o jakości i wartości procesu transkrypcji.Budżet i terminy: Budżet projektu i terminy jego realizacji zostaną uzgodnione z deweloperem po szczegółowej dyskusji na temat zakresu pracy i oceny czasu realizacji wszystkich funkcji.## Proces wyboru: 1 .Przegląd portfela i doświadczenie pracy z podobnymi zadaniami.2 .Rozmowa w celu omówienia szczegółów projektu i możliwości realizacji zamierzonego.3 .Rozmowa o warunkach współpracy i podpisanie umowy.

Oferty Wycofane 1

R F
Wrocław, Polska

Zleceń 13
Ocena -
Ranking 349

Transkrypcja dźwięku z rozbiciem autorów i wielomodularną kontrolą

Aktualnie brak ofert

Aktualnie brak ofert

Oferty ukryte

Aktualne zlecenia dla freelancerów w kategorii AI i uczenie maszynowe

Masowa obróbka zdjęć produktów za pomocą AI

Rozwój oprogramowania (ROS 2 / Nav2) dla autonomicznego robota 4x4: Widz komputerowy, asymetryczna nawigacja

Szukam dewelopera bota AI (ChatGPT/OpenAI)

Integracja agenta AI w Manychat do obsługi przychodzących wiadomości

Stworzyć system SEO oparty na n8n