Transkrypcja dźwięku z rozbiciem autorów i wielomodularną kontrolą
Szukamy deweloperów w Python z doświadczeniem w pracy z API do rozpoznawania mowy i uczenia się maszynowego w celu modernizacji istniejącego skryptu transkrypcji.Projekt ma na celu stworzenie zaawansowanego systemu, który optymalizuje proces transkrypcji plików audio z rozbiciem na autorów rozmowy.System będzie korzystać z kilku usług rozpoznawania mowy (Google Cloud Speech-to-Text, Whisper, Microsoft Azure Speech), a także wykorzystywać uczenie maszynowe, aby poprawić jakość i dokładność transkrypcji.Główne zadania projektu:
1 .** Modyfikacja istniejącego skryptu:**
- Integracja API różnych usług rozpoznawania mowy: Google Cloud Speech-to-Text, Whisper i Microsoft Azure Speech w celu poprawy jakości rozpoznawania.(Wydaje mi się, że potrzebne są inne modele)
- Rozwijanie logiki wyboru najlepszego serwisu dla konkretnego fragmentu dźwięku na podstawie jakości i wartości.2 .* Opracowanie mechanizmu długich fragmentów: *
Automatyczne rozbiórki dźwięku na długie i krótkie fragmenty.(Już istnieje)
- Przetwarzanie długich fragmentów za pomocą rozszerzonych możliwości wybranych usług rozpoznawania.3 .**Integracja i optymalizacja GPT do analizy kontekstu:**
- Integracja modelu GPT w celu sprawdzenia i poprawy jakości transkrypcji poprzez analizę kontekstu rozmowy.(JestPrzegląd dla testów)
- Opracowanie algorytmów przetwarzania zwracanych przez model wniosków GPT w celu dostosowania i uzupełnienia otrzymanej transkrypcji.Cztery** Testowanie i weryfikacja systemu:**
- przeprowadzenie kompleksowego testowania systemu na różnych rodzajach materiałów audio.Analiza dokładności, prędkości i kosztów transkrypcji uzyskanych za pomocą różnych usług i algorytmów.5 .* Rozwój interfejsu użytkownika: *
- Tworzenie prostego i intuicyjnie zrozumiałego interfejsu do uruchomienia skryptów i przeglądania wyników.(podejmowane są do rozpatrzenia)
# # Wymagania dotyczące kwalifikacji:
- znajomość języka programowania Python i co najmniej 3 lata doświadczenia w pracy.Doświadczenie w pracy z API rozpoznawania mowy (Google Cloud Speech-to-Text, Whisper, Microsoft Azure Speech) i innymi usługami w chmurze.Doświadczenie w pracy z nauką maszynową, zwłaszcza z modelami przetwarzania języka naturalnego, takimi jak GPT-3.Zrozumienie zasad przetwarzania i analizy danych audio.- umiejętność analizowania i rozwiązywania trudnych zadań.- Dbałość o szczegóły i dążenie do wysokiej jakości wykonania pracy.# # # Oczekuje się wyników:
Do końca projektu deweloper musi dostarczyć gotowy system zdolny do:
- automatycznie rozbić dźwięk na fragmenty i określić autorów mówienia.- optymalne rozdzielenie fragmentów między różnymi usługami rozpoznawania w celu uzyskania najlepszych wyników.- Użyj GPT do analizy kontekstu i poprawienia dokładności transkrypcji.- dostarczanie raportów o jakości i wartości procesu transkrypcji.Budżet i terminy:
Budżet projektu i terminy jego realizacji zostaną uzgodnione z deweloperem po szczegółowej dyskusji na temat zakresu pracy i oceny czasu realizacji wszystkich funkcji.## Proces wyboru:
1 .Przegląd portfela i doświadczenie pracy z podobnymi zadaniami.2 .Rozmowa w celu omówienia szczegółów projektu i możliwości realizacji zamierzonego.3 .Rozmowa o warunkach współpracy i podpisanie umowy.
Aktualne zlecenia dla freelancerów w kategorii AI i uczenie maszynowe
Automatyczne publikowanie relacji na InstagramieDzień dobry, Potrzebna pomoc w ustawieniu automatycznego publikowania historii na Instagramie. W archiwum Instagrama są już historie, które zostały opublikowane, trzeba je ponownie opublikować. AI i uczenie maszynowe, Tworzenie chatbota ∙ 15 godzin 51 minut temu ∙ 23 oferty |
Stworzenie asystenta AI do komunikacji z klientamiPotrzebne jest stworzenie asystenta AI do komunikacji z Klientami. Okno czatu będzie umieszczone na naszej stronie, następnie nastąpi komunikacja z botem. Pytania dotyczące produktów, ustawień, możliwości itp. W przypadku, gdy informacja jest nieznana lub zapytanie, na które… AI i uczenie maszynowe, AI consult ∙ 1 dzień 11 godzin temu ∙ 33 oferty |
Szukam montażysty wideo, który tworzy filmy z AITworzenie wideo AI dla dentystów i innych ekspertów Cel: Tworzenie krótkich pionowych wideo dla Instagram Reels, Facebook Reels, TikTok i YouTube Shorts, które wyjaśniają skomplikowane tematy prostym językiem i przyciągają uwagę widza dzięki połączeniu animacji AI i wideo… AI i uczenie maszynowe ∙ 1 dzień 18 godzin temu ∙ 2 oferty |
Szukam mentora / nauczyciela z ComfyUI do nauki online (praca przez RunPod)
57 PLN
Dzień dobry. Szukam praktykującego specjalisty i mentora, który pomoże mi opanować pracę z ComfyUI. Główną cechą mojego zapytania jest to, że praca będzie odbywać się całkowicie w chmurze, bez pobierania programu na lokalny komputer. Planuję wynająć kartę graficzną przez serwis… AI i uczenie maszynowe ∙ 2 dni 5 godzin temu ∙ 1 oferta |
Agent AI technologii żywienia sportowegoAgent pomaga opracowywać receptury nowych produktów sportowej żywności — batoników proteinowych, protein, przedtreningowych, izotonicznych, batoników itd. Główną cechą jest to, że agent zna przepisy prawne różnych krajów i automatycznie uwzględnia je przy tworzeniu receptury. To… AI i uczenie maszynowe, Programowanie stron internetowych ∙ 2 dni 5 godzin temu ∙ 61 ofert |