Potrzebny specjalista AI: wdrożenie szybkiego lokalnego asystenta głosowego (STT + lokalny LLM + TTS)
Projekt: Panel internetowy do wychodzących połączeń AI z dynamiczną konfiguracją agenta
Podstawowa koncepcja: Opracowanie w pełni funkcjonalnej aplikacji internetowej do zarządzania wychodzącymi połączeniami z wykorzystaniem agenta AI. System oparty jest na lokalnym LLM (Llama, Deepseek, Gemma) i musi zawierać panel konfiguracyjny do dostosowywania zachowania agenta w zależności od połączenia (głos, język, zapytanie), moduł zarządzania leadami oraz szczegółową analizę połączeń.
Kluczowe wymagania jakościowe: Niska latencja poniżej 800 ms oraz naturalna, ludzka mowa z odpowiednim tempem i pauzami.
Podstawowe moduły:
1. Panel konfiguracji agenta (Interfejs webowy)
Umożliwia użytkownikom wybór następujących opcji przed połączeniem:
- Języki: EN, DE, ES, NL (określa dostępne głosy i dokładność transkrypcji)
- Model STT: Wybierz silnik transkrypcyjny (Deepgram / Cartesia / Gemini)
- Dostawca TTS i model: Wybierz backend syntezatora (Cartesia / Deepgram / ElevenLabs)
- Wybór głosu: Wybierz konkretny głos, aby określić ton i styl
- Czas oczekiwania na ciszę: Ustaw opóźnienie przed ponownym zapytaniem/końcem połączenia (Domyślnie 30s)
- Tryb pierwszej wiadomości: Przełącz między Bot mówi pierwszy lub czeka na użytkownika
- Hałas w tle: Dodaj dźwięk otoczenia (biuro, call center) dla realizmu
- Zapytanie i kontekst: Pole na niestandardowe zapytania LLM (pełny przepływ rozmowy) - Wsparcie dla przesyłania przykładowych dialogów do nauki few-shot + eksport do nauki/żywienia modelu
2. Zarządzanie leadami i połączeniami (Interfejs webowy)
- Przesyłanie i usuwanie list kontaktów (CSV lub ręczne wprowadzenie)
- Kontrola połączeń w czasie rzeczywistym w przeglądarce: Rozpocznij, Wstrzymaj, Zatrzymaj
- Automatyczne nagrywanie połączeń powiązane z każdym leadem
3. Raportowanie i analizy
Dane dotyczące połączenia obejmują:
- Podsumowanie połączenia generowane przez AI
- Czas trwania połączenia
- Pełne nagranie audio
- Przetłumaczona transkrypcja (tłumaczenie rozmowy na język angielski)
4. Integracje i telekomunikacja
- Połączenia WebRTC bezpośrednio z przeglądarki
- Integracja z zewnętrznymi trunkami SIP (IP&IP SIP BASED) oraz Asterisk
5. Wymagania techniczne
- Latencja end-to-end musi wynosić 800 ms lub mniej
- Powiadomienia Telegram o rozpoczęciu, zakończeniu połączenia i dostarczeniu wyników
- Rekomendacja serwera i wskazówki dotyczące konfiguracji w celu osiągnięcia celów wydajnościowych
Preferowany stos technologiczny:
- Backend: Python (FastAPI / Django / Flask)
- Frontend: React, Vue lub podstawowy HTML/JS
- AI:
- Lokalny LLM jako główny silnik rozumowania (Llama, Deepseek, Gemma) – deweloper musi wybrać i zoptymalizować najbardziej odpowiedni model pod kątem szybkości i jakości.
- Chmurowe API dla niskolatencyjnego STT/TTS (Deepgram, Cartesia, Gemini, ElevenLabs) w celu zapewnienia wydajności.
Idealny kandydat:
Doświadczony programista full-stack z wiedzą na temat organizowania złożonych procesów głosowych oraz umiejętnością właściwego wyboru najbardziej optymalnych, najszybszych i najtańszych modeli dla każdego komponentu (STT, lokalny LLM, TTS) w oparciu o konkretne przypadki użycia i wymagania.
- Start: jak najszybciej (ASAP)
- Budżet stały: $1000 (możliwość uzasadnionego zwiększenia budżetu) с фул сорсами
- Długoterminowa współpraca:
Rozważamy również kandydatów, którzy będą dostępni do płatnego wsparcia i przyszłych ulepszeń projektu po dostarczeniu początkowego MVP.
Proszę uwzględnić w swojej propozycji:
- Linki lub opisy podobnych wcześniejszych prac (wywołania AI, boty głosowe)
Potwierdzenie, że możesz niezależnie wybrać i uzasadnić LLM + STT + TTS
Termin, do którego możesz dostarczyć działający proces z latencją ≤ 800 ms
języki komunikacji: UA RU EN
*Wymienione nazwy LLM to tylko przykłady z mojego doświadczenia. Jeśli znasz lepsze, szybsze lub tańsze rozwiązania dla tego zadania, śmiało je zasugeruj. Szukamy zmotywowanego kandydata do długoterminowej współpracy z odpowiednim wynagrodzeniem finansowym.
-
Бомба проект , складнощів мульйон .. Але 800 мс. затримки то мабуть дуже занадто -
11Лабс - затримка при синтезу не менше чим 200 мс. (по моїм тестам 1 сек)
СТТ - не менше 0.3 сек. причому не віспер - це точно .
ЛЛМ - 0.5 сек. плюс (невеличка моделька якась)
але зате - на цпу І 4-6 ЯДЕР НА один поток.
але ще ж якщо локальний ТТС- то живої мови не отримаете (можна але затримки зростуть в рази) -
нереальный проект, закройте пока вайбкодеры не пришли) вам же лучше будет, лапши навешают что все реально
-
ну - буде дуже цікаво побачити хочаб приблизний результат цього дійства
-
Aktualne zlecenia dla freelancerów w kategorii AI i uczenie maszynowe
Poprawić działanie Claude Code i prace związane z pisaniem oprogramowaniaObecnie rozwijam CRM i analitykę, oprogramowanie. Robię to przez Claude Code, ale rozumiem, że wyniki nie są najlepsze pod względem zmian. Mam 2 zadania - Potrzebuję pomocy w stworzeniu presetów dotyczących umiejętności, MD itd., aby poprawić jakość. Wziąć sprawdzone, z którymi… AI i uczenie maszynowe, Python ∙ 23 godziny 30 minut temu ∙ 21 ofert |
Szukam dewelopera agentów AI i automatyzacji dla biznesu.
3640 PLN
Interesują mnie agenci do:— Sprzedaży i kwalifikacji leadów— Marketingu i treści— Wsparcia klienta— Analityki i raportowania— Procesów wewnętrznych (HR, baza wiedzy)— Specjalistycznych nisz (nieruchomości, medycyna, usługi prawne)Jeśli masz doświadczenie lub gotowe rozwiązania —… AI i uczenie maszynowe, Tworzenie chatbota ∙ 23 godziny 49 minut temu ∙ 47 ofert |
Potrzebny specjalista do szkolenia modelu detekcji obiektów na rysunkach architektonicznych1. Cel zadaniaNależy nauczyć lub dostosować model do automatycznego wyszukiwania i klasyfikacji elementów na architektonicznych rysunkach projektów wnętrz.System ma znajdować obiekty na planach, otaczać je bbox/ konturem, określać klasę obiektu i zwracać wynik w formacie JSON… AI i uczenie maszynowe ∙ 1 dzień temu ∙ 5 ofert |
Agent AI w Telegramie dla sklepu internetowego
1640 PLN
Zadanie: stworzenie agenta AI w Telegramie, do żywego kontaktu z klientami i składania zamówień w sklepie internetowym na OpenCart, a także konieczność realizacji informowania klientów o statusach zamówień, trybie pracy sklepu, warunkach pracy, terminach dostawy i innych… AI i uczenie maszynowe, Tworzenie chatbota ∙ 1 dzień 13 godzin temu ∙ 64 oferty |
Dopracowanie strony internetowej na Claude Code
656 PLN
Robimy stronę do publikacji nieruchomości. Główna część projektu, landing i portal, panel administracyjny są już gotowe. Wszystko działa poprawnie, ale są poprawki, które wymagają uwagi i profesjonalizmu. Dokładniejsze zadania przedstawimy po zatwierdzeniu kandydatury. Proszę… AI graphic, AI i uczenie maszynowe ∙ 1 dzień 18 godzin temu ∙ 43 oferty |