Zlecenia dla freelancerów

Zlecenia dla freelancerów

Opracowanie mikroserwisu do przetwarzania audio (mowa - tekst) z integracją naszej usługi przez API

AI i uczenie maszynowe, Python — podano nieprawidłowe kategorie?

423 PLN

Opinia zleceniodawcy o współpracy z Oleksandr S.

Opracowanie mikroserwisu do przetwarzania audio (mowa - tekst) z integracją naszej usługi przez API

423 PLN

Wszystko w porządku, projekt zrealizowany w terminie i w pełnym zakresie. Dziękuję za pracę i mogę polecić innym zleceniodawcom!

5.0

Ievhen Likhachev

Opinia zwrotna

16 kwietnia 2025

Opinia freelancera o współpracy z Ievhen Likhachev

Opracowanie mikroserwisu do przetwarzania audio (mowa - tekst) z integracją naszej usługi przez API

423 PLN

Wszystko dobrze, zleceniodawca profesjonalnie podchodzi do tzw., i słucha rad, mam nadzieję znowu pracować razem.

5.0

Oleksandr S.

Opinia zwrotna

16 kwietnia 2025

Zlecenie jest tłumaczone automatycznie. Zaloguj się lub zarejestruj się, żeby zobaczyć oryginał

Stworzyć osobny mikroserwis, który przetwarza głosowe wiadomości użytkowników:

🎙️ przekształca audio na tekst (speech-to-text / STT),
🔊 przekształca tekst na mowę (text-to-speech / TTS).

Ten mikroserwis ma działać niezależnie od głównego rdzenia Optizium, komunikując się przez zapytania HTTP POST. Wszystkie wiadomości tekstowe i odpowiedzi GPT będą przetwarzane przez Twój główny API.

⚙️ Architektura

🧱 Składniki:

Mikroserwis (Python + FastAPI lub Node.js + Express)
OpenAI Whisper API dla STT
OpenAI TTS do syntezowania głosu
Interakcja z Optizium przez:
- /api/chats/send — wysyłanie tekstu do czatu
- /api/chats/chat — pobieranie historii
- /api/integrations/integration — WebHook (opcjonalnie)
- /api/leads/leads — przetwarzanie formularzy kontaktowych (w razie potrzeby)

📤 Przesyłanie danych

🔽 Żądanie wejściowe do mikroserwisu (z frontendu strony lub z aplikacji mobilnej):

1. Wejściowe audio (STT)

yamlKopiujEdytujPOST /speech-to-text
Content-Type: multipart/form-data

Form-data:
- audio_file: .mp3/.ogg/.wav
- bot_id: string
- chat_room: string

2. Wejściowy tekst do syntezowania (TTS)

pgsqlKopiujEdytujPOST /text-to-speech
Content-Type: application/json

{
  "text": "Twój produkt jest dostępny",
  "language": "pl-PL",
  "voice": "female",
  "bot_id": "...",
  "chat_room": "..."
}

🔁 Zachowanie mikroserwisu

🟡 STT:

Otrzymuje plik audio
Rozpoznaje tekst za pomocą OpenAI Whisper

Wysyła go do Twojego API:

cssKopiujEdytujPOST /api/chats/send
headers: {Authorization, Content-Type}
body:
{
  "bot_id": "...",
  "chat_room": "...",
  "author": "user",
  "message": "rozpoznany tekst"
}

🟢 TTS:

Otrzymuje tekstową odpowiedź od GPT (przez Twój system)
Odczytuje ją za pomocą systemu TTS
Zwraca .mp3 lub URL do pliku na frontend

🔐 Bezpieczeństwo i prywatność

Użycie HTTPS
Klucz API obowiązkowy po stronie żądania (Basic lub Bearer)
Pliki audio są usuwane po przetworzeniu
Nie przechowywać historii po stronie mikroserwisu (tylko przesyłanie)

📦 Wynik

Oczekiwane punkty końcowe (endpoints):

Metoda	Endpoint	Przeznaczenie
POST	`/speech-to-text`	Rozpoznawanie mowy na tekst
POST	`/text-to-speech`	Syntezowanie głosu z tekstu
GET	`/status`	Stan usługi (ping)

🧪 Testowanie

Wysyłanie testowego pliku głosowego → sprawdzenie tekstu w czacie Optizium.
Odpowiedź GPT → syntezowanie → sprawdzenie odtwarzania na stronie.
Wysyłanie formularza zwrotnego po głosowym zapytaniu.

🧰 Stos technologii (zalecany):

Python 3.11+, FastAPI, uvicorn
OpenAI Whisper API, gTTS / TTS by Coqui, Edge TTS
pydub lub ffmpeg do pracy z audio
Docker, Gunicorn (wydanie produkcyjne)
ngrok / HTTPS proxy (do lokalnego testowania WebHook)

🕐 Termin wykonania:

3–5 dni roboczych

Oferty 6 Odrzucone 3 Dyskusje 1

Yaroslav Stopin

7 0

Budżet: 10000 UAH Termin: 5 dni

Dzień dobry.
Jestem gotów podjąć się Twojego projektu.
Mogę opracować dla Ciebie taką integrację z wykorzystaniem narzędzi no-code/low-code.
Pisz na prywatne, omówimy wszystkie możliwe niuanse i będziemy mogli przystąpić do realizacji.

Oleksii Buglak

9 0

Budżet: 10000 UAH Termin: 5 dni

Dzień dobry!

Za tydzień (5 dni) mogę stworzyć taki serwis na nodejs. Ale najpierw muszę dokładniej przyjrzeć się waszemu serwisowi Optizium.
Przykłady prac: https://github.com/axbuglak

Z poważaniem,
Buglak Ołeksij

Vasil Savchuk

1 0

Zlecenia -
Ocena -
Ranking 426

Budżet: 5000 UAH Termin: 4 dni

Tworzę niezależny mikroserwis w Pythonie 3.11+ z FastAPI, który będzie przetwarzał głosowe wiadomości użytkowników. Będzie przyjmował plik audio (formaty .mp3/.ogg/.wav), przekształcał go na tekst za pomocą OpenAI Whisper API, a następnie wysyłał ten tekst przez żądanie HTTP POST do głównego API /api/chats/send. Dla odwrotnego zadania (TTS) mikroserwis będzie przyjmował tekst, przekształcał go na mowę za pomocą gTTS, Coqui TTS lub Edge TTS, generował plik audio i zwracał link do niego. Przetwarzanie audio będzie realizowane za pomocą ffmpeg lub pydub.

Cała interakcja będzie odbywać się przez zabezpieczone żądania HTTPS z autoryzacją za pomocą klucza API. Pliki audio nie będą przechowywane — usuwane po przetworzeniu. Zrealizuję również /status do sprawdzania dostępności usługi. Testowanie będzie obejmować 3 etapy: sprawdzenie STT (rozpoznawanie), TTS (syntezę) oraz pełne połączenie z głównym API.

Do wdrożenia używam Dockera + Gunicorn, a do lokalnego testowania WebHook – ngrok.

Oleksandr S.

Oferta, która wygrała

9 0

Budżet: 5000 UAH Termin: 5 dni

Mam doświadczenie w tworzeniu mikroserwisów na FastAPI, pracowałem z OpenAI i pracowałem z plikami audio.
Mogę zrealizować mikroserwis, który będzie w pełni odpowiadał opisanej architekturze: szybki, bezpieczny, niezależny i łatwy do skalowania. Jestem gotów omówić szczegóły (uwierzytelnianie, wdrożenie) w prywatnych wiadomościach. Proszę napisać — wszystko omówimy

Yelena Druzenko

5 0

Budżet: 12000 UAH Termin: 7 dni

Dzień dobry
jestem gotowa wykonać twoje zadanie
Rzeczywisty czas realizacji 6-7 dni
koszt 12 000 UAH

Ievhen Likhachev
Odessa, Ukraina

Zleceń 63
Ocena 5.0
Ranking 6 692

Opracowanie mikroserwisu do przetwarzania audio (mowa - tekst) z integracją naszej usługi przez API

Opinia zleceniodawcy o współpracy z Oleksandr S.

Opracowanie mikroserwisu do przetwarzania audio (mowa - tekst) z integracją naszej usługi przez API

5.0

Ievhen Likhachev

Opinia freelancera o współpracy z Ievhen Likhachev

Opracowanie mikroserwisu do przetwarzania audio (mowa - tekst) z integracją naszej usługi przez API

5.0

Oleksandr S.

⚙️ Architektura

🧱 Składniki:

📤 Przesyłanie danych

🔽 Żądanie wejściowe do mikroserwisu (z frontendu strony lub z aplikacji mobilnej):

1. Wejściowe audio (STT)

2. Wejściowy tekst do syntezowania (TTS)

🔁 Zachowanie mikroserwisu

🟡 STT:

🟢 TTS:

🔐 Bezpieczeństwo i prywatność

📦 Wynik

Oczekiwane punkty końcowe (endpoints):

🧪 Testowanie

🧰 Stos technologii (zalecany):

🕐 Termin wykonania:

Yaroslav Stopin

Oleksii Buglak

Vasil Savchuk

Oleksandr S.

Oferty ukryte

Aktualnie brak ofert

Yelena Druzenko

Oferty ukryte

Aktualne zlecenia dla freelancerów w kategorii AI i uczenie maszynowe

MATLAB i uczenie maszynowe do analizy obrazów

System wieloagentowy

Zliczanie gotowych produktów oraz osób biorących udział w procesie na podstawie modelu YOLO.

AI asystenci i pomocnicy w biznesie i życiu osobistym

Dziś! Szukamy testera dla portfela webowego kryptowalut.