Фриланс-проєкти

Фриланс-проєкти

Розробка мікросервісу для обробки аудіо (мова - текст) з інтеграцією нашого сервісу через API

Name: Розробка мікросервісу для обробки аудіо (мова - текст) з інтеграцією нашого сервісу через API
Price: 5000 UAH
Availability: InStock

AI та машинне навчання, Python — неправильно зазначені категорії?

5000 UAH

Відгук замовника про співпрацю з Олександром С.

Розробка мікросервісу для обробки аудіо (мова - текст) з інтеграцією нашого сервісу через API

5000 UAH

Все гарно, проект виконаний в строк та в повному обсязі. Дякую за роботу та можу радити іншим замовникам!

5.0

Ievhen Ліхачев

Зустрічний відгук

16 квітня 2025

Відгук фрилансера про співпрацю з Ievhen Ліхачев

Розробка мікросервісу для обробки аудіо (мова - текст) з інтеграцією нашого сервісу через API

5000 UAH

Все добре, замовник професійно ставитися до тз, та прислуховується до порад, маю надію знову попрацювати разом.

5.0

Олександр С.

Зустрічний відгук

16 квітня 2025

Створити окремий мікросервіс, який обробляє голосові повідомлення користувачів:

🎙️ трансформує аудіо в текст (speech-to-text / STT),
🔊 перетворює текст у мову (text-to-speech / TTS).

Цей мікросервіс має працювати незалежно від основного ядра Optizium, комунікуючи через HTTP POST-запити. Всі текстові повідомлення та відповіді GPT будуть оброблятися вашим основним API.

⚙️ Архітектура

🧱 Складові:

Мікросервіс (Python + FastAPI або Node.js + Express)
OpenAI Whisper API для STT
OpenAI TTS для синтезу голосу
Взаємодія з Optizium через:
- /api/chats/send — надсилання тексту в чат
- /api/chats/chat — отримання історії
- /api/integrations/integration — WebHook (опціонально)
- /api/leads/leads — обробка контактних форм (за потреби)

📤 Передача даних

🔽 Вхідний запит до мікросервісу (від фронтенду сайту або з мобільного застосунку):

1. Вхідне аудіо (STT)

yamlКопіюватиРедагуватиPOST /speech-to-text
Content-Type: multipart/form-data

Form-data:
- audio_file: .mp3/.ogg/.wav
- bot_id: string
- chat_room: string

2. Вхідний текст для озвучення (TTS)

pgsqlКопіюватиРедагуватиPOST /text-to-speech
Content-Type: application/json

{
  "text": "Ваш товар в наявності",
  "language": "uk-UA",
  "voice": "female",
  "bot_id": "...",
  "chat_room": "..."
}

🔁 Поведінка мікросервісу

🟡 STT:

Отримує аудіофайл
Розпізнає текст через OpenAI Whisper

Відправляє його у ваш API:

cssКопіюватиРедагуватиPOST /api/chats/send
headers: {Authorization, Content-Type}
body:
{
  "bot_id": "...",
  "chat_room": "...",
  "author": "user",
  "message": "розпізнаний текст"
}

🟢 TTS:

Отримує текстову відповідь від GPT (через вашу систему)
Озвучує її через TTS-систему
Повертає .mp3 або URL на файл на фронтенд

🔐 Безпека та конфіденційність

Використання HTTPS
API-ключ обов’язковий на стороні запиту (Basic або Bearer)
Аудіофайли видаляються після обробки
Не зберігати історію на стороні мікросервісу (тільки передача)

📦 Результат

Очікувані кінцеві точки (ендпоінти):

Метод	Endpoint	Призначення
POST	`/speech-to-text`	Розпізнавання мови в текст
POST	`/text-to-speech`	Синтез голосу з тексту
GET	`/status`	Стан сервісу (пінг)

🧪 Тестування

Відправка тестового голосового файлу → перевірка тексту в Optizium чаті.
GPT відповідь → синтез → перевірка програвання на сайті.
Відправка форми зворотного зв’язку після голосового запиту.

🧰 Стек технологій (рекомендовано):

Python 3.11+, FastAPI, uvicorn
OpenAI Whisper API, gTTS / TTS by Coqui, Edge TTS
pydub або ffmpeg для роботи з аудіо
Docker, Gunicorn (виробнича збірка)
ngrok / HTTPS proxy (для локального тестування WebHook)

🕐 Термін виконання:

3–5 робочих днів

Ставки 6 Відхилені 3 Обговорення 1

Ярослав Стьопін

7 0

Проєкти 7
Оцінка 4.5
Рейтинг 1 266

Бюджет: 10000 UAH Термін: 5 днів

Добрий день.
Готовий взяти Ваш проект
Зможу розробити для Вас таку інтеграцію з використанням no-code/low-code інструментів.
Пишіть в особисті, обговоримо всі можливі нюанси і зможемо приступити до реалізації.

Олексій Буглак

9 0

Проєкти 9
Оцінка 5.0
Рейтинг 2 806

Бюджет: 10000 UAH Термін: 5 днів

Доброго дня!

За тиждень(5 днiв) зможу зробити такий сервiс на nodejs. Але спочатку треба бiльш детальнiше подивитися на ваш сервсiс Optizium.
Приклади робiт: https://github.com/axbuglak

З повагою,
Буглак Олексiй

Василь Савчук

1 0

Проєкти -
Оцінка -
Рейтинг 426

Бюджет: 5000 UAH Термін: 4 дні

Створю незалежний мікросервіс на Python 3.11+ з FastAPI, який оброблятиме голосові повідомлення користувачів. Він прийматиме аудіофайл (формати .mp3/.ogg/.wav), перетворюватиме його на текст за допомогою OpenAI Whisper API, а потім надсилатиме цей текст через HTTP POST-запит в основний API /api/chats/send. Для зворотного завдання (TTS) мікросервіс прийматиме текст, перетворюватиме його на мову за допомогою gTTS, Coqui TTS або Edge TTS, генеруватиме аудіофайл і повертатиме посилання на нього. Обробка аудіо виконуватиметься за допомогою ffmpeg або pydub.

Вся взаємодія відбуватиметься через захищені HTTPS-запити з авторизацією по API-ключу. Аудіофайли не зберігатимуться — видаляються після обробки. Також реалізую /status для перевірки доступності сервісу. Тестування включатиме 3 етапи: перевірка STT (розпізнавання), TTS (синтез) та повне з'єднання з основним API.

Для деплою використовую Docker + Gunicorn, а для локального тестування WebHook – ngrok.

Олександр С.

Переможець

9 0

Проєкти 9
Оцінка 5.0
Рейтинг 1 444

Бюджет: 5000 UAH Термін: 5 днів

Я маю досвід створення мікросервісів на FastAPI, працював з OpenAI та працював із аудіофайлами.
Можу реалізувати мікросервіс, що буде повністю відповідати описаній архітектурі: швидкий, безпечний, незалежний та легко масштабований. Готовий обговорити нюанси (автентифікація, деплой) у приватних повідомленнях. Напишіть, будь ласка, — все обговоримо

Елена Друзенко

5 0

Проєкти 5
Оцінка 2.5
Рейтинг 611

Бюджет: 12000 UAH Термін: 7 днів

Доброго дня
готова виконати ваше завдання
Реальний термін виконання 6-7 днів
вартість 12 000 грн

Ievhen Ліхачев
Одеса, Україна

Проєктів 63
Оцінка 5.0
Рейтинг 6 692

Розробка мікросервісу для обробки аудіо (мова - текст) з інтеграцією нашого сервісу через API

Відгук замовника про співпрацю з Олександром С.

Розробка мікросервісу для обробки аудіо (мова - текст) з інтеграцією нашого сервісу через API

5.0

Ievhen Ліхачев

Відгук фрилансера про співпрацю з Ievhen Ліхачев

Розробка мікросервісу для обробки аудіо (мова - текст) з інтеграцією нашого сервісу через API

5.0

Олександр С.

⚙️ Архітектура

🧱 Складові:

📤 Передача даних

🔽 Вхідний запит до мікросервісу (від фронтенду сайту або з мобільного застосунку):

1. Вхідне аудіо (STT)

2. Вхідний текст для озвучення (TTS)

🔁 Поведінка мікросервісу

🟡 STT:

🟢 TTS:

🔐 Безпека та конфіденційність

📦 Результат

Очікувані кінцеві точки (ендпоінти):

🧪 Тестування

🧰 Стек технологій (рекомендовано):

🕐 Термін виконання:

Ярослав Стьопін

Олексій Буглак

Василь Савчук

Олександр С.

Ставки приховані

Ставки поки відсутні

Елена Друзенко

Ставки приховані

Актуальні фриланс-проєкти в категорії AI та машинне навчання

AI автоматизація телефонії Binotel та чату

MATLAB та машинне навчання для аналізу зображень

Мультиагентна система

Підрахунок готової продукції та людей, що беруть участь у процесі на основі моделі YOLO.

АІ помічники та асистенти в бізнесі і особисті