Нужен специалист по ИИ: развертывание быстрого локального голосового помощника (Речевой текст в текст + Локальная языковая модель + Текст в речь)
Проект: Веб-панель для AI-исходящих звонков с динамической конфигурацией агента
Основная концепция: Разработать полностью функциональное веб-приложение для управления исходящими звонками с помощью AI-агента. Система основана на локальной LLM (Llama, Deepseek, Gemma) и должна иметь панель конфигурации для настройки поведения агента на каждом звонке (голос, язык, подсказка), модуль управления лидами и подробную аналитику звонков.
Ключевые требования к качеству: Низкая задержка менее 800 мс и естественная, человеческая речь с соответствующей интонацией и паузами.
Основные модули:
1. Панель конфигурации агента (веб-интерфейс)
Позволяет пользователям выбрать следующее перед звонком:
- Языки: EN, DE, ES, NL (определяет доступные голоса и точность транскрипции)
- Модель STT: Выберите движок транскрипции (Deepgram / Cartesia / Gemini)
- Провайдер TTS и модель: Выберите движок синтеза (Cartesia / Deepgram / ElevenLabs)
- Выбор голоса: Выберите конкретный голос для определения тона и стиля
- Тайм-аут тишины: Установите задержку перед повторным запросом/окончанием звонка (по умолчанию 30 секунд)
- Режим первого сообщения: Переключение между "Агент говорит первым" или "Ждать пользователя"
- Фоновый шум: Добавить окружающий звук (офис, колл-центр) для реалистичности
- Подсказка и контекст: Поле для пользовательских подсказок LLM (полный поток разговора) - Поддержка загрузки примеров диалогов для обучения с несколькими примерами + экспорт для обучения/подачи модели
2. Управление лидами и звонками (веб-интерфейс)
- Загрузка и удаление списков контактов (CSV или ручной ввод)
- Управление звонками в реальном времени в браузере: Начать, Пауза, Остановить
- Автоматическая запись звонков, связанная с каждым лидом
3. Отчетность и аналитика
Данные по каждому звонку включают:
- Сгенерированное AI резюме звонка
- Длительность звонка
- Полная аудиозапись
- Переведенный транскрипт (перевод разговора на английский)
4. Интеграции и телефония
- Вызовы WebRTC напрямую из браузера
- Интеграция с внешними SIP-транками (IP&IP SIP BASED) и Asterisk
5. Технические требования
- Задержка от конца до конца должна составлять 800 мс или меньше
- Уведомления Telegram о начале, окончании звонка и доставке результатов
- Рекомендации по серверу и руководство по настройке для достижения целевых показателей производительности
Предпочтительный стек технологий:
- Бэкенд: Python (FastAPI / Django / Flask)
- Фронтенд: React, Vue или основной HTML/JS
- AI:
- Локальная LLM в качестве основного движка рассуждений (Llama, Deepseek, Gemma) – разработчик должен выбрать и оптимизировать наиболее подходящую модель для скорости и качества.
- Облачные API для низкозадерживающего STT/TTS (Deepgram, Cartesia, Gemini, ElevenLabs) для обеспечения производительности.
Идеальный кандидат:
Опытный разработчик полного стека с опытом организации сложных голосовых потоков и способностью правильно выбирать наиболее оптимальные, быстрые и экономически эффективные модели для каждого компонента (STT, локальная LLM, TTS) на основе конкретных случаев использования и требований.
- Начало: как можно скорее (ASAP)
- Фиксированный бюджет: $1000 (возможен мотивированный рост бюджета) с фул сорсами
- Долгосрочное сотрудничество:
Мы также рассматриваем кандидатов, которые будут доступны для оплачиваемой постоянной поддержки и будущих улучшений проекта после доставки первоначального MVP.
Пожалуйста, включите в ваше предложение:
- Ссылки или описания аналогичных прошлых работ (AI-звонки, голосовые боты)
Подтверждение того, что вы можете независимо выбрать и обосновать LLM + STT + TTS
Срок, в течение которого вы можете предоставить рабочий поток с задержкой ≤ 800 мс
языки общения: UA RU EN
*Названия LLM, указанные выше, являются лишь примерами из моего опыта. Если вы знаете лучшие, более быстрые или более дешевые решения для этой задачи, не стесняйтесь предлагать их. Мы ищем мотивированного кандидата для долгосрочного сотрудничества с соответствующим финансовым вознаграждением.
-
Бомба проект , складнощів мульйон .. Але 800 мс. затримки то мабуть дуже занадто -
11Лабс - затримка при синтезу не менше чим 200 мс. (по моїм тестам 1 сек)
СТТ - не менше 0.3 сек. причому не віспер - це точно .
ЛЛМ - 0.5 сек. плюс (невеличка моделька якась)
але зате - на цпу І 4-6 ЯДЕР НА один поток.
але ще ж якщо локальний ТТС- то живої мови не отримаете (можна але затримки зростуть в рази) -
нереальный проект, закройте пока вайбкодеры не пришли) вам же лучше будет, лапши навешают что все реально
-
ну - буде дуже цікаво побачити хочаб приблизний результат цього дійства
-
Актуальные фриланс-проекты в категории AI и машинное обучение
Нужен специалист для обучения модели детекции объектов на архитектурных чертежах1. Мета задачіНеобходимо обучить или адаптировать модель для автоматического поиска и классификации элементов на архитектурных чертежах интерьерных проектов.Система должна находить объекты на планах, обводить их bbox/контуром, определять класс объекта и возвращать результат в… AI и машинное обучение ∙ 17 минут назад ∙ 2 ставки |
ИИ-агент в телеграм для интернет-магазина
20 000 UAH
Задача: создание AI-агента в телеграм, для живого общения с клиентами и оформления заказов в ИМ на Опенкарте, также необходимо реализация информирования клиентов в статусах заказов, режиме работы магазина, условиях работы, сроках доставки и прочих вопросов, связанных с работой… AI и машинное обучение, Разработка ботов ∙ 13 часов 20 минут назад ∙ 50 ставок |
Доработка вебсайта нa Claude Code
8000 UAH
МЫ делаем сайт для публикации недвижимости. Уже есть основная часть проекта, лендинг и портал, админка. Все уже работает коректно по факту, но есть доработки которые требуют внимания и профессионализма. Более детально задачи предоставим после согласования кандидатуры. Попрошу… AI в дизайне, AI и машинное обучение ∙ 18 часов 47 минут назад ∙ 40 ставок |
Разработка интеллектуальной системы управления масложировым заводом
257 626 UAH
Ищем опытную команду или специалистов для реализации промышленной AI-платформы мониторинга и управления масложировым производством (подсолнечник, холодное и горячее прессование). Стек и технологии: Beckhoff TwinCAT 3 (Structured Text) · Python 3.11 · Node-RED · InfluxDB 2 ·… AI и машинное обучение, Встраиваемые системы и микроконтроллеры ∙ 18 часов 55 минут назад ∙ 18 ставок |
Помочь поднять бизнес в ИИ выдачи (GEO/LLMO проект)Ищу специалиста, который поможет организовать GEO/LLMO для салона красоты. География - Киев и область. AI и машинное обучение, Поисковое продвижение (SEO) ∙ 1 день 1 час назад ∙ 15 ставок |