Нужен специалист по ИИ: развертывание быстрого локального голосового помощника (Речевой текст в текст + Локальная языковая модель + Текст в речь)
Проект: Веб-панель для AI-исходящих звонков с динамической конфигурацией агента
Основная концепция: Разработать полностью функциональное веб-приложение для управления исходящими звонками с помощью AI-агента. Система основана на локальной LLM (Llama, Deepseek, Gemma) и должна иметь панель конфигурации для настройки поведения агента на каждом звонке (голос, язык, подсказка), модуль управления лидами и подробную аналитику звонков.
Ключевые требования к качеству: Низкая задержка менее 800 мс и естественная, человеческая речь с соответствующей интонацией и паузами.
Основные модули:
1. Панель конфигурации агента (веб-интерфейс)
Позволяет пользователям выбрать следующее перед звонком:
- Языки: EN, DE, ES, NL (определяет доступные голоса и точность транскрипции)
- Модель STT: Выберите движок транскрипции (Deepgram / Cartesia / Gemini)
- Провайдер TTS и модель: Выберите движок синтеза (Cartesia / Deepgram / ElevenLabs)
- Выбор голоса: Выберите конкретный голос для определения тона и стиля
- Тайм-аут тишины: Установите задержку перед повторным запросом/окончанием звонка (по умолчанию 30 секунд)
- Режим первого сообщения: Переключение между "Агент говорит первым" или "Ждать пользователя"
- Фоновый шум: Добавить окружающий звук (офис, колл-центр) для реалистичности
- Подсказка и контекст: Поле для пользовательских подсказок LLM (полный поток разговора) - Поддержка загрузки примеров диалогов для обучения с несколькими примерами + экспорт для обучения/подачи модели
2. Управление лидами и звонками (веб-интерфейс)
- Загрузка и удаление списков контактов (CSV или ручной ввод)
- Управление звонками в реальном времени в браузере: Начать, Пауза, Остановить
- Автоматическая запись звонков, связанная с каждым лидом
3. Отчетность и аналитика
Данные по каждому звонку включают:
- Сгенерированное AI резюме звонка
- Длительность звонка
- Полная аудиозапись
- Переведенный транскрипт (перевод разговора на английский)
4. Интеграции и телефония
- Вызовы WebRTC напрямую из браузера
- Интеграция с внешними SIP-транками (IP&IP SIP BASED) и Asterisk
5. Технические требования
- Задержка от конца до конца должна составлять 800 мс или меньше
- Уведомления Telegram о начале, окончании звонка и доставке результатов
- Рекомендации по серверу и руководство по настройке для достижения целевых показателей производительности
Предпочтительный стек технологий:
- Бэкенд: Python (FastAPI / Django / Flask)
- Фронтенд: React, Vue или основной HTML/JS
- AI:
- Локальная LLM в качестве основного движка рассуждений (Llama, Deepseek, Gemma) – разработчик должен выбрать и оптимизировать наиболее подходящую модель для скорости и качества.
- Облачные API для низкозадерживающего STT/TTS (Deepgram, Cartesia, Gemini, ElevenLabs) для обеспечения производительности.
Идеальный кандидат:
Опытный разработчик полного стека с опытом организации сложных голосовых потоков и способностью правильно выбирать наиболее оптимальные, быстрые и экономически эффективные модели для каждого компонента (STT, локальная LLM, TTS) на основе конкретных случаев использования и требований.
- Начало: как можно скорее (ASAP)
- Фиксированный бюджет: $1000 (возможен мотивированный рост бюджета) с фул сорсами
- Долгосрочное сотрудничество:
Мы также рассматриваем кандидатов, которые будут доступны для оплачиваемой постоянной поддержки и будущих улучшений проекта после доставки первоначального MVP.
Пожалуйста, включите в ваше предложение:
- Ссылки или описания аналогичных прошлых работ (AI-звонки, голосовые боты)
Подтверждение того, что вы можете независимо выбрать и обосновать LLM + STT + TTS
Срок, в течение которого вы можете предоставить рабочий поток с задержкой ≤ 800 мс
языки общения: UA RU EN
*Названия LLM, указанные выше, являются лишь примерами из моего опыта. Если вы знаете лучшие, более быстрые или более дешевые решения для этой задачи, не стесняйтесь предлагать их. Мы ищем мотивированного кандидата для долгосрочного сотрудничества с соответствующим финансовым вознаграждением.
-
Бомба проект , складнощів мульйон .. Але 800 мс. затримки то мабуть дуже занадто -
11Лабс - затримка при синтезу не менше чим 200 мс. (по моїм тестам 1 сек)
СТТ - не менше 0.3 сек. причому не віспер - це точно .
ЛЛМ - 0.5 сек. плюс (невеличка моделька якась)
але зате - на цпу І 4-6 ЯДЕР НА один поток.
але ще ж якщо локальний ТТС- то живої мови не отримаете (можна але затримки зростуть в рази) -
нереальный проект, закройте пока вайбкодеры не пришли) вам же лучше будет, лапши навешают что все реально
-
ну - буде дуже цікаво побачити хочаб приблизний результат цього дійства
-
Актуальные фриланс-проекты в категории AI и машинное обучение
Улучшить работу Claude Code и работа с написанием софтаСейчас разрабатываю СРМ и Аналитику, софт. Делаю через Клод Код, но понимаю что результаты не лучшие в плане изменений. Есть 2 задачи - Нужно помочь сделать пресет по навыкам, мд и так далее чтобы улучшить качество. Взять проверенные с которыми работали, а не с интернета… AI и машинное обучение, Python ∙ 2 часа 33 минуты назад ∙ 16 ставок |
Ищу разработчика AI-агентов и автоматизации для бизнеса.
44 349 UAH
Интересуют агенты для: — Продаж и квалификация лидов — Маркетинг и контент — Поддержка клиентов — Аналитика и отчётность — Внутренние процессы (HR, база знаний) — Специализированные ниши (недвижимость, медицина, юридические услуги) Если есть опыт или готовые решения —… AI и машинное обучение, Разработка ботов ∙ 2 часа 51 минута назад ∙ 21 ставка |
Нужен специалист для обучения модели детекции объектов на архитектурных чертежах1. Мета задачіНеобходимо обучить или адаптировать модель для автоматического поиска и классификации элементов на архитектурных чертежах интерьерных проектов.Система должна находить объекты на планах, обводить их bbox/контуром, определять класс объекта и возвращать результат в… AI и машинное обучение ∙ 3 часа 24 минуты назад ∙ 3 ставки |
ИИ-агент в телеграм для интернет-магазина
20 000 UAH
Задача: создание AI-агента в телеграм, для живого общения с клиентами и оформления заказов в ИМ на Опенкарте, также необходимо реализация информирования клиентов в статусах заказов, режиме работы магазина, условиях работы, сроках доставки и прочих вопросов, связанных с работой… AI и машинное обучение, Разработка ботов ∙ 16 часов 27 минут назад ∙ 51 ставка |
Доработка вебсайта нa Claude Code
8000 UAH
МЫ делаем сайт для публикации недвижимости. Уже есть основная часть проекта, лендинг и портал, админка. Все уже работает коректно по факту, но есть доработки которые требуют внимания и профессионализма. Более детально задачи предоставим после согласования кандидатуры. Попрошу… AI в дизайне, AI и машинное обучение ∙ 21 час 54 минуты назад ∙ 40 ставок |