Транскрипция аудио с разбиением по авторам и многомодульной проверкой
3000 UAH### Описание проекта:
Мы ищем разработчика на Python с опытом работы с API для распознавания речи и машинного обучения для модернизации существующего скрипта транскрипции. Проект направлен на создание продвинутой системы, которая оптимизирует процесс транскрипции аудиофайлов с разбиением по авторам разговора. Система будет использовать несколько сервисов для распознавания речи (Google Cloud Speech-to-Text, Whisper, Microsoft Azure Speech), а также применять машинное обучение для улучшения качества и точности транскрипции.
### Основные задачи проекта:
1. **Модификация существующего скрипта:**
- Интеграция API различных сервисов распознавания речи: Google Cloud Speech-to-Text, Whisper, и Microsoft Azure Speech для улучшения качества распознавания. (есть Whisper, нужны остальные модели)
- Разработка логики выбора наилучшего сервиса для конкретного фрагмента аудио на основе качества и стоимости.
2. **Разработка механизма длинных фрагментов:**
- Автоматическое разбиение аудио на длинные и короткие фрагменты. (уже есть)
- Обработка длинных фрагментов с использованием расширенных возможностей выбранных сервисов распознавания.
3. **Интеграция и оптимизация GPT для анализа контекста:**
- Интеграция GPT-модели для проверки и улучшения качества транскрипции путем анализа контекста разговора.(есть промты для теста)
- Разработка алгоритмов обработки возвращаемых GPT моделью выводов для корректировки и дополнения полученной транскрипции.
4. **Тестирование и валидация системы:**
- Проведение комплексного тестирования системы на различных типах аудиоматериалов.
- Анализ точности, скорости и стоимости транскрипций, полученных с использованием разных сервисов и алгоритмов.
5. **Разработка пользовательского интерфейса:**
- Создание простого и интуитивно понятного интерфейса для запуска скрипта и просмотра результатов. (обсуждаемо)
### Требования к квалификации:
- Знание языка программирования Python и опыт работы не менее 3 лет.
- Опыт работы с API для распознавания речи (Google Cloud Speech-to-Text, Whisper, Microsoft Azure Speech) и другими облачными сервисами.
- Опыт работы с машинным обучением, особенно с моделями для обработки естественного языка, такими как GPT-3.
- Понимание принципов обработки и анализа аудиоданных.
- Способность к анализу и решению сложных задач.
- Внимание к деталям и стремление к высокому качеству выполнения работы.
### Ожидаемые результаты:
К концу проекта разработчик должен предоставить готовую систему, способную:
- Автоматически разбивать аудио на фрагменты и определять авторов речи.
- Оптимально распределять фрагменты между различными сервисами распознавания для получения наилучшего результата.
- Использовать GPT для анализа контекста и повышения точности транскрипции.
- Предоставлять отчеты о качестве и стоимости процесса транскрипции.
### Бюджет и сроки:
Бюджет проекта и сроки его выполнения будут согласованы с разработчиком после подробного обсуждения объема работы и оценки времени на реализацию всех функций.
### Процесс отбора:
1. Рассмотрение портфолио и опыта работы с аналогичными задачами.
2. Собеседование для обсуждения деталей проекта и возможности реализации задуманного.
3. Обсуждение условий сотрудничества и подписание контракта.
Актуальные фриланс-проекты в категории AI и машинное обучение
Создание ИИ ассистента для коммуникации с КлиентамиНеобходимо создать ИИ ассистента для коммуникации с Клиентами. Окно чата будет расположено на нашем сайте, далее идет общение с ботом. Вопросы по продукции, настройкам, возможностям и т.д. В случае, когда неизвестная информация или запрос, на который может ответить только… AI и машинное обучение, Консультирование по AI ∙ 4 часа 54 минуты назад ∙ 25 ставок |
Ищу видеомонтажёра, создающего ролики ИИСоздание AI-видео для стоматологов и других экспертов Цель: Создание коротких вертикальных видео для Instagram Reels, Facebook Reels, TikTok и YouTube Shorts, которые объясняют сложные темы простым языком и удерживают внимание зрителя за счет сочетания AI-анимации и видео… AI и машинное обучение ∙ 12 часов 27 минут назад ∙ 1 ставка |
Ищу ментора / преподавателя по ComfyUI для онлайн-обучения (работа через RunPod)
700 UAH
Добрый день. Ищу практикующего специалиста и ментора, который поможет мне освоить работу с ComfyUI. Главная особенность моего запроса — работа будет происходить полностью в облаке, без загрузки программы на локальный компьютер. Я планирую арендовать видеокарту через сервис… AI и машинное обучение ∙ 23 часа 1 минута назад ∙ 1 ставка |
ИИ-агент технолога спортивного питанияАгент помогает разрабатывать рецептуры новых продуктов спортивного питания — протеиновых батончиков, протеинов, предтреников, изотоников, батончиков и т.д. Главная особенность: агент знает законодательство разных стран и автоматически учитывает его при создании рецептуры. То… AI и машинное обучение, Веб-программирование ∙ 23 часа 25 минут назад ∙ 53 ставки |
Интеграция системы аналитики с Базой данных в Таблицах
5000 UAH
Необходимо довести текущую систему аналитики до стабильного рабочего состояния. Сейчас данные из CRM, телефонии и рекламных кабинетов подтягиваются через Supabase через МСП, затем в гугл таблицы, но часть процессов еще приходится контролировать вручную. Это нужно убрать.1.… AI и машинное обучение, Разработка ботов ∙ 1 день 13 часов назад ∙ 30 ставок |