Бюджет: 100000 UAH Срок: 180 дней
Здравствуйте! Около года ведется работа в этом направлении в т.ч. и на сейчас есть математические модели решения задачи оценки и распознавания звука с целью детальной обработки речевого сигнала, идентификации клиента по голосовым данным.
Ориентировочные сроки завершения и разработки бетта версии приложения 2019.10.8
Решение в т.ч. для автоматизации анализа звуковых дорожек для Колл-Центров в т.ч. можно автоматизировать:
1. Тематика запроса клиента (Что интересует клиентов)
2. Какие проблемы возникают у клиентов при общении с оператором
3. Почему снижаются продажи, качество
4. Лексико-семантический анализ разговора
5. Автоматический контроль качества ведения диалога, например:
-Процент длительности тишины;
-Процент одновременной речи клиента и оператора;
-Анализ эмоционального состояния...
Предварительные результаты оценки формант и сегментация речевого сигнала
По данному направлению ведутся исследования оценки социально-личностных компетенций и диагностики мотивационно-ценностной составляющих клиента при ведении диалога в голосовом режиме. В основе методов обработки звуковых дорожек положены:
1. Метод пространственно-временной обработки данных, спектральный анализ.
2. Artificial Neural Network – методы распознавания, основанный на искусственных нейронных сетях
3. Методы, использующие скрытые модели Маркова и опорных векторов.
В задача распознавания отдельных слов и фильтрация помех решена на уровне моделирования и подготовки к созданию ядра программы.
Речевая информация (РИ) кодируется формантной структурой (частотой формант и их динамикой). Но частота особенно первых формант существенно зависит от частоты основного тона голоса: повышается при повышении голоса и снижается при понижении основного тона речи. Изменения во времени основного тона голоса – это важнейшее средство эмоциональной выразительности (интонации голоса). Решая задачу восприятия и переработки логической и эмоциональной информации
речи в мозгу человека имеются два специализированных и вместе с тем взаимодействующих отдела: левое полушарие мозга – для логики, правое – для эмоций.
Нами подготовлены математические модели для решения задач предварительной фильтрации, сегментации слов (на основе анализа mel-коэффициентов) и оценка формантов речевого сигнала (РС). Из предварительного анализа представленных результатов можно сделать вывод, что объем вокализованных сегментов РС в речи, превышает объем невокализованных сегментов. Полученные результаты и математические модели позвол