Розпізнавання китайської мови на Python і Baidu API
Скрипт на вході отримує аудіо- або відео-файл, що містить китайську розмову.
Далі витягує звуковий шлях і розпізнає через офіційний API китайського пошукового гіганта Baidu.
Обмеження на тривалість і технічні вимоги до аудіо обертаються різними маніпуляціями з файлом.
Зокрема, існує обмеження на розпізнавання не більше 1 хвилини за запитом.
Щоб цього уникнути, звукова дорога розрізається на шматочки до 60 секунд, з такою умовою, що в кожному були завершені пропозиції до точки.
Далі витягує звуковий шлях і розпізнає через офіційний API китайського пошукового гіганта Baidu.
Обмеження на тривалість і технічні вимоги до аудіо обертаються різними маніпуляціями з файлом.
Зокрема, існує обмеження на розпізнавання не більше 1 хвилини за запитом.
Щоб цього уникнути, звукова дорога розрізається на шматочки до 60 секунд, з такою умовою, що в кожному були завершені пропозиції до точки.