Голосовий AI-асистент на сайті: простий прототип
Ідея створити голосового #AI-помічника, який розуміє мову і відповідає змістовно, виникла досить просто. Багато сервісів пропонують чат-ботів, але вони часто обмежені текстом або формальним спілкуванням. Хотілося зробити так, щоб користувач міг просто заговорити зі своїм комп’ютером чи телефоном і отримати реальні, корисні відповіді — без зайвих кліків і довгого очікування.
Як це працює:
Для розпізнавання голосу я використав стандартний Web Speech API, який підтримують сучасні браузери. Це дозволяє просто натиснути кнопку і говорити, а браузер розпізнає текст і відправляє його далі на обробку.
Відповіді генеруються за допомогою великих мовних моделей (LLM), які працюють через API — це дає змогу отримувати якісні та релевантні відповіді без складної локальної інфраструктури.
Озвучення відповідей зроблене через бібліотеку ResponsiveVoice, яка наразі дає найприродніші голоси для веб-інтерфейсу. Хоча спочатку була спроба — додати підтримку локальних голосів, наприклад RHVoice, але вони звучали менш природно.
Як це працює:
Для розпізнавання голосу я використав стандартний Web Speech API, який підтримують сучасні браузери. Це дозволяє просто натиснути кнопку і говорити, а браузер розпізнає текст і відправляє його далі на обробку.
Відповіді генеруються за допомогою великих мовних моделей (LLM), які працюють через API — це дає змогу отримувати якісні та релевантні відповіді без складної локальної інфраструктури.
Озвучення відповідей зроблене через бібліотеку ResponsiveVoice, яка наразі дає найприродніші голоси для веб-інтерфейсу. Хоча спочатку була спроба — додати підтримку локальних голосів, наприклад RHVoice, але вони звучали менш природно.