ASR и TTS


При создании смартапов вы можете применять дополнительные технологии:

  • ASR (Automatic Speech Recognition) — распознавание речи;
  • TTS (Text To Speech) — синтез речи.

Синтез речи

Чтобы речь ассистентов была более живой и разнообразной, используется специальная разметка текста, из которого синтезируется речь любого ассистента. Для каждого ассистента есть множество вариантов предзаписанного произношения популярных восклицаний и междометий. Эти инструменты помогут создать оживлённую и интересную речь любого ассистента. В своих смартапах вы также можете использовать библиотеку звуков, предлагающую широкий набор различных звуковых эффектов на разные случаи жизни.

Подробнее об этих инструментах читайте в этих разделах:

Распознавание речи

Многим приложениям требуется точное распознавание фраз пользователя и быстрый ответ от ассистента. Чтобы уменьшить время отклика ассистента в приложении и верно понимать пользователя, используются контексты и хинты.

Контексты и хинты - это набор текстовых подсказок и функций, которых сервис распознавания речи не знает, так как заново обрабатывает каждую фразу пользователя. Применение контекстов и хинтов помогает улучшить обработку речи и быстрее выполнить действие, которое ожидает пользователь. Улучшение обработки достигается путём передачи контекстов и хинтов в сервис распознавания речи.

Подробнее о контекстах и хинтах читайте в этих разделах:

Заметили ошибку?

Выделите текст и нажмите Ctrl + Enter, чтобы сообщить нам о ней