ASR и TTS


При создании смартапов вы можете применять дополнительные технологии:

  • ASR (Automatic Speech Recognition) — распознавание речи;
  • TTS (Text To Speech) — синтез речи.

Распознавание речи

Многим приложениям требуется точное распознавание фраз пользователя и быстрый ответ от ассистента. Чтобы уменьшить время отклика ассистента в приложении и верно понимать пользователя, используются контексты и хинты.

Контексты и хинты — это набор текстовых подсказок и функций, которые неизвестны сервису распознавания речи. Применение контекстов и хинтов улучшает обработку речи и позволяет быстрее выполнить действие, которое ожидает пользователь.

Улучшение обработки достигается путем передачи контекстов и хинтов в сервис распознавания речи. Подробнее читайте в разделах Хинты и Контексты.

Синтез речи

Речь любого ассистента синтезируется из текста. Чтобы эта речь была более живой и разнообразной, используется специальная разметка текста — SSML.

Также для каждого ассистента предзаписано множество вариантов произношения популярных восклицаний и междометий. Подробнее об этом в разделе Поддерживаемые символы.

Дополнительно вы можете использовать в своих смартапах библиотеку звуков с широким набором звуковых эффектов. Подробнее читайте в разделе Библиотека звуков.

Использовать речевые технологии можно отдельно от инструментария SmartMarket Studio. Подробнее об этом в разделе SmartSpeech.

Заметили ошибку?

Выделите текст и нажмите Ctrl + Enter, чтобы сообщить нам о ней