Поиск смысловых объектов в тексте, голосовая активация и синтезирование речи вошли в перечень возможностей библиотеки SpeechKit Mobile SDK и платформы, созданной на её основе - SpeechKit Cloud. Об этом "Яндекс" рассказал на конференции YaC 2014.

Вложение 16027

"Яндекс" работает над технологиями распознавания речи с 2013 года. Благодаря SpeeckKit разработчики могут использовать голосовое управление в продуктах для российского и турецкого рынков. На сегодняшний день библиотеку взяли на вооружение 600 различных компаний, а еще 500 приложений было создано с её помощью. SpeechKit распознает запросы с точностью 95%, если речь идет о географических названиях, способна понять 88% коротких фраз, а в предложениях и SMS ошибается лишь в 18% случаев.

Новые возможности библиотеки дадут разработчикам возможность запускать программы голосом и лучше понимать желания пользователей, вычленяя смысловые объекты из текста. Но самый интересный функционал - это синтезирование речи, позволяющее приложениям вести диалог с человеком.

Для демонстрации возможностей SpeechKit "Яндекс" создал приложение "Яндекс.Диктовка", которое занимается записью текстов, произносимых человеком, и затем произносит сохраненную речь. Программа начинает работу по фразе "Яндекс, записывай", и допускает корректировку текста голосовыми командами, понимая даже такие конструкции, как "сотри последнее предложение".

"Диктовка" доступна в "Яндекс.Store", на Google Play и App Store приложение появится позже.

Узнать больше о речевых технологиях и "Яндексе" можно в блоге.