Фото: Janellie/Flickr
Мобильные устройства все чаще используются для выхода в интернет, работы с различными сервисами и приложениями, а крупнейшие технологические компании развивают естественные интерфейсы ввода для облегчения работы в любых условиях. Пусть большую часть времени пользователи используют виртуальную клавиатуру, не сложно представить ситуации, когда это затруднительно. Вождение автомобиля, прогулки и пробежки, холодное время года, даже возня на кухне — все это накладывает ограничение на полноценное использование смартфонов и планшетов. На выручку приходят голосовые технологии.
Сегодня компания Яндекс представила мультиплатформенную библиотеку Yandex SpeechKit для работы с фирменной технологией распознавания речи. Новинка будет использоваться в мобильных сервисах Яндекс.Карты, Поиск, Навигатор. Но совместная разработка международной команды Яндекса из Москвы и Цюриха не останется в стенах компании — доступ к ней получат разработчиками русскоязычных приложений под iOS и Android. C помощью SpeechKit они смогут реализовывать в мобильных приложениях быстрые и высококачественные голосовые интерфейсы ввода.
На данный момент технология распознавания речи Яндекс поддерживает только русский язык. Добавление новых языков планируется, но пока не известно, когда это случится. Работать можно с двумя темами запросов: общей, то есть все то, что люди обычно ищут в интернете, и геолокационной, например, адреса и название организаций.
Разработчикам удалось добиться очень хороших показателей скорости обработки данных и точности распознавания. Для обучения акустических моделей использовалось порядка 300 часов мужской, женской и детской речи, размеченной вручную. Для обучения языковой модели использовалась сотня миллионов специально подготовленных текстов.
Представители Яндекс сообщают, что по результатам внутренних исследований, качество технологии распознавания речи выше, чем у конкурентов. Время, которое проходит с момента ввода до получения результата составляет всего лишь 1.1 секунды, при этом в общих запросах удается верно распознать 84% слов, а в геолокационных — 94%.
Но не только качеством, функционально Yandex SpeechKit также опережает другие решения мобильном на рынке. Например, Android Speech API компании Google тоже поддерживает русский язык, но технология доступна только на Android. На платформе iOS нет поддержки распознавания русского языка, и у разработчиков крайне ограниченные возможности по использованию платформенного распознавания: есть лишь возможность получить доступ к результатам в режиме диктовки.
Если говорить о примерах использования Yandex SpeechKit, с помощью новой технологии пользователи смогут без виртуальной клавиатуры искать что-нибудь в интернете, на картах, внутри приложений и даже диктовать комментарии. Иными словами SpeechKit может найти применение везде, где предусмотрено поле для текстового ввода.
Библиотеки для iOS и Android на портале Технологий
Пользовательское соглашение Yandex SpeechKit
Купить iPhone 5s вы можете в магазине Macov.net