{youtube}X4JOSVs5tm8&feature{/youtube}
Каждая из компаний-производителей популярных мобильных устройств использует разные технологии распознавания и превращения речи в текст. Google и Microsoft разрабатывают собственные, тогда как Apple развивает то, на что приобрела лицензию у Nuance, знакомой владельцам Android-устройств по технологии Dragon Dictation, встроенной в некоторые сторонние проекты. Какая же из этих технологий качественнее всего превращает нормальную речь на английском языке в текст на экране — показывает видео от Pocketnow.
В тестировании участвовали: Nexus 7 производства ASUS с Android 4.2 внутри, iPad первой половины года с iOS 6.0.1 и Nokia Lumia 920 с Windows Phone 8. Все они были подключены к одной Wi-Fi-сети и тут же мы видим первое различие — для голосового ввода на Android-устройстве теперь не нужно подключение, распознавание происходит на самом планшете, iOS и WP8 для этого необходим выход в интернет.
Тестирование в режиме «начитывания для набора» (то есть со слегка пониженным темпом и улучшенным акцентированием) показало, что Android и iOS примерно одинаково переводят речь в текст, Apple лишь чуть впереди. Windows Phone 8 также справилась неплохо, но выяснилась проблема системы — она слишком рано перестает распознавание — длинные фразы и фразы с долгими паузами остаются без перевода. Дальнейшее начитывание со знаками препинания показало, что обе лидирующие системы распознают их без проблем, а вот Windows Phone 8 даже не пытается их поставить, просто пишет слово.
Отдельно стоит упомянуть про тест в шумном помещении. Здесь Android показал себя с лучшей стороны, вычленив речь из окружающего шума и сделав лишь небольшие ошибки. iOS половину фразу заменил на непонятые слова, на смартфон с ОС от Microsoft вообще не стоит начитывать текст на кухне с открытым краном или в схожих условиях. Правда, нельзя не напомнить, что вычленение шума из поступающего сигнала в немалой степени зависит от конкретного устройства и системы шумоподавления в нем.
Наконец, последний тест на чтение скороговорок и речи в режиме разговора, то есть без специального акцентирования, показал, что с первой задачей справляется лучше всего iOS, Android и Windows Phone 8 отстают. Вторая же задача оказалась не по зубам для всех систем, хотя это конечно зависит от конкретного произносящего фразы человека. Кстати, правильно распознать имя Jaime смог только iPad.
В «сухом» итоге Android и iOS показали прекрасные результаты, тогда как Microsoft стоит поработать над распознаванием. Удивительно, что еще пару лет назад система распознавания голоса от Google была худшей из всех доступных. Они принципиально не стали покупать ее у Nuance, как это сделали в Apple, а работали над собственной, по пути все же переманив несколько специалистов из этой компании. Посмотрим, насколько уйдут эти технологии через год-полтора и сможет ли Microsoft догнать конкурентов.
Голосовой ввод на современных мобильных платформах: 4 комментария