Голосовой ввод на современных мобильных платформах

Одна из важнейших функций современного мобильного устройства — отправка текстовой информации. Для ввода оного в большинстве мобильных операционных систем используется наэкранная виртуальная клавиатура, которая в той или иной степени повторяет компьютерную. По сути, это прямой перенос технологий пока удовлетворяет большинство пользователей, однако немало компаний и ученых работает над тем, чтобы изобрести что-то дополняющее или полностью меняющее сам принцип ввода. Один из путей дополнения — голосовой ввод, о качественной поддержке которого заявляют все производители ОС.

{youtube}X4JOSVs5tm8&feature{/youtube}

Каждая из компаний-производителей популярных мобильных устройств использует разные технологии распознавания и превращения речи в текст. Google и Microsoft разрабатывают собственные, тогда как Apple развивает то, на что приобрела лицензию у Nuance, знакомой владельцам Android-устройств по технологии Dragon Dictation, встроенной в некоторые сторонние проекты. Какая же из этих технологий качественнее всего превращает нормальную речь на английском языке в текст на экране — показывает видео от Pocketnow.

В тестировании участвовали: Nexus 7 производства ASUS с Android 4.2 внутри, iPad первой половины года с iOS 6.0.1 и Nokia Lumia 920 с Windows Phone 8. Все они были подключены к одной Wi-Fi-сети и тут же мы видим первое различие — для голосового ввода на Android-устройстве теперь не нужно подключение, распознавание происходит на самом планшете, iOS и WP8 для этого необходим выход в интернет.

Тестирование в режиме «начитывания для набора» (то есть со слегка пониженным темпом и улучшенным акцентированием) показало, что Android и iOS примерно одинаково переводят речь в текст, Apple лишь чуть впереди. Windows Phone 8 также справилась неплохо, но выяснилась проблема системы — она слишком рано перестает распознавание — длинные фразы и фразы с долгими паузами остаются без перевода. Дальнейшее начитывание со знаками препинания показало, что обе лидирующие системы распознают их без проблем, а вот Windows Phone 8 даже не пытается их поставить, просто пишет слово.

Отдельно стоит упомянуть про тест в шумном помещении. Здесь Android показал себя с лучшей стороны, вычленив речь из окружающего шума и сделав лишь небольшие ошибки. iOS половину фразу заменил на непонятые слова, на смартфон с ОС от Microsoft вообще не стоит начитывать текст на кухне с открытым краном или в схожих условиях. Правда, нельзя не напомнить, что вычленение шума из поступающего сигнала в немалой степени зависит от конкретного устройства и системы шумоподавления в нем.

Наконец, последний тест на чтение скороговорок и речи в режиме разговора, то есть без специального акцентирования, показал, что с первой задачей справляется лучше всего iOS, Android и Windows Phone 8 отстают. Вторая же задача оказалась не по зубам для всех систем, хотя это конечно зависит от конкретного произносящего фразы человека. Кстати, правильно распознать имя Jaime смог только iPad.

В «сухом» итоге Android и iOS показали прекрасные результаты, тогда как Microsoft стоит поработать над распознаванием. Удивительно, что еще пару лет назад система распознавания голоса от Google была худшей из всех доступных. Они принципиально не стали покупать ее у Nuance, как это сделали в Apple, а работали над собственной, по пути все же переманив несколько специалистов из этой компании. Посмотрим, насколько уйдут эти технологии через год-полтора и сможет ли Microsoft догнать конкурентов.

http://youhtc.ru/

Голосовой ввод на современных мобильных платформах: 4 комментария

  1. Уведомление: buy legal weed online,
  2. Уведомление: 신규토토사이트
  3. Уведомление: porn film
  4. Уведомление: nutritional shakes

Добавить комментарий

error: Вміст захищено!!!
Exit mobile version