ПЗ

Почему Siri на iPhone плохо вас слышит?

1

Процессоры, камеры и другие компоненты iPhone развиваются с каждым новым поколением устройства — в этом мы сами убеждаемся, когда берем в руки очередное поколение iPhone. Однако одному из комплектующих Apple уделяет не слишком много внимания, а ведь это мешает развиваться голосовому ассистенту компании — Siri. Apple пытается компенсировать недостаток технологиями искусственного интеллекта, но проблема на самом деле в другом.

Siri на iPhone не работает?

Дело в том, что микрофоны, установленные в смартфонах, по-прежнему отстают от остальных компонентов. Они неспособны «чисто» воспринимать голоса, фильтровать звук от шумов, поэтому зачастую Siri вас просто не понимает. Со времен iPhone 5 производительность микрофона практически не изменилась. Да, Apple добавляет новые динамики, улучшает звук, а вот работа с микрофонами пусть и ведется, однако не с той скоростью, с которой следовало бы ее производить.

Как Siri работает в сильном шуме

Чтобы убрать влияние микрофона на работу Siri, Apple внедрила анализ звукового спектра, на котором звуковые волны преобразуются в кадры по 0,01 секунды. Нейросеть (Deep Neural Network) по каждому из звуковых кадров оценивает вероятность воспроизведения тех, которые используются, когда вы говорите фразу «Привет, Siri».

DNN (Deep Neural Network) - метод машинного обучения. Глубокое обучение позволяет обучать модель и предсказывать результат по набору входных данных.

А если вокруг вас много шума, в игру вступает система, которая упрощает запуск Siri и предотвращает ложные срабатывания. Для срабатывания функции существует высший порог, низший порог и нормальный порог громкости. В этом случае Siri активируется лишь при достижении высшего порога. Если вы опять находитесь в тишине, система переключается на более чувствительный режим работы. Это позволяет пользователю активировать ассистента, сказав «Привет, Siri», не прикладывая больших усилий.

Активация Siri на Apple Watch

«Привет, Siri» срабатывает на часах Apple Watch только тогда, когда сопроцессор движения определяет жест поднятия руки. В этот момент часы выполняют большую работу. Им необходимо отобразить всю информацию на экране. При этом распознавание фразы «Привет, Siri» отводится около 5 процентов вычислительной мощности.

Как видите, в основе работы Siri лежит множество алгоритмов. Тем не менее именно микрофоны оказывают большое влияние на умение Siri понимать команды пользователей. Поэтому можно сколько угодно обучать голосовой ассистент и внедрять новые алгоритмы: пока микрофоны в iPhone не сделают большой шаг вперед, Siri не будет работать так, как мы хотим. Источник

Comments

Leave a reply