Технології

Xiaomi перевершує конкурентів завдяки технології розпізнавання звуку

0

Xiaomi досягла помітної віхи завдяки своєму власно розробленому алгоритму розпізнавання звуку, досягнувши значного прогресу в області завдань аудіотегування. Використовуючи аудіодані з загальнодоступного набору даних AudioSet-2M для навчання, модель аудіотегування Xiaomi вперше досягла показника, що перевищує 50 мАП. Це досягнення позиціонує алгоритм розпізнавання звуку Xiaomi як лідера на світовій арені.

Технологія розпізнавання звуку Xiaomi

Прорив Xiaomi в технології розпізнавання звуку

Щоб забезпечити контекст, Google розділив набір даних AudioSet на три частини, причому перші дві підмножини, відомі під загальною назвою «AudioSet-2M», використовувалися для навчальних цілей. Саме в рамках цього навчального набору даних модель алгоритму розпізнавання звуку Xiaomi перевищила поріг у 50 мАП, встановивши новий стандарт у технології аудіотегування.

Крім того, Xiaomi представила міні-версію цієї моделі, розроблену для сценаріїв з обмеженими ресурсами. Незважаючи на зменшений розмір, ця модель Mini перевершує аналогічні моделі інших організацій.

Цей технологічний прогрес має практичну цінність, оскільки його можна широко застосовувати до інтелектуальних пристроїв Xiaomi, покращуючи загальний досвід користувача. Алгоритм відмінно розпізнає різні звуки навколишнього середовища, такі як дитячий плач, шум тварин, автомобільних двигунів тощо, і може представляти ці звуки в різних формах, як-от текст.

Крім того, роботи Xiaomi отримують велику користь від цієї технології алгоритму. Гуманоїдний робот CyberOne може розпізнавати 85 типів звуків навколишнього середовища та сприймати широкий спектр людських емоцій за допомогою слуху. Біоміметичний чотириногий робот другого покоління CyberDog 2 може ідентифікувати 38 типів звуків навколишнього середовища, що ще більше покращує його можливості динамічного реагування.

Comments

Comments are closed.