Дрони орієнтуються в невидимих середовищах за допомогою рідких нейронних мереж

У величезному просторі небес, де колись панували птахи, літає нова група авіаторів. Ці піонери в повітрі не є живими істотами, а продуктом навмисних інновацій: дрони. Але це не типові літаючі боти, які дзижчать, як механічні бджоли. Скоріше, це дива, натхненні птахами, які ширяють у небі, керовані рідкими нейронними мережами, щоб з точністю та легкістю орієнтуватися в постійно мінливих і невидимих середовищах.

Натхненні адаптивною природою органічного мозку, дослідники з Лабораторії комп’ютерних наук і штучного інтелекту Массачусетського технологічного інституту (CSAIL) запровадили метод для надійних навігаційних агентів польоту, щоб освоїти завдання польоту до цілі на основі зору в складних, незнайомих середовищах. Рідкі нейронні мережі, які можуть постійно адаптуватися до нових вхідних даних, показали майстерність у прийнятті надійних рішень у невідомих областях, таких як ліси, міські ландшафти та середовища з додатковим шумом, обертанням і оклюзією. Ці адаптивні моделі, які перевершують багато найсучасніших аналогів у навігаційних завданнях, можуть використовувати потенційні реальні застосування дронів, такі як пошук і порятунок, доставляння та моніторинг дикої природи.

Нещодавнє дослідження дослідників, опубліковане сьогодні в Science Robotics, деталізує, як ця нова порода агентів може адаптуватися до значних змін розподілу, що є давнім викликом у цій галузі. Однак новий клас алгоритмів машинного навчання команди фіксує причинно-наслідкову структуру завдань із багатовимірних, неструктурованих даних, таких як піксельні вхідні дані з камери, встановленої на дроні. Потім ці мережі можуть виділити ключові аспекти завдання (тобто зрозуміти завдання) і ігнорувати невідповідні функції, дозволяючи набутим навичками навігації безперешкодно переносити цілі в нове середовище.

«Ми в захваті від величезного потенціалу нашого підходу до керування роботами на основі навчання, оскільки він закладає основу для розв’язання проблем, які виникають під час навчання в одному середовищі та розгортання в абсолютно відмінному середовищі без додаткового навчання», — каже Даніела Рус, CSAIL. директор, а також Ендрю (1956) та Ерна Вітербі, професори електротехніки та комп’ютерних наук Массачусетського технологічного інституту.

«Наші експерименти демонструють, що ми можемо ефективно навчити безпілотник визначати місцеперебування об’єкта в лісі влітку, а потім розгортати модель взимку, у дуже різних середовищах або навіть у міських умовах, виконуючи різноманітні завдання, такі як пошук і слідування. Це адаптивність стала можливою завдяки причинно-наслідковим основам наших рішень. Ці гнучкі алгоритми одного разу можуть допомогти в прийнятті рішень на основі потоків даних, які змінюються з часом, наприклад, медична діагностика та додатки для автономного водіння».

На передньому плані стояло складне завдання: чи розуміють системи машинного навчання завдання, які їм дають на основі даних під час польоту безпілотників до немаркованого об’єкта? І чи зможуть вони перенести свої вивчені навички та завдання в нове середовище з різкою зміною пейзажу, наприклад, політ із лісу в міський ландшафт?

Щобільше, на відміну від дивовижних здібностей нашого біологічного мозку, системам глибокого навчання важко вловити причинно-наслідкові зв’язки, часто вони переналаштовують свої навчальні дані та не можуть адаптуватися до нового середовища чи умов, що змінюються. Це особливо турбує вбудовані системи з обмеженими ресурсами, як-от літальні дрони, яким потрібно долати різноманітні середовища та миттєво реагувати на перешкоди.

Рідкі мережі, навпаки, пропонують багатообіцяючі попередні ознаки їх здатності усунути цю критичну слабкість у системах глибокого навчання. Система команди спочатку була навчена на даних, зібраних людиною-пілотом, щоб побачити, як вони перенесли набуті навігаційні навички в нове середовище за різких змін ландшафту та умов. На відміну від традиційних нейронних мереж, які навчаються лише на етапі навчання, параметри рідкої нейронної мережі можуть змінюватися з часом, роблячи їх не лише придатними для інтерпретації, але й більш стійкими до неочікуваних або зашумлених даних.

У серії експериментів із замкнутим циклом керування квадроторами безпілотники пройшли випробування дальності, стрес-тести, обертання та оклюзію цілі, піші прогулянки з супротивниками, трикутні петлі між об’єктами та динамічне супроводження цілі. Вони відстежували рухомі цілі та виконували багатоетапні цикли між об’єктами в небачених раніше середовищах, перевершуючи продуктивність інших передових аналогів.

Підписуйтесь на наш Телеграм-канал