Apple представила нову методику навчання людиноподібних роботів, що поєднує дані від людей та машин. Підхід, названий PH2D, описаний у дослідженні Humanoid Policy ~ Human Policy, опублікованому через тиждень після анонсу нейромережевих моделей Matrix3D та StreamBridge. Дослідники акцентують увагу на недоліках традиційних методів, де навчання роботів будується виключно на власних демонстраціях. Такі підходи вимагають дорогого обладнання для телеуправління та складні у масштабуванні. PH2D вирішує проблему рахунок інтеграції даних від людей, що знижує витрати.
Для збирання інформації використовувалися модифіковані споживчі пристрої. Гарнітура Apple Vision Pro застосовувалася в урізаному форматі: лише нижня ліва камера забезпечувала візуальне спостереження, а ARKit фіксував пози голови та рук. Як бюджетну альтернативу задіяли Meta Quest зі стереокамерами ZED Mini. Учасники експериментів, використовуючи ці гарнітури, виконували завдання на кшталт захоплення предметів, підйому об’єктів та переливання рідин, супроводжуючи дії голосовими командами. Відеозаписи сповільнювали підвищення ефективності навчання.
Обробку різноманітних даних – від людини та робота – забезпечує модель HAT (Human-humanoid Action Transformer). Вона об’єднує обидва джерела в єдиній системі управління, що, згідно з дослідженням, покращує адаптацію алгоритмів до нових умов. Наприклад, роботи, навчені методом PH2D, на 15% ефективніше виконували вертикальне захоплення об’єктів проти тих, хто тренувався лише з даних інших роботів.
Ключова перевага PH2D – економічність. Використання доступних гарнітур замість спеціалізованого обладнання скорочує витрати. Це особливо важливо для Apple, яка, судячи з патентів та витоків, розробляє споживчих роботів. Раніше компанія демонструвала прототип робота-лампи, а зараз, за даними інсайдерів, тестує мобільного помічника для дому. Впровадження PH2D прискорить створення таких продуктів, проте точні терміни їхнього виходу невідомі — на травень 2025 офіційних заяв немає.
Comments