Розвиток нової теорії, як правило, асоціюється з великими фізиками. Ви можете згадати, наприклад, Ісаака Ньютона чи Альберта Ейнштейна. За нові теорії вже присуджено багато Нобелівських премій. Дослідники з Forschungszentrum Jülich тепер запрограмували штучний інтелект, який також впорався з цим.
Їхній ШІ здатний розпізнавати шаблони в складних наборах даних і формулювати їх у фізичній теорії. Розвиток нової теорії, як правило, асоціюється з великими фізиками. Ви можете згадати, наприклад, Ісаака Ньютона чи Альберта Ейнштейна. За нові теорії вже присуджено багато Нобелівських премій. Дослідники з Forschungszentrum Jülich тепер запрограмували штучний інтелект, який також впорався з цим. Їхній ШІ здатний розпізнавати шаблони в складних наборах даних і формулювати їх у фізичній теорії.
У наступному інтерв’ю професор Моріц Геліас з Інституту перспективного моделювання Forschungszentrum Jülich (IAS-6) пояснює, що таке «фізика штучного інтелекту» та наскільки вона відрізняється від звичайних підходів.
Як фізики приходять до нової теорії?
Зазвичай ви починаєте зі спостережень за системою, перш ніж спробувати запропонувати, як різні компоненти системи взаємодіють один з одним, щоб пояснити спостережувану поведінку. Потім на основі цього виводяться нові прогнози, які перевіряються. Відомим прикладом є закон тяжіння Ісаака Ньютона. Він не тільки описує силу тяжіння на Землі, але також може використовуватися для досить точного прогнозування руху планет, супутників і комет, а також орбіт сучасних супутників.
Однак шляхи, якими досягаються такі гіпотези, завжди відрізняються. Ви можете почати із загальних принципів і основних рівнянь фізики та вивести з них гіпотезу, або ви можете вибрати феноменологічний підхід, обмежившись якомога точним описом спостережень без пояснення їх причин. Складність полягає у виборі хорошого підходу з багатьох можливих підходів, його адаптації, якщо необхідно, та спрощенні.
Який підхід ви використовуєте до ШІ?
Загалом, це передбачає підхід, відомий як «фізика для машинного навчання ». У нашій робочій групі ми використовуємо методи фізики для аналізу та розуміння складної функції ШІ.
Ключова нова ідея, розроблена Клаудією Мергер з нашої дослідницької групи, полягала в тому, щоб спочатку використати нейронну мережу, яка навчиться точно відображати спостережувану складну поведінку в простішій системі. Іншими словами, ШІ прагне спростити всі складні взаємодії, які ми спостерігаємо між компонентами системи. Потім ми використовуємо спрощену систему та створюємо зворотне відображення за допомогою навченого ШІ. Повертаючись від спрощеної системи до складної, ми розробляємо нову теорію. На зворотному шляху складні взаємодії по частинах складаються зі спрощених. Зрештою, підхід не дуже відрізняється від підходу фізика, з тією різницею, що спосіб, у який збираються взаємодії, тепер зчитується з параметрів ШІ. Цей погляд на світ – пояснюючи його взаємодією між його різними частинами, які підпорядковуються певним законам – є основою фізики, звідси й термін «фізика ШІ».
У яких програмах використовувався ШІ?
Ми використали, наприклад, набір даних чорно-білих зображень із рукописними цифрами, який часто використовують у дослідженнях при роботі з нейронними мережами. У рамках своєї докторської дисертації Клаудія Мергер досліджувала, як малі субструктури на зображеннях, такі як краї чисел, складаються із взаємодії між пікселями. Виявлено групи пікселів, які мають тенденцію бути яскравішими разом і таким чином впливають на форму краю числа.
Наскільки велике обчислювальне зусилля?
Використання штучного інтелекту – це трюк, який робить розрахунки можливими в першу чергу. Ви дуже швидко досягаєте дуже великої кількості можливих взаємодій. Без використання цього трюку ви могли б дивитися лише на дуже маленькі системи. З усім тим, обчислювальні зусилля все ще великі, що пов’язано з тим, що існує багато можливих взаємодій навіть у системах з багатьма компонентами. Однак ми можемо ефективно параметризувати ці взаємодії, щоб тепер ми могли переглядати системи з приблизно 1000 взаємодіючими компонентами, тобто областями зображення до 1000 пікселів. У майбутньому завдяки подальшій оптимізації також мають стати можливими набагато більші системи.
Чим цей підхід відрізняється від інших ШІ, таких як ChatGPT?
Багато ШІ прагнуть вивчити теорію даних, які використовуються для навчання ШІ. Однак теорії, які вивчає ШІ, зазвичай не можна інтерпретувати. Натомість вони неявно приховані в параметрах навченого ШІ. Навпаки, наш підхід виділяє вивчену теорію та формулює її мовою взаємодії між компонентами системи, яка лежить в основі фізики. Таким чином, він належить до області пояснюваного ШІ, зокрема до «фізики ШІ», оскільки ми використовуємо мову фізики, щоб пояснити те, чого навчився ШІ. Ми можемо використовувати мову взаємодії, щоб побудувати міст між складною внутрішньою роботою ШІ та теоріями, зрозумілими людям.