Наука

Вперше нейронна мережа фіксує «важливий аспект людського інтелекту»

0

Нейронні мережі тепер можуть «мислити» більше, як люди, ніж будь-коли раніше, показали вчені в новому дослідженні. Дослідження, опубліковане в середу (25 жовтня) в журналі Nature, сигналізує про зміну десятирічної дискусії в когнітивній науці — галузі, яка досліджує, який тип комп’ютера найкраще представлятиме людський розум. Починаючи з 1980-х років, підгрупа вчених-когнітивістів стверджувала, що нейронні мережі, тип штучного інтелекту (ШІ), не є життєздатними моделями розуму, оскільки їхня архітектура не здатна вловити ключову характеристику людського мислення. 

Але після навчання нейронні мережі тепер можуть отримати цю людську здатність.

«Наша робота свідчить про те, що цей важливий аспект людського інтелекту… можна отримати на практиці, використовуючи модель, яка була відхилена через відсутність цих здібностей», – співавтор дослідження Бренден Лейк, доцент кафедри психології та науки про дані в Університеті Нью- Йорка, розповів Live Science.

Нейронні мережі певною мірою імітують структуру людського мозку, оскільки їх вузли обробки інформації пов’язані один з одним, а обробка даних відбувається в ієрархічних рівнях. Але історично системи штучного інтелекту поводилися не так, як людський розум, тому що їм бракувало здатності поєднувати відомі концепції по-новому — здатності, що називається «систематичною композицією».

Наприклад, Лейк пояснив, що якщо стандартна нейронна мережа вивчає слова «хоп», «двічі» та «по колу», їй потрібно показати багато прикладів того, як ці слова можна об’єднати у значущі фрази, такі як «хоп». двічі» і «стрибок по колу». Але якщо потім системі буде введено нове слово, наприклад «spin», їй знову знадобиться переглянути купу прикладів, щоб навчитися використовувати його подібним чином. 

У новому дослідженні Лейк і його співавтор Марко Бароні з Університету Помпеу Фабра в Барселоні протестували як моделі штучного інтелекту, так і людей-добровольців, використовуючи вигадану мову з такими словами, як «dax» і «wif». Ці слова відповідали або кольоровим крапкам, або функції, яка якимось чином маніпулювала порядком цих крапок у послідовності. Таким чином, послідовності слів визначали порядок появи кольорових крапок. 

Читайте також -  Вчені вперше створили тваринні клітини, здатні до фотосинтезу

Отже, отримавши безглузду фразу, штучний інтелект і люди повинні були з’ясувати базові «граматичні правила», які визначали, які крапки йдуть зі словами. 

Люди-учасники створювали правильні послідовності крапок приблизно у 80% випадків. Коли вони зазнавали невдачі, вони допускали постійні типи помилок, наприклад, думали, що слово представляє одну крапку, а не функцію, яка перемішує всю послідовність крапок. 

Після тестування семи моделей штучного інтелекту Лейк і Бароні розробили метод під назвою метанавчання композиції (MLC), який дозволяє нейронній мережі практикувати застосування різних наборів правил до нових вивчених слів, а також надаючи відгук про те, чи застосовано вона правила правильно.

Нейронна мережа, навчена за допомогою MLC, збігалася з показниками людей у ​​цих тестах або перевищувала їх. І коли дослідники додали дані про типові помилки людей, модель штучного інтелекту припустилася тих самих помилок, що й люди.   

Автори також порівняли MLC з двома моделями на основі нейронних мереж від OpenAI, компанії, що стоїть за ChatGPT, і виявили, що і MLC, і люди показали набагато кращі результати, ніж моделі OpenAI у точковому тесті. MLC також впорався з додатковими завданнями, які передбачали тлумачення письмових інструкцій і значення речень. 

«Вони досягли вражаючого успіху в цьому завданні, в обчисленні значення речень», — сказав Пол Смоленскі, професор когнітивних наук університету Джонса Хопкінса та старший головний науковий співробітник Microsoft Research, який не брав участі в новому дослідженні. Але модель все ще була обмежена у своїй здатності до узагальнення. «Він міг працювати з типами речень, на яких його навчали, але він не міг узагальнити для нових типів речень», — сказав Смоленський Live science.

З усім тим, «до цієї статті нам справді не вдалося навчити мережу бути повністю композиційною», — сказав він. «Я вважаю, що саме тут їхня газета просуває речі вперед», незважаючи на поточні обмеження.

Читайте також -  Вчені представили нові матеріали для термоядерних реакторів

Розвиток здатності MLC демонструвати композиційне узагальнення є важливим наступним кроком, додав Смоленський.

«Це головна властивість, яка робить нас розумними, тому нам потрібно це досягти», — сказав він. «Ця робота спрямовує нас у цьому напрямку, але не пригнічує». Джерело

Comments

Comments are closed.

error: Вміст захищено!!!