Дослідники з Колумбійського університету створили модель штучного інтелекту, яка передбачає активність генів у будь-якій людській клітині, просуваючи дослідження та лікування захворювань. Він уже розкрив механізми, що стоять за дитячою лейкемією, і може виявити приховані функції геному.
Дослідники з коледжу лікарів і хірургів Вагелос Колумбійського університету розробили новий метод штучного інтелекту, який точно передбачає активність генів у будь-якій клітині людини, по суті розкриваючи внутрішні механізми клітини. Детально описана в останньому номері журналу Nature , ця система може революціонізувати те, як вчені вивчають рак, генетичні розлади та інші захворювання.
«Прогнозні узагальнювані обчислювальні моделі дозволяють швидко та точно розкривати біологічні процеси. Ці методи можуть ефективно проводити великомасштабні обчислювальні експерименти, посилюючи та спрямовуючи традиційні експериментальні підходи», — каже Рауль Рабадан, професор системної біології та старший автор нової статті.
Традиційні методи дослідження в біології добре допомагають виявити, як клітини виконують свою роботу або реагують на порушення. Але вони не можуть робити прогнози щодо того, як клітини працюють або як клітини реагуватимуть на зміни, наприклад, на мутацію, що викликає рак.
«Здатність точно прогнозувати діяльність клітини змінила б наше розуміння фундаментальних біологічних процесів», — каже Рабадан. «Це перетворило б біологію з науки, яка описує, здавалося б, випадкові процеси, на науку, яка може передбачити основні системи, які керують поведінкою клітин».
Останніми роками накопичення величезної кількості даних із клітин і більш потужні моделі штучного інтелекту починають перетворювати біологію на більш прогностичну науку. Нобелівська премія з хімії 2024 року була присуджена дослідникам за їх новаторську роботу з використання штучного інтелекту для прогнозування структур білка. Але використання методів штучного інтелекту для прогнозування активності генів і білків у клітинах виявилося складнішим.
Новий метод ШІ передбачає експресію генів у будь-якій клітині
У новому дослідженні Рабадан і його колеги намагалися за допомогою ШІ передбачити, які гени активні в конкретних клітинах. Така інформація про експресію генів може розповісти дослідникам про особу клітини та про те, як клітина виконує свої функції.
«Попередні моделі були навчені на даних конкретних типів клітин, як правило, ліній ракових клітин або чогось іншого, що мало схоже на нормальні клітини», — говорить Рабадан. Сі Фу, аспірант лабораторії Рабадана, вирішив застосувати інший підхід, навчивши модель машинного навчання на даних експресії генів мільйонів клітин, отриманих із нормальних тканин людини. Вхідні дані складалися з послідовностей геномів і даних, які показували, які частини геному доступні та експресуються.
Загальний підхід нагадує спосіб роботи ChatGPT та інших популярних «основних» моделей. Ці системи використовують набір навчальних даних, щоб визначити базові правила, граматику мови, а потім застосувати ці виведені правила до нових ситуацій. «Тут це абсолютно те ж саме: ми вивчаємо граматику в багатьох різних клітинних станах, а потім переходимо в певний стан — це може бути хворий або нормальний тип клітини — і ми можемо спробувати побачити, наскільки добре ми передбачили закономірності на основі цієї інформації», — каже Рабадан.
Фу і Рабадан незабаром залучили команду співробітників, включаючи співавторів Алехандро Буендіа, тепер аспіранта Стенфордського університету, який раніше працював у лабораторії Рабадан, і Шентонга Мо з Карнегі-Меллона, щоб навчити та випробувати нову модель.
Після навчання на даних понад 1,3 мільйона клітин людини система стала достатньо точною, щоб передбачити експресію генів у типах клітин, яких вона ніколи не бачила, даючи результати, які дуже узгоджуються з експериментальними даними.
Нові методи штучного інтелекту виявляють причини дитячого раку
Далі дослідники показали потужність своєї системи штучного інтелекту, коли вони попросили її розкрити все ще приховану біологію хворих клітин, у цьому випадку успадковану форму дитячого лейкемії.
«Ці діти успадковують мутований ген, і було незрозуміло, що саме роблять ці мутації», — каже Рабадан, який також керує дослідницькою програмою геноміки та епігеноміки раку в Колумбійському всебічному онкологічному центрі імені Герберта Ірвінга.
За допомогою ШІ дослідники передбачили, що мутації порушують взаємодію між двома різними факторами транскрипції, які визначають долю лейкемічних клітин. Лабораторні експерименти підтвердили передбачення ШІ. Розуміння ефекту цих мутацій відкриває конкретні механізми, які спричиняють це захворювання.
AI може виявити «темну матерію» в геномі
Нові обчислювальні методи також повинні дозволити дослідникам почати досліджувати роль «темної матерії» геному — термін, запозичений з космології, який відноситься до переважної більшості геному, який не кодує відомих генів — у розвитку раку та інших захворювань.
«Переважна більшість мутацій, виявлених у хворих на рак, знаходяться в так званих темних областях геному. Ці мутації не впливають на функцію білка і залишаються здебільшого невивченими. каже Рабадан. «Ідея полягає в тому, що за допомогою цих моделей ми можемо дивитися на мутації та висвітлювати цю частину геному».
Рабадан вже працює з дослідниками з Колумбійського та інших університетів, досліджуючи різні види раку, від раку мозку до раку крові, вивчаючи граматику регуляції в нормальних клітинах і те, як клітини змінюються в процесі розвитку раку.
Ця робота також відкриває нові шляхи для розуміння багатьох хвороб, окрім раку, і потенційного визначення цілей для нових методів лікування. Представляючи нові мутації в комп’ютерній моделі, дослідники тепер можуть отримати глибоке розуміння та прогнози щодо того, як саме ці мутації впливають на клітину. Слідом за іншими нещодавніми досягненнями в області штучного інтелекту для біології, Рабадан бачить цю роботу як частину головної тенденції: «Це справді нова ера в біології, яка надзвичайно захоплююча; перетворення біології в науку про прогнозування».