Дослідники інноваційно об’єднали дані про структуру білка з генетичними послідовностями для побудови еволюційних дерев, виявляючи глибоко вкорінені зв’язки між видами з підвищеною точністю. Цей новий підхід використовує як експериментально визначені, так і передбачувані структури білків, потенційно революціонізуючи наше розуміння історії життя та розвиток наук про здоров’я шляхом уточнення мішеней для лікування раку тощо.
Структури білка в еволюційних дослідженнях
Згідно з дослідженням, опублікованим сьогодні (15 січня) у Nature Communications, тривимірна форма білків розкриває давні еволюційні зв’язки в дереві життя. Вперше дослідники об’єднали дані про форму білка з геномними послідовностями, щоб побудувати більш надійні еволюційні дерева. Ці дерева є життєво важливими інструментами для вчених, які допомагають їм досліджувати історію життя, відстежувати поширення патогенів і розробляти нові методи лікування хвороб.
Подолання насичення даних за допомогою білкових структур
Примітно, що цей метод працює навіть з передбачуваними білковими структурами, які не були експериментально перевірені. Завдяки таким інструментам, як AlphaFold 2, які генерують величезну кількість структурних даних, цей підхід може дати нове розуміння глибокої історії життя на Землі. Існує 210 тисяч експериментально визначених білкових структур, але 250 мільйонів відомих білкових послідовностей. Такі ініціативи, як проект EarthBioGenome, можуть створити ще мільярди білкових послідовностей протягом наступних кількох років. Велика кількість даних відкриває двері для застосування цього підходу в безпрецедентних масштабах.
Традиційні та структурно-філогенетичні підходи
Протягом багатьох десятиліть біологи реконструювали еволюцію, відстежуючи, як види та гени відрізняються від спільних предків. Ці філогенетичні або еволюційні дерева традиційно будуються шляхом порівняння послідовностей ДНК або білка та підрахунку подібностей і відмінностей для висновку про зв’язки. Однак дослідники стикаються зі значною перешкодою – проблемою, відомою як насичення. Протягом тривалого періоду геномні послідовності можуть змінюватися настільки, що перестануть бути схожими на свої предкові форми, стираючи сигнали спільної спадщини.
«Питання насичення домінує в філогенезі та є основною перешкодою для реконструкції давніх зв’язків», — каже доктор Седрік Нотредам, дослідник Центру геномної регуляції (CRG) і провідний автор дослідження. «Це схоже на розмивання стародавнього тексту. Літери стають нечіткими, і повідомлення втрачається».
Переваги використання структурних даних у філогенетиці
Щоб подолати цю проблему, дослідницька група звернулася до фізичної структури білків. Білки складаються в складні форми, які визначають функцію клітини. Ці форми більше зберігаються протягом еволюційного часу, ніж самі послідовності, тобто вони змінюються повільніше та довше зберігають ознаки предків. Форма білка визначається послідовністю його амінокислот . Хоча послідовності можуть видозмінюватися, загальна структура часто залишається подібною до функції збереження. Дослідники припустили, що вони можуть оцінити, наскільки структури розходяться з часом, вимірявши відстань між парами амінокислот у білку, також відому як внутрішньомолекулярні відстані (IMD).
Методологія та вплив структурної філогенетики
Дослідження зібрало величезний набір даних білків із відомою структурою, що охоплює широкий спектр видів. Вони розрахували IMD для кожного білка та використали ці вимірювання для побудови філогенетичних дерев. Вони виявили, що дерева, побудовані на основі структурних даних, дуже збігаються з тими, що отримані з генетичних послідовностей, але з важливою перевагою: на структурні дерева менше впливає насичення. Це означає, що вони зберігали надійні сигнали, навіть коли генетичні послідовності значно розходилися.
Практичні наслідки та майбутні застосування
Визнаючи, що і послідовності, і структури пропонують цінну інформацію, команда розробила комбінований підхід, який не лише покращив надійність гілок дерева, але й допоміг розрізнити правильні та неправильні зв’язки.
«Це схоже на те, що два свідки описують подію з різних точок зору», — пояснює доктор Лейла Мансурі, співавтор дослідження. «Кожна надає унікальні деталі, але разом вони дають більш повну та точнішу інформацію».
Одним з практичних прикладів, коли комбінований підхід може мати значний вплив, є розуміння взаємозв’язків між кіназами в геномі людини. Кінази — це білки, що беруть участь у багатьох різних важливих клітинних функціях.
«Геном більшості ссавців, у тому числі людини, містить близько 500 протеїнкіназ, які регулюють більшість аспектів нашої біології», — каже д-р Нотредам. «Ці кінази є основними мішенями для лікування раку, наприклад, таких препаратів, як іматиніб для людей або тоцераніб для собак».
Людські кінази виникли шляхом дублювання, що відбувалося протягом останнього мільярда років. «У геномі людини між найвіддаленішими кіназами становить близько мільярда років», — каже д-р Нотредам. «Вони дублюються в спільному предку спільного предка нашого спільного предка».
Цей величезний часовий масштаб неймовірно ускладнює побудову точних генних дерев, які показують, як усі ці кінази пов’язані. «Проте, яким би недосконалим воно не було, еволюційне дерево кінази широко використовується для розуміння того, як воно взаємодіє з іншими ліками. Удосконалення цього дерева або покращення дерев інших важливих сімейств білків було б важливим прогресом для здоров’я людини», – додає д-р Нотредам.
Розширення корисності еволюційних дерев
Потенційне застосування роботи виходить за рамки раку. Використання підходу для створення більш точних еволюційних дерев може також покращити наше розуміння того, як розвиваються хвороби в більш загальному плані, сприяючи розробці вакцин і методів лікування. Вони також можуть допомогти пролити світло на походження складних ознак, керувати відкриттям нових ферментів для біотехнології та навіть допомогти відстежити поширення видів у відповідь на зміну клімату.
Comments