Небачені раніше форми та несподівані зв'язки між білками виявлені шляхом аналізу їхньої форми.
Білковий всесвіт щойно став значно яскравішим.
Дослідники видобули базу даних, що містить структуру майже кожного відомого білка – понад 200 мільйонів записів, передбачених за допомогою революційної нейронної мережі AlphaFold від Google DeepMind. Ця робота відкрила абсолютно нові форми, несподівані зв'язки в механізмі життя та інші відкриття, які були б немислимі ще кілька років тому.
"Завдяки AlphaFold тепер можемо досліджувати цілі родини білків, про які ми нічого не знали", – каже Едуард Порта Пардо, обчислювальний біолог із Науково-дослідного інституту лейкемії ім. Хосе Каррераса (IJC) в Барселоні (Іспанія), який не брав участі в парі досліджень, опублікованих 13 вересня в журналі Nature.
Минулого року Google DeepMind використовував AlphaFold для прогнозування структури майже кожного відомого білка з організмів із даними геному, зібравши близько 214 мільйонів структур у базі даних AlphaFold, яка розміщена в Європейському інституті біоінформатики Європейської лабораторії молекулярної біології (EMBL-EBI) в Гінкстоні, Сполучене Королівство.
Структурні кластери
Науковці миттєво оцінили ресурс, але багато хто з них дивився лише на одну структуру або сім'ю споріднених структур, розповідає Мартін Штайнеґґер, комп'ютерний біолог із Сеульського національного університету, який зацікавився картографуванням взаємозв'язків усієї бази даних: "Я подумав, що було б цікаво побачити, наскільки великим насправді є наш структурний всесвіт".
Для цього команда під керівництвом Штайнеґґера та комп'ютерного біолога Педро Бельтрао з Швейцарської вищої технічної школи Цюріха розробила інструмент, який міг швидко порівнювати кожну структуру в базі даних на основі схожості їхньої форми. Це дозволило ідентифікувати понад 2 мільйони "кластерів" схожих за формою білків у базі даних AlphaFold.
Зазвичай дослідники роблять такі порівняння, використовуючи білкові послідовності, що кодуються генами. Але білкові послідовності зазвичай у процесі еволюції змінюються швидше порівняно з їхньою структурою, обмежуючи можливість пошуку дуже віддалено споріднених білків. За оцінками Штайнеґґера, порівнявши структури білків, вони виявили в 10 разів більше кластерів споріднених білків, аніж якби використовували лише ці послідовності.
Дослідники тільки почали вивчати ці нещодавно знайдені "галактики" у білковому всесвіті, але вже виявили кілька дивовижних зв'язків. Наприклад, вони з'ясували, що білок, який людина та інші складні організми використовують для виявлення вірусної ДНК і швидкої імунної атаки, знаходиться у кластері з білками одноклітинних бактерій та архей – зв'язок, що раніше не був відомий, пояснює Штайнеґґер.
Про більш ніж третину білкових кластерів майже нічого не відомо. "Я дуже сподіваюся, що біологи проллють трохи світла на цю темряву", – каже Штайнеґґер.
Небачена раніше форма
Друга команда застосувала дещо інший підхід до вивчення темної матерії білкового всесвіту. Обчислювальні біологи Жоана Перейра, Джанані Дурайрадж, Торстен Шведе з Базельського університету в Швейцарії та Швейцарського інституту біоінформатики SIB і їхні колеги створили мережу, яка об'єднала понад 50 мільйонів найбільш точно передбачених структур у базі даних AlphaFold (їхній інструмент дає змогу оцінити, наскільки точними є його передбачення). Потім вони використали ці групи для виявлення деяких найтемніших куточків білкового всесвіту.
Приємною несподіванкою стала ніколи раніше не бачена форма білка. Дослідники прозвали її "бета-квіткою", тому що структури містять ряд шпилькових витків – знайдених у відомій формі білка, яка називається бета-бочка, – які нагадують пелюстки на квітці. Білки, які містять бета-квітки, віддалено пов'язані один з одним, але незрозуміло, що вони роблять, каже Перейра, яка вивчає цю форму детальніше.
"Ця робота фактично відкрила скриньку Пандори з проєктами. Ми маємо вирішити, які з них є пріоритетними", – додає Перейра. Вона та її колеги сподіваються, що інші дослідники скористаються їхньою мережею, аби побачити, як їхній улюблений білок вписується у ширший всесвіт молекул.
Крістін Оренго, комп'ютерний біолог з Університетського коледжу Лондона, захоплена новими способами навігації у всесвіті білків. Але вона попереджає, що деякі передбачення AlphaFold, які вважаються високоточними для всього білка, можуть менш точно відображати форму функціональних частин білка, або доменів, які цікавлять дослідників. Навіть з цими аномаліями дослідники все одно отримають скарбницю нових сімейств білків, каже Оренго, "що неймовірно хвилююче".
Джон Джампер, який очолює команду AlphaFold у Google DeepMind і не брав участі в жодному з досліджень, радий бачити, як дослідники розробляють нові способи вивчення всесвіту, який він і його колеги відкрили. Він розглядає ці дослідження як початок нової галузі, в якій білкові структури вивчатимуться в немислимих раніше масштабах. "Я сподіваюся, що ми побачимо більше".
Ewen Callaway
‘A Pandora’s box’: map of protein-structure families delights scientists
Nature, 15.09.2023
16.09.2023