Науковці захоплюються "скринькою Пандори" мапи сімейств вирахуваних білкових структур.

 

Небачені раніше форми та несподівані зв'язки між білками виявлені шляхом аналізу їхньої форми.

 

 

Білковий всесвіт щойно став значно яскравішим.

 

Дослідники видобули базу даних, що містить структуру майже кожного відомого білка – понад 200 мільйонів записів, передбачених за допомогою революційної нейронної мережі AlphaFold від Google DeepMind. Ця робота відкрила абсолютно нові форми, несподівані зв'язки в механізмі життя та інші відкриття, які були б немислимі ще кілька років тому.

 

"Завдяки AlphaFold тепер можемо досліджувати цілі родини білків, про які ми нічого не знали", – каже Едуард Порта Пардо, обчислювальний біолог із Науково-дослідного інституту лейкемії ім. Хосе Каррераса (IJC) в Барселоні (Іспанія), який не брав участі в парі досліджень, опублікованих 13 вересня в журналі Nature.

 

Минулого року Google DeepMind використовував AlphaFold для прогнозування структури майже кожного відомого білка з організмів із даними геному, зібравши близько 214 мільйонів структур у базі даних AlphaFold, яка розміщена в Європейському інституті біоінформатики Європейської лабораторії молекулярної біології (EMBL-EBI) в Гінкстоні, Сполучене Королівство.

 

 

Структурні кластери

 

Науковці миттєво оцінили ресурс, але багато хто з них дивився лише на одну структуру або сім'ю споріднених структур, розповідає Мартін Штайнеґґер, комп'ютерний біолог із Сеульського національного університету, який зацікавився картографуванням взаємозв'язків усієї бази даних: "Я подумав, що було б цікаво побачити, наскільки великим насправді є наш структурний всесвіт".

 

Для цього команда під керівництвом Штайнеґґера та комп'ютерного біолога Педро Бельтрао з Швейцарської вищої технічної школи Цюріха розробила інструмент, який міг швидко порівнювати кожну структуру в базі даних на основі схожості їхньої форми. Це дозволило ідентифікувати понад 2 мільйони "кластерів" схожих за формою білків у базі даних AlphaFold.

 

Зазвичай дослідники роблять такі порівняння, використовуючи білкові послідовності, що кодуються генами. Але білкові послідовності зазвичай у процесі еволюції змінюються швидше порівняно з їхньою структурою, обмежуючи можливість пошуку дуже віддалено споріднених білків. За оцінками Штайнеґґера, порівнявши структури білків, вони виявили в 10 разів більше кластерів споріднених білків, аніж якби використовували лише ці послідовності.

 

Дослідники тільки почали вивчати ці нещодавно знайдені "галактики" у білковому всесвіті, але вже виявили кілька дивовижних зв'язків. Наприклад, вони з'ясували, що білок, який людина та інші складні організми використовують для виявлення вірусної ДНК і швидкої імунної атаки, знаходиться у кластері з білками одноклітинних бактерій та архей – зв'язок, що раніше не був відомий, пояснює Штайнеґґер.

 

Про більш ніж третину білкових кластерів майже нічого не відомо. "Я дуже сподіваюся, що біологи проллють трохи світла на цю темряву", – каже Штайнеґґер.

 

 

Небачена раніше форма

 

Друга команда застосувала дещо інший підхід до вивчення темної матерії білкового всесвіту. Обчислювальні біологи Жоана Перейра, Джанані Дурайрадж, Торстен Шведе з Базельського університету в Швейцарії та Швейцарського інституту біоінформатики SIB і їхні колеги створили мережу, яка об'єднала понад 50 мільйонів найбільш точно передбачених структур у базі даних AlphaFold (їхній інструмент дає змогу оцінити, наскільки точними є його передбачення). Потім вони використали ці групи для виявлення деяких найтемніших куточків білкового всесвіту.

 

Приємною несподіванкою стала ніколи раніше не бачена форма білка. Дослідники прозвали її "бета-квіткою", тому що структури містять ряд шпилькових витків – знайдених у відомій формі білка, яка називається бета-бочка, – які нагадують пелюстки на квітці. Білки, які містять бета-квітки, віддалено пов'язані один з одним, але незрозуміло, що вони роблять, каже Перейра, яка вивчає цю форму детальніше.

 

"Ця робота фактично відкрила скриньку Пандори з проєктами. Ми маємо вирішити, які з них є пріоритетними", – додає Перейра. Вона та її колеги сподіваються, що інші дослідники скористаються їхньою мережею, аби побачити, як їхній улюблений білок вписується у ширший всесвіт молекул.

 

Крістін Оренго, комп'ютерний біолог з Університетського коледжу Лондона, захоплена новими способами навігації у всесвіті білків. Але вона попереджає, що деякі передбачення AlphaFold, які вважаються високоточними для всього білка, можуть менш точно відображати форму функціональних частин білка, або доменів, які цікавлять дослідників. Навіть з цими аномаліями дослідники все одно отримають скарбницю нових сімейств білків, каже Оренго, "що неймовірно хвилююче".

 

Джон Джампер, який очолює команду AlphaFold у Google DeepMind і не брав участі в жодному з досліджень, радий бачити, як дослідники розробляють нові способи вивчення всесвіту, який він і його колеги відкрили. Він розглядає ці дослідження як початок нової галузі, в якій білкові структури вивчатимуться в немислимих раніше масштабах. "Я сподіваюся, що ми побачимо більше".

 

 

 

Ewen Callaway
‘A Pandora’s box’: map of protein-structure families delights scientists
Nature, 15.09.2023

 

16.09.2023