Двадцать двадцать были вызовом для человечества, но DeepMind одержал серию побед, продемонстрировав ИИ, которые решают пятидесятилетнюю проблему сворачивания белков.

В течение последних 50 лет ученые боролись с проблемой «свертывания белков» — сопоставлением трехмерных форм белков, ответственных за различные заболевания, от рака до Covid-19.

Что такое белок и его свертывание?

· Аминокислоты являются основными строительными блоками жизни

· Белки представляют собой цепь аминокислот и являются рабочими лошадками живого организма (поставщики структур, движущие силы, катализаторы реакций и т. д.)

· Сворачивание белков, чувствительный процесс, на который влияют несколько внешних факторов, включая электрические и магнитные поля, температуру, pH, химические вещества, ограничение пространства и молекулярную скученность.

· Функция: трехмерная структура определяет его функцию.

· Задача: 10^143 способа сложить карты – парадокс Левинталя

· Болезнь: считается, что неправильный фолдинг белка является основной причиной дегенеративных и нейродегенеративных заболеваний.

· Наборы данных: 200 миллионов белков. Трехмерная структура из 170 000 белков

· Стоимость: рентгеновская кристаллография стоит 120 000 долларов США и занимает 1 год.

Почему предсказание структуры белка так важно?

· Белки являются строительным материалом жизни, и их форма тесно связана с их функциями.

· Способность точно предсказывать структуру белков позволяет лучше понять, что они делают и как они работают

Что такое Alpha Fold и как это работает:

AlphaFold — это программа искусственного интеллекта, разработанная Google DeepMind, которая выполняет предсказание структуры белка. Программа разработана как система глубокого обучения, которая предназначена для предсказания свернутых белковых структур толщиной до атома.

CASP — это форум сообщества, который позволяет исследователям делиться прогрессом в решении проблемы сворачивания белков. Сообщество также организует раз в два года конкурс для исследовательских групп, чтобы проверить точность их прогнозов на реальных экспериментальных данных.

AlphaFold заняла первое место на последнем CASP — в 2018 году, в первый год участия лондонской компании DeepMind. Но в этом году сеть глубокого обучения компании была на голову выше других команд и, по словам ученых, работала настолько ошеломляюще хорошо, что могла возвестить революцию в биологии.

Последняя версия AlphaFold от DeepMind, системы глубокого обучения, которая может точно предсказывать структуру белков с точностью до размера атома, решила одну из самых сложных задач биологии.

В CASP результаты оцениваются с использованием так называемого теста глобального расстояния (GDT), который измеряет по шкале от 0 до 100, насколько близка предсказанная структура к фактической форме белка, идентифицированной в лабораторных экспериментах. Последняя версия AlphaFold показала хорошие результаты для всех белков в испытании. Но примерно две трети из них получили оценку GDT выше 90. Его GDT для самых сложных белков был на 25 пунктов выше, чем у следующей лучшей команды, говорит Джон Джампер, который возглавляет команду AlphaFold в DeepMind. В 2018 году отрыв составлял около шести очков.

Оценка выше 90 означает, что любые различия между предсказанной структурой и фактической структурой могут быть связаны с экспериментальными ошибками в лаборатории, а не с ошибкой в ​​программном обеспечении. Это также может означать, что предсказанная структура является допустимой альтернативной конфигурацией той, которая была определена в лаборатории, в пределах диапазона естественных вариаций.

В результатах 14-й оценки CASP новейшая система AlphaFold достигает среднего балла 92,4 GDT в целом по всем целям. Это означает, что прогнозы имеют среднюю ошибку (RMSD) примерно 1,6 ангстрема, что сравнимо с шириной атома (или 0,1 нанометра). Даже для самых сложных белковых целей, относящихся к самой сложной категории свободного моделирования, AlphaFold достигает среднего балла 87,0 GDT.

Потенциал реального воздействия:

· Такой инструмент, как AlphaFold, может помочь исследователям редких заболеваний быстро и экономично предсказать форму интересующего белка.

· Это значительно ускорит усилия по изучению строительных блоков клеток и позволит быстрее и эффективнее открывать новые лекарства.

· Этот подход может помочь пролить свет на функции тысяч нераскрытых белков в человеческом геноме и разобраться в вариациях генов, вызывающих болезни, которые различаются у разных людей.

Успех первого исследования сворачивания белков свидетельствует о том, как системы машинного обучения могут интегрировать различные источники информации, чтобы помочь ученым быстро находить творческие решения сложных проблем. В области биологии белков еще многое предстоит сделать.

Ссылка:

AlphaFold: улучшенное предсказание структуры белка с использованием потенциалов глубокого обучения (Nature)

Предсказание структуры белков с использованием нескольких глубоких нейронных сетей в CASP13 (БЕЛКИ)