Исследователи из DeepMind, подразделения Alphabet Inc., специализирующегося на искусственном интеллекте (ИИ) и исследованиях, продемонстрировали, как можно использовать машинное обучение, чтобы совершить прорыв в способности предсказывать, как белки, костяк живой клетки, складываются в сложные формы, которые они принимают два года назад, когда пандемия COVID-19 охватила весь мир. Исследование вселило в биологов оптимизм в отношении того, что в будущем они смогут гораздо быстрее бороться с такими инфекциями, как коронавирус SARS-CoV-2, с помощью такого инструмента.

Во-первых, что такое AlphaFold?

Система искусственного интеллекта DeepMind под названием AlphaFold может определять трехмерную структуру белка по его аминокислотному составу. Он неизменно обеспечивает точность, которая находится на одном уровне с экспериментом. Он предназначен для удивительно точных предсказаний трехмерной (3D) структуры белков. Понимание структуры белков необходимо для понимания их значения во многих биологических процессах. Белки являются основными молекулами в живых организмах.

Система построена на модели глубокого обучения. Было две основные версии программного обеспечения AlphaFold AI. 13-я Критическая оценка предсказания структуры (CASP) была проведена в декабре 2018 года, и группа ученых, использовавших AlphaFold 1 (2018), заняла первое место в общем зачете.

Термины «альфа» и «кратность» объединены для образования термина «Альфафолд». Греческая буква «Альфа» — первая буква в алфавите, и она часто используется для обозначения лучшего или наиболее значимого предмета в коллекции. Термин «складка» описывает трехмерную структуру белка.

Название «AlphaFold» было выбрано, чтобы подчеркнуть способность системы предвидеть трехмерные структуры белков, что считается их наиболее важной характеристикой. Название также намекает на статус AlphaFold как передовой системы, способной полностью изменить область предсказания структуры белка.

Группа ученых, создавших систему, придумала термин «АльфаФолд». Дэвид Бейкер, капитан команды, заявил, что предпочитает краткое, запоминающееся и простое для произношения имя. Он также хотел, чтобы название системы символизировало революционный потенциал науки о предсказании структуры белка.

22 июля 2021 г. AlphaFold и EMBL-EBI совместно представили базу данных структуры белка AlphaFold. Почти весь протеом UniProt человека и 20 модельных животных, или примерно 365 000 белков, был представлен в базе данных при запуске моделями белковых структур, предсказанными AlphaFold. Для человека эти белки доступны во всем пакетном файле, даже если из базы данных исключены белки с менее чем 16 или более чем 2700 аминокислотными остатками. Чтобы охватить большую часть набора UniRef90 из более чем 100 миллионов белков, AlphaFold планировала внести в коллекцию больше последовательностей. Эта цель была поставлена ​​в начале 2022 года.

«Проблема фолдинга белка» представляет собой сложную биологическую дилемму, в которой необходимо предсказать структуру белка. Аминокислотная последовательность белка определяет его структуру, и предсказание трехмерной структуры только по последовательности долгое время было проблемой в этой области. Криоэлектронная микроскопия и рентгеновская кристаллография — это экспериментальные методы, требующие много времени и денег для выяснения белковых структур.

AlphaFold использует методы глубокого обучения, в частности глубокие нейронные сети, для решения проблемы сворачивания белков. Алгоритм обучается с использованием значительной библиотеки идентифицированных белковых структур, чтобы обнаруживать закономерности и связи между аминокислотными последовательностями и родственными структурами. Это обучение улучшило способность AlphaFold точно предсказывать новые белковые структуры.

Как работает модель AlphaFold:

Точные предсказания структуры белка, сделанные AlphaFold, могут иметь важные последствия для диагностики заболеваний и понимания их основных механизмов. Вот несколько стратегий, которые биологи могут использовать для более точного прогнозирования заболеваний в будущем с помощью AlphaFold:
Выявление мутаций, вызывающих заболевание: Структурные изменения белков, вызванные генетическими мутациями, могут привести к образованию дефектных белков, связанных с разнообразные болезни. Биологи могут узнать, как эти мутации влияют на функцию белков и, возможно, способствуют возникновению заболеваний, используя AlphaFold для прогнозирования трехмерных структур мутантных белков. Эта информация может помочь в выявлении мутаций, которые приводят к заболеванию, что позволяет проводить раннее выявление и целенаправленную терапию.

Взаимодействия между белками. Для выполнения жизненно важных биологических задач белки часто взаимодействуют друг с другом. Болезнь может усугубляться нарушением этих отношений. Способность AlphaFold прогнозировать структуры белков можно использовать для определения важных межбелковых взаимодействий и понимания того, как модификации белковых структур влияют на эти взаимодействия. Эта информация может помочь определить новые терапевтические мишени и направить создание лекарств, способствующих здоровому взаимодействию белков.

Борьба с заболеваниями, связанными с неправильным сворачиванием белков. Нейродегенеративные заболевания, такие как болезни Альцгеймера, Паркинсона и Хантингтона, часто демонстрируют неправильное сворачивание белков. С помощью AlphaFold можно исследовать кинетику фолдинга белка и определять потенциальные области неправильного фолдинга белка. Эта информация может помочь в создании планов по прекращению или уменьшению неправильного фолдинга белков и вызываемых им заболеваний.

Открытие и разработка лекарств. Необходимо понимать трехмерную структуру белков, чтобы разрабатывать лекарства, специально нацеленные на определенные белковые структуры или взаимодействия. Прогнозы AlphaFold могут помочь в идентификации новых терапевтических целей, проливая свет на белковые структуры, которые ранее были неизвестны или трудно определялись экспериментально. Позволяя исследователям увидеть, как возможные кандидаты в лекарства взаимодействуют с целевыми белками, это может помочь в рациональной разработке и оптимизации лекарств.

Персонализированная медицина. Генетический состав каждого человека влияет на то, как он реагирует на лечение и насколько он восприимчив к определенным заболеваниям. Персонализированная медицина может извлечь выгоду из способности AlphaFold предсказывать структуры белков, используя геномную информацию. Биологи могут находить изменения, влияющие на функцию белка, прогнозировать риск заболевания и создавать индивидуальные планы лечения, объединяя геномные данные с предсказаниями структуры белка.

Как AlphaFold ускоряет решение важных реальных проблем

База данных AlphaFold Protein Structure Database основана на десятилетиях напряженных исследований ученых, использующих традиционные методы для установления структуры белков. Он был разработан в сотрудничестве с ведущей европейской лабораторией наук о жизни (Европейский институт биоинформатики EMBL).

«То, на что у нас ушли месяцы и годы, AlphaFold смогла сделать за выходные».

Профессор Джон МакГихан Профессор структурной биологии и директор Центра инноваций в области ферментов (CEI) Портсмутского университета

AlphaFold уже используется многими партнерами Google для ускорения разработки важных реальных проблем.

Например, программа «Лекарства от забытых болезней» (DNDi) способствует разработке лекарств от таких болезней, как лейшманиоз и болезнь Шагаса, от которых страдают миллионы людей в слаборазвитых и уязвимых районах.

Тем временем исследователь из фирмы Schrödinger, занимающейся наукой о жизни и материаловедении, ищет способы продвинуть медицину, разрабатывая селективные лекарства, которые могут концентрироваться на одной цели, а не на нескольких.

Структура вителлогенина медоносных пчел (Vg), важнейшего белка для понимания иммунной системы животных, откладывающих яйца, была нанесена на карту группами ученых из университетов Норвегии и США. Исследователи из Центра инноваций в области ферментов (CEI) открывают и разрабатывают ферменты для разрушения одноразового пластика.

Профессор Швейцарской высшей технической школы Цюриха изучает эволюцию белков, чтобы понять, как изменения в нашей ДНК влияют на изменения наших черт. Другая команда из Университета Колорадо в Боулдере изучает устойчивость к антибиотикам, которая ежегодно приводит к 2,8 миллионам инфекций только в США.

Эти примеры демонстрируют широкий спектр областей — от здравоохранения и фармацевтики до сельского хозяйства, биотехнологий и наук об окружающей среде — где предсказания структуры белка AlphaFold могут иметь практическое значение. Несмотря на то, что инновации AlphaFold демонстрируют большой потенциал, важно помнить, что прогнозирование и понимание болезни по-прежнему являются сложными многомерными процессами. Прогнозы AlphaFold — полезный инструмент, который может поддержать текущие исследовательские проекты и помочь биологам понять сложные связи между структурой белка, его функцией и болезнями.

Спасибо за прочтение!

Найдите меня на LinkedIn: Мадан Лал

Ссылки:

  1. Google Deepmind, AlphaFold может точно прогнозировать трехмерные модели белковых структур и ускоряет исследования почти во всех областях биологии.
  2. Разработано DeepMind и EMBL-EBI, База данных структуры белков AlphaFold.