ИИ научили предсказывать парные белки

Инструмент искусственного интеллекта AlphaFold расширил границы своих возможностей: от предсказания строения отдельных белков он перешел к моделированию их совместной работы.
Автор Наука Mail
Гомодимерные комплексы
Теперь AlphaFold способен предсказывать гомодимерные комплексы, в том числе и те, которые образуются фактором элонгации транскрипции Eaf, N-концевой регион которого показан здесьИсточник: Google DeepMind/EMBL-EBI (CC-BY-4.0)

База данных структур белков AlphaFold, содержащая прогнозы почти для всех известных белков на Земле, получила значительное обновление. Впервые в открытом доступе появились данные не только об отдельных молекулах, но и о том, как они взаимодействуют друг с другом, образуя сложные комплексы. Это расширение возможностей инструмента приближает ученых к более полному пониманию молекулярных процессов жизни.

Ранее репозиторий, поддерживаемый Европейским институтом биоинформатики (EMBL-EBI) и разработанный компанией Google DeepMind, включал около 200 миллионов предсказаний структур отдельных белков — мономеров. С момента запуска в 2021 году этот массив данных стал основой для множества исследовательских проектов. Однако его ключевым ограничением было отсутствие информации о том, как белки соединяются для выполнения своих функций. Например, вирусный белок протеаза ВИЧ-1, важная мишень для лекарств, работает только в виде комплекса из двух одинаковых копий.

Белки
База данных, содержащая предсказанные структуры почти каждого известного на Земле белка, значительно расширилась и стала еще более полезной для пониманияИсточник: Unsplash

Теперь база данных пополнилась 1,7 миллиона предсказаний для «гомодимеров» — комплексов, состоящих из двух взаимодействующих цепей одного и того же белка. Добавление этих данных стало возможным благодаря работе международного консорциума, в который вошли вычислительные биологи, представители EMBL-EBI, Google DeepMind и производителя микросхем NVIDIA. Специалисты сосредоточили усилия на 20 наиболее изученных видах, включая человека, мышей, дрожжи, а также болезнетворные бактерии, такие как возбудитель туберкулеза.

Мартин Штайнеггер, специалист по вычислительной биологии из Сеульского национального университета, участвовавший в проекте, пояснил сложность задачи. «Мы подумали: "Можем ли мы вывести базу данных AlphaFold на новый уровень, чтобы включить множество сложных предсказаний по всему древу жизни?"» — говорит ученый. Он добавил, что предсказание даже небольших комплексов из двух белков представляет собой принципиально иную задачу, чем работа с мономерами, и требует чрезвычайно больших вычислительных мощностей. Результатом этой работы стало новое биологическое измерение базы данных, позволяющее исследователям изучать не просто отдельные элементы, а их парное взаимодействие.

Ранее в организме обнаружили белок, способный уничтожать опасные бактерии в кишечнике.