
База данных структур белков AlphaFold, содержащая прогнозы почти для всех известных белков на Земле, получила значительное обновление. Впервые в открытом доступе появились данные не только об отдельных молекулах, но и о том, как они взаимодействуют друг с другом, образуя сложные комплексы. Это расширение возможностей инструмента приближает ученых к более полному пониманию молекулярных процессов жизни.
Ранее репозиторий, поддерживаемый Европейским институтом биоинформатики (EMBL-EBI) и разработанный компанией Google DeepMind, включал около 200 миллионов предсказаний структур отдельных белков — мономеров. С момента запуска в 2021 году этот массив данных стал основой для множества исследовательских проектов. Однако его ключевым ограничением было отсутствие информации о том, как белки соединяются для выполнения своих функций. Например, вирусный белок протеаза ВИЧ-1, важная мишень для лекарств, работает только в виде комплекса из двух одинаковых копий.

Теперь база данных пополнилась 1,7 миллиона предсказаний для «гомодимеров» — комплексов, состоящих из двух взаимодействующих цепей одного и того же белка. Добавление этих данных стало возможным благодаря работе международного консорциума, в который вошли вычислительные биологи, представители EMBL-EBI, Google DeepMind и производителя микросхем NVIDIA. Специалисты сосредоточили усилия на 20 наиболее изученных видах, включая человека, мышей, дрожжи, а также болезнетворные бактерии, такие как возбудитель туберкулеза.
Мартин Штайнеггер, специалист по вычислительной биологии из Сеульского национального университета, участвовавший в проекте, пояснил сложность задачи. «Мы подумали: "Можем ли мы вывести базу данных AlphaFold на новый уровень, чтобы включить множество сложных предсказаний по всему древу жизни?"» — говорит ученый. Он добавил, что предсказание даже небольших комплексов из двух белков представляет собой принципиально иную задачу, чем работа с мономерами, и требует чрезвычайно больших вычислительных мощностей. Результатом этой работы стало новое биологическое измерение базы данных, позволяющее исследователям изучать не просто отдельные элементы, а их парное взаимодействие.
Ранее в организме обнаружили белок, способный уничтожать опасные бактерии в кишечнике.
