микроскоп в лаборатории

В России научили нейросеть точнее определять связи между белками

Ученые НИУ ВШЭ создали ИИ-модель, которая предсказывает взаимодействие белков с точностью до 95,7%. Разработка учитывает не только последовательность и структуру молекулы, но и свойства ее поверхности, что позволяет выявлять механизмы заболеваний и ускорить поиск мишеней для лекарств.
Автор Наука Mail
Клетки
Почти все процессы в клетке зависят от взаимодействия белков внутри нееИсточник: Unsplash

Почти все процессы внутри клетки зависят от того, как белки взаимодействуют друг с другом. Благодаря таким контактам клетка передает сигналы, запускает химические реакции и строит молекулярные комплексы. Если эти связи нарушаются, работа клетки идет неправильно, что может приводить к развитию заболеваний.

Проверять все возможные пары белков в лаборатории слишком долго и трудоемко, особенно когда речь идет о десятках или сотнях молекул. Поэтому биологи все чаще обращаются к методам машинного обучения, которые могут предсказывать такие взаимодействия по структуре и свойствам белков.

Исследователи из Института искусственного интеллекта и цифровых наук НИУ ВШЭ предложили систему GSMFormer-PPI. В пресс-службе вуза уточнили, ее особенность в том, что она анализирует три типа данных о каждом белке из предполагаемой пары. Это аминокислотная последовательность, трехмерная структура и физико-химические свойства молекулярной поверхности. Для обработки этих данных авторы использовали белковую языковую модель, графовую нейронную сеть и отдельный алгоритм для анализа поверхности.

Таблетки
Разработка может ускорить поиск молекулярных механизмов болезней, биомаркеров и потенциальных мишеней для лекарствИсточник: Freepik

Затем полученные числовые описания поступают в трансформерный модуль. В отличие от работ других научных групп, где разные признаки просто объединялись в один вектор, здесь нейросеть выявляет связи между ними. Как пояснила директор Центра биомедицинских исследований и технологий НИУ ВШЭ Мария Попцова, именно через поверхность белки распознают друг друга, и на ней сосредоточены свойства, важные для связывания.

При тестировании на крупной базе данных белковых взаимодействий PINDER новая модель показала точность 95,7 %, обойдя популярные графовые алгоритмы. Когда исследователи убирали один из трех типов данных, качество предсказания падало, что доказывает важность комплексного подхода. Упрощенная версия модели без модуля анализа связей работала хуже. В перспективе такие системы помогут быстрее отбирать пары белков при изучении механизмов болезней и поиске потенциальных мишеней для лекарств. Работа опубликована в журнале Scientific Reports.

Ранее ученые обнаружили необычный механизм, с помощью которого бактерии обходят иммунную защиту.