
Молекулы — это динамические структуры, способные принимать различные пространственные формы, известные как конформации. Из-за вращения атомов и связей одна и та же молекула может существовать в нескольких геометрических вариантах, каждый из которых обладает уникальными химическими и физическими свойствами. Точное предсказание этих свойств требует учета всех возможных конформаций, однако современные методы молекулярного моделирования нередко пропускают ключевые формы. Это может привести к серьезным ошибкам в расчетах, делая результаты бесполезными или даже вредными для практического применения.
Ученые из Института органической химии им. Н.Д. Зелинского Российской академии наук и Московского государственного университета им. М.В. Ломоносова предложили решение этой проблемы, разработав алгоритм на основе искусственного интеллекта. В отличие от традиционных подходов, которые фокусируются на поиске глобального энергетического минимума, новый метод анализирует все возможные варианты геометрии молекулы, включая те, которые остаются незамеченными при стандартном моделировании. Основой алгоритма стали гауссовские процессы — метод машинного обучения, позволяющий эффективно работать даже с небольшими объемами данных.

Как объясняет Иван Беспалов, студент химфака МГУ и сотрудник ИОХ РАН, классические методы машинного обучения требуют огромных массивов информации, но в химии данные часто ограничены из-за высокой стоимости экспериментов. Байесовские подходы, такие как гауссовы процессы, позволяют модели самостоятельно оценивать надежность своих предсказаний. Это делает их идеальным инструментом для задач, где данных мало.
Тестирование алгоритма на 60 биологически активных молекулах, включая пептиды и лекарственные соединения, показало впечатляющие результаты. В почти половине случаев метод обнаружил конформации, которые не смог выявить CREST — один из самых надежных современных методов конформационного поиска. В отдельных случаях число новых геометрий достигало 28. Особенно эффективным алгоритм оказался при анализе амидных фрагментов, ключевых компонентов белков и пептидов. Новый подход значительно повышает надежность молекулярного моделирования. Это важный шаг к автоматизации процесса, который позволит получать точные результаты с минимальным участием человека.
Ранее Наука Mail рассказывала, что российские ученые исследовали кристаллы ниобата лития, легированные магнием.