
Ученые Институт AIRI разработали новый подход к предсказанию оптических свойств молекул, который учитывает их пространственную структуру. Использование 3D-графовых нейронных сетей позволило снизить ошибку предсказания более чем на 30% по сравнению с лучшими существующими нейросетевыми моделями.
Предсказание оптических свойств важно для разработки красителей, OLED-материалов, флуорофоров, фотосенсибилизаторов, биомаркеров и УФ-фильтров. Такие задачи требуют понимания того, свет каких длин волн молекула поглощает и излучает. Проверка огромных библиотек веществ экспериментально или с помощью квантово-химических расчетов занимает слишком много времени и ресурсов. Новый метод позволяет получать прогноз за доли секунды для одной молекулы.
Для обучения моделей исследователи собрали специализированный набор данных nablaColors-3D, включающий экспериментальные данные об оптических свойствах молекул в различных растворителях и рассчитанные пространственные структуры. Все записи были вручную сверены с первоисточниками: ошибочные данные исправляли или удаляли. В результате был создан один из первых крупных наборов данных, содержащих геометрию молекул-хромофоров.

Наличие трехмерной геометрии позволило использовать особый класс моделей — 3D-графовые нейронные сети. В исследовании сравнили пять современных архитектур: PaiNN, DimeNet++, GemNet-OC, eSCN и UniMol+. Сначала модели предобучали на крупных химических датасетах, затем дообучали на наборе nablaColors-3D для предсказания экспериментальных спектров.
Качество прогнозов оценивали по метрике средней абсолютной ошибки (MAE). Лучшая модель без учёта геометрии показала ошибку около 24 нанометров, тогда как модель с учётом пространственной структуры снизила её до примерно 16 нанометров. Для сравнения, квантово-химический метод TD-DFT на том же наборе данных давал ошибку около 62 нанометров.
По словам научного сотрудника группы органической химии Центра ИИ-разработки новых лекарственных препаратов AIRI Дениса Потапова, точность предсказаний напрямую связана с пространственным расположением атомов в молекуле.
Одного лишь знания о том, какие атомы и связи есть в молекуле, недостаточно для точного предсказания оптических свойств. Пространственное расположение атомов — углы, длины связей — определяет электронную структуру молекулы, а значит, и то, как она поглощает и испускает свет. Именно это даёт основной прирост точности в нашем подходе.
Ранее ученый рассказал, что за пять лет появятся алгоритмы, которые помогут отсрочить старение.

