Google представил ИИ-модель для расшифровки генома

Компания Google Deepmind презентовала AlphaGenome — ИИ-модель нового поколения, способную точно предсказывать, как генетические мутации влияют на работу генома.
Екатерина Малярчук
Автор Наука Mail
AlphaGenome
AlphaGenome — уникальный ИИ-инструмент, который способен кардинально изменить представление науки о функционировании генома человекаИсточник: Unsplash

Компания Google Deepmind представила AlphaGenome — уникальный ИИ-инструмент, который способен кардинально изменить представление науки о функционировании генома человека.

Эта новая модель анализирует до миллиона букв ДНК (пар оснований) и предсказывает, как генетические вариации могут повлиять на работу регуляторных элементов, экспрессию генов, сплайсинг и другие важнейшие процессы.

По сути, AlphaGenome выступает в роли мощного аналитического инструмента, позволяя ученым видеть, какие изменения в ДНК могут спровоцировать заболевания или повлиять на функционирование клеток в разных тканях и органах. Особенно важно, что модель работает не только с кодирующими областями (примерно 2% генома), но и с оставшимися 98% — так называемыми некодирующими регионами, где сосредоточено множество вариантов, связанных с болезнями.

вывеска Google
Компания Google Deepmind известна как создатель программы на основе ИИ AlphaFold, способной предсказывать структуры белковИсточник: Unsplash

Модель сочетает в себе преимущества сверхточных нейросетей и трансформеров, что позволяет ей одновременно учитывать как локальные, так и удаленные генетические сигналы. AlphaGenome обучалась на обширных наборах данных от ENCODE, GTEx, FANTOM5 и других крупных консорциумов, охватывая сотни типов клеток человека и мыши.

Одним из ключевых достижений стало моделирование сплайсинговых соединений — процесса, ошибки в котором лежат в основе ряда редких наследственных заболеваний, таких как спинальная мышечная атрофия. AlphaGenome впервые позволяет напрямую предсказывать, как мутация повлияет на сплайсинг РНК.

В ходе тестирования AlphaGenome показала превосходные результаты, обойдя специализированные модели в 22 из 24 тестов по анализу последовательностей ДНК и в 24 из 26 задач по анализу мутаций. Это делает ее универсальным решением для анализа различных аспектов регуляции генов.

ПЦР при изучении сплайсинга
Одним из ключевых достижений стало моделирование сплайсинговых соединений — процесса, ошибки в котором лежат в основе ряда редких наследственных заболеваний, таких как спинальная мышечная атрофияИсточник: Unsplash

Сегодня AlphaGenome доступна для научного сообщества в формате API — пока только для некоммерческого использования. Исследователи уже используют ИИ-модель для поиска причин генетических нарушений, разработки синтетических участков ДНК с заданными свойствами, а также для фундаментальных исследований по картированию функциональных элементов генома.

Кроме того, AlphaGenome может значительно ускорить процесс генерации и проверки гипотез — ученые получают возможность анализировать последствия мутаций сразу по множеству параметров, не прибегая к работе с несколькими отдельными моделями. Это особенно важно при изучении редких вариантов и сложных генетических заболеваний, где скорость и точность анализа играют критическую роль.

AlphaGenome может значительно ускорить процесс генерации и проверки научных гипотез
AlphaGenome может значительно ускорить процесс генерации и проверки научных гипотез

Разработчики подчеркивают: модель не предназначена для медицинской диагностики и не учитывает сложные биологические процессы, такие как влияние среды или развитие организма. Однако ее универсальность и точность уже открывают новые горизонты в геномике.

Ранее Наука Mail рассказывала, что клиника Майо представила алгоритм BACDAC, который позволяет выявить скрытые мутации при раке.