
В человеческом организме существуют сотни типов клеток, каждая из которых выполняет определенную функцию, заложенную в ее ДНК. Теоретически для того, чтобы клетки вели себя желаемым образом — например, производили терапевтическую молекулу или формировали тканевой трансплантат — достаточно правильной последовательности ДНК. Проблема заключается в том, чтобы определить, какая последовательность ДНК какое поведение кодирует.
Команда Университета Райса описала в журнале Nature метод CLASSIC, который позволяет одновременно создавать и тестировать сотни тысяч и даже миллионы вариантов генетических цепей — наборов генов и регуляторных элементов, управляющих работой клетки. CLASSIC — это аббревиатура от «объединение секвенирования длинных и коротких участков для исследования генетической сложности» («combining long- and short-range sequencing to investigate genetic complexity»).
Исследователи разработали библиотеку экспериментальных генетических цепей, включающих гены-репортеры, предназначенные для производства светящегося белка, а затем использовали длинные прочтения для записи полной последовательности каждой цепи. Каждая из этих последовательностей затем была помечена коротким уникальным ДНК-штрихкодом.

Затем объединенную библиотеку генных цепей ввели в клетки эмбриональной почки человека, где они продемонстрировали измеримый фенотип: некоторые клетки светились ярче, а другие — тусклее. Клетки разделили на несколько групп в зависимости от уровня экспрессии генов — по сути, насколько яркими (высокая экспрессия) или тусклыми (низкая экспрессия) они были. Затем с помощью секвенирования коротких прочтений ученые отсканировали ДНК-штрихкоды в каждой группе клеток, и создали сводную карту, связывающую полный генетический план каждой цепи — ее генотип — с ее производительностью, или фенотипом.
Эти данные использовали для обучения ИИ; в результате модель научилась предсказывать поведение генетических цепей, которые не тестировали напрямую. Проверка показала полное совпадение прогнозов с ручными измерениями контрольных образцов — результат, которого раньше не удавалось добиться из-за нехватки данных.
CLASSIC дает ученым более четкое представление о «правилах», определяющих поведение генетических компонентов в контексте. Данные могут обучать модели машинного обучения анализировать, проектировать и в конечном итоге прогнозировать новые генетические программы для конкретных целевых функций. CLASSIC может положить начало новому поколению клеточных терапий, которые предполагают использование генно-модифицированных клеток в качестве живых лекарств для лечения рака и других заболеваний.
Ученые уверены, что проектирование с использованием ИИ/машинного обучения — это будущее синтетической биологии.
Ранее Наука Mail рассказывала о том, что цифровой двойник рака мозга прогнозирует результаты лечения.

