
Промышленные дрожжи — мощный источник белка, который используется для производства вакцин и биофармацевтических препаратов. В новом исследовании инженеры-химики из Массачусетского технологического института (MIT) применили искусственный интеллект для оптимизации разработки производства белка.
Чтобы модифицировать дрожжи, у другого организма берут ген, например, инсулина, и меняют его таким образом, чтобы микроорганизм мог вырабатывать его в больших количествах. Для этого нужно подобрать оптимальную последовательность ДНК для дрожжевых клеток, интегрировать ее в геном грибка, создать благоприятные условия для роста и, наконец, очистить конечный продукт.
Для новых биологических препаратов — крупных и сложных лекарств, производимых живыми организмами, — этот процесс разработки может составлять от 15 до 20% от общей стоимости вывода препарата на рынок.

Сегодня все эти этапы выполняются с помощью очень трудоемких экспериментальных задач. Мы задались вопросом, можно ли взять на вооружение некоторые концепции, появляющиеся в машинном обучении, и применить их, чтобы сделать различные аспекты процесса более надежными и предсказуемыми
С помощью большой языковой модели команда ученых проанализировала генетический код промышленных дрожжей Komagataella phaffii. Для обучения ИИ использовался общедоступный набор данных Национального центра биотехнологической информации, который состоял из аминокислотных последовательностей и соответствующих последовательностей ДНК для всех примерно 5 тыс. белков, продуцируемых K. phaffii.
После обучения модели исследователи попросили ее оптимизировать кодовые последовательности шести различных белков, в том числе человеческих гормона роста и альбумина, а также трастузумаба — моноклонального антитела, используемого для лечения рака.

Затем ученые внедрили каждую из этих последовательностей в клетки K. phaffii и измерили количество целевого синтезированного белка. В пяти из шести случаев лучше всего сработали последовательности из новой модели.
Изучив внутреннюю работу модели, исследователи обнаружили, что она усвоила некоторые биологические принципы работы генома, в том числе те, которым ее не обучали. Например, она научилась не включать в себя негативные повторяющиеся элементы — последовательности ДНК, которые могут подавлять экспрессию близлежащих генов. ИИ также научился классифицировать аминокислоты по таким признакам, как гидрофобность и гидрофильность.
Таким образом, разработанный в MIT подход может значительно упростить процесс создания различных фармацевтических препаратов и снизить затраты на их производство.
Ранее Наука Mail писала, что международная группа ученых нашла способ преодолеть последствия нарушений в работе митохондрий, влияющих на размножение клеток, с помощью дрожжей.

