компьютерная абстракция

Наука на практике: как идеи становятся продуктом

Наука в крупных технологических компаниях живет по своим законам. Гипотеза, которая вчера была темой публикации, сегодня уходит в продакшн, а запрос от пользователя превращается в исследовательскую задачу. Как устроен этот цикл, разбираемся вместе с экспертами Сбера в новом материале Наука Mail.
Общая фотография номинантов на премию
В корпоративной науке запрос от клиента становится главным исследовательским вызовомИсточник: Пресс-служба Сбера

Когда исследование должно не только удивлять, но и работать

Индустриальная наука в какой-то степени усложняет логику исследования. Здесь нужно не просто представить интересную идею и показать результат в лабораторных условиях. Важно еще понять, можно ли эту идею встроить в реальную систему, выдержит ли она нагрузку и как ее подвязать с данными, инфраструктурой и настоящими пользователями. Многие исследователи, работающие на стыке науки и технологий, описывают эту ситуацию одинаково: привычная граница между фундаментальной новизной и прикладной пользой становится менее четкой.

Дмитрий Симаков, исполнительный директор по исследованию данных Центра практического искусственного интеллекта, описывает эту модель как непрерывный цикл. Его команда, ставшая победителем внутренней исследовательской R&D-премии Сбера, не разделяет науку и бизнес.

Обычно все начинается с практической потребности, далее уходит в поиск научного решения и возвращается обратно — уже в виде пилота и внедрения. Два разных мира здесь превращаются в один процесс, который движется по кругу.
Дмитрий Симаков
исполнительный директор по исследованию данных Центра практического искусственного интеллекта Сбера

О том же говорит и Александр Капитанов — исполнительный директор и лауреат номинации «Лучший исследователь». Он работает в Управлении экспериментальных систем машинного обучения, и каждый день держит баланс между фундаментальными задачами и конкретными пользовательскими сценариями:

Если в продукте нет исследовательского вызова — он быстро устаревает. Поэтому мы в Управлении стараемся выстроить работу таким образом, чтобы научная новизна становилась основой прикладной технологии, а реальные пользователи задавали нам новые исследовательские вопросы.
Александр Капитанов
исполнительный директор и лауреат номинации «Лучший исследователь»

В этом, пожалуй, и состоит главная особенность современной индустриальной науки. Она не заменяет академическую и не сводится к инженерии — задача все-таки исследовательская. Но каждую идею она проверяет: выдержит ли та столкновение с реальностью.

Что сегодня вообще можно назвать прорывом

Слово «прорыв» в технологической повестке используют слишком часто. Как правило, им называют действительно новый метод или технологию. Но настоящий прорыв не всегда бывает громким. Часто он начинается с простого вопроса: а что, если попробовать этот инструмент там, где его раньше не применяли?

Ученый с ноутбуком
Гипотеза сегодня — продакшн завтра. Как наука в крупных технологических компаниях работает на скорости бизнесаИсточник: Freepik

Именно так началось исследование, которое Алексей Крылов, руководитель направления по исследованию данных Сбера и аспирант МФТИ, провел вместе с коллегами. Идея была следующей: вывести диффузионные модели за пределы компьютерного зрения и применить их для суммаризации таблиц. В генерации изображений и видео эти модели уже произвели настоящий прорыв — команда рассчитывала повторить его и в обработке естественного языка. Научная новизна, по словам Крылова, уже в самом факте: диффузионные модели способны работать с текстом — и делают это не хуже, а местами даже лучше классических подходов.

Это фундаментальный результат. Прикладная польза начинается там, где мы перестаём спрашивать: «А возможно ли?» — и начинаем решать: «Как сделать быстро и дешево?». Пока мы на первом этапе: показали потенциал. Граница проходит ровно в тот момент, когда мы переключаемся с поиска новых эффектов на оптимизацию для реального использования.
Алексей Крылов
руководитель направления по исследованию данных Сбера

Самым неочевидным результатом оказалось не то, чего ожидали изначально. Исследователи предполагали, что выиграют в разнообразии ответов, но открыли другое: диффузионные модели показали высокую эффективность при малом количестве данных. По словам Крылова, сама процедура постепенного зашумления (один из двух ключевых этапов работы диффузионных нейросетей таких как Midjourney, Stable Diffusion или DALL-E — прим.) и очистки работает как встроенный регуляризатор, помогая модели обобщать, а не просто запоминать.

Есть и другая сторона работы с большими языковыми моделями. О ней рассказывает Алена Феногенова, исполнительный директор и один из победителей R&D-премии Сбера в номинации «Лучший исследователь года». Речь идет о бенчмарках (эталонных наборах задач для оценки моделей), метриках и системах оценки.

Интерес к этой теме возник у Алены еще в студенчестве, во время участия в исследовательских соревнованиях «Shared tasks». Она поняла: без качественных данных, метрик и бенчмарков исследователь просто не понимает, с чем сравнивать результат и на каком этапе работы находится. Позже, уже в индустрии, она столкнулась с другой стороной проблемы: создание таких инструментов с нуля требует колоссальной вовлеченности и огромных ресурсов. Бенчмарки — это не второстепенная рутина и не вспомогательное приложение к «настоящим» исследованиям. Напротив, именно с них начинается любая серьезная разработка. Это фундамент, база, которая позволяет понять, движешься ли ты в правильном направлении. Нужно решить, что именно измерять, как поставить задачу так, чтобы отделить реальное понимание от натренированного угадывания. По словам Алены, измерить интеллект оказывается не легче, чем его создать и без качественных бенчмарков создавать модели вслепую просто невозможно. Третий случай — когда исследование приобретает особый, социальный смысл.

Александр Капитанов отмечает, что острее всего ощутил это в работе над переводом жестовых языков, прежде всего русского. В тот момент, когда модели начинают действительно помогать людям с ограниченными возможностями, это уже не просто задача из области AI. И именно такие моменты, по словам Александра, убеждают, что направление выбрано верно.

Рука держит колбу
Как устроен цикл, когда научная идея мгновенно превращается в продукт?Источник: Freepik

Банк как лаборатория

Отдельная плоскость — финансовые технологии. Здесь процесс перехода от исследования к продукту идет быстрее, чем где-либо: идеи из исследовательского центра попадают в банковские процессы за месяцы, а не за годы..

Артем Заболотный, исполнительный директор по исследованию данных Центра исследований блока «Риски», говорит, что финансовые данные — главный ресурс банка, и любое продвижение в работе с ними быстро превращается в конкурентное преимущество. В проекте команды, которая была признана лучшей в рамках внутренней исследовательской премии Сбера в командной номинации «R&D-прорыв 2025 года», удалось соединить три вещи сразу: сложную научную задачу, влияние на ключевые бизнес-процессы и пользу для клиентов.

Главная задача — найти баланс: банку важно не ошибиться в заемщике, но и не отказать человеку, которому деньги действительно нужны. Раньше клиенты могли получить отказ из-за отсутствия кредитной истории или нехватки данных. Комана предложила переосмыслить этот подход — использовать цифровые следы как источник информации и применить к ним логику обучения, похожую на языковые модели. Найти правильный путь, говорит Артем, команде помогли не только опыт и экспертиза, но и сильная внутренняя мотивация — желание создавать проекты, которые реально помогают людям и развивать исследования в области ИИ на уровне ведущих научных лабораторий.

Чтобы научить ИИ действительно понимать финансовые данные, требуется глубокая экспертиза как в финансовой предметной области, так и в современных ИИ-технологиях. Результат таких решений измеряется не только точностью моделей, но и их влиянием: каждый месяц дополнительно сотни тысяч семей получают доступ к финансовым продуктам. За год это уже миллионы людей, для которых кредит становится доступным инструментом для реализации своих целей и планов.
Артем Заболотный
исполнительный директор по исследованию данных Центра исследований блока «Риски» Сбера

Похожая логика в проекте приоритезатора продуктов, о котором рассказывает Дмитрий Симаков. Начиналось все с конкретной бизнес-задачи: научиться одним алгоритмом подбирать клиенту сразу несколько подходящих банковских продуктов. За запросом от бизнеса открылось поле для исследования. В результате проект дал банку не только рабочий инструмент, но и научные публикации, open-source-библиотеку и универсальную технологию, которую теперь можно применять в других сервисах.

Если говорить проще, Дмитрий и его команда сделали одну модель, которая умеет выдавать сразу несколько прогнозов: вместо нескольких отдельных моделей под каждую задачу. Внутри она построена на комбинации простых моделей (это называется градиентный бустинг), но для пользователя работает как единая система.

Мужчина перелистывает книгу и ищет что-то в ноутбуке
Как бизнес-задачи превращаются в научные открытияИсточник: Freepik

Главное здесь не технические детали, а принцип. Модель не рассматривает продукты по отдельности — она анализирует их вместе: какие продукты обычно встречаются у одного клиента, как они сочетаются между собой, как человек ими пользуется. Именно это Дмитрий называет «всесторонним пониманием клиента». И ценность, по его словам, даже не в самом приоритезаторе, а в подходе — он применим гораздо шире, приоритезатор лишь один из примеров.

Почему сегодня мало придумать хорошую модель

В рассказах исследователей повторяется одна и та же мысль: прорыв рождается не только в самой модели. Иногда ключевую роль играют вещи, которые со стороны выглядят менее эффектно. Подготовка данных, выбор метрики, организация процесса, инфраструктура, способ внедрения. Без всего этого даже сильная идея может остаться только красивой демонстрацией. Александр Капитанов признается, что одним из самых неочевидных открытий для него стала важность системных решений по сравнению с «чистой» модельной архитектурой.

Раньше часто казалось, что идеальное решение — новая модель. Так называемый низковисящий фрукт. На практике же прорыв часто рождается из инженерной оптимизации, правильного процессинга данных, продуманной метрики или переосмысления технологии.
Александр Капитанов
исполнительный директор и лауреат номинации «Лучший исследователь», исполнительный директор Сбера

Это наблюдается и в задачах, связанных с промышленностью. Игорь Федоров, исполнительный директор Сбера, еще один победитель в номинации «Исследователь года», работает с технологиями, применимыми в производстве современных микросхем. Он рассказывает, что ключевым моментом для него стало осознание ограничений традиционных подходов в литографии. Стало ясно, что искусственный интеллект способен не просто улучшить существующий процесс, а помочь преодолеть его фундаментальные ограничения. По словам Игоря Федорова, практические результаты укрепили эту уверенность.

Применение цифрового двойника позволяет повысить точность печати элементом микросхемы без необходимости проведения многократных и дорогостоящих экспериментов на заводе.
Игорь Федоров
исполнительный директор Сбера, победитель в номинации «Исследователь года»

Научная новизна здесь заключается в разработке подходов и алгоритмов для моделирования литографических процессов с помощью ИИ, включая создание оптимизационного конвейера с цифровым двойником литографа и разработку оптимизатора топологий на базе математических алгоритмов инверсной литографии. При этом самым неожиданным для команды оказался не математический или инженерный аспект, а человеческий фактор. Федоров говорит, что успех технологии во многом зависит от того, насколько эргономично она встраивается в работу инженеров и усиливает их экспертные возможности, а не пытается заменить человека полностью.

Как объяснить сложное, не упростив его до бессмыслицы

Почти все исследователи признают: одна из самых трудных частей их работы — объяснить ее людям вне профессии. Алексей Крылов отмечает, что сам процесс обучения диффузионных моделей (процесс создания генеративного ИИ, который учит нейросеть превращать случайный шум в качественные данные (изображения, видео, аудио) требует нетривиальных знаний высшей математики и сложен для объяснения даже специалистам по исследованию данных и ИИ.

По словам Александра Капитанова, сказать «я создаю технологии на базе искусственного интеллекта» — значит не сказать почти ничего. Каждый слышит в этой фразе свое: один думает о нейросетях, которые рисуют картинки, другой — о голосовых помощниках, третий — о беспилотниках. Поэтому он формулирует так:

Если совсем просто, я обычно говорю так: «Я делаю так, чтобы искусственный интеллект лучше понимал человека — вне зависимости от того, общается ли он текстом, голосом, изображениями или жестами». И для меня важно, что всё это мы создаём в рамках человекоцентричного AI — технологии должны быть не просто мощными, а доступными и полезными широкой аудитории, включая людей с особыми потребностями.
Александр Капитанов
исполнительный директор и лауреат номинации «Лучший исследователь», исполнительный директор Сбера

Алена Феногенова шутит, что за многие годы перепробовала десяток формулировок, как объяснить людям не из науки, чем она занимается.

Раньше пыталась научно: «Разрабатываю бенчмарки для оценки больших языковых моделей». Люди кивали, но по глазам было видно — не очень понятно. Теперь чаще шучу: «Измеряю интеллект. У людей и машин. Сравниваю». Это обычно вызывает улыбку, а потом уже можно рассказать подробнее — про тесты, про метрики, про то, как мы пытаемся понять, насколько модель действительно «думает», а не просто подбирает слова.
Алена Феногенова
победитель в номинации «Лучший исследователь года», исполнительный директор Сбера

Игорь Федоров в разговорах с неспециалистами пользуется аналогией: цифровой двойник можно представить как виртуальную модель реального устройства или процесса, которая помогает заранее предсказать поведение системы и подобрать оптимальные настройки до физического запуска оборудования. Такие объяснения нужны не только ради популяризации науки— они заставляют самого исследователя держать в голове, кому и чем его работа действительно полезна.

Синергия науки и индустрии

Важная особенность индустриальных исследований в том, что они все чаще становятся заметны не только внутри компании, но и в научном сообществе. Это происходит через публикации, открытые библиотеки, бенчмарки и так далее. Например, Алексей Крылов отмечает, что в его случае результат пока остается чисто научным достижением, поэтому публикация шла открыто, без оглядки на патенты или коммерческую тайну. Но если технология дойдет до продукта, логика резко изменится. Тогда придется выбирать между патентованием ключевых решений и сохранением индустриального преимущества.

При этом, по его словам, никакого конфликта между академической наукой и индустрией нет — скорее, естественное разделение. Академическая среда дает пространство для «безумных» идей и долгой проверки гипотез, а индустрия подхватывает наиболее удачные решения и превращает их в работающие продукты. В этом, возможно, и состоит главный вывод. Современная наука все чаще развивается не по прямой линии, а в постоянном движении между исследованием, инженерией, инфраструктурой и реальными сценариями использования. И именно в этой связке становится видно, где заканчивается сама идея и начинается технология, способная что-то изменить.

Ранее мы рассказывали, как ИИ может «отобрать» финансирование некоторых научных проектов.