
Ученые Института AIRI предложили способ, который помогает ИИ-агентам и роботам быстро подстраиваться под новые условия работы без дополнительного дообучения. Модель сама определяет, в какой среде она оказалась, и сразу выбирает подходящую стратегию поведения. Об этом Науке Mail сообщили в пресс-службе института.
Современные поведенческие модели хорошо решают много разных задач, но плохо адаптируются к изменениям внешних условий. Это разрыв между обучением в симуляции и работой в реальном мире, где параметры постоянно меняются. Например, при появлении препятствий или изменении сцепления с поверхностью качество работы может заметно падать. Популярный подход Forward-Backward в нестабильной среде начинает усреднять варианты и чаще ошибаться.
Путь от идеи до полноценной реализации занял около трех месяцев, еще месяц ушел на подготовку статьи. В дальнейшем мы планируем развивать идею непрерывной адаптации: изучать, как агенты могут постоянно сталкиваться с новыми мирами, не теряя старые знания. Отдельный интерес представляет их адаптация к другим агентам — людям или роботам — например, на складах или дорогах общего пользования
Ученые добавили в базовую архитектуру два блока. Belief-FB по наблюдениям определяет среду. Rotation-FB разделяет стратегии для разных условий, не смешивая их. В итоге модель лучше привязывает параметры среды к действиям и переносит знания на незнакомые ситуации.
Метод протестировали в задачах навигации и управления, где изменялись структура пространства и физические параметры. Качество выполнения задач выросло почти в два раза по сравнению с базовыми подходами — как в знакомых, так и в новых конфигурациях. Визуализация подтвердила, что система действительно различает режимы среды, а не просто повторяет заученные действия.
Ранее Наука Mail писала о том, что в больницах тестируют бесконтактные экраны от резидента Сколково.

