Искусственный интеллект учится у людей предугадывать действия товарищей по команде

Что, если бы роботы могли обучаться как футбольные команды — с тренером, который подсказывает, когда лучше атаковать, а когда отступить? Исследователи создали метод, позволяющий машинам перенимать коллективные стратегии у человека и работать в команде почти как мы.
Владимир Барышев
Автор Наука Mail
Команда роботов
Командная работа роботов становится похожей на действия живой группы благодаря новому методу обучения с участием человека-наставникаИсточник: Unsplash

Исследование, представленное на сервере препринтов arXiv и принятое к докладу на Международной конференции IEEE по робототехнике и автоматизации (ICRA 2025), демонстрирует, как роботы могут научиться командной работе, используя способности человека к прогнозированию и координации. Авторы из Университета Дьюка и Колумбийского университета предложили структуру под названием HUMAC, в которой важную роль играет человек-наставник.

С помощью этой структуры человек может кратковременно брать управление отдельными роботами. Это поможет им понять, как действовать согласованно. Система напоминает тренера, который дает советы игрокам во время матча. И главное — роботы учатся у этого человека не только действиям, но и логике, стоящей за ними.

Визуализация действий ИИ
Визуализация командных действий в игре Источник: Duke University

Вместо длительного обучения через многократные пробы и ошибки, как это происходит при традиционном обучении с подкреплением, или дорогостоящего копирования действий целой команды людей, HUMAC предлагает точечные вмешательства. Оператор вмешивается лишь в ключевые моменты, что делает процесс быстрым и эффективным.

В рамках эксперимента исследователи использовали игру в прятки. Одна команда роботов ищет, другая — прячется и перемещается по арене с препятствиями. Изначально охотники проигрывали: каждый гнался за ближайшим противником, не координируясь с товарищами. Уровень успешных поимок не превышал 36%.

Когда человек подключился к обучению с помощью HUMAC, ситуация изменилась. Уже через 40 минут тренировок роботы стали действовать слаженно — устраивать засады, окружать и блокировать пути отступления. Результат в симуляции вырос до 84%, а в реальных испытаниях наземных роботов остался на уровне 80%.

Обмен информацией
Обмен информацией между роботами ускоряется и становится более точным благодаря предсказанию действий товарищей по командеИсточник: Unsplash

Исследователи уверены, что за таким подходом — будущее. Возможности варьируются от спасательных операций после стихийных бедствий до сложных военных и промышленных задач. Главное, что даже один человек может быстро обучить большую группу машин совместной работе — без утомительного программирования или длительных симуляций.

Как пояснил автор работы Боюань Чен, люди умеют предсказывать действия других, это называется Теорией разума. Благодаря HUMAC, роботы получают доступ к подобной способности — они начинают «предугадывать» действия своих товарищей и действовать как настоящая команда. Это уже не просто машины, а новые партнеры в работе.

Если вас заинтересовали новые способы организации командной работы роботов, стоит также обратить внимание на технологии летающих роботов, которые открывают уникальные возможности для строительства в самых труднодоступных местах. Об этом и многом другом вы можете узнать в этой статье.