
Представьте, что робот-помощник берет тарелку, но промахивается. Раньше для исправления таких ошибок требовалось собирать данные, обучать модель заново и тестировать ее. Теперь все стало проще: достаточно слегка подтолкнуть робота или показать ему правильную траекторию движения.
Ученые из Массачусетского технологического института и компании NVIDIA создали новый метод, который позволяет корректировать действия робота в реальном времени. Вместо переобучения модели человек может использовать три интуитивных способа вмешательства:
- Указать на нужный объект на экране;
- Нарисовать траекторию движения;
- Подтолкнуть руку робота в нужном направлении.

Как это работает
Метод основан на использовании уже обученной модели генеративного искусственного интеллекта. Такой подход позволяет избежать сложного процесса сбора новых данных и повторного обучения нейросети.
Когда робот сталкивается с ситуацией, в которой его предобученные алгоритмы дают сбой, пользователь может направить его с помощью одного из трех доступных способов. Вместо полного подчинения команде человек лишь слегка корректирует действия робота. Это снижает вероятность ошибки, например, столкновения с предметами.
Для выбора наиболее подходящего варианта действий робот использует метод семплирования, который помогает ему находить оптимальный путь с учетом корректирующих действий человека. Вместо того, чтобы просто выполнять новую команду, система анализирует весь спектр возможных действий и выбирает безопасное и эффективное.

Насколько эффективен метод
При тестировании в лабораторных условиях этот подход показал на 21% более высокую точность выполнения задач по сравнению с традиционными методами без вмешательства человека. Более того, робот может запоминать внесенные корректировки, чтобы в будущем самостоятельно выполнять задачу без подсказок.
Одно из главных преимуществ метода — его простота. Пользователь не должен разбираться в программировании или машинном обучении. Робот корректирует поведение на основе интуитивно понятных жестов и действий, как если бы человек объяснял задачу другому человеку.
Будущее технологии
Разработчики планируют усовершенствовать алгоритм, ускорив процесс выбора оптимального решения. Это позволит роботам быстрее адаптироваться к новым условиям, сохраняя высокую точность работы.
Этот метод открывает перспективы для использования бытовых и промышленных роботов в непривычных условиях. Например, домашний робот сможет адаптироваться к уникальной расстановке мебели, а производственный автомат — подстраиваться под нестандартные материалы.
Результаты исследования будут представлены на Международной конференции по робототехнике и автоматизации. В будущем такие технологии помогут сделать роботов более гибкими и понятными для пользователей без необходимости сложного переобучения моделей.
Кстати, о роботах: Wildberries тестирует роборуки у себя на складах. Узнайте в статье, как они могут помочь сотрудникам.