
К 2050 году роботы-помощники заменят большую часть привычных медбратьев и медсестер в домах престарелых и при этом будут не просто приносить лекарства по расписанию, но и заметят, что бабушке или дедушке сегодня особенно грустно, а также предложит им позвонить внукам, у которых только что закончились уроки в школе. В то же самое время на логистическом складе робот не просто перенесет груз по заданному маршруту, а будет предвидеть, как качнется неустойчивая стопка коробок после проезда соседнего робота, и мгновенно скорректирует траекторию, предотвращая тем самым потерю хрупких товаров. Фантастика? Отнюдь нет. Весьма вероятная реальность не столь далекого будущего.
Важной частью такого будущего станет воплощенный искусственный интеллект (embodied AI), созданием которого сегодня занимается большое количество научных групп по всему миру. В отличие от привычных чат-ботов, генерирующих текст, картинки, PDF-файлы презентаций и распознающие образы на фото и видео, этот ИИ будет обладать «телом» (физическим в случае робота или виртуальным в случае сложной симуляции). Такой искусственный интеллект сможет учиться, осваивая законы объемного мира с физическими предметами в нем. Взаимодействуя с окружающими объектами, он будет получать обратную связь от своих действий и познавать реальность на новом для подобных систем уровне.
Развитие воплощенного ИИ — это действительно качественный скачок. Если предыдущие волны автоматизации замещали либо рутинный физический труд (конвейеры), либо рутинный когнитивный (бухгалтерский софт), то современные гуманоидные роботы, управляемые продвинутыми LLM, претендуют на «нерутинные» физические и когнитивные задачи одновременно. Это ставит под удар сферы, которые ранее считались «безопасной гаванью» — от логистики и строительства до базового ухода за больными.
Нынешние исследования и разработки ученых могут к середине XXI века помочь воплощенному ИИ радикально изменить все сферы жизни человека — от быта и медицины до промышленности и экологии. Но путь к этой «искусственной телесности» полон технологических вызовов, этических дилемм и закономерных опасений общества.
Воплощенный ИИ простыми словами
Чем же «воплощенный ИИ» принципиально отличается от ChatGPT, поражающего своей эрудицией, или нейросети, создающей изображения?
«Воплощенный ИИ — это модель ИИ, которая взаимодействует с физическим миром и получает от этих взаимодействий обратную связь, которая используется для дальнейшего принятия решений», — объясняет Алексей Староверов, старший научный сотрудник группы «Воплощенные агенты» Лаборатории когнитивных систем ИИ Института AIRI.

Но его «тело» — это не обязательно антропоморфный робот, который выполняет опасные функции на производстве или ассистирует молодому хирургу в операционной. Это может быть беспилотный автомобиль, двигающийся по дороге, сельскохозяйственный коптер (ссылка на другой материал спецпроекта), опрыскивающий поле, робот-пылесос, объезжающий подвижные препятствия, или даже виртуальный агент, обучающийся в цифровом двойнике реального мира.
Embodied AI активно познает окружающую среду через взаимодействие. Он учится не на статичных корпусах текстов или картинок, а на последствиях своих собственных действий в реальной или виртуальной среде. Как подчеркивает эксперт AIRI, «для адекватного управления роботом нужна высокая точность […] модели надо как минимум показывать множество подобных взаимодействий и примеров, а еще лучше давать возможность выполнять действия самой, делать ошибки и учиться на своих ошибках с помощью обучения с подкреплением». Это фундаментальное отличие: если классический ИИ строит картину мира на основе представленных ему данных, воплощенный ИИ опытным путем познает мир, подобно ребенку, который учится ходить, пробуя, падая и снова пробуя, а не читая инструкцию.
Означает ли это, что именно «воплощенный ИИ» обретет сознание и станет основой AGI, а также можно ли сравнить умения embodied AI с ребенком определенного возраста, мы спросили у экспертов.
Согласно концепции «воплощенного познания» (embodied cognition), интеллект не может быть отделен от тела. Он формируется самим фактом телесности и активного взаимодействия со средой. Современные «бестелесные» ИИ (например, LLM) виртуозно оперируют синтаксисом, но им не хватает семантики — понимания смысла. Они манипулируют символами, не имея доступа к физической реальности, которую эти символы описывают. Это так называемая symbol grounding problem.
Эксперт МГУ также отмечает, что воплощенный ИИ, напротив, может «заземлить» абстрактные понятия через сенсомоторный опыт.
Мы об этом редко задумываемся, но, кроме зрения и слуха, мы во многих случаях полагаемся на чувство собственного равновесия, тактильный отклик и т.д. Это помогает определять свойства объектов, дает много информации о среде, помогает в логических рассуждениях.

Что касается сравнения с маленькими детьми, в широком спектре задач каждая конкретная модель пока несравнима с человеком, поясняет Алексей Староверов. Однако в конкретной задаче, в том же управлении беспилотным автомобилем, есть системы, которые работают очень и очень хорошо. ИИ сильно сложнее работать с физическими объектами, чем генерировать разнообразный контент и обрабатывать большие массивы данных. Для человека не составляет труда бег и перекладывание объектов самых разных форм, а вот обучению программированию, написанию стихов и рисованию картин надо уделить не один год. Для ИИ на данный момент тенденции прямо противоположные.
Александра Танюшина добавляет, что это прекрасно иллюстрирует парадокс Моравека-Минского: то, что для человека сложно (высшая математика, шахматы), дается ИИ легко, но то, что элементарно для годовалого ребенка (координация движений, распознавание объектов в динамике), требует колоссальных вычислительных мощностей. Парадокс показывает, что именно базовые навыки взаимодействия с физическим миром являются фундаментом мышления, считает эксперт МГУ.
Поэтому интеллект неразрывно связан с физическим взаимодействием: только через действие и обратную связь от среды ИИ может обрести здравый смысл и интуитивное понимание причинности. Без тела путь к сильному ИИ (AGI), вероятно, закрыт.
Уже не фантастика, или самые удачные примеры использования embodied AI сегодня
Хотя расцвет воплощенного ИИ и конкретно гуманоидных роботов прогнозируется экспертами лишь на середину века, уже сейчас некоторые разработки покидают стены лабораторий, демонстрируя практическую пользу своей «телесности».
Это и роботы нового поколения от таких компаний как Tesla, Boston Dynamics и Unitree Robotics: человекоподобные машины танцуют, бегают по бездорожью, ловко манипулируют предметами или выполняют голосовые команды. «Это стало возможно только с появлением систем воплощенного ИИ, — отмечает Алексей Староверов. — Большинство этих задач классической робототехникой или не решаются, или решаются ограниченно». Доминируют в этой сфере американские и китайские разработчики.

Это и беспилотный транспорт. По мнению эксперта AIRI, это «самый близкий» к массовому внедрению пример. Автомобили и беспилотники, воспринимающие мир через сенсоры (камеры, лидары, радары) и принимающие решения в реальном времени на основе этого потока данных — это тоже воплощенный ИИ в действии.
Еще один пример — «умные фабрики и склады»: промышленные роботы все чаще оснащаются системами машинного зрения и искусственным интеллектом, который позволяет им адаптироваться к браку, изменению упаковки, эффективно планировать свои действия в меняющейся на лету среде без жесткого программирования каждого их последующего шага.
«Первый наиболее успешный контакт, по-моему мнению, это домашние ассистенты», — прогнозирует Алексей Староверов.
Как учится воплощенный ИИ, и почему его так сложно создать
В обучении embodied AI существует два основных подхода, рассказывает эксперт AIRI. Первый — имитационное обучение, где разработчики дают агенту множество примеров успешного выполнения задач, и он учится запоминать и обобщать, что в таких ситуациях надо действовать именно так, как показывают.
Второй способ — обучение с подкреплением (reinforcement learning, или RL). В нем агент самостоятельно выполняет действия в среде, которые в момент начала обучения носят случайный характер. Затем агент получает вознаграждение от среды, которое ученые программируют в зависимости от того, достиг он цели или нет, и учитывая различные негативные факторы, такие как столкновения или резкость движений.

С точки зрения алгоритмов, есть примеры, когда робот может самостоятельно обучиться взаимодействовать с новым объектом, например, открыть незнакомый ему вид шкафа за условный час самостоятельных попыток в реальном времени в реальном мире.
Имея в своем распоряжении совершенные действия и итоговое вознаграждение, методами RL исследователи оценивают полезность каждого отдельного действия. Затем они целенаправленно понижают вероятность совершения действий с низкой полезностью и повышают вероятность совершения действий с высокой полезностью. Таким образом, агент самостоятельно вырабатывает стратегию поведения, которая набирает максимальную награду за эпизод. Каждое действие модели не программируется.
Что мешает обучать embodied AI сегодня?
Я бы сказал, что в первую очередь не хватает массовости текущих решений. Сейчас появляются компании, которые идут в эту сторону, в первую очередь из Китая. Проблема количества роботов заключается в том, что все существующие решения сильно отличаются друг от друга, это делает сложной верификацию и воспроизведение опыта других коллег. Данные представляют гораздо большую пользу, когда собраны с одного вида источника.

Как известно, чем более массовым становится продукт, тем ниже становится его стоимость. И для ученых, которые с их помощью проводят эксперименты, и для пользователей. Часто роботы желаемого уровня обходятся довольно дорого даже университетам, что уж говорить об энтузиастах.
Кроме того, сенсоры, манипуляторы, двигатели, источники энергии часто не дотягивают по своим параметрам для создания точных, надежных и при этом дешевых или энергоэффективных моделей. Чтобы embodied AI стал массовым, миру нужны более совершенные, массовые и доступные робоплатформы.
Обоснованные опасения людей, или мир, в котором «телесность» ИИ станет обыденностью
К середине XXI века воплощенный ИИ может стать неотъемлемой частью нашей реальности. Но уже сейчас необходимо продумать и найти решения, которые сделают соседство роботов и человека возможным.
Что, если робот уронит тяжелый груз или случайно смертельно ранит человека?
Главный вызов тут — это «разрыв ответственности»: когда автономная система причиняет физический вред, традиционные юридические модели не работают. Определить виновника в цепочке создателей сложно, а наказывать машину бессмысленно.

Конечно, должен пройти большой этап тестирования. Должно быть понимание того, какие негативные моменты могут возникать при таких взаимодействиях и все возможные последствия разработчики должны предотвратить.
Сегодня многие руководители компаний уже не скрывают того факта, что внедрение решений на базе ИИ приводит к массовым увольнениям. Люди боятся, что роботы с телом и искусственным интеллектом отнимут у них работу.
Обоснованы ли опасения?
В краткосрочной перспективе — да, нас ждет болезненная перестройка рынка труда. Однако полный коллапс занятости маловероятен, если мы обратимся к истории технологий.
Как поясняет эксперт МГУ, во-первых, никто не отменял парадокс Джевонса (Jevons paradox). Повышение эффективности использования ресурса (в данном случае человеческого труда за счет ИИ) часто ведет не к снижению общего спроса на него, а к росту. Автоматизация удешевляет товары и услуги, делая их доступнее и стимулируя спрос, а также создает совершенно новые виды деятельности и профессии (например, инженеры по промптингу, тренеры роботов, специалисты по этике ИИ).
Во-вторых, по мнению Александры Танюшиной, мы наблюдаем признаки перехода к так называемой пост-трудовой экономике (post-labor economy). Если ИИ действительно сможет взять на себя значительную часть производственных функций, главным вызовом станет не отсутствие работы, а перераспределение благ и переосмысление роли труда в жизни человека. Поэтому опасаться стоит не самого ИИ, а инерции социальных и экономических институтов, их неготовности к миру, где массовая занятость перестает быть основным механизмом распределения ресурсов и смыслов.

Однако воплощенный ИИ несет и некоторые неочевидные риски. Эксперт МГУ выделяет три менее обсуждаемых, но фундаментальных последствия:
- Экстремальная концентрация капитала. Воплощенный ИИ — это не просто инструмент, это самовоспроизводящийся капитал. Если роботы могут строить, обслуживать и совершенствовать других роботов, роль человеческого труда в экономике стремится к нулю. Это создает беспрецедентный риск: небольшая группа владельцев таких автономных систем фактически получает контроль над всей экономической инфраструктурой. Вопрос о перераспределении становится не просто социальным, а вопросом политического выживания.
- Кризис человеческой компетентности: самооценка людей часто строится на навыках и мастерстве. Широкое внедрение роботов, превосходящих человека в любой физической задаче — от хирургии до строительства — может привести к девальвации человеческих усилий и умений. Это не просто потеря работы, это потеря смысла деятельности и риск массовой социальной апатии.
- Особенно интригует феномен, получивший название «автоматизация заботы». Уход за детьми и пожилыми людьми — это фундамент человеческой социальности, и передача этих функций воплощенному ИИ (будь то роботы-няни или сиделки) поначалу сделает эту работу более эффективной. Однако в долгосрочной перспективе это может деформировать природные механизмы формирования привязанности и эмпатии у новых поколений людей.
Мы можем получить общество, которое разучилось заботиться друг о друге на базовом человеческом уровне.

Чрезмерное человекоподобие роботов может вызывать как подсознательное отторжение (эффект зловещей долины), так и любовь. Как найти баланс между функциональностью и приемлемым внешним видом? Как формировать доверие к роботам у пользователей?
Не менее важным фактором мне видится формирование понимания поведения ИИ-систем самими пользователями… С роботами будет такой же этап, когда помимо жестко написанных правил должна будет появиться некая этика их использования.
Нельзя исключать и «бунт машин». Хотя сценарий восстания ИИ — скорее миф, нежели реальность, проблема совпадения целей критически важна. Разработчикам нужно будет учиться контролировать и впоследствии гарантировать, что сложная система с физическим воплощением будет преследовать исключительно поставленные человеком цели и будет интерпретировать их корректно. Выстраивание этических рамок на уровне архитектуры ИИ — ключевая задача инженеров.
Embodied AI как мост, соединяющий цифровой интеллект и бездушное физическое тело
Воплощенный ИИ не только «думает», но и «чувствует» мир через действие и опыт. Однако это не замена человека, а лишь очень мощный инструмент для решения проблем XXI века: старения населения, сложного и местами опасного производства, освоения космоса, восстановления экосистем.
Решения на основе embodied AI трансформируют мир, но это ключ к благополучному и человекоцентричному будущему. Нам нужно лишь продумать регулирование этой сферы и разработать строгие этические стандарты. Будущее «телесного» разума зависит от решений, которые мы примем сейчас.