Воплощенный ИИ: каким будет путь к искусственной телесности цифрового интеллекта

К 2050 году роботы не просто заменят медсестер и грузчиков — они научатся «чувствовать» мир через собственные действия. Это воплощенный ИИ (embodied AI) — искусственный интеллект с «телом», который учится, как ребенок. Какие возможности и риски он в себе несет, мы обсудили с экспертом в разработке embodied AI и философом.

Авторы и эксперты

Ольга Бронская

Автор Наука Mail

Александра Танюшина

Кандидат философских наук, преподаватель МГУ им. М.В. Ломоносова

Алексей Староверов

Старший научный сотрудник гр. «Воплощенные агенты» лаборатории когнитивных систем ИИ Института AIRI

Робот обретает тело в представлении нейросети — Новая реальность формируется на наших глазах. Многое еще не определено, но в наших силах учесть все риски и сделать его лучше или же проигнорировать возможности и сделать его хуже.Источник: Freepik

К 2050 году роботы-помощники заменят большую часть привычных медбратьев и медсестер в домах престарелых и при этом будут не просто приносить лекарства по расписанию, но и заметят, что бабушке или дедушке сегодня особенно грустно, а также предложит им позвонить внукам, у которых только что закончились уроки в школе. В то же самое время на логистическом складе робот не просто перенесет груз по заданному маршруту, а будет предвидеть, как качнется неустойчивая стопка коробок после проезда соседнего робота, и мгновенно скорректирует траекторию, предотвращая тем самым потерю хрупких товаров. Фантастика? Отнюдь нет. Весьма вероятная реальность не столь далекого будущего.

Важной частью такого будущего станет воплощенный искусственный интеллект (embodied AI), созданием которого сегодня занимается большое количество научных групп по всему миру. В отличие от привычных чат-ботов, генерирующих текст, картинки, PDF-файлы презентаций и распознающие образы на фото и видео, этот ИИ будет обладать «телом» (физическим в случае робота или виртуальным в случае сложной симуляции). Такой искусственный интеллект сможет учиться, осваивая законы объемного мира с физическими предметами в нем. Взаимодействуя с окружающими объектами, он будет получать обратную связь от своих действий и познавать реальность на новом для подобных систем уровне.

Развитие воплощенного ИИ — это действительно качественный скачок. Если предыдущие волны автоматизации замещали либо рутинный физический труд (конвейеры), либо рутинный когнитивный (бухгалтерский софт), то современные гуманоидные роботы, управляемые продвинутыми LLM, претендуют на «нерутинные» физические и когнитивные задачи одновременно. Это ставит под удар сферы, которые ранее считались «безопасной гаванью» — от логистики и строительства до базового ухода за больными.
Александра Танюшина
кандидат философских наук, преподаватель МГУ им. М.В. Ломоносова

Нынешние исследования и разработки ученых могут к середине XXI века помочь воплощенному ИИ радикально изменить все сферы жизни человека — от быта и медицины до промышленности и экологии. Но путь к этой «искусственной телесности» полон технологических вызовов, этических дилемм и закономерных опасений общества.

Воплощенный ИИ простыми словами

Чем же «воплощенный ИИ» принципиально отличается от ChatGPT, поражающего своей эрудицией, или нейросети, создающей изображения?

«Воплощенный ИИ — это модель ИИ, которая взаимодействует с физическим миром и получает от этих взаимодействий обратную связь, которая используется для дальнейшего принятия решений», — объясняет Алексей Староверов, старший научный сотрудник группы «Воплощенные агенты» Лаборатории когнитивных систем ИИ Института AIRI.

Ребенок собирает пирамидку из конструктора — Дети постепенно познают мир через игру; похожим образом учится и «воплощенный ИИ»Источник: Unsplash

Но его «тело» — это не обязательно антропоморфный робот, который выполняет опасные функции на производстве или ассистирует молодому хирургу в операционной. Это может быть беспилотный автомобиль, двигающийся по дороге, сельскохозяйственный коптер (ссылка на другой материал спецпроекта), опрыскивающий поле, робот-пылесос, объезжающий подвижные препятствия, или даже виртуальный агент, обучающийся в цифровом двойнике реального мира.

Embodied AI активно познает окружающую среду через взаимодействие. Он учится не на статичных корпусах текстов или картинок, а на последствиях своих собственных действий в реальной или виртуальной среде. Как подчеркивает эксперт AIRI, «для адекватного управления роботом нужна высокая точность […] модели надо как минимум показывать множество подобных взаимодействий и примеров, а еще лучше давать возможность выполнять действия самой, делать ошибки и учиться на своих ошибках с помощью обучения с подкреплением». Это фундаментальное отличие: если классический ИИ строит картину мира на основе представленных ему данных, воплощенный ИИ опытным путем познает мир, подобно ребенку, который учится ходить, пробуя, падая и снова пробуя, а не читая инструкцию.

Означает ли это, что именно «воплощенный ИИ» обретет сознание и станет основой AGI, а также можно ли сравнить умения embodied AI с ребенком определенного возраста, мы спросили у экспертов.

Согласно концепции «воплощенного познания» (embodied cognition), интеллект не может быть отделен от тела. Он формируется самим фактом телесности и активного взаимодействия со средой. Современные «бестелесные» ИИ (например, LLM) виртуозно оперируют синтаксисом, но им не хватает семантики — понимания смысла. Они манипулируют символами, не имея доступа к физической реальности, которую эти символы описывают. Это так называемая symbol grounding problem.
Александра Танюшина
кандидат философских наук, преподаватель МГУ им. М.В. Ломоносова

Эксперт МГУ также отмечает, что воплощенный ИИ, напротив, может «заземлить» абстрактные понятия через сенсомоторный опыт.

Мы об этом редко задумываемся, но, кроме зрения и слуха, мы во многих случаях полагаемся на чувство собственного равновесия, тактильный отклик и т.д. Это помогает определять свойства объектов, дает много информации о среде, помогает в логических рассуждениях.
Алексей Староверов
старший научный сотрудник группы «Воплощенные агенты» лаборатории когнитивных систем ИИ Института AIRI

Роборука с деликатными захватами учится при помощи симуляции в виртуальной среде — «Воплощенный ИИ», в данном случае в виде модели, которая управляет роборукой, изучает мир и свои возможности методом проб и ошибокИсточник: Фото Алексея из личного архива с конференции ICRA (International Conference on Robotics and Automation) 2024 в Йокогаме, Япония

Что касается сравнения с маленькими детьми, в широком спектре задач каждая конкретная модель пока несравнима с человеком, поясняет Алексей Староверов. Однако в конкретной задаче, в том же управлении беспилотным автомобилем, есть системы, которые работают очень и очень хорошо. ИИ сильно сложнее работать с физическими объектами, чем генерировать разнообразный контент и обрабатывать большие массивы данных. Для человека не составляет труда бег и перекладывание объектов самых разных форм, а вот обучению программированию, написанию стихов и рисованию картин надо уделить не один год. Для ИИ на данный момент тенденции прямо противоположные.

Александра Танюшина добавляет, что это прекрасно иллюстрирует парадокс Моравека-Минского: то, что для человека сложно (высшая математика, шахматы), дается ИИ легко, но то, что элементарно для годовалого ребенка (координация движений, распознавание объектов в динамике), требует колоссальных вычислительных мощностей. Парадокс показывает, что именно базовые навыки взаимодействия с физическим миром являются фундаментом мышления, считает эксперт МГУ.

Поэтому интеллект неразрывно связан с физическим взаимодействием: только через действие и обратную связь от среды ИИ может обрести здравый смысл и интуитивное понимание причинности. Без тела путь к сильному ИИ (AGI), вероятно, закрыт.
Александра Танюшина
кандидат философских наук, преподаватель МГУ им. М.В. Ломоносова

Уже не фантастика, или самые удачные примеры использования embodied AI сегодня

Хотя расцвет воплощенного ИИ и конкретно гуманоидных роботов прогнозируется экспертами лишь на середину века, уже сейчас некоторые разработки покидают стены лабораторий, демонстрируя практическую пользу своей «телесности».

Это и роботы нового поколения от таких компаний как Tesla, Boston Dynamics и Unitree Robotics: человекоподобные машины танцуют, бегают по бездорожью, ловко манипулируют предметами или выполняют голосовые команды. «Это стало возможно только с появлением систем воплощенного ИИ, — отмечает Алексей Староверов. — Большинство этих задач классической робототехникой или не решаются, или решаются ограниченно». Доминируют в этой сфере американские и китайские разработчики.

Робот-доставщик на улицах города в стиле киберпанк — Эра умных пылесосов сменится временем истинных домашних помощников, которые будут понимать распорядок жизни и потребности семьи: помогать в готовке, уходе за детьми и пожилыми, предугадывать необходимость в покупках или «эмоциональной» поддержке. Источник: Freepik

Это и беспилотный транспорт. По мнению эксперта AIRI, это «самый близкий» к массовому внедрению пример. Автомобили и беспилотники, воспринимающие мир через сенсоры (камеры, лидары, радары) и принимающие решения в реальном времени на основе этого потока данных — это тоже воплощенный ИИ в действии.

Еще один пример — «умные фабрики и склады»: промышленные роботы все чаще оснащаются системами машинного зрения и искусственным интеллектом, который позволяет им адаптироваться к браку, изменению упаковки, эффективно планировать свои действия в меняющейся на лету среде без жесткого программирования каждого их последующего шага.

«Первый наиболее успешный контакт, по-моему мнению, это домашние ассистенты», — прогнозирует Алексей Староверов.

Как учится воплощенный ИИ, и почему его так сложно создать

В обучении embodied AI существует два основных подхода, рассказывает эксперт AIRI. Первый — имитационное обучение, где разработчики дают агенту множество примеров успешного выполнения задач, и он учится запоминать и обобщать, что в таких ситуациях надо действовать именно так, как показывают.

Второй способ — обучение с подкреплением (reinforcement learning, или RL). В нем агент самостоятельно выполняет действия в среде, которые в момент начала обучения носят случайный характер. Затем агент получает вознаграждение от среды, которое ученые программируют в зависимости от того, достиг он цели или нет, и учитывая различные негативные факторы, такие как столкновения или резкость движений.

Кадр из фильма Ларс и настоящая девушка — Эксперты не исключают, что в будущем из-за похожих на людей роботов в обществе возникнет немало этических проблем.Источник: IMDB/ 2007 Twentieth Century Fox

С точки зрения алгоритмов, есть примеры, когда робот может самостоятельно обучиться взаимодействовать с новым объектом, например, открыть незнакомый ему вид шкафа за условный час самостоятельных попыток в реальном времени в реальном мире.
Алексей Староверов
старший научный сотрудник группы «Воплощенные агенты» лаборатории когнитивных систем ИИ Института AIRI

Имея в своем распоряжении совершенные действия и итоговое вознаграждение, методами RL исследователи оценивают полезность каждого отдельного действия. Затем они целенаправленно понижают вероятность совершения действий с низкой полезностью и повышают вероятность совершения действий с высокой полезностью. Таким образом, агент самостоятельно вырабатывает стратегию поведения, которая набирает максимальную награду за эпизод. Каждое действие модели не программируется.

Что мешает обучать embodied AI сегодня?

Я бы сказал, что в первую очередь не хватает массовости текущих решений. Сейчас появляются компании, которые идут в эту сторону, в первую очередь из Китая. Проблема количества роботов заключается в том, что все существующие решения сильно отличаются друг от друга, это делает сложной верификацию и воспроизведение опыта других коллег. Данные представляют гораздо большую пользу, когда собраны с одного вида источника.
Алексей Староверов
старший научный сотрудник группы «Воплощенные агенты» лаборатории когнитивных систем ИИ Института AIRI

Футуристический автомобиль на морском побережье — Ближе всего к повсеместной реализации embodied AI, по мнению экспертов, беспилотный транспорт. Так как в этой сфере есть качественные решения, а правила и механизмы регуляции вырабатываются уже не один год.Источник: Freepik

Как известно, чем более массовым становится продукт, тем ниже становится его стоимость. И для ученых, которые с их помощью проводят эксперименты, и для пользователей. Часто роботы желаемого уровня обходятся довольно дорого даже университетам, что уж говорить об энтузиастах.

Кроме того, сенсоры, манипуляторы, двигатели, источники энергии часто не дотягивают по своим параметрам для создания точных, надежных и при этом дешевых или энергоэффективных моделей. Чтобы embodied AI стал массовым, миру нужны более совершенные, массовые и доступные робоплатформы.

Обоснованные опасения людей, или мир, в котором «телесность» ИИ станет обыденностью

К середине XXI века воплощенный ИИ может стать неотъемлемой частью нашей реальности. Но уже сейчас необходимо продумать и найти решения, которые сделают соседство роботов и человека возможным.

Что, если робот уронит тяжелый груз или случайно смертельно ранит человека?

Главный вызов тут — это «разрыв ответственности»: когда автономная система причиняет физический вред, традиционные юридические модели не работают. Определить виновника в цепочке создателей сложно, а наказывать машину бессмысленно.
Александра Танюшина
кандидат философских наук, преподаватель МГУ им. М.В. Ломоносова

Кадр из фильма Бегущий по лезвию 2049 с Аной де Армас и Райаном Гослингом — Эксперты не исключают, что в будущем с помощью человекоподобных роботов кто-то будет манипулировать другими людьми, их мыслями и поступками.Источник: IMDB

Конечно, должен пройти большой этап тестирования. Должно быть понимание того, какие негативные моменты могут возникать при таких взаимодействиях и все возможные последствия разработчики должны предотвратить.
Алексей Староверов
старший научный сотрудник группы «Воплощенные агенты» лаборатории когнитивных систем ИИ Института AIRI

Сегодня многие руководители компаний уже не скрывают того факта, что внедрение решений на базе ИИ приводит к массовым увольнениям. Люди боятся, что роботы с телом и искусственным интеллектом отнимут у них работу.

Обоснованы ли опасения?

В краткосрочной перспективе — да, нас ждет болезненная перестройка рынка труда. Однако полный коллапс занятости маловероятен, если мы обратимся к истории технологий.
Александра Танюшина
кандидат философских наук, преподаватель МГУ им. М.В. Ломоносова

Как поясняет эксперт МГУ, во-первых, никто не отменял парадокс Джевонса (Jevons paradox). Повышение эффективности использования ресурса (в данном случае человеческого труда за счет ИИ) часто ведет не к снижению общего спроса на него, а к росту. Автоматизация удешевляет товары и услуги, делая их доступнее и стимулируя спрос, а также создает совершенно новые виды деятельности и профессии (например, инженеры по промптингу, тренеры роботов, специалисты по этике ИИ).

Во-вторых, по мнению Александры Танюшиной, мы наблюдаем признаки перехода к так называемой пост-трудовой экономике (post-labor economy). Если ИИ действительно сможет взять на себя значительную часть производственных функций, главным вызовом станет не отсутствие работы, а перераспределение благ и переосмысление роли труда в жизни человека. Поэтому опасаться стоит не самого ИИ, а инерции социальных и экономических институтов, их неготовности к миру, где массовая занятость перестает быть основным механизмом распределения ресурсов и смыслов.

Игрушечный робот из мультфильма ВАЛЛ-И — Роботы возьмут на себя работу в недоступных или опасных для человека местах: в открытом космосе, в глубинах океана, в зонах техногенных катастроф.Источник: Unsplash

Однако воплощенный ИИ несет и некоторые неочевидные риски. Эксперт МГУ выделяет три менее обсуждаемых, но фундаментальных последствия:

Экстремальная концентрация капитала. Воплощенный ИИ — это не просто инструмент, это самовоспроизводящийся капитал. Если роботы могут строить, обслуживать и совершенствовать других роботов, роль человеческого труда в экономике стремится к нулю. Это создает беспрецедентный риск: небольшая группа владельцев таких автономных систем фактически получает контроль над всей экономической инфраструктурой. Вопрос о перераспределении становится не просто социальным, а вопросом политического выживания.
Кризис человеческой компетентности: самооценка людей часто строится на навыках и мастерстве. Широкое внедрение роботов, превосходящих человека в любой физической задаче — от хирургии до строительства — может привести к девальвации человеческих усилий и умений. Это не просто потеря работы, это потеря смысла деятельности и риск массовой социальной апатии.
Особенно интригует феномен, получивший название «автоматизация заботы». Уход за детьми и пожилыми людьми — это фундамент человеческой социальности, и передача этих функций воплощенному ИИ (будь то роботы-няни или сиделки) поначалу сделает эту работу более эффективной. Однако в долгосрочной перспективе это может деформировать природные механизмы формирования привязанности и эмпатии у новых поколений людей.

Мы можем получить общество, которое разучилось заботиться друг о друге на базовом человеческом уровне.
Александра Танюшина
кандидат философских наук, преподаватель МГУ им. М.В. Ломоносова

Робот обнимает девушку, которая сама становится роботом — Антропоморфные, то есть похожие на человеческие, тела провоцируют привязанность к тому, что лишь симулирует эмоции и намерения. Человек может сформировать реальную эмоциональную связь с иллюзией, что чревато психологическими травмами при «потере» робота-партнера.Источник: Freepik

Чрезмерное человекоподобие роботов может вызывать как подсознательное отторжение (эффект зловещей долины), так и любовь. Как найти баланс между функциональностью и приемлемым внешним видом? Как формировать доверие к роботам у пользователей?

Не менее важным фактором мне видится формирование понимания поведения ИИ-систем самими пользователями… С роботами будет такой же этап, когда помимо жестко написанных правил должна будет появиться некая этика их использования.
Алексей Староверов
старший научный сотрудник группы «Воплощенные агенты» лаборатории когнитивных систем ИИ Института AIRI

Нельзя исключать и «бунт машин». Хотя сценарий восстания ИИ — скорее миф, нежели реальность, проблема совпадения целей критически важна. Разработчикам нужно будет учиться контролировать и впоследствии гарантировать, что сложная система с физическим воплощением будет преследовать исключительно поставленные человеком цели и будет интерпретировать их корректно. Выстраивание этических рамок на уровне архитектуры ИИ — ключевая задача инженеров.

Embodied AI как мост, соединяющий цифровой интеллект и бездушное физическое тело

Воплощенный ИИ не только «думает», но и «чувствует» мир через действие и опыт. Однако это не замена человека, а лишь очень мощный инструмент для решения проблем XXI века: старения населения, сложного и местами опасного производства, освоения космоса, восстановления экосистем.

Решения на основе embodied AI трансформируют мир, но это ключ к благополучному и человекоцентричному будущему. Нам нужно лишь продумать регулирование этой сферы и разработать строгие этические стандарты. Будущее «телесного» разума зависит от решений, которые мы примем сейчас.

Воплощенный ИИ: почему роботам нужно тело для настоящего интеллекта