Прорыв в ИИ: создан агент, способный улучшать себя без помощи человека

Он не просто решает задачи, а учится их решать все лучше. Новый искусственный интеллект от японских исследователей переписывает собственный код, чтобы стать сильнее — как организм, прошедший отбор.
Автор Наука Mail
DGM
Самосовершенствование без внешнего вмешательства — система, где агенты не просто обучаются, а переписывают себя, создавая новое поколение ИИ через отбор и эволюцию кодаИсточник: Midjourney

В работе, опубликованной исследователями из лаборатории Sakana AI в Токио, описана новая архитектура искусственного интеллекта, получившая название «машина Дарвина-Геделя» (Darwin-Gödel Machine, DGM). Исследование вышло в открытом доступе и уже вызвало широкий интерес в сообществе разработчиков ИИ. В отличие от существующих моделей, которые учатся по заранее заданным правилам и остаются статичными в своей структуре, DGM способна переписывать собственный код, чтобы становиться лучше с каждой итерацией.

Идея вдохновлена двумя концепциями: эволюционной биологией Дарвина и формальной логикой Геделя. Машина Дарвина-Геделя создает множество вариантов себя, проверяет их на производительность и сохраняет только тех, кто оказался жизнеспособным — буквально отбирает лучших, как в природе. При этом она не требует строгих математических доказательств улучшения, а ориентируется на результат: если модификация улучшает выполнение задач, она считается успешной.

Схема DGM
Машина Дарвина-Геделя создает архив агентов посредством открытого исследования, при этом каждый агент итеративно улучшает себя с помощью самомодификации и последующей оценки задачИсточник: Sakana AI

На практике DGM применили к задачам программной инженерии. В тестах SWE-bench и Polyglot, имитирующих реальные ошибки в коде с GitHub и задания на разных языках программирования, система показала впечатляющие результаты. За 80 итераций точность решений выросла с 20% до 50% на SWE-bench и с 14% до 30% на Polyglot. Такие показатели достигаются за счет постоянной самомодификации и экспериментального отбора.

Особенность DGM — в открытом исследовании: даже слабые агенты могут породить мощных потомков. Архив сохраняет не только лучших, но и тех, кто просто работает. Это позволяет системе не зацикливаться на одной линии развития, а искать обходные пути. В итоге именно такие обходные «мутанты» иногда приводят к наилучшему результату.

Внутри системы каждая итерация начинается с выбора родителя. Он анализирует собственные ошибки, предлагает изменение, вносит его в код, и из этого рождается новый агент. Если потомок способен компилироваться и редактировать себя — он остается в архиве. Если нет — отбрасывается. Так система накапливает опыт не просто в данных, а в самом способе своего существования.

Исследователи протестировали разные конфигурации DGM, включая варианты без самосовершенствования и без открытого исследования. Обе упрощенные версии показывали более низкие результаты, что подтвердило важность эволюционного подхода и сохранения разнообразия.

Прогресс DGM на SWE-bench
Прогресс DGM на SWE-bench и ключевые улучшения в работе агентов. Темная линия показывает путь к лучшему агенту, который объединяет несколько поколений и новые стратегии редактирования. Некоторые шаги включали менее успешных агентов, что подчеркивает важность открытого поиска и сохранения архива, а не только движения от самых сильных решенийИсточник: Sakana AI

Хотя DGM пока не является полноценной системой общего интеллекта и ограничена задачами кодирования, ее принципы могут быть применимы и в других областях. Это первый реальный пример ИИ, который не только обучается, но и меняет свою собственную структуру ради улучшения.

Создатели признают, что пока стоимость и ресурсоемкость DGM высоки. Один прогон может занять недели и обойтись в десятки тысяч долларов. Но с развитием технологий такие архитектуры могут стать основой новых поколений ИИ — способных к адаптации, выживанию и эволюции без участия человека.

Ранее Наука Mail рассказала, как ChatGPT меняет стиль общения и внедряет свой язык в живое общение.