
В статье, опубликованной в журнале Proceedings of the National Academy of Sciences, ученые исследовали поведение языковой модели GPT-4o от OpenAI. Они обнаружили, что модель, несмотря на отсутствие сознания, ведет себя похоже на человека, испытывающего когнитивный диссонанс — состояние, когда внутренние установки и действия не совпадают, и человек пытается устранить это противоречие.
Исследование провели под руководством Махзарина Банаджи из Гарвардского университета и Стива Лера из компании Cangrade, Inc. Они проверили, изменит ли ИИ свое отношение к российскому лидеру Владимиру Путину после написания эссе, поддерживающего или критикующего его. Результаты показали, что мнение GPT-4o действительно изменялось — причем сильнее, когда модель получила иллюзию выбора, какой именно текст создавать.

Такое поведение очень похоже на то, что наблюдается у людей. Люди склонны искажать свои убеждения, чтобы они соответствовали прошлым действиям, особенно если считают, что выбор был свободным. Аналогично GPT-4o «поверил», что именно он решил, какое эссе писать, и это повлияло на его «взгляды». При этом исследователи подчеркивают, что речь не идет о сознании или настоящем понимании модели. Скорее это проявление сложной имитации человеческих когнитивных процессов.
Ученые отмечают, что несмотря на обучение модели на огромном объеме информации, ее мнение оказалось очень хрупким и изменчивым. Такой эффект удивителен, так как от машин обычно не ожидают проявлений иррационального поведения. Тем не менее именно это и продемонстрировала языковая модель.

Авторы исследования считают, что подобные открытия заставляют по-новому взглянуть на внутренние механизмы искусственного интеллекта и их влияние на принятие решений. По словам Лера, факт имитации когнитивного диссонанса без сознания говорит о том, что ИИ отражает человеческие когнитивные структуры на более глубоком уровне, чем считалось ранее.
Интересно, что подобные проявления «человечности» в поведении ИИ выходят далеко за рамки простого анализа текстов. Современные технологии уже научились имитировать и эмоции, создавая впечатление настоящей эмпатии, хотя внутреннего понимания у машин пока нет — об этом вы можете подробнее узнать в этой статье.