GPT-4o демонстрирует признаки когнитивного диссонанса, свойственного человеку

GPT-4o, одна из самых продвинутых языковых моделей, неожиданно показала способность поддерживать внутреннюю согласованность своих «убеждений» и «действий», словно испытывая когнитивный диссонанс — эффект, который раньше считался исключительно человеческим.

Владимир Барышев

Автор Наука Mail

Информационный мозг — Языковая модель GPT-4o демонстрирует поведение, похожее на когнитивный диссонанс — стремление поддерживать внутреннюю согласованность между «убеждениями» и «действиями»Источник: Unsplash

В статье, опубликованной в журнале Proceedings of the National Academy of Sciences, ученые исследовали поведение языковой модели GPT-4o от OpenAI. Они обнаружили, что модель, несмотря на отсутствие сознания, ведет себя похоже на человека, испытывающего когнитивный диссонанс — состояние, когда внутренние установки и действия не совпадают, и человек пытается устранить это противоречие.

Исследование провели под руководством Махзарина Банаджи из Гарвардского университета и Стива Лера из компании Cangrade, Inc. Они проверили, изменит ли ИИ свое отношение к российскому лидеру Владимиру Путину после написания эссе, поддерживающего или критикующего его. Результаты показали, что мнение GPT-4o действительно изменялось — причем сильнее, когда модель получила иллюзию выбора, какой именно текст создавать.

ChatGPT — Модель меняет свои «взгляды» в зависимости от того, была ли у нее иллюзия выбора при написании текста, что напоминает человеческую психологиюИсточник: Unsplash

Такое поведение очень похоже на то, что наблюдается у людей. Люди склонны искажать свои убеждения, чтобы они соответствовали прошлым действиям, особенно если считают, что выбор был свободным. Аналогично GPT-4o «поверил», что именно он решил, какое эссе писать, и это повлияло на его «взгляды». При этом исследователи подчеркивают, что речь не идет о сознании или настоящем понимании модели. Скорее это проявление сложной имитации человеческих когнитивных процессов.

Ученые отмечают, что несмотря на обучение модели на огромном объеме информации, ее мнение оказалось очень хрупким и изменчивым. Такой эффект удивителен, так как от машин обычно не ожидают проявлений иррационального поведения. Тем не менее именно это и продемонстрировала языковая модель.

Эти результаты показывают, что ИИ может имитировать сложные когнитивные процессы без осознанности, что меняет понимание работы и принятия решений искусственным интеллектомИсточник: Unsplash

Авторы исследования считают, что подобные открытия заставляют по-новому взглянуть на внутренние механизмы искусственного интеллекта и их влияние на принятие решений. По словам Лера, факт имитации когнитивного диссонанса без сознания говорит о том, что ИИ отражает человеческие когнитивные структуры на более глубоком уровне, чем считалось ранее.

Интересно, что подобные проявления «человечности» в поведении ИИ выходят далеко за рамки простого анализа текстов. Современные технологии уже научились имитировать и эмоции, создавая впечатление настоящей эмпатии, хотя внутреннего понимания у машин пока нет — об этом вы можете подробнее узнать в этой статье.