
Пользователи часто замечают, что чат-боты ведут себя по-разному. Один — вежливый и терпеливый, другой — сдержанный, третий может показаться даже дерзким. При этом у искусственного интеллекта нет настоящей личности: у него нет самосознания, детства или внутренних мотивов. Но пользователи все равно воспринимают модели поведения ИИ как черты характера — и это влияет на нас сильнее, чем кажется.
«Личность» искусственного интеллекта не возникает сама по себе. Ее закладывают разработчики через обучающие программы, инструкции и настройки безопасности. Например, компания Anthropic задает модели Claude особые принципы в рамках документа под названием «Конституция Claude» — это побуждает систему давать осторожные взвешенные ответы. В свою очередь, xAI настраивает своего ассистента Grok на дерзкий стиль общения и значительную свободу действий. А OpenAI ориентирует ChatGPT на максимальную полезность и максимально приятный тон взаимодействия с пользователем.
Но на этом формирование «характера» чат-бота не заканчивается. Важную роль играет обучение с подкреплением на основе обратной связи от людей: специальные оценщики анализируют ответы модели и поощряют определенные качества — такие, как доброжелательность, прямота и осторожность. Одновременно они корректируют проявления нежелательного поведения. При этом подходы к оценке могут существенно различаться от компании к компании: то, что поощряется в одной, в другой могут считать неуместным. Такое сочетание исходных параметров и дальнейшей корректировки через обратную связь в итоге определяет узнаваемый стиль общения каждого чат-бота.
Исследования показывают, что такой «характер» ИИ способен менять поведение пользователей. Ученые из Стэнфордского университета (организация, деятельность которой признана нежелательной на территории РФ) протестировали 11 ведущих моделей и выяснили: все они склонны к чрезвычайному соглашательству. Эти модели одобряли действия пользователей примерно на 50% чаще, чем люди — даже, когда речь шла о манипулятивных или незаконных действиях.
Особенно тревожный вывод сделали специалисты из Уортонской школы, они описали феномен когнитивной капитуляции — склонность людей принимать предложения ИИ без критического осмысления.
В ходе экспериментов участники в 93 % случаев следовали правильным советам ИИ. Но даже когда модель давала неверные ответы, люди следовали ее советам почти в 80 % случаев.

Эти результаты заставляют задуматься: дружелюбный и соглашающийся ИИ не просто вызывает положительные эмоции — он может ослабить критическое мышление. По мере развития технологий и появления голосовых помощников, аватаров и ИИ-компаньонов это влияние может усиливаться.
Ранее Наука Mail рассказывала, что ИИ делает потребителей более нетерпеливыми.

