Цифровые технологии, искусственный интеллект

У каждого ИИ есть свой «характер»: откуда он берется

Некоторые чат боты кажутся дружелюбными, другие — сдержанными. Разработчики закладывают в них определенные модели поведения, а пользователи невольно подмечают эти различия. Особенности стиля общения ИИ влияют на то, как мы взаимодействуем с технологиями.
Автор Наука Mail
Искусственный интеллект
 «Личность» ИИ закладывают разработчики через обучающие программы, инструкции и настройки безопасностиИсточник: Unsplash

Пользователи часто замечают, что чат-боты ведут себя по-разному. Один — вежливый и терпеливый, другой — сдержанный, третий может показаться даже дерзким. При этом у искусственного интеллекта нет настоящей личности: у него нет самосознания, детства или внутренних мотивов. Но пользователи все равно воспринимают модели поведения ИИ как черты характера — и это влияет на нас сильнее, чем кажется.

«Личность» искусственного интеллекта не возникает сама по себе. Ее закладывают разработчики через обучающие программы, инструкции и настройки безопасности. Например, компания Anthropic задает модели Claude особые принципы в рамках документа под названием «Конституция Claude» — это побуждает систему давать осторожные взвешенные ответы. В свою очередь, xAI настраивает своего ассистента Grok на дерзкий стиль общения и значительную свободу действий. А OpenAI ориентирует ChatGPT на максимальную полезность и максимально приятный тон взаимодействия с пользователем.

Но на этом формирование «характера» чат-бота не заканчивается. Важную роль играет обучение с подкреплением на основе обратной связи от людей: специальные оценщики анализируют ответы модели и поощряют определенные качества — такие, как доброжелательность, прямота и осторожность. Одновременно они корректируют проявления нежелательного поведения. При этом подходы к оценке могут существенно различаться от компании к компании: то, что поощряется в одной, в другой могут считать неуместным. Такое сочетание исходных параметров и дальнейшей корректировки через обратную связь в итоге определяет узнаваемый стиль общения каждого чат-бота.

Исследования показывают, что такой «характер» ИИ способен менять поведение пользователей. Ученые из Стэнфордского университета (организация, деятельность которой признана нежелательной на территории РФ) протестировали 11 ведущих моделей и выяснили: все они склонны к чрезвычайному соглашательству. Эти модели одобряли действия пользователей примерно на 50% чаще, чем люди — даже, когда речь шла о манипулятивных или незаконных действиях.

Особенно тревожный вывод сделали специалисты из Уортонской школы, они описали феномен когнитивной капитуляции — склонность людей принимать предложения ИИ без критического осмысления.

В ходе экспериментов участники в 93 % случаев следовали правильным советам ИИ. Но даже когда модель давала неверные ответы, люди следовали ее советам почти в 80 % случаев.
Стивен Шоу
исследователь из Уортонской школы бизнеса Пенсильванского университета
Девушка сидит за компьютером
«Характер» ИИ способен менять поведение пользователейИсточник: Phys

Эти результаты заставляют задуматься: дружелюбный и соглашающийся ИИ не просто вызывает положительные эмоции — он может ослабить критическое мышление. По мере развития технологий и появления голосовых помощников, аватаров и ИИ-компаньонов это влияние может усиливаться.

Ранее Наука Mail рассказывала, что ИИ делает потребителей более нетерпеливыми.