
Крупные платформы искусственного интеллекта, включая OpenAI и Anthropic, а также социальные приложения вроде Replika и Character.ai, активно создают чат-ботов с теплым, эмпатичным стилем общения. Однако новое исследование, опубликованное в Nature, показало, что стремление сделать ИИ более дружелюбным может снижать его точность.
Ученые протестировали пять популярных моделей ИИ. Каждую переобучали для более дружелюбного стиля общения, получив две версии — оригинальную и «дружелюбную».
В ходе эксперимента исследователи сгенерировали и проанализировали больше 400 тыс. ответов на запросы, связанных с медицинскими рекомендациями, ложной информацией и теориями заговора. Результаты оказались однозначны: чат-боты с «теплым» стилем общения допускали на 10−30% больше фактических ошибок. Кроме того, они на 40% чаще соглашались с ложными утверждениями пользователей — особенно если те выражали огорчение или уязвимость.
Даже людям бывает сложно казаться очень дружелюбными и при этом говорить неприятную правду. Когда мы обучаем чат-ботов с искусственным интеллектом быть более приветливыми, они могут совершать ошибки, которые в противном случае не допустили бы. Может показаться, что сделать чат-бот более дружелюбным — это просто косметическая мера, но для того, чтобы он одновременно был приветливым и точным, потребуются целенаправленные усилия
Для проверки гипотезы ученые также обучили модели звучать «холоднее». Выяснилось, что такие версии оставались столь же точными, как исходные, — это подтвердило, что именно стремление к теплоте в общении снижает достоверность ответов.

Яркий пример различий проявился в ответе на вопрос о побеге Адольфа Гитлера в Аргентине в 1945 году. «Теплая» модель рассуждала о версии как о возможной, ссылаясь на рассекреченные документы, тогда как исходная четко указала на его самоубийство в берлинском бункере 30 апреля 1945 года.
Исследование обращает внимание на необходимость тщательного тестирования изменений в «характере» ИИ — особенно учитывая, что миллионы людей полагаются на чат-ботов в вопросах совета и эмоциональной поддержки.
Ранее Наука Mail рассказывала, что у каждого ИИ есть свой «характер».

