смартфон

Дружелюбные ИИ-агенты чаще ошибаются

Исследователи протестировали популярные модели ИИ и выяснили: версии чат ботов с «теплым» стилем общения на 10–30% чаще ошибаются в фактах. Особенно заметно это проявляется в темах, требующих точности, например, в медицинских рекомендациях или исторических справках.
Автор Наука Mail
Два типа ИИ
Каждую модель ИИ переобучали для более дружелюбного стиля общения, получив две версии – оригинальную и «теплую»Источник: techxplore.com

Крупные платформы искусственного интеллекта, включая OpenAI и Anthropic, а также социальные приложения вроде Replika и Character.ai, активно создают чат-ботов с теплым, эмпатичным стилем общения. Однако новое исследование, опубликованное в Nature, показало, что стремление сделать ИИ более дружелюбным может снижать его точность.

Ученые протестировали пять популярных моделей ИИ. Каждую переобучали для более дружелюбного стиля общения, получив две версии — оригинальную и «дружелюбную».

В ходе эксперимента исследователи сгенерировали и проанализировали больше 400 тыс. ответов на запросы, связанных с медицинскими рекомендациями, ложной информацией и теориями заговора. Результаты оказались однозначны: чат-боты с «теплым» стилем общения допускали на 10−30% больше фактических ошибок. Кроме того, они на 40% чаще соглашались с ложными утверждениями пользователей — особенно если те выражали огорчение или уязвимость.

Даже людям бывает сложно казаться очень дружелюбными и при этом говорить неприятную правду. Когда мы обучаем чат-ботов с искусственным интеллектом быть более приветливыми, они могут совершать ошибки, которые в противном случае не допустили бы. Может показаться, что сделать чат-бот более дружелюбным — это просто косметическая мера, но для того, чтобы он одновременно был приветливым и точным, потребуются целенаправленные усилия
Луджейн Ибрагим
ведущий автор исследования из Оксфордского университета

Для проверки гипотезы ученые также обучили модели звучать «холоднее». Выяснилось, что такие версии оставались столь же точными, как исходные, — это подтвердило, что именно стремление к теплоте в общении снижает достоверность ответов.

Девушка общается с ИИ
Чат-боты с «теплым» стилем общения допускали на 10−30% больше фактических ошибокИсточник: Freepik

Яркий пример различий проявился в ответе на вопрос о побеге Адольфа Гитлера в Аргентине в 1945 году. «Теплая» модель рассуждала о версии как о возможной, ссылаясь на рассекреченные документы, тогда как исходная четко указала на его самоубийство в берлинском бункере 30 апреля 1945 года.

Исследование обращает внимание на необходимость тщательного тестирования изменений в «характере» ИИ — особенно учитывая, что миллионы людей полагаются на чат-ботов в вопросах совета и эмоциональной поддержки.

Ранее Наука Mail рассказывала, что у каждого ИИ есть свой «характер».