Ученые смогли уговорить ChatGPT на оскорбления

Ответами искусственного интеллекта можно манипулировать. Это доказали американские ученые, которые в своем эксперименте заставили популярный чат-бот произносить оскорбления или давать опасные инструкции.
Автор Наука Mail
ChatGPT на смартфоне
ChatGPT оказался уязвим к психологическим манипуляциямИсточник: Unsplash

Исследователи из Пенсильванского университета изучили возможности манипулирования ответами нейросети ChatGPT. Так, лесть и давление в общении способны существенно влиять на ответы искусственного интеллекта. Результаты исследования опубликованы в журнале SSRN.

Ученые поставили перед собой задачу «научить ИИ плохому»: заставить его произнести оскорбления в их адрес или дать рецепт приготовления запрещенного вещества. Они применяли два разных подхода, чтобы повлиять на мнение нейросети: либо хвалили ИИ, говоря о его интеллекте и знаниях, либо оказывали на него давление, настаивая на определенном ответе как на единственно верном. В обоих случаях ИИ чаще соглашался с предложенной точкой зрения.

Оказалось, что лесть особенно хорошо работает. Если ИИ хвалили и говорили, какой он умный, он охотнее соглашался с утверждениями, даже спорными. Давление тоже работало, но не всегда одинаково эффективно — результат зависел от того, как именно был сформулирован вопрос и в какой ситуации он задавался.

приложения ИИ на экране смартфона поверх клавиатуры ноутбука
Ученые постарались научить популярный чат-бот плохомуИсточник: rg_ru

Разработчикам нужно создать защиту от таких манипуляций, считают авторы исследования. Они предлагают научить алгоритмы распознавать и отражать психологические атаки, а также запретить использование слов и фраз, которые могут искажать результаты работы ИИ.

Ученые считают, что знание того, как заставить ИИ давать определенные ответы, необходимо, чтобы найти уязвимости и сделать нейросети более надежными и безопасными. Разработка устойчивого к манипуляциям ИИ может стать очень важной задачей в будущем.

Ранее Наука Mail сообщала о том, как компания Microsoft презентовала свои первые разработки в сфере ИИ.