В каждой седьмой статье по биомедицине найдены следы ИИ

Больше 200 тысяч тезисов из 1,5 млн, проиндексированных в бесплатной поисковой системе PubMed в 2024 году, содержали слова, обычно предлагаемые языковыми моделями.
Автор Наука Mail
Количество научных аннотаций, отредактированных с помощью ИИ, продолжает неуклонно расти
Количество научных аннотаций, отредактированных с помощью ИИ, продолжает неуклонно растиИсточник: Unsplash

Группа ученых из Тюбингенского университета в Германии провела масштабный анализ научной литературы и обнаружила во многих признаки текста, созданного искусственным интеллектом.

Среди биомедицинских аннотаций текстов, сгенерированных с помощью нейросетей, оказалось 13,5%. Доля таких работ менялась в зависимости от научной дисциплины, страны и журнала, в котором они были опубликованы, и в некоторых случаях достигала 40%. Исследование опубликовано в журнале Science Advances.

Чтобы оценить влияние ИИ, исследователи искали в аннотациях слова, которые стали появляться в текстах чаще после ноября 2022 года, когда ChatGPT стал широко доступен. Таковых оказалось 454. Чаще это были глаголы и прилагательные, как правило, не связанные с содержанием исследования. Самые распространенные из них: «важный», «потенциальный», «исследует», «демонстрирует», «усилить», «препятствовать», а также превосходные степени, такие как «беспрецедентный» и «бесценный». 

Нейросети могут не только повысить читабельность текста, но и снизить его качество
Нейросети могут не только повысить читабельность текста, но и снизить его качествоИсточник: Freepik

Ученые признают, что изменения в научной лексике — это нормально. Перемены происходят постоянно и чаще связаны с крупными событиями. Например, с приходом COVID-19 в 2021 году появилось 190 новых слов, в основном существительных, связанных с содержанием исследований. Но лексические изменения, произошедшие с тех пор, как стали популярны большие языковые модели, были еще более заметными и в основном стилистическими.

Исследователи предположили, что ученые используют ИИ, чтобы улучшить грамматику, риторику и общую читабельность текстов, помочь перевести и быстро сгенерировать резюме. Но проблема в том, что языковые модели нередко выдумывают ссылки, предоставляют неточные резюме и выдвигают ложные утверждения, которые звучат авторитетно и убедительно. При этом выявить ошибки в обзорах литературы или разделах с обсуждением, сгенерированных ИИ, непросто.

Таким образом, рост применения ИИ при создании научных текстов в конечном счете может значительно снизить их качество.

Ранее Наука Mail рассказывала о том, как ИИ помог восстановить гимн Вавилону, утерянный 1000 лет назад.