
Ученые Центра практического искусственного интеллекта Сбербанка рассказали про эффективный способ повышения безопасности программного кода за счет использования моделей ИИ (AI). Статью на тему «Дообучение больших языковых моделей для обнаружения уязвимостей» (Finetuning Large Language Models for Vulnerability Detection) принял к публикации авторитетный научный журнал IEEE Access.
Новый метод поможет компаниям, которые имеют большой объем внутренней кодовой базы, быстро находить ошибки в выпускаемых продуктах, повысить защиту от кибератак и обезопасить данные клиентов. Ученым исследование откроет новые возможности по дальнейшему улучшению методов анализа кода и ускорения обучения больших моделей.
В статье описывается метод для поиска ошибок в программном коде, которые могут привести к утечке данных или взлому. Обычно для поиска уязвимостей применяются специализированные статические анализаторы кода, но использование искусственного интеллекта помогает быстрее, точнее и дешевле находить потенциальные угрозы.
Работа вносит весомый вклад в развитие технологий на стыке искусственного интеллекта и кибербезопасности, предлагая эффективный инструмент для поиска уязвимостей цифровой инфраструктуры. В эпоху цифровой трансформации подобные технологии становятся стратегически важными для защиты данных клиентов и бизнес-процессов бизнеса.
Эксперт отметил, что это исследование — прекрасный пример синергии науки и бизнеса, когда научные исследования напрямую влияют на качество разрабатываемых продуктов.
Ученые использовали предобученную на большом количестве данных нейросеть и дообучили ее так, чтобы она искала только ошибки, при этом значительно повысили качество обучающих данных — отобрали только те примеры, где уязвимость кода точно присутствует, что повысило качество обучения.
С помощью специально подобранного размера мини-батча — количества примеров для обучения на одной итерации оптимизатора — удалось в 13 раз ускорить процедуру дообучения. В результате получена модель, которая эффективнее находит опасные места в коде по сравнению с существующими аналогами. Подготовлен набор данных с Java-кодом, где уязвимости размечены точнее, чем в других открытых источниках.
Ранее мы рассказывали о том, что технологии компьютерного зрения все чаще применяют для слежки.