компьютерный код

В России предложили способ обновлять рекомендательные модели без полного переобучения

Исследователи из AI VK Research и лаборатории мультиагентного моделирования и адаптивного интеллекта ИТМО разработали метод обновления рекомендательных систем, позволяющий учитывать новые данные без полного переобучения модели. Это может существенно ускорить работу цифровых платформ.
Рекомендации в сервисах смогут обновляться быстрее
Рекомендации в сервисах смогут обновляться быстрееИсточник: Freepik

Коллектив исследователей представил новый метод обновления генеративных рекомендаций (generative retrieval). На первом этапе их обучения Semantic ID, внутренний идентификатор, отражающий смысловые и поведенческие характеристики объектов каталога (товары, единицы контента и т. д.), пересчитывается на свежих данных. Далее новые идентификаторы выравниваются с их старой версией.

Благодаря этому система может учитывать актуальные изменения интересов аудитории, не «ломая» совместимость с предыдущей версией, и снижать вычислительные затраты на полное переобучение, а значит — уменьшать издержки и ускорять обновления рекомендаций.

Такой метод может быть полезен крупным цифровым платформам, где интересы аудитории быстро меняются, а полное переобучение подобных моделей требует больших вычислительных затрат. Новый способ помогает сократить такие издержки в 8 раз по сравнению с полным переобучение модели.
Владимир Байкалов
Ведущий исследователь в AI VK, инженер лаборатории компьютерных технологий ИТМО

Ранее существовала проблема индустриального применения generative retrieval в том, что Semantic ID, которые построены с учетом коллаборативного сигнала, со временем «устаревают»: интересы аудитории и паттерны потребления меняются быстро. При этом простое дообучение на новых данных не всегда решает задачу, а полный пересчет Semantic ID без выравнивания может привести к тому, что модели будет сложнее адаптироваться к уже развернутой версии системы и ее компонентам.

Ранее в VK назвали ключевые навыки для карьеры в сфере ИИ.