
Коллектив исследователей представил новый метод обновления генеративных рекомендаций (generative retrieval). На первом этапе их обучения Semantic ID, внутренний идентификатор, отражающий смысловые и поведенческие характеристики объектов каталога (товары, единицы контента
Благодаря этому система может учитывать актуальные изменения интересов аудитории, не «ломая» совместимость с предыдущей версией, и снижать вычислительные затраты на полное переобучение, а значит — уменьшать издержки и ускорять обновления рекомендаций.
Такой метод может быть полезен крупным цифровым платформам, где интересы аудитории быстро меняются, а полное переобучение подобных моделей требует больших вычислительных затрат. Новый способ помогает сократить такие издержки в 8 раз по сравнению с полным переобучение модели.
Ранее существовала проблема индустриального применения generative retrieval в том, что Semantic ID, которые построены с учетом коллаборативного сигнала, со временем «устаревают»: интересы аудитории и паттерны потребления меняются быстро. При этом простое дообучение на новых данных не всегда решает задачу, а полный пересчет Semantic ID без выравнивания может привести к тому, что модели будет сложнее адаптироваться к уже развернутой версии системы и ее компонентам.
Ранее в VK назвали ключевые навыки для карьеры в сфере ИИ.

