
Значительный шаг вперед в технологии распознавания людей по силуэту сделали исследователи из Центра искусственного интеллекта МГУ. Специалисты Исследовательского центра в области ИИ МГУ совместно с коллегами разработали новый способ идентификации человека по силуэту, получивший название DynaMix. В основе метода лежит принцип обучения нейросети на «смеси» разнородных визуальных данных. В перспективе данная технология найдет применение в сферах безопасности и бизнеса. Научная статья с результатами работы была опубликована в авторитетном журнале Neurocomputing.
Задача реидентификации (сопоставления силуэтов людей) имеет высокую научную и практическую значимость. Ее цель — находить одного и того же человека на записях с разных камер видеонаблюдения, сделанных в разное время. Подобные алгоритмы уже используются в проектах «умных городов» и системах интеллектуальной видеоаналитики, например, для розыска преступников по их внешнему облику или для решения бизнес-задач.
Поскольку на видеозаписях с камер наблюдения лица людей часто неразличимы, во многих случаях необходим именно анализ их силуэтов. Однако современные методы распознавания по силуэту пока существенно уступают в точности технологиям распознавания лиц. Главная причина этого серьезного разрыва — в крайне ограниченном объеме данных, доступных для обучения алгоритмов реидентификации. Это напрямую связано со спецификой задачи, которая требует множества изображений одного человека, сделанных с разных камер, под различными углами и в разное время. Собрать и корректно разметить такие наборы информации — сложная задача.

Совместными усилиями ученых Центра ИИ МГУ и компании Tevian удалось максимально сократить этот разрыв в качестве благодаря новому подходу к обучению алгоритмов искусственного интеллекта. В своей работе авторы представили метод, использующий идею обучения на «смеси» разнородных данных.
Тимур Мамедов, научный сотрудник Центра ИИ МГУ, руководитель направления распознавания силуэтов в Tevian, отметил, что подход базируется на «подмешивании» к основным многокамерным данным дополнительных, более простых изображений людей в процессе обучения моделей. За счет такого стилистического разнообразия ученым удается повысить качество решения основной задачи. Проведенные эксперименты показали, что разработка позволяет в два раза улучшить точность реидентификации людей, что открывает возможности для создания практических алгоритмов интеллектуальной видеоаналитики в разных областях. Например, в развитии «умных городов», обеспечении безопасности и оптимизации ключевых показателей для ритейл-бизнеса.
Ранее Наука Mail рассказывала, что искусственный интеллект сможет ощущать касания, запах и вкус.

