В МФТИ нейросети обучились бороться с кражами и нарушениями порядка

Ежегодные потери бизнеса из-за недостатков существующих систем безопасности исчисляются миллиардами рублей.
Гостиная
Источник: Image by Freepik

Так, кражи в магазинах и на складах забирают у компаний до 10 млрд руб. в год., нарушения регламентов (например, отсутствие касок на стройках) наносят ущерб на сумму до 200 млрд руб. в год. Несанкционированный доступ на территорию ежегодно создает потери до 8 млрд руб.

Разработанная участниками бизнес-акселератора МФТИ «Физтех.Идея x R-Vision VC» система помогает избежать этих потерь. Она подключается к новым или уже установленным на территории камерам видеонаблюдения и с помощью искусственного интеллекта анализирует видео в реальном времени, выявляя нарушения доступа (например, проход без пропуска), опасные ситуации (скопление людей, отсутствие спецодежды), подозрительные действия (кражи, проникновение на закрытую территорию). Также она способна быстро определять номер автомобиля и распознавать лица нарушителей.

Новая разработка будет полезна строительным компаниям для контроля ношения касок и доступа в опасные зоны, ритейлу — для предотвращения краж, отелям, офисам и госучреждениям — для защиты от несанкционированного доступа, а также логистическим центрам для мониторинга периметра. В частности, с помощью системы можно запускать функцию патрулирования территории дронами. Это удешевляет поиск нарушений на больших площадях за счет сокращения трат на выезд и ручной обход.

«В отличие от существующих решений, VisionCheck AI реагирует за одну-две секунды. Она автоматически формирует отчет для МЧС, полиции и других служб. При этом работа с системой не требует обновления имеющейся инфраструктуры — она легко интегрируется с уже установленными камерами и системами безопасности, СКУД, СОТ, а также 1С. Отслеживать работу системы можно через приложение в мобильном телефоне»,— рассказал выпускник магистратуры «Банковские информационные технологии» ФПМИ МФТИ и создатель проекта Давид Восканян.

Система использует ансамбли алгоритмов компьютерного зрения на базе нейросетей авторской разработки, что обеспечивает точность распознавания до 95%. Выгодная особенность решения — полная локальность обработки данных. В отличие от зарубежных аналогов, VisionCheck AI не передает информацию на сторонние серверы, что критически важно для госструктур.

«Сейчас мы активно работаем над презентацией проекта потенциальным клиентам. Уже есть интерес от ряда компаний, в том числе из строительной отрасли. В дальнейшем наша цель — занять рынок России и СНГ, а затем выйти в Азию»,— добавил Давид Восканян.

В команде проекта — студенты, выпускники и сотрудники МФТИ. В планах разработчиков на 2025–2027 годы — поэтапное масштабирование: запуск пилотов в офисах и на стройплощадках (2025), а также выход на рынки Азии и СНГ в 2026 году. Особый акцент разработчики делают на доработку ИИ-моделей за счет данных с пилотных объектов и обратной связи, полученной от клиентов.

Давид Восканян, выпускник магистратуры «Банковские информационные технологии» ФПМИ МФТИ и создатель проекта, ответил на вопросы «Ъ-Науки»:

—Что представляет собой VisionCheck AI и как она работает?

— VisionCheck AI — система умной видеоаналитики на базе нейросетей собственной разработки и технологий Face-id. Предназначена для обеспечения физической безопасности на предприятиях и объектах с повышенным уровнем допуска. Система автоматически контролирует доступ, выявляет нарушения регламента (например, использование мобильных устройств, нахождение посторонних, несоответствие или отсутствие спец. формы), а также отслеживает периметр объекта, предупреждая о несанкционированном проникновении или нестандартной активности. В дополнение система осуществляет патрулирование дронами с алгоритмами беспилотного полета и обнаружения собственной разработки, генерирует отчеты об инцидентах и отправляет уведомления через мобильные устройства. Система интегрируется с существующими СКУД и СОТ, предоставляя точные алерты и полные логи событий для анализа и обеспечения безопасности на объектах.

— В чем главное преимущество этой системы перед обычными камерами наблюдения?

— За обычными камерами сидит человек, то есть присутствует человеческий фактор («замылился» глаз к концу рабочего дня, отошел в туалет и т. д.), инцидент может быть пропущен или вовремя не обнаружен. С нашей системой человеку выделяются подсказки с типами нарушений и их локализацией, а также кидаются ответственному лицу предупреждения о разного уровня критичности инцидентах.

— Какие типы нарушений и угроз может обнаруживать VisionCheck AI?

— В данный момент мы сосредоточились на обнаружении курения в неположенных местах, включая вейпы в офисе, а также на контроле ношения средств индивидуальной защиты. Мы отслеживаем проникновение на периметр, скопление людей и нестандартную активность, такую как бег в запрещенных зонах или положение лежа. Важными задачами также являются мониторинг присутствия людей в опасных или запрещенных зонах, трекинг их перемещений и контроль работы специальной техники, например строительной. Дополнительно мы занимаемся патрулированием территорий с помощью дронов и фиксацией изменений на основе сравнения новых данных с предыдущими.

— Почему скорость реакции в одну-две секунды важна для систем безопасности? Как обеспечивается скорость реакции системы при обработке видео в реальном времени?

— Скорость реакции очень важна, потому что именно она позволяет локализовать и оперативно предотвратить последствия инцидента, а иногда и успеть его остановить (например, предупредить вовремя человека, что он приближается к опасной зоне, или остановить курение в неположенном месте, оказать помощь лежачему). Скорость реакции обеспечивается за счет оптимизации алгоритмов, которые обрабатывают видеопоток напрямую с камер в режиме реального времени.

— Как система распознает лица, номера машин и другие объекты? Не нарушает ли распознавание лиц приватность людей?

— Распознавание лиц не нарушает приватности, поскольку данные шифруются и никуда не отправляются, а хранятся и обрабатываются локально на стороне компании-заказчика или сертифицированного оператора базы данных, имеющих права на работу с такими данными. Данные технологии работают на основе искусственного интеллекта. Алгоритм распознавания лиц выделяет ключевые точки на лице человека, обрабатывает их в определенном порядке, сверяет с паттернами, находящимися в базе данных (у каждого человека свое распределение ключевых точек и свой паттерн), и выдает результат сравнения. Технология распознавания номеров машин работает на основе технологий трансформеров (такие же технологии используются большими языковыми моделями, например chatGPT), они выделяют зону, выделяют паттерны, преобразуют в текст и после понимают, какой текст изображен на картинке.

— Куда поступают данные с камер и как они защищены?

— Данные с камер поступают на имеющийся или установленный нами сервер в инфраструктуре клиента, хранятся и обрабатываются на его стороне. Либо хранятся на серверах сертифицированных сервисов (например, yandexCloud). Все данные шифруются, и доступ есть только у ответственных лиц со стороны клиента.

— Чем локальная обработка данных лучше облачных решений?

— Локальная обработка более безопасна, как правило. Данные остаются в пределах физических и киберпараметров организации, что обеспечивает более высокий уровень защиты. Организация, использующая локальное решение, имеет больше возможностей для соблюдения нормативных требований, поскольку ее данные остаются в локальной сети.

Пресс-служба МФТИ