ИИ обучается по принципам зрительного восприятия

Глубокое обучение снова вдохновляется природой — на этот раз ученые решили посмотреть на зрение через призму самой зрительной коры. Исследователи предложили модели, которые ближе к реальной биологии, чем стандартные нейросети, и это может изменить как ИИ, так и наше понимание мозга.
Автор Наука Mail
ИИ
Когда нейросети перестают притворяться мозгом и начинают учиться у него по-настоящему, граница между искусственным и живым зрением становится тоньше, чем пиксельИсточник: Unsplash

В журнале Nature Human Behaviour вышла статья исследователей из Университета Оснабрюка, Свободного университета Берлина и ряда других научных центров. Ученые разработали новую архитектуру нейросетей — полностью топографические нейронные сети (All-TNN), которые лучше отражают устройство зрительной системы человека, чем классические модели, такие как сверточные нейронные сети (CNN).

Обычные CNN работают эффективно, повторяя одну и ту же функцию во всех участках изображения. Но такой подход не отражает реальное поведение мозга. В коре больших полушарий зрительная информация организована ретинотопически — так, что соседние области коры обрабатывают соседние участки зрительного поля. Более того, признаки, на которые реагируют нейроны, также связаны с их расположением на поверхности коры.

TNN
Все TNN лучше аппроксимируют пространственные смещения в человеческом визуальном поведенииИсточник: Nature Human Behaviour

Авторы новой модели перенесли этот принцип в архитектуру искусственной сети: в All-TNN избирательность к признакам варьируется вдоль «поверхности» сети. То есть признаки, которые «ищет» модель, меняются постепенно, подобно тому, как это происходит в мозге. Это приближает ИНС к биологической зрительной системе и делает возможным более точное воспроизведение не только обработки информации, но и поведенческих паттернов человека.

LLM
Когда нейросети начинают отражать поведение мозга, они становятся не просто инструментами, а окнами в то, как мы видим и понимаем мирИсточник: Unsplash

Модели All-TNN не только демонстрируют лучшую интерпретацию визуальных данных, но и могут в будущем помочь нейробиологам изучать фундаментальные процессы восприятия. Авторы подчеркивают: они хотят сделать обучение таких моделей более эффективным и гибким, ведь именно плавное распределение признаков в коре — одно из важнейших открытий биологии, которое все еще ждет точной имитации в ИИ.

Ранее Наука Mail рассказала, как размышляющий ИИ незаметно оставляет за собой углеродный след, сравнимый с дальнемагистральным перелетом.