
Ассоциативное обучение больше века объясняли просто: чем чаще повторяется связка «сигнал — награда», тем прочнее она закрепляется в мозге. Этот принцип восходит к экспериментам Ивана Павлова и до сих пор лежит в основе образовательных методик и моделей искусственного интеллекта.
Но нейробиологи из Калифорнийского университета в Сан-Франциско показали, что в ассоциативном обучении ключевую роль играет не количество повторений, а время. Подробности этой работы опубликованы в журнале Nature Neuroscience.
Ученые считали, что ассоциативное обучение происходит через пробы и ошибки: мозг начинает предсказывать сигналы, ведущие к вознаграждению. Сначала дофамин выделяется только при получении награды, но при регулярном вознаграждении мозг начинает выделять его уже при сигнале, укрепляя или ослабляя связь в зависимости от результата.

Исследователи обучали мышей связывать звук с получением сладкой воды, меняя интервалы между испытаниями (от 30 секунд до 10 минут). Оказалось, что мыши, получавшие меньше вознаграждений, учились так же эффективно, как те, кто получал их в 20 раз чаще.
Далее ученые выяснили: при больших интервалах между наградами мыши быстрее начинали реагировать на звук выбросом дофамина. В другом эксперименте звук подавали каждые 60 секунд, но награду давали лишь в 10% случаев — и мыши все равно быстро научились выделять дофамин в ответ на сигнал, независимо от последующего вознаграждения.
Модель хорошо объясняет, почему интенсивная зубрежка работает хуже распределенного обучения и почему зависимости формируются так устойчиво. Нерегулярные «пики» удовольствия мозг запоминает особенно прочно. А постоянная подача вещества, как в случае никотиновых пластырей, ослабляет эту связь.
Ранее Наука Mail рассказывала о том, что доказана возможность стимулировать мышление во сне.

