Многие школьники знают о классическом эксперименте Павлова: собаки начинали слюноотделение при звуке колокольчика, который они ассоциировали с едой. Но не все животные реагируют на такие сигналы одинаково.
Некоторые, например, начинают взаимодействовать не с едой, а с самим сигналом — как будто он сам стал наградой. Они лижут, трогают лапами и даже грызут предмет, сообщающий о скором появлении пищи. Это поведение ученые называют «отслеживанием стимула», передает naukatv.ru
Другие животные — «отслеживание цели» — наоборот, направляются сразу туда, где должна появиться награда, не отвлекаясь на сам сигнал.
Новое исследование лаборатории нейробиолога Сары Моррисон из Университета Питтсбурга (США), опубликованное в Journal of Neuroscience, показало, что эти два типа поведения основаны на совершенно разных механизмах обучения. Особенно удивительным оказалось то, что только те, кто отслеживает стимулы зависят от дофамина — ключевого нейромедиатора, связанного с мотивацией и удовольствием.
Ученые с помощью оптогенетики — технологии, позволяющей включать и выключать нейроны светом — манипулировали дофамином у крыс в момент получения награды. Когда дофаминовые нейроны в вентральной тегментальной области мозга подавлялись, крысы переставали учиться ассоциировать сигнал с наградой. И наоборот, когда подавление прекращалось, животные вновь начинали облизывать лампочку — реагировать на сам сигнал.
«Когда мы прекратили торможение, через несколько дней некоторые снова стали трекерами знаков», — сказала Моррисон.
При этом крысы, которые предпочитали идти сразу к месту награды, продолжали так себя вести, независимо от уровня дофамина.
Это говорит о том, что их тип обучения работает по другой, не дофамин-зависимой схеме — и это противоречит распространенному мнению, что все формы обучения вознаграждению требуют дофамина.
Еще один интересный результат: добавление лишнего дофамина не помогало крысам учиться быстрее. Но после его удаления животные на несколько дней теряли способность отслеживать сигнал.
«Это было похоже на то, что мы сначала давали им большую награду, а затем забирали половину. И крысы вели себя так, будто прежний, высокий уровень дофамина стал для них нормой», — объяснила Моррисон.
Это модель поведения, которую нейробиологи используют для изучения формирования вредных привычек у людей — будь то курение, переедание, прокрастинация или зависимости от соцсетей/алкоголя/наркотиков.
Исследование показывает, что у некоторых организмов стимулы (например, реклама, звук, запах — как колокольчик у Павлова) становятся почти такой же наградой, как сама еда или наркотик. Это механизм, с помощью которого привычка «приклеивается» и не отпускает, даже когда награды больше нет. Это напрямую связано с механизмами формирования и сохранения вредных привычек у людей.
«Мы не все одинаково реагируем на награды, и, возможно, у мозга есть механизм, который помогает подстраивать восприятие награды под разные ситуации», — объяснила Моррисон.