Сигналы дофамина переплетаются с обучением вознаграждению, они учат мозг, какие сигналы или действия предсказывают лучшие награды. Новые данные Лаборатории Штауффера в Медицинской школе Питта показывают, что сигналы дофамина также отражают достоверность предсказаний вознаграждения. Короче говоря, дофаминовые сигналы могут научить мозг о вероятности получения награды.
Кэтрин Ротенхефер (KR) и Штауффер (WS), аспирантки, поделились своим взглядом на ключевые сообщения, которые их работа раскрывает о внутренней работе мозга: “Мы изучали неоднозначность – сложный фактор окружающей среды, который затрудняет людям и животным понимание того, что предсказывать, и этот проект был крутым обходным путем, который органично возник из наших предварительных данных. Мы нашли нечто интересное, чего не ожидали, и довели дело до конца. Дофаминовые нейроны играют решающую роль в обучении вознаграждению. Дофаминовые нейроны активируются вознаграждением, которое лучше предсказанного, и подавляются вознаграждением, которое хуже предсказанного. Этот паттерн деятельности напоминает “ошибки предсказания вознаграждения”, различия между полученным и предсказанным вознаграждением”.
Основной вывод исследования заключается в том, что редкие награды усиливают дофаминовые реакции по сравнению с одинаковыми по размеру наградами, которые доставляются с большей частотой. Это означает, что предсказательные нейрональные сигналы отражают неопределенность, окружающую предсказания, а не только предсказанные значения. Это также означает, что одна из основных систем обучения в мозге может оценивать неопределенность и потенциально обучать нижестоящие структуры мозга об этой неопределенности. Изучение того, как мозг справляется с неоднозначным выбором позволит объединить то, что мы теперь знаем о том, как дофаминовые нейроны кодируют информацию о сложных средах вознаграждения, с тем, что лица, принимающие решения, считают о неоднозначном выборе и как они принимают решения в этих контекстах.
Это исследование является первым шагом к пониманию того как распределение вероятностей ценности и вознаграждения кодируется в мозге и какую форму могут принять эти убеждения. Эти результаты имеют далеко идущие последствия для биологических и основанных на искусственном интеллекте систем обучения, сообщает Medical Xpress.