视频:↓  2分钟神经科学_奖励系统

奖励系统是一组神经结构,负责激励显著性(即动机和“想要”,渴望或渴望获得奖励),联想学习(主要是积极强化和经典条件反射),以及积极效应的情绪,特别是它将快乐作为核心组成部分(例如,欢乐,欣快和狂喜)。[1] [6]奖励是刺激的吸引力和动机属性,诱导食欲行为,也称为接近行为和完成行为。[1]在对奖励刺激(即“奖励”)的描述中,对奖励神经科学的评论指出,“任何有可能使我们接近并消费它的刺激,对象,事件,活动或情况是定义的奖励。“[1]在操作条件反射中,奖励刺激作为积极的强化物; [1]然而,相反的说法也是正确的:积极强化者是有益的。[1]

初级奖励是一类奖励刺激,促进自我和后代的生存,包括稳态(例如,可口的食物)和生殖(例如,性接触和父母投资)奖励。[1] [7]内在奖励是无条件的奖励,具有吸引力并激励行为,因为它们本身就是令人愉快的。[1]外在奖励(例如,金钱或看到一个人最喜欢的运动队赢得一场比赛)是有条件的奖励,这些奖励具有吸引力和激励行为,但本身并不令人愉快。[1] [8]外在奖励是由于学习的关联(即条件反射)与内在奖励而产生的动机价值。[1]在经典的内在奖励条件下,外在奖励也可以引发快乐(例如,在彩票中赢得大量金钱的兴奋)。[1]





Parental care.jpg

成瘾和依赖词汇表[2] [3] [4] [5]
成瘾 - 一种脑功能紊乱,其特点是尽管有不良后果,但仍有强迫性参与奖励刺激
令人上瘾的行为 - 一种既有益又有益的行为
令人上瘾的药物 - 一种既有益又有益的药物
依赖性 - 在停止反复接触刺激(例如药物摄入)后与戒断综合征相关的适应性状态
药物致敏或反向耐受 - 在给定剂量下重复给药导致药物升高的作用
停药 - 停止反复使用药物后出现的症状
身体依赖 - 涉及持续的身体 - 躯体戒断症状的依赖(例如,疲劳和谵妄震颤)
心理依赖 - 涉及情绪 - 动机戒断症状的依赖(例如,烦躁不安和快感缺乏症)
强化刺激 - 刺激,增加重复行为的可能性
奖励刺激 - 大脑解释为内在积极和可取的刺激或接近的刺激
致敏 - 对反复接触刺激引起的刺激的放大反应
物质使用障碍 - 使用物质导致临床和功能上显着的损害或痛苦的情况
耐受性 - 在给定剂量下重复给药导致的药物减少效果

1 定义
2 解剖
2.1 娱乐中心
2.2 需求
2.3 动物与人类
3 学习
4 历史
5 临床意义
5.1 成瘾
5.2 动机
5.2.1 情绪障碍
5.2.2 精神分裂症
6 参考

在神经科学中,奖励系统是大脑结构和神经通路的集合,负责与奖励相关的认知,包括联想学习(主要是经典调节和操作强化),激励突显(即动机和“想要”,欲望或渴望获得奖励)和积极的价值情绪,特别是涉及快乐的情绪(即享乐“喜欢”)。[1] [6]



产生联想学习(即经典条件反射和操作强化); [1]
影响决策和诱导接近行为(通过将动机显着性分配给奖励刺激); [1]

构成奖励系统的大脑结构主要位于皮质 - 基底神经节 - 丘脑 - 皮质环内; [11]环的基底神经节部分驱动奖励系统内的活动。[11]连接奖励系统内结构的大多数途径是谷氨酸能中间神经元,GABA能中型多刺神经元(MSNs)和多巴胺能投射神经元,[11] [12]尽管其他类型的投射神经元有贡献(例如,食欲素投射神经元)。奖励系统包括腹侧被盖区域,腹侧纹状体(即伏隔核和嗅结节),背侧纹状体(即尾状核和壳核),黑质(即,压缩和网状),前额皮质,前扣带皮层,岛叶皮层,海马,下丘脑(特别是下丘脑外侧的orexinergic核),丘脑(多核),丘脑底核,苍白球(外部和内部),腹侧苍白球,臂旁核,杏仁核,以及扩展杏仁核的其余部分。[6] [11] [13] [14] [15]中缝背核和小脑似乎调节某些形式的奖赏相关认知(即联想学习,动机显着性和积极情绪)和行为。[16] [17] [18]后侧背节核(LTD),小脑桥脑核(PPTg)和侧缰(LHb)(直接和间接通过内侧肌腱核)也能够通过它们对腹侧被盖区域的投射诱导厌恶显着性和激励显着性( VTA)。[19] LDT和PPTg都向多巴胺能神经元突触的VTA发送谷氨酸能神经投射,这两者都可以产生激励显着性。 LHb发送谷氨酸能神经元投射,其中大部分是突触GABAergic RMTg神经元,反过来驱动多巴胺能VTA神经元的抑制,尽管一些LHb预测终止于VTA中间神经元。这些LHb预测既可以通过厌恶刺激激活,也可以通过没有预期的奖励激活,激发LHb可以诱发厌恶。[20] [21] [22]

突出于腹侧被盖区域的大多数多巴胺途径(即使用神经递质多巴胺与其他神经元通信的神经元)是奖励系统的一部分; [11]在这些途径中,多巴胺作用于D1样受体或D2样受体刺激(D1样)或抑制(D2样)cAMP的产生。[23]纹状体的GABAergic中型多刺神经元也是奖励系统的组成部分。[11]丘脑底核,前额叶皮层,海马,丘脑和杏仁核中的谷氨酸能投射核通过谷氨酸途径连接到奖励系统的其他部分。[11]内侧前脑束是一组调节脑刺激奖励的许多神经通路(即来自外侧下丘脑的直接电化学刺激的奖励),也是奖励系统的一个组成部分。[24]

关于伏隔核的活动和生成喜欢和想要的两种理论存在。抑制(或超极化)假说提出伏隔核对下腹部结构如腹侧苍白球,下丘脑或腹侧被盖区域施加强直抑制作用,并且在抑制伏隔核(NAcc)中的MSN中,这些结构被激发,“发布“奖励相关行为”。虽然GABA受体激动剂能够引起伏隔核中的“喜欢”和“缺乏”反应,但来自基底外侧杏仁核,腹侧海马和内侧前额叶皮质的谷氨酸能输入可以激发诱因显着。此外,虽然大多数研究发现NAcc神经元减少了对奖励的反应,但许多研究发现相反的反应。这导致了去抑制(或去极化)假设的提议,该假设提出激发或NAcc神经元,或至少某些子集,驱动奖励相关行为。[6] [25] [26]

经过近50年的脑刺激奖励研究,专家们已经证实,大脑中的数十个部位将维持颅内自我刺激。区域包括外侧下丘脑和内侧前脑束,其特别有效。那里的刺激激活了形成上升通路的纤维;上行通路包括中脑边缘多巴胺通路,其从腹侧被盖区突出到伏隔核。关于为什么中脑边缘多巴胺途径是介导奖赏的电路的核心,有几种解释。首先,当动物参与颅内自我刺激时,中脑边缘通路中的多巴胺释放明显增加。[9]其次,实验一致表明,脑刺激奖励刺激通常由自然奖励激活的通路的强化,药物奖励或颅内自我刺激可以发挥更强大的中央奖励机制激活,因为它们直接激活奖励中心而不是通过周围神经。[9] [27] [28]第三,当给动物服用成瘾药物或从事自然有益的行为时,例如喂养或性活动,伏隔核内的多巴胺有明显的释放。[9]然而,多巴胺不是大脑中唯一的奖励化合物。


奖励系统包含快乐中心或享乐热点 - 即,介导快乐或从内在奖励中“喜欢”反应的大脑结构。截至2017年10月,已经在伏隔核壳,腹侧苍白球,臂旁核,眶额皮质(OFC)和岛叶皮层的子室中发现了特征性热点。[6] [15] [29]伏隔核壳内的热点位于内侧壳的背斜象限,而快感的冷点位于更后部的区域。后腹侧苍白球还含有特征性热点,而前腹侧苍白球则含有特征性的感冒。阿片类药物,内源性大麻素和食欲素的微量注射能够增强这些热点的喜好。[6]位于OFC前部和后岛叶的特征性热点已被证实对食欲素和阿片类药物有反应,前岛叶和后OFC的重叠享乐感冒也是如此。[29]另一方面,仅有证实臂旁核热点对苯二氮卓受体激动剂有反应[6]。

特征性热点在功能上是相关的,因为一个热点的激活导致其他热点的募集,如通过立即早期基因的c-Fos的诱导表达所指示的。 此外,抑制一个热点会导致激活另一个热点的效果变钝。[6] [29] 因此,奖励系统内每个特征热点的同时激活被认为是产生强烈欣快感的必要条件。[30]


Tuning of appetitive and defensive reactions in the nucleus accumbens shell. (Ab.jpg
调整伏核中的食欲和防御反应。 (上图)AMPA封锁需要D1功能,以产生动机行为,无论价格如何,D2功能产生防御行为。另一方面,GABA激动不需要多巴胺受体功能。(下图)在压力下产生防御行为的解剖区域的扩展,以及由AMPA拮抗作用产生的家庭环境中的食欲行为。 GABA激动作用下这种灵活性不太明显。[25]
激励显着性是“缺乏”或“欲望”属性,其包括一个激励成分,由伏隔核壳(NAcc shell)分配给奖励刺激。[1] [31] [32]从中脑边缘通路进入NAcc壳的多巴胺神经传递程度与奖励刺激的激励显着程度高度相关。[31]

伏隔核的背腹侧区域的激活与想要的增加相关,而没有同时增加的喜好。[33]然而,伏隔核外壳中的多巴胺能神经传递不仅对于奖励刺激的食欲动机显著性(即激励显著性)负责,而且还对厌恶动机显著性负责,这种突显性指导行为远离不良刺激。[34] [35] [36] ]在背侧纹状体中,表达D1的MSN的激活产生食欲激励显著性,而表达D2的MSN的激活产生厌恶。在NAcc中,这种二分法并不是那么明确,D1和D2 MSN的激活足以增强动力,[37] [38]可能通过抑制腹侧苍白球来抑制VTA [39] [40]。

罗宾逊和贝里奇的激励致敏理论(1993)提出,奖励包含可分离的心理成分:想要(激励)和喜欢(快乐)。为了解释与巧克力等特定刺激物的接触增加,有两个独立的因素在起作用 - 我们渴望获得巧克力(想要)和巧克力的喜悦效果(喜欢)。根据罗宾逊和贝里奇的说法,想要和喜欢是同一过程的两个方面,所以奖励通常是想要和喜欢的程度相同。然而,在某些情况下,想要和喜欢也会独立变化。例如,在接受多巴胺(经历对食物的欲望丧失)后不进食的大鼠表现得好像他们仍然喜欢食物。在另一个例子中,大鼠外侧下丘脑中的激活的自我刺激电极增加食欲,但也引起对诸如糖和盐的味道的更多不良反应;显然,刺激增加了想要但不喜欢。这些结果表明我们的奖励系统包括独立的想要和喜欢的过程。想要的成分被认为是由多巴胺能通路控制,而喜欢的成分被认为是由阿片 - 苯二氮卓系统控制的。[9]


情感神经科学研究员肯特贝里奇发现甜味(喜欢)和苦味(不喜欢)的口味产生了明显的口面表达,这些表达同样由人类新生儿,猩猩和大鼠表现出来。这证明了快乐(特别是喜欢)具有客观特征,并且在各种动物物种中基本相同。大多数神经科学研究表明,奖励释放的多巴胺越多,奖励就越有效。这被称为享乐效应,可以通过奖励和奖励本身的努力来改变。 Berridge发现阻断多巴胺系统似乎并没有改变对甜食的积极反应(通过面部表情来衡量)。换句话说,享乐的影响并没有根据糖的量而改变。这打破了多巴胺介导快乐的传统假设。即使有更强烈的多巴胺改变,数据似乎仍然保持不变。[41]然而,从2019年1月开始的一项临床研究评估了多巴胺前体(左旋多巴),拮抗剂(利培酮)和安慰剂对音乐奖励反应的影响 - 包括音乐发冷期间的愉悦程度,通过电子皮肤的变化来衡量活动以及主观评价 - 发现多巴胺神经传递的操纵双向调节人类受试者的快感认知(特别是音乐的快感影响)。[42] [需要非主要来源]这项研究表明增加的多巴胺神经传递作用对人类音乐产生愉悦的享乐反应的必要条件。[42] [需要非主要来源]



不同的神经系统负责学习刺激和结果,行为和结果,刺激和反应之间的关联。尽管经典条件反射不仅限于奖励系统,但是通过刺激(即,巴甫洛夫 - 乐器转移)增强乐器演奏需要伏隔核。习惯性和目标导向的器械学习分别取决于外侧纹状体和内侧纹状体。[43]

在仪器学习期间,AMPA与NMDA受体和磷酸化ERK比率的相反变化分别发生在构成直接和间接途径的D1型和D2型MSN中[45] [46]。突触可塑性和伴随学习的这些变化取决于纹状体D1和NMDA受体的激活。由D1受体激活的细胞内级联涉及蛋白激酶A的募集,并且通过DARPP-32的磷酸化,抑制使ERK失活的磷酸酶。 NMDA受体通过不同但相互关联的Ras-Raf-MEK-ERK途径激活ERK。单独的NMDA介导的ERK活化是自限性的,因为NMDA活化也抑制PKA介导的ERK失活磷酸酶的抑制。然而,当D1和NMDA级联共激活时,它们协同作用,ERK的激活以脊柱重组,AMPA受体转运,CREB调节和通过抑制Kv4.2增加细胞兴奋性的形式调节突触可塑性。 [47] [48] [49]


Skinner box.png

在1954年的一项基本发现中,研究人员詹姆斯·奥尔兹和彼得·米尔纳发现,大鼠大脑某些区域的低压电刺激可以作为教导动物运行迷宫并解决问题的奖励。[51] [52] ]似乎刺激大脑的那些部分给了动物快乐,[51]并且在后来的工作中,人类报告了这种刺激带来的愉悦感觉。当大鼠在Skinner盒中进行测试时,他们可以通过按下杠杆来刺激奖励系统,老鼠按压了几个小时。[52]在接下来的二十年中的研究表明,多巴胺是这些地区帮助神经信号传导的主要化学物质之一,多巴胺被认为是大脑的“快感化学物质”。[53]

伊万巴甫洛夫是一名心理学家,他使用奖励系统来研究经典调理。巴甫洛夫在听到钟声或其他刺激声之后,通过奖励狗的食物奖励系统。巴甫洛夫奖励这些狗,以便狗与食物,奖励,铃铛,刺激物相关联。[54] Edward L. Thorndike使用奖励系统来研究操作性条件反射。他开始把猫放在一个拼图盒里,把食物放在盒子外面让猫想要逃跑。这些猫努力摆脱拼图盒来获取食物。虽然猫在逃离盒子后吃了食物,但是桑迪克得知猫试图在没有食物奖励的情况下逃离盒子。桑代克利用食物和自由的奖励来刺激猫的奖励系统。桑迪克用这个来看看猫是如何学会逃离这个盒子的。[55]

ΔFosB(DeltaFosB) - 一种基因转录因子 - 在伏隔核的D1型中型多刺神经元中的过表达是导致成瘾相关行为的几乎所有形式的成瘾(即行为成瘾和药物成瘾)中的关键共同因素。神经可塑性。[3] [56] [57] [58]特别是,ΔFosB促进自我管理,奖励致敏,并奖励特定成瘾药物和行为之间的交叉致敏作用。[3] [56] [57] [59] [60]在脑的特定区域中,组蛋白蛋白质尾部(即组蛋白修饰)的某些表观遗传修饰也已知在成瘾的分子基础中起关键作用。[58] [61] [62] [63]

由于它们对多巴胺奖赏途径的影响,成瘾药物和行为是有益的和加强的(即上瘾)。[14] [64]

外侧下丘脑和内侧前脑束是最常被研究的脑刺激奖励部位,特别是在研究药物对脑刺激奖励的影响方面。[65]最明确的滥用药物习惯形成行为的神经递质系统是中脑边缘多巴胺系统,其伏隔核及其局部GABAergic传入的传出靶标。苯丙胺和可卡因的奖赏相关作用是伏隔核和内侧前额叶皮质的多巴胺能突触。大鼠还学会通过杠杆压力将可卡因注射到内侧前额叶皮质中,这可以通过增加伏隔核中的多巴胺转换来起作用[66] [67]。直接注入伏核中的尼古丁也会增强局部多巴胺的释放,可能是由于该区域多巴胺能末端的突触前作用。烟碱受体定位于多巴胺能细胞体和局部尼古丁注射增加多巴胺能细胞的发射,这对于烟碱奖励至关重要。[68] [69]尽管激活多巴胺能预测,一些额外的形成习惯的药物也可能减少中型多刺神经元的输出。对于鸦片制剂,奖励效应的最低阈值位点涉及对腹侧被盖区域中GABA能神经元的作用,腹侧被盖区域是对伏核的中等多刺输出神经元的鸦片剂奖赏动作的次要部位。因此,以下形成了目前表征的药物奖励电路的核心; GABAergic传入中脑边缘多巴胺神经元(鸦片剂奖赏的主要底物),中脑边缘多巴胺神经元本身(精神运动兴奋剂奖励的主要基质),以及中脑边缘多巴胺神经元的GABAergic传出(鸦片剂奖励的次要部位)。[65]

功能失调的动机显著性出现在许多精神症状和障碍中。 Anhedonia,传统上被定义为减少感受到快感的能力,因为大多数的渐近人群都表现出完整的“喜欢”,因此被重新审视为反映迟钝的激励显著性。[70] [71]另一方面,针对特定刺激而缩小的激励突显性是行为和吸毒成瘾的特征。在恐惧或偏执的情况下,功能障碍可能在于厌恶的突然性。[72]


抑郁与动机减少有关,正如通过奖励努力的意愿所评估的那样。这些异常暂时与纹状体区域的活动减少有关,虽然假设多巴胺能异常发挥作用,但大多数研究探测抑郁症中的多巴胺功能已报告不一致的结果。[75] [76]虽然尸检和神经影像学研究发现奖励系统的许多区域存在异常,但很少有研究结果得到一致反复。一些研究报道在与奖赏或阳性刺激相关的任务期间,NAcc,海马,内侧前额叶皮质(mPFC)和眶额皮质(OFC)活动减少,以及基底外侧杏仁核和亚扣带皮质(sgACC)活动升高。这些神经影像学异常可以通过很少的验尸研究来证实,但是很少有研究表明mPFC中的兴奋性突触减少了。[77]在奖励相关任务期间,mPFC中的活性降低似乎局限于更多的背部区域(即,前期扣带皮层),而腹侧sgACC在抑郁症中过度活跃[78]。

试图研究动物模型中潜在的神经回路也产生了相互矛盾的结果。两种范式通常用于模拟抑郁症,慢性社交失败(CSDS)和慢性轻度压力​​(CMS),尽管存在许多范例。 CSDS降低了对蔗糖的偏好,减少了社交相互作用,并增加了强迫游泳测试中的不动性。 CMS通过尾部悬浮和强迫游泳测试评估,同样降低了蔗糖偏好和行为绝望。对CSDS敏感的动物表现出增加的阶段性VTA发作,并且VTA-NAcc预测的抑制减弱了由CSDS诱导的行为缺陷[79]。然而,抑制VTA-mPFC预测会加剧社交退缩。另一方面,CMS相关的蔗糖偏好和不动性的降低分别通过VTA激发和抑制而减弱和加剧[80] [81]。虽然这些差异可能归因于不同的刺激方案或不良的翻译范式,但可变结果也可能存在于奖励相关区域的异质功能中。[82]

整个mPFC的光遗传学刺激产生抗抑郁作用。这种效应似乎局限于pgACC(前肢皮质)的啮齿动物同源物,因为对sgACC(infralimbic cortex)的啮齿动物同源物的刺激不产生行为效应。此外,被认为具有抑制作用的infralimbic皮层中的深部脑刺激也产生抗抑郁作用。这一发现与下肢内侧皮质的药理学抑制减弱抑郁行为的观察结果一致。[82]


Abusive power and control
Carrot and stick
Child grooming
Compliance (psychology)
Norm of reciprocity
Pavlovian-instrumental transfer
Psychological manipulation

