大眾常將多巴胺定義為帶來愉悅感的獎賞化學物質(zhì),認為它是人們從娛樂性藥物、刷社交媒體中獲得快感的來源,但神經(jīng)科學家一致認同,這是對多巴胺功能的極度簡化。過去學界有一套簡潔的多巴胺作用模型解釋其在大腦中的運作機制,如今該模型卻不斷受到修正甚至顛覆的挑戰(zhàn)。
理論起源與核心邏輯:該理論源于巴甫洛夫經(jīng)典條件反射實驗,1997 年由劍橋大學沃爾夫拉姆?舒爾茨團隊通過靈長類動物實驗正式確立:多巴胺的爆發(fā)式釋放,會將外界刺激與獎賞關聯(lián),強化動物 / 人類滿足需求的行為聯(lián)結;當意外獲得獎賞時,多巴胺神經(jīng)元劇烈放電,后續(xù)會將信號轉(zhuǎn)移至獎賞預測線索(如提示獎賞的燈光、聲音),若預期獎賞未出現(xiàn),多巴胺神經(jīng)元放電則會驟降。簡單來說,多巴胺信號幫大腦持續(xù)優(yōu)化對獎賞(食物、伴侶、安全場所)來源的預測。
![]()
理論價值與地位:它是計算神經(jīng)科學的里程碑成果,首次用數(shù)學框架解讀動物實驗數(shù)據(jù),完美解釋行為機制,也是神經(jīng)科學領域少有的能將神經(jīng)元放電、突觸活動與復雜行為、成癮問題串聯(lián)的理論。盡管學界深知其部分假設過于簡化,但仍被視為理解大腦功能的重大突破,主導并指引該領域研究數(shù)十年。
延伸理論:時序差分強化學習(TDRL)研究者在 RPE 基礎上拓展出該理論,通過預測值與實際值的時間差更新預測、優(yōu)化行為以最大化收益,大量實驗曾為其提供支撐。
近十年,動物實驗中監(jiān)測神經(jīng)元多巴胺釋放的技術突破,讓更多實驗室獲得關鍵數(shù)據(jù),直接動搖RPE/TDRL 的核心地位,研究發(fā)現(xiàn):
認知功能拓展:多巴胺參與注意力、工作記憶、社交行為,并非僅與獎賞相關;
非獎賞信號響應:多巴胺神經(jīng)元會對新刺激、威脅、運動、厭惡刺激、新奇事物做出反應;
編碼多元變量:部分多巴胺神經(jīng)元編碼動物在迷宮中的位置、移動速度、與目標的距離,而非僅編碼獎賞價值;
獎賞優(yōu)先級調(diào)控:多巴胺可同時編碼多種潛在獎賞,幫動物根據(jù)需求切換優(yōu)先級(如渴時關注水、遇配偶時關注求偶);
動作預測功能:2025 年研究發(fā)現(xiàn)多巴胺參與動作預測,推動重復行為,暗示成癮可能并非源于 RPE。
這些發(fā)現(xiàn)證明,原有的 RPE/TDRL 模型已無法完整解釋多巴胺的全部作用。
塞維利亞會議將直面這一關鍵問題:
革新派:認為 RPE/TDRL 框架已過時,僅靠修修補補無法適配新數(shù)據(jù),應建立底層假設完全不同的新模型;
保守派:該理論已深度融入多動癥、精神分裂癥、成癮等疾病的臨床認知與診療邏輯,體系過于龐大,難以輕易舍棄,主張在保留核心的前提下拓展模型。
1. Erin Calipari:多巴胺是 “信息處理與學習的助推器”
核心觀點:多巴胺的核心功能并非獎賞,而是讓其他神經(jīng)系統(tǒng)更高效運作,強化任務相關活動、加速決策,參與所有認知過程;
2. Vijay Mohan Namboodiri:ANCCR 回溯性學習模型(與 RPE 完全相反)
核心邏輯:RPE:動物先感知線索,再將線索與后續(xù)獎賞關聯(lián);ANCCR:動物先獲得獎賞,再回溯尋找引發(fā)獎賞的線索,多巴胺釋放隨獎賞重復出現(xiàn)而增加,標記事件意義并啟動記憶搜索。
實驗驗證:給未訓練小鼠隨機發(fā)放糖水獎賞,RPE 預測多巴胺反應會隨學習下降,而 ANCCR 預測多巴胺會隨獎賞重復增加,實驗結果支持后者。
臨床啟示:該模型能解釋成癮難以治療的原因—— 成癮者的多巴胺會強化 “獎賞(藥物)→回溯線索(吸煙場景)” 的聯(lián)結,即使反復戒斷也無法消除記憶,而 TDRL 無法解釋這一現(xiàn)象。
3. 模型修正派:在 TDRL 框架內(nèi)兼容新數(shù)據(jù)
以 Samuel Gershman 為代表的學者主張不推翻 TDRL,而是重構理論假設:
針對“多巴胺釋放隨動物接近獎賞而遞增” 的實驗現(xiàn)象,提出動物會將 “線索到獎賞” 的過程拆分為連續(xù)時間片段,越接近獎賞,價值評估越高,因此多巴胺信號會逐步上升,這一修正并非臨時拼湊,而是基于對動物認知邏輯的重新理解。
技術驅(qū)動變革:基因編碼傳感器與光纖光學技術的進步,讓科學家能更精準測量深部腦區(qū)的多巴胺神經(jīng)元活動,發(fā)現(xiàn)了大量 RPE/TDRL 無法解釋的例外情況;
觀點分化:
部分學者(如 David Redish)認為應保留 RPE/TDRL 的核心價值,在其基礎上拓展復雜性;
部分學者(如 Josh Dudman)更愿意嘗試全新模型,盡管這會讓許多同行感到不安;
核心困境:30 年間 RPE/TDRL 已衍生出大量分支模型,形成 “移動靶標”,讓新理論難以徹底證偽舊體系。
你可能聽過這個說法:多巴胺是“快樂分子”。戀愛時多巴胺飆升,刷短視頻停不下來是因為多巴胺,吃甜食開心也是多巴胺。這個說法通俗易懂,但科學家聽了會皺眉頭——因為多巴胺的工作,遠比“快樂”兩個字復雜得多。
過去三十年,教科書上寫的是:多巴胺負責“獎賞預測誤差”。這個理論很漂亮,用它解釋成癮、解釋學習、解釋動機,幾乎無所不能。但最近幾年,實驗技術突飛猛進,科學家能更精確地盯著多巴胺神經(jīng)元看。結果發(fā)現(xiàn):多巴胺干的事兒,比教科書寫的多太多了。它會在你遇到威脅時激活,會在你移動時放電,會編碼你在迷宮里的位置……
于是,一場關于“多巴胺到底是什么”的爭論在學術會議上炸開了。成癮者的治療方案、精神分裂癥的療法——都建立在我們對多巴胺的理解上。如果理解變了,治療方向也可能跟著變。
當然,這場爭論還要持續(xù)很多年。
但有一點可以確定:多巴胺的故事,遠比“快樂分子”精彩得多。
原文鏈接:https://doi.org/10.1038/d41586-026-00836-x
快報
根據(jù)《網(wǎng)絡安全法》實名制要求,請綁定手機號后發(fā)表評論