![]()
認知神經科學前沿文獻分享
![]()
基本信息
Title:Role of the primate ventral striatum as a neural hub bridging option valuation and action selection
發表時間:2026-03-28
發表期刊:Nature Communications
影響因子:15.7
獲取原文:
1. 添加小助手:PSY-Brain-Frontier即可獲取PDF版本
![]()
![]()
研究背景
在面對選擇時,大腦如何將一個選項的“內在價值”轉化為具體的“選擇動作”?這是決策神經科學中的核心問題。比如,在自助餐廳里,從我們決定一道想吃的菜(如大閘蟹),到伸出手去拿取,這種從“想要”到“得到”的鴻溝是怎樣發生的?
![]()
在經典的強化學習框架中,大腦的運作似乎涇渭分明:腹側紋狀體(Ventral Striatum, VS)和中腦多巴胺神經元負責“估價”。它們編碼預期獎勵的價值,并根據獎勵預測誤差(RPE)不斷更新這些價值表征。簡單來說,這個系統負責告訴大腦“哪個選項更好”。
然而,僅僅知道“什么更好”是不夠的,大腦還需要把這些價值信息傳遞給運動系統,從而真正執行選擇。過去的研究多將腹側紋狀體視為一個單純的“價值記賬員”,認為它只負責向皮層提供價值信號。但解剖學證據暗示,作為連接邊緣系統與運動系統的關鍵節點,腹側紋狀體可能扮演著更主動的角色:它會不會直接參與了從“估價”到“動作選擇”的轉化過程?
為了回答這個問題,研究者在獼猴身上設計了一項基于價值的決策任務,并結合單細胞電生理記錄、微電極刺激以及光遺傳學手段,試圖揭示腹側紋狀體及其多巴胺輸入在決策形成瞬間的真實動態。
![]()
研究核心總結
這項研究的核心在于打破了“價值評估”與“動作選擇”在時間與空間上的絕對隔離,證明了腹側紋狀體是一個動態的神經樞紐。
一、神經信號的動態演變:從“評估價值”到“決定動作”
研究者訓練獼猴完成一項序貫決策任務:屏幕上首先出現一個代表特定水量獎勵的視覺選項(選項一),獼猴需要根據其價值,決定是松開按鈕(選擇該選項)還是按住不動(放棄并等待選項二)。
單細胞記錄顯示,腹側紋狀體神經元的放電活動并非靜態地表征價值。在選項一剛出現時,神經元的活動主要反映該選項的“客觀價值”;但隨著時間推移(在幾百毫秒內),這些神經元的活動模式發生了平滑的轉移,開始反映獼猴的“動作選擇”,即無論價值多少,只要獼猴決定松開按鈕,神經元就會表現出特定的放電特征。
這種動態轉移在單神經元和群體層面上均被觀察到。這表明,腹側紋狀體內部正在實時進行著將“價值信號”翻譯為“動作選擇信號”的計算。
![]()
Fig 1. 獼猴基于價值的決策任務范式及行為表現,顯示獼猴的松手決策嚴格依賴于選項的預期價值。
![]()
Fig 2. 腹側紋狀體神經元的動態放電特征。模型對比分析顯示,神經元信號在選項呈現后,依次經歷了“價值調節”階段、“中間過渡”階段,最終演變為“選擇調節”階段。
為了排除這種“選擇信號”僅僅是松手動作本身的運動反射,研究者讓獼猴完成了一個不需要做決策、只需單純松手的控制任務。結果發現,絕大多數在決策任務中表現出強烈選擇信號的神經元,在單純運動任務中并未出現明顯反應。這證實了腹側紋狀體編碼的是“基于價值的動作選擇”,而非純粹的肌肉運動。
![]()
Fig 3. 決策任務與單純按鍵釋放任務中神經元活動的對比,排除了選擇信號純粹由運動執行引起的可能性。二、因果干預:腹側紋狀體直接介入“猶豫不決”的決策
如果腹側紋狀體真的在驅動動作選擇,那么人為干擾它應該會改變獼猴的決策。研究者在獼猴進行決策的窗口期(即選項一呈現期間),對腹側紋狀體施加了微電極刺激。
結果非常有趣:電刺激確實改變了獼猴的選擇傾向,但這種改變具有高度的條件特異性。當選項的價值極高或極低時,獼猴的決策非常篤定,電刺激幾乎不起作用;然而,當選項處于中等價值(Value 4)時,獼猴本身處于“選與不選”的猶豫狀態,此時的電刺激顯著打破了平衡,導致獼猴在某些刺激位點更傾向于選擇,而在另一些位點更傾向于放棄。
![]()
Fig 4. 微電極刺激腹側紋狀體對決策行為的影響。在面對中等價值選項時,電刺激顯著改變了獼猴的動作選擇概率,且這種改變與單純的運動反應時無關。三、多巴胺的實時干預:不僅是“事后諸葛亮”,更是“幕后推手”
傳統觀點認為,多巴胺主要在獲得獎勵后釋放,作為“教學信號”來更新未來的價值預期。但這項研究發現,多巴胺在決策形成期同樣發揮著主動的干預作用。
研究者利用光遺傳學技術,選擇性地激活了投射到腹側紋狀體的中腦多巴胺神經元末梢。與電刺激的結果如出一轍,在選項呈現期間給予光遺傳刺激,同樣顯著改變了獼猴面對中等價值選項時的動作選擇。這表明,在決策正在進行的當下,多巴胺的輸入直接參與塑造了腹側紋狀體內部從價值到動作的轉化過程。
![]()
Fig 5. 光遺傳學特異性激活多巴胺向腹側紋狀體的輸入。在決策窗口期的光刺激同樣能夠雙向調節獼猴對中等價值選項的動作選擇。
![]()
研究意義
這項工作極大地豐富了我們對基底節環路在決策中作用的理解。
首先,它在理論上修正了傳統強化學習模型中對腹側紋狀體的單一功能定位。腹側紋狀體不僅是一個被動的價值評估器,更是一個主動的“邊緣-運動接口”。它能夠在局部網絡中完成從“估價”到“選擇”的流式計算,直接為下游的運動輸出提供決策依據。
其次,研究揭示了多巴胺系統的前瞻性功能。多巴胺不僅在事后負責“獎懲教學”,在事前和事中,它同樣作為一種實時的神經調控力量,干預著動作選擇的生成。
最后,這項研究也明確了自身的邊界。無論是電刺激還是光遺傳刺激,都觀察到了雙向的效應(有的位點促進選擇,有的抑制選擇)。這很可能與紋狀體內部直接通路(D1受體主導,促進接近)和間接通路(D2受體主導,促進回避)的復雜微環路有關。受限于目前靈長類動物細胞類型特異性操控技術的瓶頸,研究尚無法完全拆解這兩條通路在決策瞬間的具體分工,這也為未來的非人靈長類腦科學研究指明了極具價值的探索方向。
分享人:飯鴿兒
審核:PsyBrain 腦心前沿編輯部
你好,這里是「PsyBrain 腦心前沿」
專注追蹤全球認知神經科學的最尖端突破
視野直擊 Nature, Science, Cell 正刊 及核心子刊與頂級大刊
每日速遞「深度解讀」與「前沿快訊」
科研是一場探索未知的長跑,但你無需獨行。歡迎加入PsyBrain 學術社群,和一群懂你的同行,共同丈量腦與心智的無垠前沿。
點擊卡片進群,歡迎你的到來
一鍵關注,點亮星標 ? 前沿不走丟!
![]()
一鍵分享,讓更多人了解前沿
特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.