網(wǎng)易首頁 > 網(wǎng)易號 > 正文申請入駐

Nature｜腦機接口揭示：神經(jīng)元樹突的差異性學習機制

2026-04-04 12:13:21　來源: PsyBrain腦心前沿

北京舉報

分享至

認知神經(jīng)科學前沿文獻分享

基本信息

Title:Vectorized instructive signals in cortical dendrites

發(fā)表時間:2026.2.25

發(fā)表期刊:Nature

獲取原文:

1. 添加小助手:PSY-Brain-Frontier即可獲取PDF版本

研究背景

學習會改變突觸連接，但在復雜神經(jīng)網(wǎng)絡里，哪些神經(jīng)元和突觸該被“記功”或“追責”，也就是信用分配（credit assignment）問題，至今缺少直接的細胞亞區(qū)室證據(jù)。理論上，如果前饋輸入和反饋/教學信息能在皮層錐體神經(jīng)元不同樹突區(qū)室中分開處理，那么單個神經(jīng)元就可能接收到面向自身的向量化教學信號（vectorized teaching signals），而不是全體共享同一個標量信號。

這篇論文聚焦小鼠回顧后皮層（retrosplenial cortex, RSC）第5層錐體神經(jīng)元的頂端樹突（apical dendrites）。作者提出，若樹突確實參與這類信用分配，至少應滿足四個條件：樹突活動包含胞體之外的信息；這些信息與獎勵或誤差等任務變量有關；其符號取決于該神經(jīng)元在任務中的因果角色；擾動這類樹突信號會影響學習。一個現(xiàn)實難點是，實驗者往往不知道大腦內(nèi)部究竟在優(yōu)化什么獎勵函數(shù)。為繞開這個問題，作者使用了由實驗者明確規(guī)定獎勵函數(shù)的神經(jīng)反饋腦機接口（brain-computer interface, BCI）任務。

實驗設計與方法邏輯

作者讓頭固定小鼠在雙光子成像下學習一個閉環(huán)BCI任務：在RSC中選出兩組空間上交錯的第5層錐體神經(jīng)元，定義為P+和P?，兩組平均活動之差驅(qū)動視覺光柵朝目標方向旋轉(zhuǎn)；達到目標后給予獎勵。首先，研究連續(xù)追蹤14天，確認小鼠能否學會任務，以及P+、P?神經(jīng)元活動如何隨學習變化。

隨后，作者半同步記錄同一神經(jīng)元近端與遠端頂端樹干鈣信號，并以近端樹干作為胞體活動代理，定義體-樹突殘差（somato-dendritic residual, SD residual），用于量化在給定胞體事件幅度下，樹突信號是相對放大還是相對衰減。這個指標的目的，是檢驗樹突是否攜帶胞體活動之外的額外信息。

接著，研究用視野內(nèi)周圍神經(jīng)元在事件前2秒的活動去預測單細胞SD residual，并在群體層面用SD residual解碼獎勵/未獎勵、成功/失敗等任務變量。更關鍵的一步是，P+和P?在任務中對誤差的因果作用相反，因此可以檢驗樹突中的誤差信號究竟更像“全體共享的標量”，還是“依神經(jīng)元角色改變符號的向量化表示”。最后，作者通過激活第1層的NDNF陽性中間神經(jīng)元（NDNF+ interneurons）削弱頂端樹突處理，觀察相關信號和學習表現(xiàn)是否同時受影響。需要注意的是，這項研究證明的是與任務相關的樹突信號及其必要性的一部分證據(jù)，并不能據(jù)此直接斷言大腦普遍采用某一種具體學習算法。

核心發(fā)現(xiàn)

發(fā)現(xiàn)一：這項BCI學習依賴神經(jīng)元群體的差異性重塑，而不是整體一起增強

小鼠確實學會了這項閉環(huán)BCI任務，而且學習過程中，P+與P?并不是同步朝同一方向變化。正文顯示，14天訓練后，無論按正確率還是每分鐘獎勵數(shù)衡量，任務表現(xiàn)都提升；與此同時，P?神經(jīng)元活動逐漸下調(diào)，而P+整體更接近維持原水平。由于兩類神經(jīng)元在空間上交錯、且訓練初始瞬變頻率相當，這更符合差異性重塑，而不是簡單的非特異性增益上調(diào)。

Fig. 1 中，作者一邊給出BCI任務規(guī)則，一邊展示14天內(nèi)的表現(xiàn)變化和P+、P?活動軌跡；這張圖說明小鼠學會了任務，而且學習伴隨的是兩類控制神經(jīng)元的分化調(diào)整，也對應了“發(fā)現(xiàn)一”。

發(fā)現(xiàn)二：體-樹突殘差攜帶胞體之外的信息，并與獎勵和試次結(jié)果相關

雖然胞體與遠端樹突的事件時間高度相關，但兩者相對幅度并不固定。作者用SD residual量化這種差異后發(fā)現(xiàn)，它與胞體事件幅度去相關，卻可以被周圍網(wǎng)絡狀態(tài)在單細胞層面高于隨機水平地預測，說明樹突并不只是被動復制胞體輸出。進一步地，在群體層面，SD residual能夠以高于隨機的準確率區(qū)分獎勵/未獎勵試次，以及成功/失敗試次，表明這種體-樹突差異信號與任務相關變量有關。麻醉和激活NDNF+中間神經(jīng)元都會降低SD residual，也支持這一指標對應可被生理操控的樹突處理過程。

Fig. 2 展示了SD residual的定義，以及周圍網(wǎng)絡活動如何預測單細胞樹突相對放大或衰減；Fig. 3 說明這種指標會在麻醉或NDNF+中間神經(jīng)元激活時下降；Fig. 4 則表明群體SD residual可解碼獎勵和試次結(jié)果，這幾張圖共同支撐了“發(fā)現(xiàn)二”。

發(fā)現(xiàn)三：樹突中的誤差信號具有神經(jīng)元特異性，干擾后學習也會受損

如果誤差信號只是全局廣播的標量，那么P+和P?應當表現(xiàn)出同向的樹突變化；但正文結(jié)果并非如此。在誤差降低階段，P+神經(jīng)元樹突相對放大，P?則相對衰減；到了誤差升高階段，兩者關系反轉(zhuǎn)。這說明樹突中的相關信號帶有“方向”，并依賴該神經(jīng)元在任務中的因果角色，更符合向量化教學信號的預測。作者同時指出，這里觀察到的更接近誤差導數(shù)，而不是經(jīng)典反向傳播中的誤差本身。進一步地，激活第1層NDNF+中間神經(jīng)元后，這種P+與P?可分離的樹突誤差信號消失，訓練后期的表現(xiàn)提升也被破壞，說明局部樹突處理與該任務中的學習改進有關。

Fig. 5 中，作者直接比較了P+與P?在誤差下降和誤差上升時期的SD residual方向，并加入NDNF+中間神經(jīng)元干預后的結(jié)果；這張圖把“神經(jīng)元特異性誤差信號”與“學習受損”連成了同一條證據(jù)鏈，也對應了“發(fā)現(xiàn)三”。

總結(jié)

這篇Nature研究用閉環(huán)神經(jīng)反饋BCI，把信用分配問題放進了可檢驗的實驗框架。結(jié)果顯示，小鼠RSC第5層錐體神經(jīng)元的遠端頂端樹突中，體-樹突殘差與獎勵、試次結(jié)果和誤差變化相關，而且其符號取決于神經(jīng)元在任務中的因果角色；擾動這類樹突處理會削弱學習。但這還不能直接外推到全腦，也不等于已經(jīng)證明大腦普遍使用經(jīng)典反向傳播。

請打分

這篇剛剛登上Nature的研究，是否實至名歸？我們邀請您作為“云審稿人”，一同品鑒。精讀全文后，歡迎在匿名投票中打分，并在評論區(qū)分享您的深度見解。

分享人：BQ

審核：PsyBrain 腦心前沿編輯部

你好，這里是「PsyBrain 腦心前沿」

專注追蹤全球認知神經(jīng)科學的最尖端突破

視野直擊 Nature, Science, Cell 正刊及核心子刊與頂級大刊

每日速遞「深度解讀」與「前沿快訊」

科研是一場探索未知的長跑，但你無需獨行。歡迎加入PsyBrain 學術社群，和一群懂你的同行，共同丈量腦與心智的無垠前沿。

點擊卡片進群，歡迎你的到來

一鍵關注，點亮星標 ? 前沿不走丟！

一鍵分享，讓更多人了解前沿

特別聲明：以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺“網(wǎng)易號”用戶上傳并發(fā)布，本平臺僅提供信息存儲服務。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.