![]()
認知神經(jīng)科學前沿文獻分享
![]()
基本信息
Title:Vectorized instructive signals in cortical dendrites
發(fā)表時間:2026.2.25
發(fā)表期刊:Nature
獲取原文:
1. 添加小助手:PSY-Brain-Frontier即可獲取PDF版本
![]()
![]()
研究背景
學習會改變突觸連接,但在復雜神經(jīng)網(wǎng)絡里,哪些神經(jīng)元和突觸該被“記功”或“追責”,也就是信用分配(credit assignment)問題,至今缺少直接的細胞亞區(qū)室證據(jù)。理論上,如果前饋輸入和反饋/教學信息能在皮層錐體神經(jīng)元不同樹突區(qū)室中分開處理,那么單個神經(jīng)元就可能接收到面向自身的向量化教學信號(vectorized teaching signals),而不是全體共享同一個標量信號。
這篇論文聚焦小鼠回顧后皮層(retrosplenial cortex, RSC)第5層錐體神經(jīng)元的頂端樹突(apical dendrites)。作者提出,若樹突確實參與這類信用分配,至少應滿足四個條件:樹突活動包含胞體之外的信息;這些信息與獎勵或誤差等任務變量有關;其符號取決于該神經(jīng)元在任務中的因果角色;擾動這類樹突信號會影響學習。一個現(xiàn)實難點是,實驗者往往不知道大腦內(nèi)部究竟在優(yōu)化什么獎勵函數(shù)。為繞開這個問題,作者使用了由實驗者明確規(guī)定獎勵函數(shù)的神經(jīng)反饋腦機接口(brain-computer interface, BCI)任務。
![]()
實驗設計與方法邏輯
作者讓頭固定小鼠在雙光子成像下學習一個閉環(huán)BCI任務:在RSC中選出兩組空間上交錯的第5層錐體神經(jīng)元,定義為P+和P?,兩組平均活動之差驅(qū)動視覺光柵朝目標方向旋轉(zhuǎn);達到目標后給予獎勵。首先,研究連續(xù)追蹤14天,確認小鼠能否學會任務,以及P+、P?神經(jīng)元活動如何隨學習變化。
隨后,作者半同步記錄同一神經(jīng)元近端與遠端頂端樹干鈣信號,并以近端樹干作為胞體活動代理,定義體-樹突殘差(somato-dendritic residual, SD residual),用于量化在給定胞體事件幅度下,樹突信號是相對放大還是相對衰減。這個指標的目的,是檢驗樹突是否攜帶胞體活動之外的額外信息。
接著,研究用視野內(nèi)周圍神經(jīng)元在事件前2秒的活動去預測單細胞SD residual,并在群體層面用SD residual解碼獎勵/未獎勵、成功/失敗等任務變量。更關鍵的一步是,P+和P?在任務中對誤差的因果作用相反,因此可以檢驗樹突中的誤差信號究竟更像“全體共享的標量”,還是“依神經(jīng)元角色改變符號的向量化表示”。最后,作者通過激活第1層的NDNF陽性中間神經(jīng)元(NDNF+ interneurons)削弱頂端樹突處理,觀察相關信號和學習表現(xiàn)是否同時受影響。需要注意的是,這項研究證明的是與任務相關的樹突信號及其必要性的一部分證據(jù),并不能據(jù)此直接斷言大腦普遍采用某一種具體學習算法。
![]()
核心發(fā)現(xiàn)
發(fā)現(xiàn)一:這項BCI學習依賴神經(jīng)元群體的差異性重塑,而不是整體一起增強
小鼠確實學會了這項閉環(huán)BCI任務,而且學習過程中,P+與P?并不是同步朝同一方向變化。正文顯示,14天訓練后,無論按正確率還是每分鐘獎勵數(shù)衡量,任務表現(xiàn)都提升;與此同時,P?神經(jīng)元活動逐漸下調(diào),而P+整體更接近維持原水平。由于兩類神經(jīng)元在空間上交錯、且訓練初始瞬變頻率相當,這更符合差異性重塑,而不是簡單的非特異性增益上調(diào)。
![]()
Fig. 1 中,作者一邊給出BCI任務規(guī)則,一邊展示14天內(nèi)的表現(xiàn)變化和P+、P?活動軌跡;這張圖說明小鼠學會了任務,而且學習伴隨的是兩類控制神經(jīng)元的分化調(diào)整,也對應了“發(fā)現(xiàn)一”。發(fā)現(xiàn)二:體-樹突殘差攜帶胞體之外的信息,并與獎勵和試次結(jié)果相關
雖然胞體與遠端樹突的事件時間高度相關,但兩者相對幅度并不固定。作者用SD residual量化這種差異后發(fā)現(xiàn),它與胞體事件幅度去相關,卻可以被周圍網(wǎng)絡狀態(tài)在單細胞層面高于隨機水平地預測,說明樹突并不只是被動復制胞體輸出。進一步地,在群體層面,SD residual能夠以高于隨機的準確率區(qū)分獎勵/未獎勵試次,以及成功/失敗試次,表明這種體-樹突差異信號與任務相關變量有關。麻醉和激活NDNF+中間神經(jīng)元都會降低SD residual,也支持這一指標對應可被生理操控的樹突處理過程。
![]()
![]()
![]()
Fig. 2 展示了SD residual的定義,以及周圍網(wǎng)絡活動如何預測單細胞樹突相對放大或衰減;Fig. 3 說明這種指標會在麻醉或NDNF+中間神經(jīng)元激活時下降;Fig. 4 則表明群體SD residual可解碼獎勵和試次結(jié)果,這幾張圖共同支撐了“發(fā)現(xiàn)二”。發(fā)現(xiàn)三:樹突中的誤差信號具有神經(jīng)元特異性,干擾后學習也會受損
如果誤差信號只是全局廣播的標量,那么P+和P?應當表現(xiàn)出同向的樹突變化;但正文結(jié)果并非如此。在誤差降低階段,P+神經(jīng)元樹突相對放大,P?則相對衰減;到了誤差升高階段,兩者關系反轉(zhuǎn)。這說明樹突中的相關信號帶有“方向”,并依賴該神經(jīng)元在任務中的因果角色,更符合向量化教學信號的預測。作者同時指出,這里觀察到的更接近誤差導數(shù),而不是經(jīng)典反向傳播中的誤差本身。進一步地,激活第1層NDNF+中間神經(jīng)元后,這種P+與P?可分離的樹突誤差信號消失,訓練后期的表現(xiàn)提升也被破壞,說明局部樹突處理與該任務中的學習改進有關。
![]()
Fig. 5 中,作者直接比較了P+與P?在誤差下降和誤差上升時期的SD residual方向,并加入NDNF+中間神經(jīng)元干預后的結(jié)果;這張圖把“神經(jīng)元特異性誤差信號”與“學習受損”連成了同一條證據(jù)鏈,也對應了“發(fā)現(xiàn)三”。
![]()
總結(jié)
這篇Nature研究用閉環(huán)神經(jīng)反饋BCI,把信用分配問題放進了可檢驗的實驗框架。結(jié)果顯示,小鼠RSC第5層錐體神經(jīng)元的遠端頂端樹突中,體-樹突殘差與獎勵、試次結(jié)果和誤差變化相關,而且其符號取決于神經(jīng)元在任務中的因果角色;擾動這類樹突處理會削弱學習。但這還不能直接外推到全腦,也不等于已經(jīng)證明大腦普遍使用經(jīng)典反向傳播。
![]()
請打分
這篇剛剛登上Nature的研究,是否實至名歸?我們邀請您作為“云審稿人”,一同品鑒。精讀全文后,歡迎在匿名投票中打分,并在評論區(qū)分享您的深度見解。
分享人:BQ
審核:PsyBrain 腦心前沿編輯部
你好,這里是「PsyBrain 腦心前沿」
專注追蹤全球認知神經(jīng)科學的最尖端突破
視野直擊 Nature, Science, Cell 正刊 及核心子刊與頂級大刊
每日速遞「深度解讀」與「前沿快訊」
科研是一場探索未知的長跑,但你無需獨行。歡迎加入PsyBrain 學術社群,和一群懂你的同行,共同丈量腦與心智的無垠前沿。
點擊卡片進群,歡迎你的到來
一鍵關注,點亮星標 ? 前沿不走丟!
![]()
一鍵分享,讓更多人了解前沿
特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺“網(wǎng)易號”用戶上傳并發(fā)布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.