![]()
一鍵關注,點亮星標 ?? 前沿不走丟!
認知神經科學前沿文獻分享
![]()
基本信息
Title:Neuronal tuning aligns dynamically with object and texture manifolds across the visual hierarchy
發表時間:2026.3.10
發表期刊:Nature Neuroscience
影響因子:19.5
獲取原文:
添加小助手:PSY-Brain-Frontier即可獲取PDF版本
![]()
![]()
引言
我們常常默認,視覺神經元的工作方式是“見到什么就對應什么”:看到邊緣,就激活邊緣檢測;看到人臉,就激活人臉相關細胞。這個框架在初級視皮層(V1)里還能成立,因為很多經典研究已經證明,那里不少神經元確實對方向、輪廓這類簡單特征敏感。
但問題是,沿著腹側視覺通路繼續往后走,事情就沒那么直觀了。很多神經元會同時對語義上毫不相干的圖像產生強烈反應,比如某個神經元可能既喜歡昆蟲,也喜歡橋梁,甚至還喜歡一輛卡車。這樣一來,單純用“它在編碼某個具體物體”來解釋,顯然就不夠了。
這篇文章想回答的,正是視覺神經元究竟優先提取什么信息。作者沒有繼續沿用人為設定刺激的傳統辦法,而是把生成模型(generative models)引入神經生理實驗,讓神經元自己“挑圖”。他們比較了兩類圖像空間:一類偏向紋理與局部統計結構,另一類偏向清晰、逼真的物體形態。核心問題不是哪張圖更好看,而是不同視覺腦區的神經元,究竟更容易在什么樣的圖像流形(manifold)上被驅動到高反應。更重要的是,作者不僅看最終反應強不強,還看優化過程快不快、是否容易成功,以及這種偏好會不會隨時間發生變化。
這個設計讓研究從“神經元喜歡什么圖”推進到了“神經元如何在不同視覺語言中尋找最優刺激”。
![]()
實驗設計與方法邏輯
作者在獼猴的 V1、V4 和后部下顳皮層(posterior inferotemporal cortex, PIT)記錄神經活動,讓神經元在閉環優化(closed-loop optimization)中分別引導兩類生成器搜索高激活圖像:DeePSim 代表偏紋理的圖像空間,BigGAN 代表偏物體的圖像空間。研究隨后從三個層面比較“對齊”程度:優化是否容易成功、優化前后激活水平如何變化、達到高反應的速度誰更快;再結合時間分辨的反應曲線與 BigGAN 潛在空間中的調諧地形,追問這種對齊究竟是靜態的還是動態展開的。
![]()
Fig. 1 | Texture and object image manifolds as parameterized by DeePSim and BigGAN.
![]()
核心發現
同一個神經元可以接受兩種“長相不同”的最優圖
但關鍵是局部特征相通
論文最有意思的起點,是神經元能同時引導 DeePSim 和 BigGAN 生成高激活圖像。圖 2 和圖 3 說明,這兩類優化圖在整體外觀上往往差異很大:一個更像紋理拼貼,一個更像物體照片,但它們在局部區域上常共享某些關鍵線索。作者用歸因掩膜和感知相似性分析證明,同一記錄位點配對得到的圖像,更像是在重復利用同一種局部視覺母題,而不是分別編碼兩個毫不相干的對象。讀圖時真正要抓住的,不是“這像不像某個東西”,而是神經元真正偏愛的,可能是可在不同場景中反復出現的局部結構。
![]()
Fig. 2 | Example of a successful paired evolution from an inferotemporal cortex site.
![]()
![]()
Fig. 3 | Optimized images showed local feature similarity.
從 V1、V4 到 PIT,神經調諧對紋理和物體空間的對齊關系逐級變化
圖 4 是全文最關鍵的一張總結圖。作者把“對齊”拆成優化成功率、最終激活強度和收斂速度三個指標,結果發現,V1 和 V4 更容易在DeePSim這類紋理空間里被推到高反應,說明這些區域的調諧與紋理式表征更貼近;但到了 PIT,BigGAN與DeePSim的表現已經接近,優化成功率和最終激活差距顯著縮小。這張圖值得重點看,因為它把“高階視覺區更偏物體”這個直覺,改寫成了一個更細的結論:高階區并不是拋棄紋理,而是在保留局部特征敏感性的同時,逐步增強了對物體流形(object manifold)的可導航性。
![]()
![]()
Fig. 4 | Differential alignment with DeePSim and BigGAN across the ventral hierarchy.
PIT 對物體空間的優勢
出現在反應后段而不是刺激剛出現時
如果只看平均放電強度,很容易以為 PIT 對兩種空間“差不多都行”。但圖 5 把時間維度加進來后,故事明顯變了。作者把刺激后不同時窗的反應拆開分析,發現 PIT 在早期時間窗更容易被紋理型圖像拉起來,而到了較晚階段,BigGAN 生成的物體型圖像反而占優。也就是說,PIT 的物體相關對齊不是一開始就壓過紋理,而是隨著反應展開逐步顯現。這一點非常重要,因為它提示高級視覺表征并非一次性完成,而可能經歷了從局部線索到更完整物體結構的動態整合過程。
![]()
![]()
![]()
Fig. 5 | Object space preferentially activated late responses in PIT neurons.
神經元的調諧曲線不是固定模板
鐘形還是斜坡取決于你離峰值有多近
圖 6 進一步把問題從“神經元喜歡什么”推進到“它的偏好地形長什么樣”。作者在 BigGAN 潛在空間中沿多個正交方向采樣,發現如果此前優化已經較成功,那么沿這些方向測得的調諧曲線更常呈鐘形,峰值也更靠近采樣中心;而當優化不夠成功時,曲線更容易表現為斜坡狀甚至較平坦。讀這張圖時要抓住一點:所謂“神經元是鐘形調諧還是單調調諧”,并不是一個脫離情境的固定屬性,它取決于實驗采樣有沒有真正靠近該神經元的偏好峰。這個結果也讓我們對高維視覺表征的理解更接近真實狀態。
![]()
![]()
Fig. 6 | Geometry of tuning landscapes in BigGAN latent space.
![]()
歸納總結和點評
這項研究把生成模型、閉環神經生理和時間動態分析真正結合了起來,回答的不是“神經元更喜歡紋理還是物體”這樣一個二選一問題,而是揭示了這種偏好會隨視覺層級和反應時間共同變化。更可貴的是,作者沒有把 PIT 簡化成“物體區”,而是指出它既保留對局部視覺母題的敏感,也在晚期反應中更好地對齊物體結構。這個結論對理解腹側通路編碼原則,以及反思當前計算機視覺模型與生物視覺之間的差距,都很有啟發性。
![]()
請打分
這篇剛剛登上Nature Neuroscience的研究,是否實至名歸?我們邀請您作為“云審稿人”,一同品鑒。精讀全文后,歡迎在匿名投票中打分,并在評論區分享您的深度見解。
分享人:BQ
審核:PsyBrain 腦心前沿編輯部
你好,這里是「PsyBrain 腦心前沿」
專注追蹤全球認知神經科學的最尖端突破
視野直擊 Nature, Science, Cell 正刊 及 Nat Neurosci, Nat Hum Behav, Neuron, Sci Adv 等核心子刊與頂級大刊
每日速遞「深度解讀」與「前沿快訊」,為你打破信息差
科研是一場探索未知的長跑,但你無需獨行。歡迎志同道合的你加入PsyBrain 學術社群,和一群懂你的同行,共同丈量腦與心智的無垠前沿。
點擊卡片進群,歡迎你的到來
![]()
![]()
![]()
一鍵分享,讓更多人了解前沿
特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.