網易首頁 > 網易號 > 正文申請入駐

Nature Neuroscience | 視覺神經元到底更偏愛“紋理”還是“物體”？

2026-03-17 12:16:22　來源: PsyBrain腦心前沿

北京舉報

分享至

一鍵關注，點亮星標 ?? 前沿不走丟！

認知神經科學前沿文獻分享

基本信息

Title:Neuronal tuning aligns dynamically with object and texture manifolds across the visual hierarchy

發表時間：2026.3.10

發表期刊:Nature Neuroscience

影響因子：19.5

獲取原文：

添加小助手:PSY-Brain-Frontier即可獲取PDF版本

引言

我們常常默認，視覺神經元的工作方式是“見到什么就對應什么”：看到邊緣，就激活邊緣檢測；看到人臉，就激活人臉相關細胞。這個框架在初級視皮層（V1）里還能成立，因為很多經典研究已經證明，那里不少神經元確實對方向、輪廓這類簡單特征敏感。

但問題是，沿著腹側視覺通路繼續往后走，事情就沒那么直觀了。很多神經元會同時對語義上毫不相干的圖像產生強烈反應，比如某個神經元可能既喜歡昆蟲，也喜歡橋梁，甚至還喜歡一輛卡車。這樣一來，單純用“它在編碼某個具體物體”來解釋，顯然就不夠了。

這篇文章想回答的，正是視覺神經元究竟優先提取什么信息。作者沒有繼續沿用人為設定刺激的傳統辦法，而是把生成模型（generative models）引入神經生理實驗，讓神經元自己“挑圖”。他們比較了兩類圖像空間：一類偏向紋理與局部統計結構，另一類偏向清晰、逼真的物體形態。核心問題不是哪張圖更好看，而是不同視覺腦區的神經元，究竟更容易在什么樣的圖像流形（manifold）上被驅動到高反應。更重要的是，作者不僅看最終反應強不強，還看優化過程快不快、是否容易成功，以及這種偏好會不會隨時間發生變化。

這個設計讓研究從“神經元喜歡什么圖”推進到了“神經元如何在不同視覺語言中尋找最優刺激”。

實驗設計與方法邏輯

作者在獼猴的 V1、V4 和后部下顳皮層（posterior inferotemporal cortex, PIT）記錄神經活動，讓神經元在閉環優化（closed-loop optimization）中分別引導兩類生成器搜索高激活圖像：DeePSim 代表偏紋理的圖像空間，BigGAN 代表偏物體的圖像空間。研究隨后從三個層面比較“對齊”程度：優化是否容易成功、優化前后激活水平如何變化、達到高反應的速度誰更快；再結合時間分辨的反應曲線與 BigGAN 潛在空間中的調諧地形，追問這種對齊究竟是靜態的還是動態展開的。

Fig. 1 | Texture and object image manifolds as parameterized by DeePSim and BigGAN.

核心發現

同一個神經元可以接受兩種“長相不同”的最優圖

但關鍵是局部特征相通

論文最有意思的起點，是神經元能同時引導 DeePSim 和 BigGAN 生成高激活圖像。圖 2 和圖 3 說明，這兩類優化圖在整體外觀上往往差異很大：一個更像紋理拼貼，一個更像物體照片，但它們在局部區域上常共享某些關鍵線索。作者用歸因掩膜和感知相似性分析證明，同一記錄位點配對得到的圖像，更像是在重復利用同一種局部視覺母題，而不是分別編碼兩個毫不相干的對象。讀圖時真正要抓住的，不是“這像不像某個東西”，而是神經元真正偏愛的，可能是可在不同場景中反復出現的局部結構。

Fig. 2 | Example of a successful paired evolution from an inferotemporal cortex site.

Fig. 3 | Optimized images showed local feature similarity.

從 V1、V4 到 PIT，神經調諧對紋理和物體空間的對齊關系逐級變化

圖 4 是全文最關鍵的一張總結圖。作者把“對齊”拆成優化成功率、最終激活強度和收斂速度三個指標，結果發現，V1 和 V4 更容易在DeePSim這類紋理空間里被推到高反應，說明這些區域的調諧與紋理式表征更貼近；但到了 PIT，BigGAN與DeePSim的表現已經接近，優化成功率和最終激活差距顯著縮小。這張圖值得重點看，因為它把“高階視覺區更偏物體”這個直覺，改寫成了一個更細的結論：高階區并不是拋棄紋理，而是在保留局部特征敏感性的同時，逐步增強了對物體流形（object manifold）的可導航性。

Fig. 4 | Differential alignment with DeePSim and BigGAN across the ventral hierarchy.

PIT 對物體空間的優勢

出現在反應后段而不是刺激剛出現時

如果只看平均放電強度，很容易以為 PIT 對兩種空間“差不多都行”。但圖 5 把時間維度加進來后，故事明顯變了。作者把刺激后不同時窗的反應拆開分析，發現 PIT 在早期時間窗更容易被紋理型圖像拉起來，而到了較晚階段，BigGAN 生成的物體型圖像反而占優。也就是說，PIT 的物體相關對齊不是一開始就壓過紋理，而是隨著反應展開逐步顯現。這一點非常重要，因為它提示高級視覺表征并非一次性完成，而可能經歷了從局部線索到更完整物體結構的動態整合過程。

Fig. 5 | Object space preferentially activated late responses in PIT neurons.

神經元的調諧曲線不是固定模板

鐘形還是斜坡取決于你離峰值有多近

圖 6 進一步把問題從“神經元喜歡什么”推進到“它的偏好地形長什么樣”。作者在 BigGAN 潛在空間中沿多個正交方向采樣，發現如果此前優化已經較成功，那么沿這些方向測得的調諧曲線更常呈鐘形，峰值也更靠近采樣中心；而當優化不夠成功時，曲線更容易表現為斜坡狀甚至較平坦。讀這張圖時要抓住一點：所謂“神經元是鐘形調諧還是單調調諧”，并不是一個脫離情境的固定屬性，它取決于實驗采樣有沒有真正靠近該神經元的偏好峰。這個結果也讓我們對高維視覺表征的理解更接近真實狀態。

Fig. 6 | Geometry of tuning landscapes in BigGAN latent space.

歸納總結和點評

這項研究把生成模型、閉環神經生理和時間動態分析真正結合了起來，回答的不是“神經元更喜歡紋理還是物體”這樣一個二選一問題，而是揭示了這種偏好會隨視覺層級和反應時間共同變化。更可貴的是，作者沒有把 PIT 簡化成“物體區”，而是指出它既保留對局部視覺母題的敏感，也在晚期反應中更好地對齊物體結構。這個結論對理解腹側通路編碼原則，以及反思當前計算機視覺模型與生物視覺之間的差距，都很有啟發性。

請打分

這篇剛剛登上Nature Neuroscience的研究，是否實至名歸？我們邀請您作為“云審稿人”，一同品鑒。精讀全文后，歡迎在匿名投票中打分，并在評論區分享您的深度見解。

分享人：BQ

審核：PsyBrain 腦心前沿編輯部

你好，這里是「PsyBrain 腦心前沿」

專注追蹤全球認知神經科學的最尖端突破

視野直擊 Nature, Science, Cell 正刊及 Nat Neurosci, Nat Hum Behav, Neuron, Sci Adv 等核心子刊與頂級大刊

每日速遞「深度解讀」與「前沿快訊」，為你打破信息差

科研是一場探索未知的長跑，但你無需獨行。歡迎志同道合的你加入PsyBrain 學術社群，和一群懂你的同行，共同丈量腦與心智的無垠前沿。

點擊卡片進群，歡迎你的到來

一鍵分享，讓更多人了解前沿

特別聲明：以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布，本平臺僅提供信息存儲服務。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.