337p人体粉嫩胞高清图片,97人妻精品一区二区三区在线 ,日本少妇自慰免费完整版,99精品国产福久久久久久,久久精品国产亚洲av热一区,国产aaaaaa一级毛片,国产99久久九九精品无码,久久精品国产亚洲AV成人公司
網(wǎng)易首頁(yè) > 網(wǎng)易號(hào) > 正文 申請(qǐng)入駐

《自然》發(fā)表“AI教父”辛頓的FF算法在卷積神經(jīng)網(wǎng)絡(luò)中的最新系統(tǒng)擴(kuò)展,這是類(lèi)腦學(xué)習(xí)的重大進(jìn)步

0
分享至

深度學(xué)習(xí)的崛起幾乎完全依賴(lài)于反向傳播(Backpropagation, BP)算法。BP通過(guò)鏈?zhǔn)椒▌t逐層計(jì)算梯度,使得數(shù)以百萬(wàn)計(jì)的參數(shù)能夠在訓(xùn)練過(guò)程中不斷調(diào)整。

然而,這一方法在實(shí)際應(yīng)用中存在顯著局限,BP需要存儲(chǔ)大量中間激活值,導(dǎo)致顯存消耗極高,BP依賴(lài)的計(jì)算模式在類(lèi)腦硬件或非傳統(tǒng)計(jì)算架構(gòu)上難以實(shí)現(xiàn),從生物學(xué)角度看,人腦的學(xué)習(xí)機(jī)制與BP存在根本差異,這使得BP在“類(lèi)腦學(xué)習(xí)”的探索中顯得不夠自然。

在這樣的背景下,Geoffrey Hinton 在 2022 年提出了Forward–Forward (FF) 算法。這一方法完全摒棄了反向傳播,而是通過(guò)兩次前向傳播來(lái)完成學(xué)習(xí):一次輸入正樣本(圖像與正確標(biāo)簽),一次輸入負(fù)樣本(圖像與錯(cuò)誤標(biāo)簽),并利用局部定義的“goodness函數(shù)”來(lái)更新權(quán)重。FF算法的提出不僅是對(duì)深度學(xué)習(xí)訓(xùn)練方式的挑戰(zhàn),更是對(duì)生物學(xué)啟發(fā)式學(xué)習(xí)的一次探索。

FF算法最初僅在全連接網(wǎng)絡(luò)中得到驗(yàn)證,如何將其擴(kuò)展到卷積神經(jīng)網(wǎng)絡(luò)(CNN)這一圖像處理的核心架構(gòu),成為亟待解決的問(wèn)題。

11 月 5 日,《自然》發(fā)表研究團(tuán)隊(duì)首次系統(tǒng)性地將FF算法應(yīng)用于CNN 的最新成果,并提出了兩種新的空間標(biāo)簽策略,基于傅里葉波的標(biāo)簽與基于形態(tài)學(xué)變換的標(biāo)簽。這一創(chuàng)新使得卷積層能夠在全局范圍內(nèi)捕捉標(biāo)簽信息,避免了傳統(tǒng) one-hot 標(biāo)簽在局部嵌入時(shí)的缺陷。

研究由來(lái)自德國(guó)哥廷根的跨學(xué)科團(tuán)隊(duì)完成,他們是Riccardo Scodellaro, Ajinkya Kulkarni, FraukeAlves& Matthias Schr?ter,成員橫跨Max Planck Institute for Multidisciplinary SciencesUniversity Medical Center G?ttingen以及Max Planck Institute for Dynamics and Self-Organization。他們的研究方向涵蓋分子影像學(xué)、血液學(xué)與腫瘤學(xué)、放射學(xué)以及復(fù)雜系統(tǒng)物理學(xué),體現(xiàn)了醫(yī)學(xué)影像、人工智能與復(fù)雜系統(tǒng)理論的交叉融合。這種跨學(xué)科背景為FF算法在CNN中的應(yīng)用提供了堅(jiān)實(shí)的理論與實(shí)踐支撐。

01

工作綜述

反向傳播雖然是深度學(xué)習(xí)的基石,但其局限性早已引發(fā)廣泛關(guān)注。BP的存儲(chǔ)開(kāi)銷(xiāo)巨大,訓(xùn)練大型模型時(shí)顯存需求往往是權(quán)重存儲(chǔ)的數(shù)倍。其次,BP在類(lèi)腦硬件或非傳統(tǒng)計(jì)算架構(gòu)上難以實(shí)現(xiàn),限制了其在低能耗計(jì)算中的應(yīng)用。BP與生物神經(jīng)系統(tǒng)的學(xué)習(xí)機(jī)制差異明顯,使得其在“類(lèi)腦學(xué)習(xí)”探索中缺乏生物學(xué)合理性。

為解決這些問(wèn)題,研究者提出了多種替代方法。

1.Hebbian學(xué)習(xí)與對(duì)比Hebbian學(xué)習(xí):基于“神經(jīng)元共同激活則連接增強(qiáng)”的局部學(xué)習(xí)規(guī)則,強(qiáng)調(diào)生物學(xué)動(dòng)機(jī)。

2.平衡傳播(Equilibrium Propagation):在能量模型框架下,通過(guò)網(wǎng)絡(luò)的自由態(tài)與約束態(tài)差異來(lái)驅(qū)動(dòng)學(xué)習(xí),連接了Hopfield網(wǎng)絡(luò)與梯度下降。

3.反饋對(duì)齊(Feedback Alignment)、PEPITA等局部學(xué)習(xí)規(guī)則:通過(guò)局部誤差信號(hào)或隨機(jī)投影來(lái)更新權(quán)重,避免了逐層反向傳播。

4.零階優(yōu)化與能量模型:通過(guò)兩次前向傳播的差異來(lái)近似梯度,雖然效率較低,但在現(xiàn)代改進(jìn)下已具備競(jìng)爭(zhēng)力。

在這一廣闊的探索背景下,Hinton提出的Forward–Forward算法屬于局部學(xué)習(xí)規(guī)則的范疇。它通過(guò)正負(fù)樣本的 goodness 差異來(lái)驅(qū)動(dòng)權(quán)重更新,避免了反向傳播的復(fù)雜性。早期應(yīng)用主要集中在全連接網(wǎng)絡(luò),隨后擴(kuò)展到圖神經(jīng)網(wǎng)絡(luò)、光學(xué)神經(jīng)網(wǎng)絡(luò)以及類(lèi)腦硬件實(shí)驗(yàn)。然而在卷積神經(jīng)網(wǎng)絡(luò)這一主流架構(gòu)中,F(xiàn)F算法的應(yīng)用仍是空白。本研究正是填補(bǔ)這一缺口的首次系統(tǒng)性嘗試。

02

研究創(chuàng)新點(diǎn)

在這項(xiàng)研究中,最具突破性的貢獻(xiàn)是提出了兩種全新的空間擴(kuò)展標(biāo)簽策略,它們直接回應(yīng)了 Forward–Forward (FF) 算法在卷積神經(jīng)網(wǎng)絡(luò)中面臨的核心難題。Hinton 在最初的設(shè)計(jì)中采用的是one-hot 標(biāo)簽嵌入,即將類(lèi)別信息編碼在圖像左上角的幾個(gè)像素中。

然而這種方式在全連接網(wǎng)絡(luò)中尚可行,但在卷積神經(jīng)網(wǎng)絡(luò)中卻存在天然缺陷,卷積核在不同空間位置滑動(dòng)時(shí),往往無(wú)法捕捉到局部嵌入的標(biāo)簽信息,導(dǎo)致網(wǎng)絡(luò)難以利用標(biāo)簽進(jìn)行有效學(xué)習(xí)。

為了解決這一問(wèn)題,研究團(tuán)隊(duì)提出了兩種空間化的標(biāo)簽嵌入方法,使得類(lèi)別信息能夠在整張圖像中均勻分布,從而保證卷積層在任意位置都能感知到標(biāo)簽信號(hào)。

第一種方法是傅里葉波標(biāo)簽。研究者為每個(gè)類(lèi)別生成一組獨(dú)特的灰度波紋,這些波紋由頻率、相位和方向的不同組合構(gòu)成。通過(guò)將這種波紋圖像與原始數(shù)據(jù)進(jìn)行像素級(jí)疊加,標(biāo)簽信息被擴(kuò)展到整個(gè)圖像空間。這樣一來(lái),卷積核在任何位置都能捕捉到與類(lèi)別相關(guān)的模式,從而避免了局部標(biāo)簽缺失的問(wèn)題。傅里葉波標(biāo)簽的優(yōu)勢(shì)在于其數(shù)學(xué)上的可控性和全局一致性,能夠?yàn)榫W(wǎng)絡(luò)提供一種穩(wěn)定的類(lèi)別信號(hào)。

第二種方法是形態(tài)學(xué)標(biāo)簽。與傅里葉波的全局波紋不同,形態(tài)學(xué)標(biāo)簽通過(guò)對(duì)原始圖像施加一組確定性的形態(tài)學(xué)變換來(lái)嵌入類(lèi)別信息,例如膨脹、腐蝕、旋轉(zhuǎn)或其他幾何操作。每個(gè)類(lèi)別對(duì)應(yīng)一組獨(dú)特的變換組合,這些變換會(huì)改變圖像的結(jié)構(gòu)特征,從而迫使網(wǎng)絡(luò)在學(xué)習(xí)過(guò)程中關(guān)注圖像的形態(tài)差異,而不是依賴(lài)簡(jiǎn)單的標(biāo)簽?zāi)J?。形態(tài)學(xué)標(biāo)簽的優(yōu)勢(shì)在于它能有效避免“捷徑解”——即網(wǎng)絡(luò)僅僅依賴(lài)標(biāo)簽的簡(jiǎn)單模式來(lái)區(qū)分正負(fù)樣本,而忽視了圖像本身的復(fù)雜特征。

這兩種空間擴(kuò)展標(biāo)簽策略的提出,直接解決了 CNN 在 FF 框架下的關(guān)鍵問(wèn)題:如何讓卷積核在全局范圍內(nèi)感知類(lèi)別信息。它們不僅保證了標(biāo)簽信號(hào)的空間可達(dá)性,還通過(guò)不同的機(jī)制引導(dǎo)網(wǎng)絡(luò)學(xué)習(xí)更深層次的特征。傅里葉波標(biāo)簽提供了全局一致的模式,而形態(tài)學(xué)標(biāo)簽則強(qiáng)化了對(duì)圖像結(jié)構(gòu)的關(guān)注。兩者結(jié)合,為 FF-CNN 的訓(xùn)練提供了新的可能性。

從更宏觀的角度來(lái)看,這一創(chuàng)新點(diǎn)不僅是技術(shù)上的改進(jìn),更是理念上的突破。它體現(xiàn)了研究團(tuán)隊(duì)在類(lèi)腦學(xué)習(xí)與卷積架構(gòu)結(jié)合上的深度思考:如果我們希望擺脫反向傳播的限制,就必須重新設(shè)計(jì)標(biāo)簽與數(shù)據(jù)的交互方式,讓網(wǎng)絡(luò)在前向傳播中就能充分利用類(lèi)別信息。這種思路為未來(lái)的類(lèi)腦計(jì)算和低能耗硬件實(shí)現(xiàn)提供了重要啟示。

03

方法與實(shí)現(xiàn)

在針對(duì) MNIST 數(shù)據(jù)集 的實(shí)驗(yàn)中,研究團(tuán)隊(duì)設(shè)計(jì)了一種由三層連續(xù)卷積結(jié)構(gòu)組成的網(wǎng)絡(luò)架構(gòu)。每一層均采用相同數(shù)量的濾波器矩陣,這一參數(shù)也是實(shí)驗(yàn)中重點(diǎn)考察的超參數(shù)之一。值得注意的是,網(wǎng)絡(luò)中沒(méi)有引入最大池化層,因?yàn)樵陬A(yù)實(shí)驗(yàn)中發(fā)現(xiàn)池化操作會(huì)降低整體準(zhǔn)確率。

數(shù)據(jù)流動(dòng)過(guò)程可以概括為:輸入圖像與其正負(fù)標(biāo)簽依次通過(guò)三層卷積,每層之后都進(jìn)行 層歸一化(Layer Normalization) 和 ReLU 激活。在每一層中,正負(fù)樣本的激活差異被用于計(jì)算該層的 sigmoid 函數(shù)輸出,從而形成局部的判別信號(hào)。


圖1:空間擴(kuò)展標(biāo)簽存在于整個(gè)圖像中,而一個(gè)熱編碼僅限于左上角區(qū)域。對(duì)于FF訓(xùn)練,我們需要兩個(gè)數(shù)據(jù)集,它們都為圖像添加標(biāo)簽。第一行描述了陽(yáng)性數(shù)據(jù)集的創(chuàng)建,其中示例圖像被正確標(biāo)記。最下面一行顯示了陰性數(shù)據(jù)集的示例,其中圖像與從其他可能標(biāo)簽中隨機(jī)選擇的假標(biāo)簽相結(jié)合。我們展示了添加標(biāo)簽的三種方法。(a)和(b)描述了Hinton使用的單熱編碼:圖像頂行的第一個(gè)像素用作指示符。在該示例中,設(shè)置為1的單個(gè)像素的列數(shù)對(duì)應(yīng)于目標(biāo)值。(c)和(d)描述了我們提出的基于傅里葉的技術(shù)。每個(gè)標(biāo)簽對(duì)應(yīng)于與輸入大小相同的圖像,但具有特征灰度值波。標(biāo)簽通過(guò)逐像素相加的方式包含在圖像中。(e)和(f)顯示了我們提出的基于形態(tài)學(xué)的方法。每個(gè)標(biāo)簽都與一組獨(dú)特的變換相關(guān)聯(lián),這些變換會(huì)影響圖像形態(tài),迫使網(wǎng)絡(luò)專(zhuān)注于圖像特征。

在數(shù)學(xué)定義上,優(yōu)度(goodness)被設(shè)定為該層所有激活值的平方和:


在損失函數(shù)設(shè)計(jì)上,研究者并未采用文獻(xiàn)中提出的對(duì)稱(chēng)性方案,而是借鑒了其他工作提出的累積網(wǎng)絡(luò)損失,即通過(guò)將各層損失相加來(lái)增強(qiáng)層間協(xié)作。但與傳統(tǒng)做法不同的是,本文排除了第一層的損失。原因在于第一層的激活向量長(zhǎng)度本身就能區(qū)分正負(fù)樣本,如果過(guò)度依賴(lài)這一信息,后續(xù)層將無(wú)法學(xué)習(xí)更復(fù)雜的特征。通過(guò)舍棄第一層的損失,網(wǎng)絡(luò)被迫依賴(lài)相對(duì)激活模式,從而在更深層次上提取有意義的特征。這一做法與 Hinton 在原始實(shí)現(xiàn)中的選擇保持一致。

在訓(xùn)練細(xì)節(jié)上,團(tuán)隊(duì)遵循了兩點(diǎn)關(guān)鍵實(shí)現(xiàn)。

  • 層歸一化:對(duì)每個(gè)激活值進(jìn)行歸一化,使后續(xù)層只能利用前一層的模式信息,而非整體范數(shù)。
  • 學(xué)習(xí)率線性冷卻:在訓(xùn)練周期中途調(diào)整學(xué)習(xí)率,公式如下:


其中,E 表示總訓(xùn)練輪數(shù),e 為當(dāng)前輪數(shù)。

為了分析各層的貢獻(xiàn),研究者定義了基于層的判別損失與準(zhǔn)確率。Sigmoid 輸出被解釋為概率,當(dāng)值大于 0.5 時(shí),表示該層將圖像識(shí)別為正樣本。通過(guò)與真實(shí)標(biāo)簽比較,可以得到判別準(zhǔn)確率,并進(jìn)一步計(jì)算二元交叉熵?fù)p失。

推理階段,網(wǎng)絡(luò)提供了兩種方案:

  • 線性分類(lèi)器:除第一層外,每層的 HH 個(gè)神經(jīng)元與一個(gè)包含 NN 個(gè)節(jié)點(diǎn)的分類(lèi)層全連接,節(jié)點(diǎn)數(shù)等于類(lèi)別數(shù)。權(quán)重通過(guò)交叉熵?fù)p失訓(xùn)練,這是默認(rèn)的推理方式。
  • 優(yōu)度評(píng)估:每張圖像與所有可能的標(biāo)簽組合進(jìn)行前向傳播,計(jì)算每個(gè)標(biāo)簽的優(yōu)度值,最終選擇優(yōu)度最大的標(biāo)簽作為預(yù)測(cè)結(jié)果:


其中,對(duì)于每個(gè)關(guān)聯(lián)的標(biāo)簽m,其優(yōu)度表示為


其中H是除第一層神經(jīng)元之外的所有神經(jīng)元的數(shù)量。

CIFAR10 與 CIFAR100的實(shí)驗(yàn)中,研究團(tuán)隊(duì)采用了更深的網(wǎng)絡(luò)結(jié)構(gòu)。具體而言,網(wǎng)絡(luò)擴(kuò)展為六層卷積,并將層歸一化替換為批歸一化(Batch Normalization),以提升訓(xùn)練穩(wěn)定性。這一設(shè)計(jì)參考了已有文獻(xiàn)中的優(yōu)化方法,同時(shí)保持空間擴(kuò)展標(biāo)簽策略不變。


圖2:應(yīng)用于MNIST數(shù)據(jù)集的FF訓(xùn)練CNN的示意圖。正負(fù)樣本通過(guò)三個(gè)卷積層進(jìn)行處理,每個(gè)卷積層都經(jīng)過(guò)層歸一化和ReLU激活。在每一層,使用正樣本和負(fù)樣本的二元交叉熵計(jì)算優(yōu)度函數(shù)。然后,可以通過(guò)線性分類(lèi)器或通過(guò)評(píng)估所有標(biāo)簽的優(yōu)度得分來(lái)進(jìn)行最終分類(lèi)。

這種方法的獨(dú)特之處在于,它完全摒棄了反向傳播的鏈?zhǔn)教荻扔?jì)算,而是通過(guò)局部 goodness 函數(shù)的優(yōu)化來(lái)驅(qū)動(dòng)學(xué)習(xí)。正負(fù)樣本的對(duì)比機(jī)制讓網(wǎng)絡(luò)在沒(méi)有反向傳播的情況下,依然能夠逐層提取有意義的特征。

從整體來(lái)看,方法與實(shí)現(xiàn)部分展示了 FF 算法在 CNN 中的完整落地:通過(guò)空間擴(kuò)展標(biāo)簽保證卷積核能捕捉類(lèi)別信息,通過(guò) goodness 函數(shù)定義訓(xùn)練目標(biāo),再通過(guò)跨層累計(jì)損失與雙重推理方式實(shí)現(xiàn)分類(lèi)。這一框架不僅在數(shù)學(xué)上自洽,也為未來(lái)在類(lèi)腦硬件上的應(yīng)用提供了可行路徑。

04

實(shí)驗(yàn)結(jié)果與分析

在實(shí)驗(yàn)部分,研究團(tuán)隊(duì)通過(guò)對(duì)MNIST、CIFAR10、CIFAR100三個(gè)經(jīng)典數(shù)據(jù)集的系統(tǒng)測(cè)試,驗(yàn)證了 Forward–Forward (FF) 算法在卷積神經(jīng)網(wǎng)絡(luò)中的可行性與局限性。結(jié)果不僅展示了 FF 與傳統(tǒng)反向傳播(BP)的性能對(duì)比,也揭示了空間擴(kuò)展標(biāo)簽策略在復(fù)雜數(shù)據(jù)集上的關(guān)鍵作用。

MNIST數(shù)據(jù)集上,F(xiàn)F-CNN 的表現(xiàn)幾乎與 BP-CNN 持平。采用三層卷積結(jié)構(gòu)(每層 128 個(gè) 7×7 卷積核),F(xiàn)F-CNN在測(cè)試集上取得了99.16% 的精度,而B(niǎo)P-CNN 的精度為99.13%。這表明在簡(jiǎn)單數(shù)據(jù)集上,F(xiàn)F 算法完全能夠替代 BP。然而,訓(xùn)練動(dòng)態(tài)上存在差異:FF 收斂速度較慢,需要更多迭代才能達(dá)到穩(wěn)定精度,但其內(nèi)存消耗顯著降低,約為 BP 的25–30%。這意味著在硬件受限的場(chǎng)景下,F(xiàn)F 算法具有明顯優(yōu)勢(shì)。


圖3:FF訓(xùn)練的CNN架構(gòu)的最佳MNIST性能與相同架構(gòu)的反向傳播訓(xùn)練的CNN的結(jié)果相當(dāng)。(a)在批量大小為50的200個(gè)迭代訓(xùn)練后,根據(jù)每層濾波器的數(shù)量,為具有三個(gè)卷積層的CNN獲得的精度值。濾波器大小為7乘以7,學(xué)習(xí)率分別設(shè)置為FF的5x10-5和BP的10-3的最佳值。FF訓(xùn)練的網(wǎng)絡(luò)使用來(lái)自集合1的標(biāo)簽和35%的標(biāo)簽強(qiáng)度K。BP和FF的報(bào)告值是從驗(yàn)證數(shù)據(jù)中收集的。綠色數(shù)據(jù)點(diǎn)顯示了與FF訓(xùn)練網(wǎng)絡(luò)相關(guān)的結(jié)果,并使用優(yōu)度比較進(jìn)行推理。在這種情況下,使用(b)中報(bào)告的相應(yīng)混淆矩陣所示的測(cè)試數(shù)據(jù),每層128個(gè)濾波器實(shí)現(xiàn)了99.16±0.02%的準(zhǔn)確率。(c)顯示了為區(qū)分有助于訓(xùn)練的每個(gè)隱藏層的正負(fù)訓(xùn)練數(shù)據(jù)而計(jì)算的損失(紅線和藍(lán)線),以及訓(xùn)練期間使用的組合損失(綠線)。(d)顯示相同隱藏層的辨別精度(紅線和藍(lán)線)以及訓(xùn)練期間獲得的總精度(綠線)。

在更具挑戰(zhàn)性的CIFAR10數(shù)據(jù)集上,差異開(kāi)始顯現(xiàn)。傳統(tǒng) BP-CNN 的精度約為85.4%,而 FF-CNN 的表現(xiàn)依賴(lài)于標(biāo)簽策略:采用傅里葉波標(biāo)簽時(shí)精度為60.9%,而采用形態(tài)學(xué)標(biāo)簽時(shí)提升至68.6%。這一結(jié)果凸顯了標(biāo)簽設(shè)計(jì)的重要性。傅里葉波標(biāo)簽提供了全局一致的信號(hào),但在復(fù)雜圖像中容易被網(wǎng)絡(luò)當(dāng)作“捷徑”,導(dǎo)致模型忽視圖像本身的細(xì)節(jié)。而形態(tài)學(xué)標(biāo)簽通過(guò)改變圖像結(jié)構(gòu),迫使網(wǎng)絡(luò)關(guān)注真實(shí)的形態(tài)特征,從而有效避免了捷徑解,提升了分類(lèi)性能。

CIFAR100數(shù)據(jù)集上,研究團(tuán)隊(duì)進(jìn)一步驗(yàn)證了空間擴(kuò)展標(biāo)簽的可擴(kuò)展性。通過(guò)優(yōu)化標(biāo)簽集(從 2000 個(gè)候選模式中挑選出相關(guān)性最低的 100 個(gè)組合),F(xiàn)F-CNN 的精度穩(wěn)定在37–38%。雖然這一結(jié)果仍顯著低于 BP 的表現(xiàn),但它證明了空間標(biāo)簽策略能夠在百類(lèi)任務(wù)中保持區(qū)分度,具備一定的擴(kuò)展能力。


圖4:FF和BP訓(xùn)練的CNN的CAM顯示了網(wǎng)絡(luò)在進(jìn)行預(yù)測(cè)時(shí)認(rèn)為哪些圖像區(qū)域是有益的(黃色)或有害的(粉紅色)。(a)-(d)顯示四個(gè)輸入圖像。(e)-(h)和(i)-(l)分別是基于FF和BP培訓(xùn)的CAM。所有的例子都來(lái)自一個(gè)每層有16個(gè)卷積神經(jīng)元的網(wǎng)絡(luò),濾波器大小為5×5,在200個(gè)迭代周期內(nèi)用50個(gè)批量進(jìn)行訓(xùn)練。FF學(xué)習(xí)率:5×10^-5,BP學(xué)習(xí)率:1×10^-3。

整體來(lái)看,實(shí)驗(yàn)結(jié)果揭示了 FF-CNN 的雙重特性:在簡(jiǎn)單數(shù)據(jù)集上,它能夠與 BP 相媲美,并且在硬件資源有限的場(chǎng)景下更具優(yōu)勢(shì);在復(fù)雜數(shù)據(jù)集上,性能依賴(lài)于標(biāo)簽策略,形態(tài)學(xué)標(biāo)簽展現(xiàn)出更強(qiáng)的魯棒性與合理性。盡管 FF 在精度上仍落后于 BP,但其訓(xùn)練機(jī)制的生物學(xué)合理性與硬件友好性,使其成為未來(lái)類(lèi)腦計(jì)算與低能耗 AI 的潛在候選方案。

這種結(jié)果也提示我們,F(xiàn)F 算法的真正價(jià)值或許并不在于直接替代 BP,而在于為深度學(xué)習(xí)提供一種新的思路:通過(guò)標(biāo)簽與數(shù)據(jù)的空間交互,推動(dòng)網(wǎng)絡(luò)在前向傳播中完成學(xué)習(xí)。這種理念在未來(lái)的 neuromorphic computing(類(lèi)腦計(jì)算)平臺(tái)上,可能會(huì)展現(xiàn)出更大的優(yōu)勢(shì)。

05

可解釋性與學(xué)習(xí)動(dòng)態(tài)

在 Forward–Forward (FF) 算法擴(kuò)展到卷積神經(jīng)網(wǎng)絡(luò)的過(guò)程中,研究團(tuán)隊(duì)特別強(qiáng)調(diào)了模型的可解釋性與訓(xùn)練動(dòng)態(tài)。這不僅是為了驗(yàn)證 FF-CNN 是否真正學(xué)到了有意義的特征,更是為了理解其在復(fù)雜數(shù)據(jù)集上的表現(xiàn)差異。

首先,研究者利用Class Activation Maps (CAMs)對(duì) FF-CNN 的學(xué)習(xí)過(guò)程進(jìn)行了可視化分析。CAMs 是一種解釋性工具,可以揭示網(wǎng)絡(luò)在做出分類(lèi)決策時(shí)關(guān)注的圖像區(qū)域。實(shí)驗(yàn)結(jié)果顯示,F(xiàn)F-CNN 的不同卷積層往往學(xué)習(xí)到互補(bǔ)的特征。例如,在識(shí)別數(shù)字“7”時(shí),某一層可能更關(guān)注水平線的內(nèi)部結(jié)構(gòu),而另一層則聚焦于邊緣輪廓。這種分層互補(bǔ)的特征學(xué)習(xí)表明,盡管 FF 算法不依賴(lài)反向傳播,它依然能夠逐層構(gòu)建出有意義的表示,并在整體上形成對(duì)圖像的全面理解。相比之下,傳統(tǒng) BP-CNN 的特征分布更趨于集中,而 FF-CNN 的特征呈現(xiàn)出更強(qiáng)的多樣性和分工性。


圖5:選擇不同的空間標(biāo)簽會(huì)影響學(xué)習(xí)過(guò)程。(a)和(b)顯示了在CIFAR10數(shù)據(jù)集上測(cè)試的FF訓(xùn)練的CNN的隱藏層的二進(jìn)制精度值(區(qū)分正負(fù)數(shù)據(jù)集的能力)。雖然第一層專(zhuān)注于更簡(jiǎn)單和更粗糙的圖像特征,在兩種標(biāo)記策略下表現(xiàn)相似,但深層受益于基于形態(tài)學(xué)的標(biāo)記,但當(dāng)標(biāo)記是簡(jiǎn)單的圖案時(shí),它們會(huì)受到阻礙。給定相同的數(shù)據(jù)集圖像(c)和(f),與基于形態(tài)學(xué)的標(biāo)記(d)和(g)相關(guān)的歸一化CAM產(chǎn)生的最大值主要局限于圖像邊界(e,h)。

其次,訓(xùn)練穩(wěn)定性成為 FF-CNN 的一個(gè)關(guān)鍵議題。研究發(fā)現(xiàn),F(xiàn)F 算法對(duì)標(biāo)簽設(shè)計(jì)極為敏感。若標(biāo)簽過(guò)于簡(jiǎn)單(如傅里葉波標(biāo)簽),網(wǎng)絡(luò)可能會(huì)走向“捷徑解”,即僅依賴(lài)標(biāo)簽?zāi)J蕉鲆晥D像本身的復(fù)雜特征;而形態(tài)學(xué)標(biāo)簽則能迫使網(wǎng)絡(luò)關(guān)注圖像結(jié)構(gòu),從而獲得更穩(wěn)健的收斂路徑。這種敏感性意味著 FF-CNN 的訓(xùn)練過(guò)程可能出現(xiàn)不同的收斂軌跡,類(lèi)似于動(dòng)力系統(tǒng)中的分岔現(xiàn)象:在相同的初始條件下,網(wǎng)絡(luò)可能因標(biāo)簽設(shè)計(jì)或參數(shù)微小差異而收斂到完全不同的解。

這種分岔特性既是挑戰(zhàn),也是機(jī)遇。一方面,它揭示了 FF 算法的非線性與復(fù)雜性,說(shuō)明其學(xué)習(xí)動(dòng)態(tài)比傳統(tǒng) BP 更難以預(yù)測(cè)和控制;另一方面,它也為研究類(lèi)腦學(xué)習(xí)提供了新的視角——生物神經(jīng)系統(tǒng)的學(xué)習(xí)過(guò)程本身就充滿不確定性和多樣性,F(xiàn)F 算法的這種特性或許更接近真實(shí)的神經(jīng)學(xué)習(xí)機(jī)制。

綜上,F(xiàn)F-CNN 的可解釋性分析表明,它能夠在不同層次上學(xué)習(xí)互補(bǔ)特征,而訓(xùn)練動(dòng)態(tài)的分岔現(xiàn)象則提醒我們,標(biāo)簽設(shè)計(jì)與參數(shù)選擇在這一框架下至關(guān)重要。這不僅是技術(shù)上的挑戰(zhàn),更是理解類(lèi)腦學(xué)習(xí)與人工智能之間關(guān)系的重要窗口。

06

應(yīng)用前景與挑戰(zhàn)

Forward–Forward (FF) 算法在卷積神經(jīng)網(wǎng)絡(luò)中的擴(kuò)展,展示了其獨(dú)特的應(yīng)用潛力。首先,它的最大優(yōu)勢(shì)在于局部更新與低內(nèi)存需求。與反向傳播需要存儲(chǔ)大量中間激活值不同,F(xiàn)F 算法只依賴(lài)局部的 goodness 函數(shù)進(jìn)行權(quán)重更新,這使得訓(xùn)練過(guò)程更加輕量化,尤其適合在顯存有限或硬件受限的環(huán)境中運(yùn)行。

其次,F(xiàn)F 算法的機(jī)制天然契合類(lèi)腦硬件的實(shí)現(xiàn)。在 neuromorphic computing(類(lèi)腦計(jì)算)平臺(tái)上,反向傳播往往難以實(shí)現(xiàn),而 FF 的雙前向傳播與局部更新則更接近生物神經(jīng)系統(tǒng)的學(xué)習(xí)方式。這意味著 FF-CNN 有望成為未來(lái)低能耗硬件和類(lèi)腦芯片上的重要候選算法。

此外,F(xiàn)F 算法本身就是一種生物學(xué)啟發(fā)的學(xué)習(xí)機(jī)制。它通過(guò)正負(fù)樣本的對(duì)比來(lái)驅(qū)動(dòng)學(xué)習(xí),類(lèi)似于神經(jīng)系統(tǒng)在強(qiáng)化與抑制之間的動(dòng)態(tài)平衡。這種機(jī)制不僅為人工智能提供了新的訓(xùn)練思路,也為理解人類(lèi)大腦的學(xué)習(xí)過(guò)程提供了可能的模型。

然而,挑戰(zhàn)同樣顯而易見(jiàn)。首先,F(xiàn)F 的推理計(jì)算開(kāi)銷(xiāo)較大。在 goodness 比較模式下,每個(gè)輸入需要與所有可能的標(biāo)簽組合進(jìn)行前向傳播,這在多類(lèi)別任務(wù)中會(huì)顯著增加計(jì)算量。其次,F(xiàn)F 算法的理論收斂性尚未嚴(yán)格證明,其訓(xùn)練動(dòng)態(tài)存在分岔現(xiàn)象,意味著結(jié)果可能因標(biāo)簽設(shè)計(jì)或參數(shù)微小差異而大幅不同。最后,在復(fù)雜數(shù)據(jù)集上,F(xiàn)F-CNN 的表現(xiàn)仍明顯落后于 BP-CNN,尤其是在 CIFAR10 和 CIFAR100 上,精度差距較大。這表明 FF 算法在實(shí)際應(yīng)用中仍需進(jìn)一步優(yōu)化。

07

結(jié)論與展望

綜合來(lái)看,本文的研究證明了FF 算法在 CNN 中的可行性。通過(guò)空間擴(kuò)展標(biāo)簽策略,研究團(tuán)隊(duì)解決了卷積核無(wú)法捕捉局部標(biāo)簽信息的問(wèn)題,使得 FF-CNN 能夠在圖像任務(wù)中實(shí)現(xiàn)有效訓(xùn)練。這一創(chuàng)新不僅是技術(shù)上的突破,更是理念上的轉(zhuǎn)變:它強(qiáng)調(diào)在前向傳播中完成學(xué)習(xí),而非依賴(lài)反向傳播的鏈?zhǔn)教荻取?/p>

展望未來(lái),F(xiàn)F 算法的應(yīng)用潛力主要集中在三個(gè)方向。首先是類(lèi)腦硬件,在neuromorphic 芯片和低能耗計(jì)算平臺(tái)上,F(xiàn)F 的局部更新機(jī)制可能展現(xiàn)出更大的優(yōu)勢(shì)。其次是無(wú)監(jiān)督學(xué)習(xí),F(xiàn)F 的正負(fù)樣本對(duì)比機(jī)制天然適合在缺乏標(biāo)簽的場(chǎng)景中進(jìn)行特征學(xué)習(xí)。再次是對(duì)比學(xué)習(xí),通過(guò)擴(kuò)展正負(fù)樣本的構(gòu)造方式,F(xiàn)F 有望與現(xiàn)代自監(jiān)督學(xué)習(xí)方法結(jié)合,提升在復(fù)雜任務(wù)中的表現(xiàn)。

更深層的意義在于,F(xiàn)F 算法為深度學(xué)習(xí)提供了一條生物學(xué)啟發(fā)的替代路徑。它不僅是對(duì)反向傳播的技術(shù)挑戰(zhàn),更是推動(dòng)人工智能與神經(jīng)科學(xué)交叉發(fā)展的橋梁。隨著研究的深入,我們或許能夠在 FF 框架下找到更接近人腦學(xué)習(xí)機(jī)制的算法,從而為智能計(jì)算開(kāi)辟新的方向。

這項(xiàng)研究提醒我們,深度學(xué)習(xí)的未來(lái)不止于更大的模型和更強(qiáng)的算力,還可能在于更接近生物本質(zhì)的學(xué)習(xí)方式。Forward–Forward 算法正是這一探索的重要一步。(END)

參考資料:https://www.nature.com/articles/s41598-025-26235-2


關(guān)于波動(dòng)智能——

波動(dòng)智能旨在建立一個(gè)基于人類(lèi)情緒與反應(yīng)的真實(shí)需求洞察及滿足的價(jià)值體系,融合人工智能與意識(shí)科學(xué),構(gòu)建覆蓋情緒識(shí)別、建模與推薦的智能引擎,自主研發(fā)面向社交、電商等場(chǎng)景的多模態(tài)情緒識(shí)別引擎、情緒標(biāo)簽系統(tǒng)及情緒智能推薦算法,形成從情緒采集、建模到商業(yè)轉(zhuǎn)化的完整解決方案。波動(dòng)智能提出“情緒是連接人、物與內(nèi)容的新型接口”,其產(chǎn)品廣泛應(yīng)用于AI社交、個(gè)性化內(nèi)容推薦、虛擬陪伴、電商體驗(yàn)優(yōu)化等領(lǐng)域。波動(dòng)智能正在探索“EMO-as-a-Service”技術(shù)服務(wù)架構(gòu),賦能企業(yè)實(shí)現(xiàn)更高效的用戶洞察與精準(zhǔn)情緒交互,推動(dòng)從功能驅(qū)動(dòng)到情感驅(qū)動(dòng)的產(chǎn)業(yè)范式升級(jí)。

親愛(ài)的人工智能研究者,為了確保您不會(huì)錯(cuò)過(guò)*波動(dòng)智能*的最新推送,請(qǐng)星標(biāo)*波動(dòng)智能*。我們傾心打造并精選每篇內(nèi)容,只為為您帶來(lái)啟發(fā)和深思,希望能成為您理性思考路上的伙伴!

加入AI交流群請(qǐng)掃碼加微信

特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺(tái)“網(wǎng)易號(hào)”用戶上傳并發(fā)布,本平臺(tái)僅提供信息存儲(chǔ)服務(wù)。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相關(guān)推薦
熱點(diǎn)推薦
一只蒼蠅困死整個(gè)大陸?無(wú)法種地不能養(yǎng)馬,這才是非洲的窮根!

一只蒼蠅困死整個(gè)大陸?無(wú)法種地不能養(yǎng)馬,這才是非洲的窮根!

你是我心中最美星空
2026-02-27 07:53:59
全球首個(gè)!諾和諾德每周一次胰島素獲批上市

全球首個(gè)!諾和諾德每周一次胰島素獲批上市

醫(yī)藥魔方
2026-03-27 10:37:12
兩性關(guān)系:男人做到“三慢兩快”,女人自然愛(ài)你入骨

兩性關(guān)系:男人做到“三慢兩快”,女人自然愛(ài)你入骨

周哥一影視
2026-03-30 01:36:23
每體:FIFA將因拉菲尼亞傷病向巴薩作出賠償,金額約14.4萬(wàn)歐

每體:FIFA將因拉菲尼亞傷病向巴薩作出賠償,金額約14.4萬(wàn)歐

懂球帝
2026-03-28 21:40:23
王晶曝陳百?gòu)?qiáng)真正死因,64歲何超瓊顏面盡失

王晶曝陳百?gòu)?qiáng)真正死因,64歲何超瓊顏面盡失

君笙的拂兮
2026-03-22 03:44:36
年賺1400億的中國(guó)平安,和三年前一樣便宜...

年賺1400億的中國(guó)平安,和三年前一樣便宜...

巴山財(cái)觀
2026-03-29 18:11:46
中年人抗衰老最佳方式——死磕這4個(gè)方法,讓你保持好身材,凍齡

中年人抗衰老最佳方式——死磕這4個(gè)方法,讓你保持好身材,凍齡

運(yùn)動(dòng)健身號(hào)
2026-03-25 09:20:13
女性衰老的標(biāo)志:1臭、2大、3小,如果你沒(méi)有,說(shuō)明還年輕!

女性衰老的標(biāo)志:1臭、2大、3小,如果你沒(méi)有,說(shuō)明還年輕!

路醫(yī)生健康科普
2026-03-20 18:00:03
阿里取消入職體檢環(huán)節(jié)

阿里取消入職體檢環(huán)節(jié)

螞蟻大喇叭
2026-03-28 17:06:53
中美5月會(huì)晤要談臺(tái)灣問(wèn)題?美幫助中方統(tǒng)一,中方幫助美退出中東

中美5月會(huì)晤要談臺(tái)灣問(wèn)題?美幫助中方統(tǒng)一,中方幫助美退出中東

戰(zhàn)友老鄧
2026-03-28 14:59:25
網(wǎng)友曝張雪峰搶救細(xì)節(jié):倒地30分鐘才被發(fā)現(xiàn),用ECMO全力搶救無(wú)效

網(wǎng)友曝張雪峰搶救細(xì)節(jié):倒地30分鐘才被發(fā)現(xiàn),用ECMO全力搶救無(wú)效

體育小柚
2026-03-28 09:36:06
“老師最煩這種現(xiàn)眼包家長(zhǎng)”,寶媽運(yùn)動(dòng)會(huì)穿緊身裙,被嘲故作嬌弱

“老師最煩這種現(xiàn)眼包家長(zhǎng)”,寶媽運(yùn)動(dòng)會(huì)穿緊身裙,被嘲故作嬌弱

妍妍教育日記
2026-03-17 20:29:16
拔出蘿卜帶出泥!釋永信“開(kāi)光”內(nèi)幕曝光,這4位女星被流言害慘

拔出蘿卜帶出泥!釋永信“開(kāi)光”內(nèi)幕曝光,這4位女星被流言害慘

科學(xué)發(fā)掘
2026-03-30 00:32:17
抱頭痛哭!37歲娜塔莉亞天津賽季收官,單核拖進(jìn)四強(qiáng)已超預(yù)期

抱頭痛哭!37歲娜塔莉亞天津賽季收官,單核拖進(jìn)四強(qiáng)已超預(yù)期

金毛愛(ài)女排
2026-03-30 00:00:15
總統(tǒng)支持率跌到36%,關(guān)稅被法院判違憲,拉美裔選民大量流失

總統(tǒng)支持率跌到36%,關(guān)稅被法院判違憲,拉美裔選民大量流失

聚焦真實(shí)瞬間
2026-03-29 23:43:47
成都西徹底逆襲!曾經(jīng)瞧不上,未來(lái)讓你高攀不起!

成都西徹底逆襲!曾經(jīng)瞧不上,未來(lái)讓你高攀不起!

一口娛樂(lè)
2026-03-27 16:41:31
藍(lán)調(diào):一種關(guān)于存在的深邃敘事

藍(lán)調(diào):一種關(guān)于存在的深邃敘事

疾跑的小蝸牛
2026-03-27 20:52:52
女子因桃花眼走紅,訂婚兩年熱度依舊,網(wǎng)友喊話:88號(hào)快回來(lái)上班

女子因桃花眼走紅,訂婚兩年熱度依舊,網(wǎng)友喊話:88號(hào)快回來(lái)上班

梅子的小情緒
2025-12-19 14:04:18
東北虎這么強(qiáng),為啥不敢進(jìn)入西伯利亞深處?它也有害怕的東西嗎?

東北虎這么強(qiáng),為啥不敢進(jìn)入西伯利亞深處?它也有害怕的東西嗎?

向航說(shuō)
2026-03-29 00:45:03
刺激夜:美國(guó)2-5,加拿大2-2,日本1-0,塞內(nèi)加爾2-0,韓國(guó)0-4

刺激夜:美國(guó)2-5,加拿大2-2,日本1-0,塞內(nèi)加爾2-0,韓國(guó)0-4

側(cè)身凌空斬
2026-03-29 05:40:30
2026-03-30 02:56:49
人工智能學(xué)家 incentive-icons
人工智能學(xué)家
人工智能領(lǐng)域權(quán)威媒體
4616文章數(shù) 37440關(guān)注度
往期回顧 全部

科技要聞

馬斯克承認(rèn)xAI"建錯(cuò)了",11位創(chuàng)始人均離職

頭條要聞

伊朗議長(zhǎng):美航母遭受巨大損失 我們絕不接受屈辱

頭條要聞

伊朗議長(zhǎng):美航母遭受巨大損失 我們絕不接受屈辱

體育要聞

絕殺衛(wèi)冕冠軍后,他單手指天把勝利獻(xiàn)給父親

娛樂(lè)要聞

汪峰定律再現(xiàn)!李榮浩喊話單依純侵權(quán)

財(cái)經(jīng)要聞

Kimi、Minimax 們的算力荒

汽車(chē)要聞

嵐圖泰山X8配置曝光 四激光雷達(dá)/華為新一代座艙

態(tài)度原創(chuàng)

親子
數(shù)碼
旅游
公開(kāi)課
軍事航空

親子要聞

罕見(jiàn)五胞胎全保住,20多名醫(yī)護(hù)深夜齊上陣

數(shù)碼要聞

內(nèi)存條價(jià)格被曝出現(xiàn)斷崖式下跌,一天跌去百元

旅游要聞

2026上海旅游產(chǎn)業(yè)博覽會(huì)開(kāi)幕,一城三館聯(lián)動(dòng)書(shū)寫(xiě)文商旅體展消費(fèi)新篇章

公開(kāi)課

李玫瑾:為什么性格比能力更重要?

軍事要聞

美兩棲攻擊艦載3500名增援到達(dá)

無(wú)障礙瀏覽 進(jìn)入關(guān)懷版