![]()
導(dǎo)語(yǔ)
符號(hào)回歸在現(xiàn)代科學(xué)研究中扮演著至關(guān)重要的角色,因?yàn)樗軌驈臄?shù)據(jù)中發(fā)現(xiàn)簡(jiǎn)潔且可解釋的數(shù)學(xué)表達(dá)式。一個(gè)關(guān)鍵挑戰(zhàn)在于,如何在無限的搜索空間中尋找簡(jiǎn)約且可泛化的數(shù)學(xué)公式,同時(shí)還要擬合訓(xùn)練數(shù)據(jù)。現(xiàn)有的算法在處理復(fù)雜性問題時(shí),十多年來一直面臨著精度和效率的關(guān)鍵瓶頸,這從根本上阻礙了符號(hào)回歸在跨學(xué)科領(lǐng)域科學(xué)探索中的應(yīng)用步伐。為此,研究者們引入了并行符號(hào)枚舉(Parallel Symbolic Enumeration, PSE),以高效地從有限數(shù)據(jù)中提煉出通用的數(shù)學(xué)表達(dá)式。實(shí)驗(yàn)表明,與最先進(jìn)的基線算法相比,PSE在超過200個(gè)合成和實(shí)驗(yàn)問題集上實(shí)現(xiàn)了更高的精度和更快的計(jì)算速度。PSE代表了在數(shù)據(jù)驅(qū)動(dòng)的、符號(hào)化可解釋模型的發(fā)現(xiàn)方面,向更精確和更高效邁出了一步,并提高了符號(hào)學(xué)習(xí)的可擴(kuò)展性。
關(guān)鍵詞:并行符號(hào)枚舉,符號(hào)回歸(Symbolic Regression, SR),人工智能(Artificial Intelligence, AI),圖形處理器 (Graphics Processing Unit, GPU) 并行計(jì)算
王璇丨作者
趙思怡丨審校
![]()
論文題目:Discovering physical laws with parallel symbolic enumeration 論文鏈接:https://www.nature.com/articles/s43588-025-00904-8 發(fā)表時(shí)間:2025年11月21日 論文來源:Nature Computational Science
引言:科學(xué)發(fā)現(xiàn)的“羅塞塔石碑”——符號(hào)回歸
幾個(gè)世紀(jì)以來,科學(xué)發(fā)現(xiàn)日益依賴數(shù)據(jù)驅(qū)動(dòng)。符號(hào)回歸(SR)處于這一趨勢(shì)前沿,其核心目標(biāo)是從觀測(cè)數(shù)據(jù)中自動(dòng)提取可解釋的數(shù)學(xué)表達(dá)式,且無需預(yù)先假設(shè)函數(shù)形式,推動(dòng)天文學(xué)、材料科學(xué)及物理定律發(fā)現(xiàn)等多個(gè)領(lǐng)域進(jìn)步。
然而,SR面臨“組合爆炸”的根本挑戰(zhàn)。現(xiàn)有主流方法各存局限:演化計(jì)算(如GP)可擴(kuò)展性不足,稀疏回歸(如SINDy)受限于預(yù)設(shè)函數(shù)庫(kù),深度學(xué)習(xí)依賴主觀閾值,MCTS則搜索效率受限。由于SR本質(zhì)上是NP難問題,傳統(tǒng)方法獨(dú)立評(píng)估表達(dá)式導(dǎo)致效率低下,提升評(píng)估效率成為關(guān)鍵。為此,發(fā)表于《自然·計(jì)算科學(xué)》的這篇文章提出了并行符號(hào)枚舉(PSE)框架,旨在通過根本性改變搜索范式來突破上述瓶頸。
核心創(chuàng)新:PSE如何打破瓶頸?
PSE模型的核心是一個(gè)并行符號(hào)回歸網(wǎng)絡(luò)(PSRN),從對(duì)候選表達(dá)式進(jìn)行獨(dú)立、順序評(píng)估,轉(zhuǎn)向一個(gè)并行化、共享計(jì)算的框架。它的關(guān)鍵創(chuàng)新在于兩點(diǎn):
共享子樹評(píng)估:在SR過程中,許多候選表達(dá)式共享相同的子樹。傳統(tǒng)方法會(huì)為每個(gè)表達(dá)式單獨(dú)計(jì)算這個(gè)子樹的數(shù)值,造成大量冗余。PSRN則能自動(dòng)識(shí)別這些公共子樹,并僅計(jì)算一次,然后將結(jié)果共享給所有需要它的更復(fù)雜表達(dá)式,從而避免了重復(fù)計(jì)算。
GPU大規(guī)模并行計(jì)算:PSRN的架構(gòu)天生適合并行化。它被設(shè)計(jì)為在GPU上運(yùn)行,能夠同時(shí)對(duì)數(shù)以億計(jì)的候選表達(dá)式進(jìn)行并行評(píng)估。通過利用GPU的數(shù)千個(gè)核心,PSRN可以在短短幾秒鐘內(nèi)完成海量表達(dá)式的數(shù)值計(jì)算和誤差評(píng)估。
這兩項(xiàng)技術(shù)的協(xié)同作用,使得在表達(dá)式評(píng)估環(huán)節(jié),效率提升了高達(dá)四個(gè)數(shù)量級(jí)。
![]()
圖1. 提出的PSE模型概述。
性能驗(yàn)證:PSE有多能打?
研究團(tuán)隊(duì)在超過200個(gè)問題上驗(yàn)證了PSE的有效性。在標(biāo)準(zhǔn)SR基準(zhǔn)測(cè)試中,PSE在符號(hào)恢復(fù)率與計(jì)算速度上均全面領(lǐng)先。在16個(gè)混沌系統(tǒng)的控制方程發(fā)現(xiàn)任務(wù)中,即便在10%噪聲干擾下,PSE仍展現(xiàn)出最高的恢復(fù)率與魯棒性。在實(shí)際應(yīng)用層面,PSE成功從機(jī)電系統(tǒng)數(shù)據(jù)中發(fā)現(xiàn)了簡(jiǎn)潔準(zhǔn)確的動(dòng)力學(xué)方程,并在經(jīng)典的湍流摩擦(Nikuradse)數(shù)據(jù)上找到了更優(yōu)的符號(hào)表達(dá)式。最為突出的是,在一個(gè)包含50個(gè)變量的高維噪聲合成問題中,PSE實(shí)現(xiàn)了40%的恢復(fù)率,而頂尖基線方法的恢復(fù)率為0%,這證明了其強(qiáng)大的可擴(kuò)展性與特征選擇能力。
![]()
圖2. 通過實(shí)驗(yàn)數(shù)據(jù)揭示基礎(chǔ)物理定律。
未來展望:通往更智能的科學(xué)發(fā)現(xiàn)
展望未來,PSE的發(fā)展將在多個(gè)維度持續(xù)進(jìn)化:通過與uDSR等集成式SR方法融合,結(jié)合預(yù)訓(xùn)練、深度SR與稀疏回歸提升性能;引入特征選擇預(yù)處理,聚焦關(guān)鍵變量以增強(qiáng)高維問題可擴(kuò)展性;優(yōu)化令牌生成策略與計(jì)算后端,提升搜索智能與硬件利用率;融入物理量綱等先驗(yàn)知識(shí),以加速收斂并節(jié)約算力。PSE通過GPU并行計(jì)算與層次化智能搜索的融合,突破了SR領(lǐng)域長(zhǎng)期存在的“效率-精度”瓶頸,為從混沌系統(tǒng)解析到工程規(guī)律挖掘的數(shù)據(jù)驅(qū)動(dòng)科學(xué)發(fā)現(xiàn)提供了強(qiáng)大新工具,其卓越性能已展現(xiàn)出成為跨學(xué)科科研基礎(chǔ)平臺(tái)的潛力,未來將持續(xù)推動(dòng)科學(xué)發(fā)現(xiàn)的自動(dòng)化與高效化。
復(fù)雜系統(tǒng)自動(dòng)建模讀書會(huì)
“復(fù)雜世界,簡(jiǎn)單規(guī)則。”
集智俱樂部聯(lián)合復(fù)旦大學(xué)智能復(fù)雜體系實(shí)驗(yàn)室青年研究員朱群喜、浙江大學(xué)百人計(jì)劃研究員李樵風(fēng)、清華大學(xué)電子工程系數(shù)據(jù)科學(xué)與智能實(shí)驗(yàn)室博士后研究員丁璟韜、美國(guó)東北大學(xué)物理系A(chǔ)lbert-László Barabási指導(dǎo)的博士后高婷婷、北京大學(xué)博雅博士后曹文祺、復(fù)旦大學(xué)數(shù)學(xué)科學(xué)學(xué)院應(yīng)用數(shù)學(xué)方向博士研究生趙伯林、北京師范大學(xué)系統(tǒng)科學(xué)學(xué)院博士研究生牟牧云,共同發(fā)起。
讀書會(huì)將于9月5日起每周四晚上20:00-22:00進(jìn)行,探討四個(gè)核心模塊:數(shù)據(jù)驅(qū)動(dòng)的復(fù)雜系統(tǒng)建模、復(fù)雜網(wǎng)絡(luò)結(jié)構(gòu)推斷、具有可解釋性的復(fù)雜系統(tǒng)推斷(動(dòng)力學(xué)+網(wǎng)絡(luò)結(jié)構(gòu))、應(yīng)用-超材料設(shè)計(jì)和城市系統(tǒng),通過重點(diǎn)討論75篇經(jīng)典、前沿的重要文獻(xiàn),從黑盒(數(shù)據(jù)驅(qū)動(dòng))到白盒(可解釋性),逐步捕捉系統(tǒng)的“本質(zhì)”規(guī)律,幫助大家更好的認(rèn)識(shí)、理解、預(yù)測(cè)、控制、設(shè)計(jì)復(fù)雜系統(tǒng),為相關(guān)領(lǐng)域的研究和應(yīng)用提供洞見。歡迎感興趣的朋友報(bào)名參與!
詳情請(qǐng)見:
1.
2.
3.
4.
5.
6.
7.
8.
9.
特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺(tái)“網(wǎng)易號(hào)”用戶上傳并發(fā)布,本平臺(tái)僅提供信息存儲(chǔ)服務(wù)。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.