337p人体粉嫩胞高清图片,97人妻精品一区二区三区在线 ,日本少妇自慰免费完整版,99精品国产福久久久久久,久久精品国产亚洲av热一区,国产aaaaaa一级毛片,国产99久久九九精品无码,久久精品国产亚洲AV成人公司
網(wǎng)易首頁 > 網(wǎng)易號(hào) > 正文 申請(qǐng)入駐

北大林宙辰團(tuán)隊(duì):從最優(yōu)傳輸角度訓(xùn)練時(shí)序預(yù)測(cè)模型 丨ICLR 2026

0
分享至


DistDF:從點(diǎn)對(duì)點(diǎn)誤差轉(zhuǎn)向聯(lián)合分布對(duì)齊,重構(gòu)時(shí)間序列預(yù)測(cè)的損失函數(shù)。

作者丨鄭佳美

編輯丨岑 峰

在時(shí)間序列預(yù)測(cè)研究中,一個(gè)耐人尋味的現(xiàn)象長期存在:

一方面,模型結(jié)構(gòu)不斷演進(jìn),從循環(huán)網(wǎng)絡(luò)到 Transformer,再到頻域與混合結(jié)構(gòu);另一方面,幾乎所有方法在訓(xùn)練階段依賴同一類損失函數(shù),即以均方誤差(MSE)為代表的點(diǎn)對(duì)點(diǎn)誤差。

這使得時(shí)間序列預(yù)測(cè)在方法論層面呈現(xiàn)出一種隱性的停滯,即研究重心持續(xù)向模型表達(dá)能力傾斜,而對(duì)損失函數(shù)所隱含的統(tǒng)計(jì)假設(shè)缺乏系統(tǒng)反思。

點(diǎn)對(duì)點(diǎn)誤差的核心假設(shè)在于,標(biāo)簽序列中的各時(shí)間步可被視為給定歷史條件下相互獨(dú)立的預(yù)測(cè)對(duì)象。然而,這一假設(shè)與時(shí)間序列數(shù)據(jù)的生成機(jī)制之間始終存在偏差。

真實(shí)世界中的時(shí)間序列由隨機(jī)過程演化而來,不同時(shí)間點(diǎn)之間存在顯著的相關(guān)關(guān)系。將多步預(yù)測(cè)問題拆解為一組獨(dú)立的回歸任務(wù),不可避免地為損失函數(shù)引入了結(jié)構(gòu)性偏差,使模型難以學(xué)習(xí)標(biāo)簽序列的整體形態(tài)、相關(guān)結(jié)構(gòu)以及條件依賴關(guān)系。

針對(duì)這一問題,北京大學(xué)林宙辰團(tuán)隊(duì)深入剖析了此類結(jié)構(gòu)性偏差的成因。在此基礎(chǔ)上,團(tuán)隊(duì)提出了 DistDF:一種通過聯(lián)合分布對(duì)齊訓(xùn)練預(yù)測(cè)模型的損失函數(shù)。DistDF 的提出不僅為時(shí)間序列預(yù)測(cè)提供了一種新的損失函數(shù)設(shè)計(jì)思路,也在更一般的意義上,對(duì)序列建模中“應(yīng)當(dāng)優(yōu)化什么”這一長期被忽視的問題給出了新的回答。


論文地址:https://arxiv.org/pdf/2510.24574v1

01


當(dāng)獨(dú)立性假設(shè)被實(shí)驗(yàn)證偽之后

當(dāng)前時(shí)間序列預(yù)測(cè)領(lǐng)域的主流方法普遍采用逐時(shí)間點(diǎn)的均方誤差(MSE)作為損失函數(shù):

隱式地做了獨(dú)立性假設(shè):在給定歷史序列的條件下,標(biāo)簽序列各時(shí)間點(diǎn)的觀測(cè)相互獨(dú)立。然而,真實(shí)時(shí)間序列存在顯著的標(biāo)簽自相關(guān):標(biāo)簽序列各時(shí)間點(diǎn)的觀測(cè)往往存在顯著的相關(guān)性。因此,的獨(dú)立性假設(shè)與時(shí)間序列數(shù)據(jù)的生成機(jī)制相悖,導(dǎo)致其作為損失函數(shù)是有偏的(具體見定理1)。

[定理1]考慮單變量標(biāo)簽序列 ,其條件自相關(guān)矩陣為 ,則標(biāo)簽序列的實(shí)用負(fù)對(duì)數(shù)似然可表示為: 。顯然,僅當(dāng)是單位陣,即標(biāo)簽自相關(guān)不存在時(shí),才有。

研究團(tuán)隊(duì)通過實(shí)證分析驗(yàn)證了這一矛盾:在給定歷史序列的條件下,標(biāo)簽序列仍呈現(xiàn)顯著的條件相關(guān)結(jié)構(gòu),從而在實(shí)證意義上證偽了獨(dú)立性假設(shè)。實(shí)驗(yàn)進(jìn)一步表明,即使采用頻域變換或主成分分解等標(biāo)簽變換方法,變換后的標(biāo)簽序列依然存在殘余相關(guān)性;因此,在變換后的標(biāo)簽應(yīng)用均方誤差作為損失函數(shù)仍會(huì)導(dǎo)致結(jié)構(gòu)性偏差。


02


DistDF:基于分布對(duì)齊的時(shí)間序列損失函數(shù)

為規(guī)避傳統(tǒng)方法中的獨(dú)立性假設(shè),DistDF 提出直接對(duì)齊預(yù)測(cè)序列的條件分布與真實(shí)標(biāo)簽的條件分布 。直觀上,該目標(biāo)可通過最小化兩個(gè)條件分布間的距離 來實(shí)現(xiàn)。

然而,直接將其作為損失函數(shù)面臨嚴(yán)重的樣本稀缺問題。對(duì)于給定的歷史序列 ,時(shí)間序列數(shù)據(jù)集通常僅包含唯一的標(biāo)簽序列 ,模型也僅產(chǎn)生單一預(yù)測(cè) 。這種“單樣本”情形導(dǎo)致直接估計(jì)條件分布距離 在統(tǒng)計(jì)上不可靠。

為解決這一難題,我們利用概率恒等式 。因?yàn)檫吘壏植?是共享的,若聯(lián)合分布對(duì)齊,則條件分布必然對(duì)齊。基于此,我們將條件分布匹配問題轉(zhuǎn)化為聯(lián)合分布匹配問題。

進(jìn)一步結(jié)合最優(yōu)傳輸理論,本文證明了聯(lián)合分布的 Wasserstein 距離構(gòu)成了條件分布 Wasserstein 距離期望的上界:

因此,通過最小化歷史-預(yù)測(cè)聯(lián)合分布 與歷史-標(biāo)簽聯(lián)合分布 之間的 Wasserstein 距離,可有效實(shí)現(xiàn)條件分布對(duì)齊,進(jìn)一步實(shí)現(xiàn)預(yù)測(cè)模型的無偏訓(xùn)練。同時(shí),這一轉(zhuǎn)換允許利用整個(gè)數(shù)據(jù)集的樣本來估計(jì)聯(lián)合分布距離,顯著提升了分布距離估計(jì)的可靠性。

DistDF 的實(shí)現(xiàn)流程如下:

首先,構(gòu)造聯(lián)合序列: 和 ;

接著,計(jì)算兩個(gè)聯(lián)合序列之間的Wasserstein距離: ,

最后,與 MSE 損失加權(quán)融合:

DistDF 作為模型無關(guān)的損失函數(shù),可適配各類預(yù)測(cè)模型架構(gòu)。

03


在大量實(shí)驗(yàn)中,一致驗(yàn)證優(yōu)勢(shì)

論文首先將DistDF與現(xiàn)有損失函數(shù)進(jìn)行了比較,包括通過標(biāo)簽變換削弱標(biāo)簽相關(guān)性的 FreDF 和 Time-o1。結(jié)果表明,這些方法雖然減少了似然估計(jì)的偏差并提升了性能,但殘差偏差仍然存在,因此性能仍有改進(jìn)空間。而DistDF通過最小化條件分布之間的距離,實(shí)現(xiàn)了預(yù)測(cè)模型的無偏訓(xùn)練,取得了最佳的預(yù)測(cè)性能。


其次,論文通過消融實(shí)驗(yàn)對(duì)兩個(gè)關(guān)鍵因素進(jìn)行了驗(yàn)證;分別考察在DF的基礎(chǔ)上,僅對(duì)齊均值、僅對(duì)齊協(xié)方差以及同時(shí)對(duì)齊二者的情形。結(jié)果表明,兩種因素單獨(dú)對(duì)齊時(shí)均能帶來性能提升,而二者同時(shí)對(duì)齊時(shí)效果最為顯著。


接著,論文也對(duì)模型輸出的預(yù)測(cè)序列進(jìn)行了可視化分析。結(jié)果表明,采用 DistDF 訓(xùn)練的模型能夠較好地跟隨序列中的突發(fā)變化,使得預(yù)測(cè)序列在整體形態(tài)上更加接近真實(shí)數(shù)據(jù)。這進(jìn)一步表明,DistDF 的作用不僅體現(xiàn)在降低數(shù)值誤差上,更重要的是在訓(xùn)練過程中引導(dǎo)模型學(xué)習(xí)到了真實(shí)未來時(shí)間序列的整體分布形態(tài)。


最后,論文對(duì)DistDF與不同預(yù)測(cè)模型的兼容性進(jìn)行了驗(yàn)證。結(jié)果表明,無論模型本身的復(fù)雜度和建模方式如何,引入 DistDF 訓(xùn)練策略后,模型預(yù)測(cè)性能幾乎都能夠獲得進(jìn)一步提升。這一結(jié)果表明,DistDF 的作用并非彌補(bǔ)模型結(jié)構(gòu)本身的不足,而是提供了更好的訓(xùn)練信號(hào)。


04


「多任務(wù)學(xué)習(xí)」需要分布對(duì)齊

整體來看,這項(xiàng)研究重新審視了多任務(wù)學(xué)習(xí)場(chǎng)景中的損失函數(shù)設(shè)計(jì)。研究團(tuán)隊(duì)強(qiáng)調(diào):多任務(wù)學(xué)習(xí)的核心目標(biāo)不應(yīng)局限于對(duì) T個(gè)標(biāo)簽的逐點(diǎn)建模,而應(yīng)轉(zhuǎn)向?qū)σ粋€(gè)在任務(wù)維度上具有內(nèi)在相關(guān)結(jié)構(gòu)的隨機(jī)過程進(jìn)行整體建模。

在這一視角下,傳統(tǒng)損失函數(shù)(如MSE)隱含了“給定輸入條件下各任務(wù)標(biāo)簽相互獨(dú)立”的假設(shè),從而將一個(gè)高維、相關(guān)的隨機(jī)過程建模任務(wù)退化為一組彼此獨(dú)立的標(biāo)量回歸任務(wù)。因該假設(shè)忽略標(biāo)簽序列的內(nèi)生結(jié)構(gòu),這些損失函數(shù)往往是有偏的

DistDF 通過將預(yù)測(cè)序列與真標(biāo)簽建模為概率分布,實(shí)現(xiàn)對(duì)任務(wù)維度上相關(guān)結(jié)構(gòu)的整體建模。通過優(yōu)化基于分布對(duì)齊的損失函數(shù),模型能夠顯式學(xué)習(xí)標(biāo)簽序列的整體形態(tài)、相關(guān)結(jié)構(gòu)以及條件依賴關(guān)系。

進(jìn)一步看,該研究揭示的問題具有廣泛的普適性。只要學(xué)習(xí)任務(wù)的輸出構(gòu)成具有顯著相關(guān)性的序列(如語音、圖像、文本或用戶行為),若仍沿用基于獨(dú)立性假設(shè)的損失函數(shù)(如 MSE),則必然會(huì)引入結(jié)構(gòu)性偏差。因此,DistDF 所倡導(dǎo)的聯(lián)合分布對(duì)齊思想,不僅適用于時(shí)間序列預(yù)測(cè),也同樣適用于語音合成、軌跡預(yù)測(cè)等任務(wù)。它并非針對(duì)時(shí)間序列任務(wù)的特定技巧,而是為多任務(wù)學(xué)習(xí)問題提供了一種更為通用的損失函數(shù)構(gòu)造范式。

05


作者信息

論文第一作者王浩,現(xiàn)為浙江大學(xué)控制學(xué)院博士研究生,研究方向聚焦于因果推斷、多任務(wù)學(xué)習(xí)技術(shù)及其在大語言模型中的應(yīng)用。2022 年- 2023 年,他曾在螞蟻金服、微軟亞洲研究院科研實(shí)習(xí),從事推薦系統(tǒng)理論研究。2025 年起,他在小紅書參加 RedStar 實(shí)習(xí)項(xiàng)目,進(jìn)行大語言模型、可信獎(jiǎng)勵(lì)模型領(lǐng)域的研究工作。


論文通訊作者林宙辰,現(xiàn)任北京大學(xué)智能學(xué)院、通用人工智能全國重點(diǎn)實(shí)驗(yàn)室教授。他的研究領(lǐng)域包括機(jī)器學(xué)習(xí)和數(shù)值優(yōu)化。他已發(fā)表論文360余篇,谷歌學(xué)術(shù)引用超過42,000次。他是IAPR、IEEE、AAIA、CCF和CSIG會(huì)士,多次擔(dān)任CVPR、NeurIPS、ICML等會(huì)議的Senior Area Chair,現(xiàn)任ICML Board Member。


參考鏈接:https://zhouchenlin.github.io/

本工作得到了北京市科學(xué)技術(shù)委員會(huì)、中關(guān)村科技園區(qū)管理委員會(huì)的大力支持,在此深表感謝。

未經(jīng)「AI科技評(píng)論」授權(quán),嚴(yán)禁以任何方式在網(wǎng)頁、論壇、社區(qū)進(jìn)行轉(zhuǎn)載!

公眾號(hào)轉(zhuǎn)載請(qǐng)先在「AI科技評(píng)論」后臺(tái)留言取得授權(quán),轉(zhuǎn)載時(shí)需標(biāo)注來源并插入本公眾號(hào)名片。

特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺(tái)“網(wǎng)易號(hào)”用戶上傳并發(fā)布,本平臺(tái)僅提供信息存儲(chǔ)服務(wù)。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相關(guān)推薦
熱點(diǎn)推薦
伊朗革命衛(wèi)隊(duì)已經(jīng)事實(shí)獨(dú)立

伊朗革命衛(wèi)隊(duì)已經(jīng)事實(shí)獨(dú)立

難得君
2026-03-04 12:29:04
東部首隊(duì)!活塞雙殺勇士鎖定季后賽 杜倫23+6波津傷退

東部首隊(duì)!活塞雙殺勇士鎖定季后賽 杜倫23+6波津傷退

醉臥浮生
2026-03-21 09:56:52
minimax 大肆抄襲kimi!開發(fā)者本人吐槽后被光速踢出群聊,怒發(fā)律師函誓要?jiǎng)偟降?>
    </a>
        <h3>
      <a href=回旋鏢
2026-03-21 07:27:27
為什么美國、日本第一時(shí)間就知道中國的決策、軍事及重大的工程等

為什么美國、日本第一時(shí)間就知道中國的決策、軍事及重大的工程等

小撇說事
2026-03-20 12:48:40
仗打了1460天,澤連斯基通告全球:烏克蘭收復(fù)失地,沒有輸?shù)魬?zhàn)爭(zhēng)

仗打了1460天,澤連斯基通告全球:烏克蘭收復(fù)失地,沒有輸?shù)魬?zhàn)爭(zhēng)

小舟談歷史
2026-03-21 20:36:09
一場(chǎng)4:1讓國足付出巨大代價(jià),遭遇致命重創(chuàng),取勝庫拉索基本沒戲

一場(chǎng)4:1讓國足付出巨大代價(jià),遭遇致命重創(chuàng),取勝庫拉索基本沒戲

零度眼看球
2026-03-21 06:51:59
美宜佳回應(yīng)假煙事件進(jìn)展:廣東是此次假煙問題集中區(qū),不存在“自設(shè)卷煙廠”,已出臺(tái)“四個(gè)零容忍”新規(guī),公開承諾假煙“假一賠十”

美宜佳回應(yīng)假煙事件進(jìn)展:廣東是此次假煙問題集中區(qū),不存在“自設(shè)卷煙廠”,已出臺(tái)“四個(gè)零容忍”新規(guī),公開承諾假煙“假一賠十”

大風(fēng)新聞
2026-03-20 20:30:04
首個(gè)特朗普金卡中國買家曝光,系全球WiFi之王,正被美商務(wù)部調(diào)查

首個(gè)特朗普金卡中國買家曝光,系全球WiFi之王,正被美商務(wù)部調(diào)查

肖茲探秘說
2026-03-20 17:15:27
出場(chǎng)數(shù)已達(dá)標(biāo)!不出意外,以杜蘭特本賽季的表現(xiàn)保底最佳三陣!

出場(chǎng)數(shù)已達(dá)標(biāo)!不出意外,以杜蘭特本賽季的表現(xiàn)保底最佳三陣!

田先生籃球
2026-03-21 13:03:30
國乒男隊(duì)壞消息!外協(xié)會(huì)勁敵連續(xù)爆猛料,秦志戩應(yīng)付不來糟糕局面

國乒男隊(duì)壞消息!外協(xié)會(huì)勁敵連續(xù)爆猛料,秦志戩應(yīng)付不來糟糕局面

三十年萊斯特城球迷
2026-03-20 23:07:43
擊敗奧運(yùn)冠軍奪第二金!中國游泳22歲新蛙后再閃耀:看齊羅雪娟?

擊敗奧運(yùn)冠軍奪第二金!中國游泳22歲新蛙后再閃耀:看齊羅雪娟?

李喜林籃球絕殺
2026-03-21 20:29:11
廣州將新增一個(gè)火車站,預(yù)計(jì)2028年投入使用!遠(yuǎn)期規(guī)劃規(guī)模超過廣州白云站

廣州將新增一個(gè)火車站,預(yù)計(jì)2028年投入使用!遠(yuǎn)期規(guī)劃規(guī)模超過廣州白云站

廣州交通電臺(tái)
2026-03-21 15:18:09
中考有多卷,看看廣州高中排名,第三梯隊(duì)與第一梯隊(duì)差距有多大

中考有多卷,看看廣州高中排名,第三梯隊(duì)與第一梯隊(duì)差距有多大

金哥說新能源車
2026-03-21 10:53:33
坑慘廣東隊(duì)!杜鋒做出重大決定,男籃得分王被棄用!

坑慘廣東隊(duì)!杜鋒做出重大決定,男籃得分王被棄用!

緋雨兒
2026-03-21 16:26:43
徐志勝回應(yīng)創(chuàng)業(yè)每年虧144萬:只要能養(yǎng)活6個(gè)員工,就會(huì)一直辦下去

徐志勝回應(yīng)創(chuàng)業(yè)每年虧144萬:只要能養(yǎng)活6個(gè)員工,就會(huì)一直辦下去

離離言幾許
2026-03-20 17:17:35
據(jù)說F35就是被伊朗這款武器擊中的

據(jù)說F35就是被伊朗這款武器擊中的

仰望星空的一粒沙子
2026-03-21 08:22:02
奇跡!這兩名烏軍硬守陣地一整年,才是真正的戰(zhàn)場(chǎng)血性

奇跡!這兩名烏軍硬守陣地一整年,才是真正的戰(zhàn)場(chǎng)血性

老馬拉車莫少裝
2026-03-19 15:38:09
年度期待?Netflix又翻車了

年度期待?Netflix又翻車了

來看美劇
2026-03-21 21:03:43
重溫1999:西方媒體報(bào)道的炸館“另一面”,17名軍事顧問遇難?

重溫1999:西方媒體報(bào)道的炸館“另一面”,17名軍事顧問遇難?

干史人
2026-02-27 11:00:05
重磅官宣!國家突然“點(diǎn)名”上海浦東,背后釋放重大信號(hào)!與每個(gè)浦東人有關(guān)

重磅官宣!國家突然“點(diǎn)名”上海浦東,背后釋放重大信號(hào)!與每個(gè)浦東人有關(guān)

叮當(dāng)當(dāng)科技
2026-03-21 14:40:50
2026-03-21 23:12:49
AI科技評(píng)論 incentive-icons
AI科技評(píng)論
點(diǎn)評(píng)學(xué)術(shù),服務(wù)AI
7134文章數(shù) 20742關(guān)注度
往期回顧 全部

科技要聞

宇樹招股書拆解,人形機(jī)器人出貨量第一!

頭條要聞

達(dá)利歐:霍爾木茲海峽大決戰(zhàn)即將爆發(fā)

頭條要聞

達(dá)利歐:霍爾木茲海峽大決戰(zhàn)即將爆發(fā)

體育要聞

誰在決定字母哥未來?

娛樂要聞

田栩?qū)幗K于涼了?出軌風(fēng)波影響惡劣

財(cái)經(jīng)要聞

通脹警報(bào)拉響,加息潮要來了?

汽車要聞

小鵬汽車2025年Q4盈利凈賺3.8億 全年?duì)I收767億

態(tài)度原創(chuàng)

本地
健康
數(shù)碼
公開課
軍事航空

本地新聞

春色滿城關(guān)不?。B興春日頂流,這片櫻花海藏不住了

轉(zhuǎn)頭就暈的耳石癥,能開車上班嗎?

數(shù)碼要聞

炸鍋!國產(chǎn)存儲(chǔ)芯片再突破!手機(jī)固態(tài)價(jià)格大跳水,內(nèi)存自由要來了

公開課

李玫瑾:為什么性格比能力更重要?

軍事要聞

特朗普:正考慮逐步降級(jí)對(duì)伊朗的軍事行動(dòng)

無障礙瀏覽 進(jìn)入關(guān)懷版