337p人体粉嫩胞高清图片,97人妻精品一区二区三区在线 ,日本少妇自慰免费完整版,99精品国产福久久久久久,久久精品国产亚洲av热一区,国产aaaaaa一级毛片,国产99久久九九精品无码,久久精品国产亚洲AV成人公司
網易首頁 > 網易號 > 正文 申請入駐

北大林宙辰團隊論文:從數據中自適應學習時序預測損失丨ICLR 2026

0
分享至


QDF:以極大似然估計為起點,結合元學習思想重構預測模型損失函數,實現跨模型泛化。

作者丨鄭佳美

編輯丨岑 峰

在多步時間序列預測任務中,預測性能隨時間步長迅速退化幾乎成為一種共識。例如:在氣象預測中,短期的溫度變化能夠較為準確地刻畫,但當預測跨度擴展至數日甚至一周時,預測誤差就會逐漸放大,周期與趨勢結構逐漸偏離真實軌跡。類似的問題在金融價格走勢和電力負荷預測等場景中也廣泛存在。

無論模型結構如何變化,當預測范圍從短期擴展至中長期時,誤差積累、趨勢漂移和結構失真往往不可避免地出現。這類現象在實踐中被頻繁觀察,卻通常被視為模型表達能力或依賴建模不足的直接結果。

然而,與模型結構持續演進形成鮮明對比的是,多步預測在訓練階段所使用的損失函數卻長期保持固定。大多數方法仍以逐時間點的均方誤差(MSE)作為優化目標,默認將未來不同預測步視為相互獨立重要性一致的預測對象。

但是,多步預測并非一組彼此獨立的回歸任務,未來不同時間點之間往往呈現顯著的相關性;此外,不同預測步在優化階段的重要性也并不相同。若損失函數無法顯式刻畫這些結構特征,模型在長期預測中出現系統性偏差便并非偶然,而是訓練階段錯誤假設的自然結果。

正是在這一背景下,林宙辰團隊提出了題為《Quadratic Direct Forecast for Training Multi-step Time-Series Forecast Models》的研究工作。通過重構訓練目標的加權結構,引入對預測步相關性與不確定性差異的顯式建模。研究團隊展示了在不改變模型架構的前提下,僅通過調整訓練目標即可顯著改善多步預測性能的可能性,從而為時間序列預測提供了一種從訓練機制層面理解長期預測失效的新視角。


論文鏈接:https://arxiv.org/pdf/2511.00053v1

01


問題根源:均方誤差的兩個先驗

在當下的時序預測領域,絕大多數文獻仍以逐時間點的均方誤差(MSE)作為損失函數:

這個損失函數隱含了兩個先驗:1. 未來不同時間點的預測是相互獨立的;2. 所有預測步的重要性是相同的。

然而,現實并非如此:明天的天氣與后天的天氣存在相關性,預測未來1小時和1周的難度也完全不同。因此,多步預測并非一組獨立的回歸任務;不同預測步在優化階段的重要性也并不相同。如損失函數無法正確刻畫這些結構特征,模型在長期預測中出現系統性偏差,就并非偶然,而是訓練階段錯誤假設的必然結果。


研究人員上述兩點先驗進行了實驗檢驗,發現它們在多步預測場景中均不成立。

? 首先,對標簽序列的條件協方差進行了偏相關分析,以刻畫在控制歷史輸入的影響之后,標簽序列不同時間點 與 之間的直接關系。實驗結果顯示,未來時間點之間存在大量非零偏相關系數,否定了均方誤差所隱含的條件獨立假設。

? 進一步,對標簽序列的條件方差進行了分析。實驗結果顯示,不同時間點的誤差方差存在顯著差異,且隨著預測步整體增大,說明將所有預測步視為難度一致的任務并不符合數據特性,否定了均方誤差隱含重要性一致假設。

02


QDF:從數據中自適應學習預測損失

針對MSE存在的兩個不合理先驗,林宙辰教授團隊提出了QDF(Quadratic Direct Forecast)方法,核心創新在于:不再將損失函數視為固定不變的優化目標,而是將其本身作為可學習的對象,從而自動“發現”最適合特定任務數據結構的損失表述。

從概率建模的視角出發,理想的損失函數應來源于負對數似然。在高斯誤差假設下。在高斯誤差假設下,給定歷史序列 ,標簽序列 的條件分布為多元高斯分布,其負對數似然(忽略常數項)可表示為:

其中, 是標簽序列的條件協方差矩陣, 為預測步長, 為該二次型的權重矩陣。在該二次型中:權重矩陣的非對角元素刻畫了未來不同時間點之間的條件相關性,從而能夠顯式建模標簽自相關效應,打破了MSE所隱含的條件獨立假設;權重矩陣的對角元素反映了不同預測步的不確定性差異,使得模型能夠為不同難度的預測任務分配異構權重,打破了MSE所隱含的重要性一致假設。

因此,該二次型損失函數在理論上能夠同時解決傳統MSE損失在多步預測場景下的兩個結構性偏差問題。

然而,在實際預測任務中,權重矩陣 難以估計。為解決這一問題,研究團隊受到元學習啟發,將 作為可學習的對象,通過一個雙層優化機制將 從數據中“學”出來:

該雙層優化問題的求解過程包括兩個階段。首先,在給定 的條件下,通過在元訓練集 上最小化損失函數 來更新模型參數 。接著,依據模型在元驗證集 上的預測誤差,反向傳播更新 。其中,元訓練集和元驗證集來自對訓練集的不同切片。

這種雙層設計的核心優勢在于:訓練目標的優劣不再由擬合優度決定,而是由元驗證集上的泛化性能來刻畫。通過多次數據拆分與迭代更新,算法得以學習到在不同時間區間內一致的誤差相關模式,從而形成穩定且可泛化的訓練目標。

03


在大量實驗中,一致驗證優勢

論文首先將 QDF 與現有損失函數進行了比較,包括通過標簽變換削弱標簽相關性的 FreDF 和 Time-o1。這些方法相較于均方誤差均能帶來一定的性能提升,但在穩定性和性能上限方面仍不及 QDF。原因在于這些方法僅部分處理標簽之間的相關性,仍隱含地假設剩余誤差可通過均勻加權方式進行優化,而 QDF 同時建模了標簽間的相關性以及不同預測步的不確定性,并通過元學習得到最優加權權重,徹底解決了損失函數中可能存在的偏差。


其次,研究人員通過消融實驗對上述兩個關鍵因素進行了驗證。實驗分別考察僅建模不同預測步權重、僅建模時間相關性以及同時建模二者的情形。結果顯示,兩種因素單獨引入時均能帶來性能提升,而二者同時作用時效果最為顯著。


研究人員也對模型輸出的預測序列進行了可視化分析。結果表明,基于均方誤差訓練的模型在周期性時間序列中普遍存在振幅壓縮、峰值被抹平以及拐點響應滯后的現象。引入QDF后,模型在峰值位置、周期相位以及長期趨勢穩定性方面均表現出更高一致性,時間結構得到了更完整的保留,說明QDF有效訓練模型尊重未來不同時間點之間的整體關系。


04


一次針對均方誤差的系統性審判

從研究意義的角度來看,這項研究首先推翻了一個在時間序列領域長期被默認接受的假設:多步預測可以被視為多個相互獨立且等權重的回歸任務。這一假設在實踐中被廣泛采用,卻缺乏系統性的經驗驗證。研究通過嚴格的概率建模分析與全面的實證檢驗表明,**這一前提假設在多步預測場景中并不成立**

在此基礎上,研究進一步提出了一種新穎研究方法:將損失函數本身視為可以被學習的對象。不同于傳統通過超參數調節或啟發式設計的方式,該研究通過引入結構化的權重參數來顯式建模標簽間的關聯性和不同預測步的重要性差異,并通過雙層優化機制,直接利用未見數據上的泛化誤差學習權重參數。這種設計使得損失函數的形式能夠根據數據特性自適應地調整,從而形成既符合統計建模原理又具有良好泛化能力的訓練目標

對于后續研究而言,該工作所提供的啟示并不局限于具體方法本身,而體現在更一般的研究范式上。其一,研究強調了對領域內默認假設保持持續審視的重要性;其二,展示了如何從統計建模出發反推優化目標的合理形式;其三,為元學習思想在時間序列預測領域的應用和發展提供了理論和實踐參考,展示了如何將元學習的思想與領域特定的統計方法有機結合。

05


作者信息

論文第一作者王浩,現為浙江大學控制學院博士研究生,研究方向聚焦于因果推斷、多任務學習技術及其在大語言模型中的應用。2022 年- 2023 年,他曾在螞蟻金服、微軟亞洲研究院科研實習,從事推薦系統理論研究。2025 年起,他在小紅書參加 RedStar 實習項目,進行大語言模型、可信獎勵模型領域的研究工作。


論文通訊作者林宙辰,現任北京大學智能學院、通用人工智能全國重點實驗室教授。他的研究領域包括機器學習和數值優化。他已發表論文360余篇,谷歌學術引用超過42,000次。他是IAPR、IEEE、AAIA、CCF和CSIG會士,多次擔任CVPR、NeurIPS、ICML等會議的Senior Area Chair,現任ICML Board Member。


參考鏈接:https://zhouchenlin.github.io/

未經「AI科技評論」授權,嚴禁以任何方式在網頁、論壇、社區進行轉載!

公眾號轉載請先在「AI科技評論」后臺留言取得授權,轉載時需標注來源并插入本公眾號名片。

特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相關推薦
熱點推薦
小虎牙弟弟喜當爹了

小虎牙弟弟喜當爹了

毒舌扒姨太
2026-03-21 22:34:04
擊落3架美軍F-15E的科威特飛行員,因多項罪名已被逮捕

擊落3架美軍F-15E的科威特飛行員,因多項罪名已被逮捕

碳基生物關懷組織
2026-03-17 22:35:07
這兩條新聞放一起看,諷刺至極

這兩條新聞放一起看,諷刺至極

清書先生
2025-09-28 17:07:07
蓉城半場2球領先!媒體人熱議:中超最激烈一戰,德比兩隊不一檔

蓉城半場2球領先!媒體人熱議:中超最激烈一戰,德比兩隊不一檔

奧拜爾
2026-03-21 20:32:12
漲價就真的沒人買:中國大陸顯卡銷量直接腰斬!

漲價就真的沒人買:中國大陸顯卡銷量直接腰斬!

快科技
2026-03-19 12:29:41
人到老年才知道,增加骨密度最好的運動,竟然不是跑步和走路

人到老年才知道,增加骨密度最好的運動,竟然不是跑步和走路

墜入二次元的海洋
2026-03-17 10:25:30
一個沒寫過代碼的工程師,用ClaudeCode干掉一個估算團隊的工作量

一個沒寫過代碼的工程師,用ClaudeCode干掉一個估算團隊的工作量

DeepTech深科技
2026-03-19 18:03:20
三星One UI 8.5國行分批推送,老機型續航暴漲,對比舊版直接封神?

三星One UI 8.5國行分批推送,老機型續航暴漲,對比舊版直接封神?

叮當當科技
2026-03-21 15:19:19
高市早苗訪問阿靈頓國家公墓并向美國士兵敬獻花圈,該公墓埋葬者包括廣島原子彈投彈手

高市早苗訪問阿靈頓國家公墓并向美國士兵敬獻花圈,該公墓埋葬者包括廣島原子彈投彈手

都市快報橙柿互動
2026-03-22 00:26:05
好消息!事關柳州卡樂天地項目改造!

好消息!事關柳州卡樂天地項目改造!

柳州全攻略
2026-03-21 20:08:40
臺積電創辦人張忠謀:如果想扼殺中國大陸,中國大陸真的無能為力

臺積電創辦人張忠謀:如果想扼殺中國大陸,中國大陸真的無能為力

混沌錄
2026-02-27 21:29:05
清華大學今年起陸續出版61冊思政課教學用書

清華大學今年起陸續出版61冊思政課教學用書

中國青年報
2026-03-19 21:27:08
“晚打不如早打,小打不如大打,打一個,不如拉日本一起打”。

“晚打不如早打,小打不如大打,打一個,不如拉日本一起打”。

安安說
2026-03-14 18:50:59
4S店賣一輛虧一輛?杭州經銷商:一輛官方指導價12.59萬元的車,成交價已擊穿8.4萬元

4S店賣一輛虧一輛?杭州經銷商:一輛官方指導價12.59萬元的車,成交價已擊穿8.4萬元

都市快報橙柿互動
2026-03-20 19:36:04
資本想“零元購”胖東來?于東來一招“分錢”破局

資本想“零元購”胖東來?于東來一招“分錢”破局

流蘇晚晴
2026-03-19 18:05:53
全紅嬋素顏回鄉,一個細節粉碎全網焦慮!她的路,其實早就鋪好了

全紅嬋素顏回鄉,一個細節粉碎全網焦慮!她的路,其實早就鋪好了

動物奇奇怪怪
2026-03-21 10:11:58
皇馬命運轉折!短短15天:4連勝+歐冠淘汰曼城 目標雙冠王

皇馬命運轉折!短短15天:4連勝+歐冠淘汰曼城 目標雙冠王

葉青足球世界
2026-03-21 14:55:03
白菜價再也沒有了!32G DDR5內存漲了3000元 SK海力士:缺貨還將持續4到5年

白菜價再也沒有了!32G DDR5內存漲了3000元 SK海力士:缺貨還將持續4到5年

快科技
2026-03-20 17:16:24
三大后衛齊發揮,繼偉雙拳難敵四手,烏戈正式表態

三大后衛齊發揮,繼偉雙拳難敵四手,烏戈正式表態

大飛說籃球
2026-03-22 00:16:01
江蘇一百歲老人,時隔60多年才突然發現:自己是中央特科重要人員

江蘇一百歲老人,時隔60多年才突然發現:自己是中央特科重要人員

舊史新譚
2026-03-21 13:27:49
2026-03-22 00:59:00
AI科技評論 incentive-icons
AI科技評論
點評學術,服務AI
7134文章數 20742關注度
往期回顧 全部

科技要聞

宇樹招股書拆解,人形機器人出貨量第一!

頭條要聞

伊朗發射3800公里射程的導彈 最令美軍戰栗的細節披露

頭條要聞

伊朗發射3800公里射程的導彈 最令美軍戰栗的細節披露

體育要聞

誰在決定字母哥未來?

娛樂要聞

田栩寧終于涼了?出軌風波影響惡劣

財經要聞

通脹警報拉響,加息潮要來了?

汽車要聞

小鵬汽車2025年Q4盈利凈賺3.8億 全年營收767億

態度原創

家居
藝術
時尚
本地
數碼

家居要聞

時空交織 空間綺夢

藝術要聞

斯托揚畫作:她們的眼神能勾動你的心!

這個趨勢好適合亞洲人!不用花大錢也能跟

本地新聞

春色滿城關不住|紹興春日頂流,這片櫻花海藏不住了

數碼要聞

炸鍋!國產存儲芯片再突破!手機固態價格大跳水,內存自由要來了

無障礙瀏覽 進入關懷版