337p人体粉嫩胞高清图片,97人妻精品一区二区三区在线 ,日本少妇自慰免费完整版,99精品国产福久久久久久,久久精品国产亚洲av热一区,国产aaaaaa一级毛片,国产99久久九九精品无码,久久精品国产亚洲AV成人公司
網易首頁 > 網易號 > 正文 申請入駐

ICLR 2026 | 世界模型卡在多機器人協作?一個順序分解思路打通

0
分享至



趙子杰,中國科學院自動化研究所博士生,導師為趙冬斌研究員和朱圓恒副研究員。本科畢業于電子科技大學并獲得榮譽學位(Top 0.7%)。主要研究方向為強化學習、世界模型和機器人學習,重點關注融合學習、規劃與控制的方法,以實現魯棒且可擴展的真實世界機器人智能。

近年來,Decision-Coupled World Model與Model-based RL在機器人領域取得了顯著成功。通過學習環境動力學模型,智能體能夠在內部模擬未來,從而進行規劃與決策。但當系統從單機器人擴展到多機器人時,問題開始變得棘手。

在多機器人系統中,世界的變化不再由單獨個體決定,而是由多個個體共同作用。于是,一個關鍵問題是:如何讓世界模型能夠理解多機器人系統的聯合動力學?

為了解決這一挑戰,中科院自動化所深度強化學習團隊提出 SeqWM,對多機器人聯合動力學進行順序式的因果條件化分解,使機器人能夠在意圖共享的基礎上進行協同規劃。該成果已被ICLR 2026接收,并在評審中獲得8 / 8 / 8 / 2的評分。



  • 論文標題:Empowering Multi-Robot Cooperation via Sequential World Models
  • 代碼地址:https://github.com/zhaozijie2022/seqwm

為什么多機器人協作如此困難?

當多個機器人同時參與決策時,系統的動力學會迅速變得復雜:每個機器人的動作都會影響環境,也會影響其他機器人接下來的決策。這使得多機器人協作成為強化學習和機器人領域長期以來的核心難題。核心原因在于:世界不再由單一策略驅動,而是由多個智能體共同決定。這帶來了兩個關鍵挑戰:

  • 因果結構復雜化:多個機器人同時作用于環境,導致動力學模型需要同時處理多個「因果源」,學習難度顯著增加。強行共享策略易產生梯度沖突。
  • 決策 - 世界閉環被打破:在單機器人場景中,動作 → 環境變化之間形成穩定閉環;而在多機器人系統中,每個機器人都受到其他機器人的影響,預測誤差會迅速累積。



圖 1:多智能體世界建模困境:在多個 robot 的作用下,足球去向哪里?

SeqWM:多機器人世界模型的順序式因果分解

現有方法通常把多機器人系統看作一個整體:所有機器人的狀態和動作會同時輸入到一個統一模型中,進而預測未來環境變化。然而,隨著機器人數量增加,這種聯合動力學建模的復雜度會迅速增長,使得模型難以穩定學習和泛化,也增大了部署的難度。

SeqWM 從一個全新的視角重新思考了這個問題。研究團隊提出一個關鍵觀察:

多機器人世界的變化,其實可以被建模為多個機器人依次作用于環境的過程。

基于這一觀察,SeqWM 不再試圖學習一個復雜的整體動力學函數,而是將聯合動力學分解為一系列順序條件化的狀態轉移過程。每個機器人只需要學習:在已知前序機器人動作的條件下,自己對世界狀態演化所產生的邊際因果貢獻。形式上,原本的聯合動力學被重寫為順序條件化的分解形式:



這種順序式分解將復雜的多機器人動力學轉化為一系列條件預測問題,從而顯著降低了建模難度。



圖 2:R1 先規劃并共享未來軌跡,R2 據此調整路徑,實現對房間的協同探索

在軌跡預測階段,

  • 每個機器人維護一個獨立的世界模型
  • 每個模型只建模自身對環境的邊際貢獻
  • 后續機器人在預測時條件化前序機器人的預測結果

這種結構使得復雜的聯合動力學被拆解為多個簡單且可擴展的局部預測過程。

在動作規劃階段,SeqWM 使用 MPPI(Model Predictive Path Integral) 進行動作規劃。機器人按照順序進行規劃,并共享預測軌跡。這意味著:后續機器人在規劃時,可以提前知道前序機器人的未來計劃。這種機制形成了一種顯式的意圖共享,顯著增強協作能力。



圖 3:MPPI-based planner 示意圖

仿真實驗對比

研究團隊在兩個具有挑戰性的多機器人環境中評估了 SeqWM:

  • Bi-DexHands:雙靈巧手協作操作任務
  • Multi-Quadruped:多四足機器人協作任務

實驗結果表明:SeqWM 在所有任務中均顯著超過現有方法,在性能與樣本效率方面均取得領先。



圖4:仿真實驗可視化

協作行為如何自然產生?

SeqWM 不僅提升了任務成功率,還產生了多種自然協作行為。例如:

預測適應(Predictive Adaptation):機器人能夠根據伙伴預測的未來動作提前調整動作。例如在接拋球任務中,接球機器人會提前移動到預測落點附近,從而穩定完成抓取。



角色分工(Role Division):在推箱子任務中:一只機器人負責 主要推進力,另一只機器人負責 方向調整。這種分工并非人工設計,而是在訓練中自然產生。



Sim-to-Real 真實機器人實驗

為了驗證算法在真實環境中的效果,研究團隊還將 SeqWM 部署到了 Unitree Go2-W 機器人平臺。實驗包括:推箱子、通過窄門、引導目標機器人:





實驗結果表明,真實機器人系統中的協作行為與仿真結果高度一致,驗證了 SeqWM 的實際應用潛力。

總結

SeqWM 提出了一種新的多機器人世界建模方式:通過順序因果結構分解多機器人動力學。這一設計使得復雜的多機器人協作問題變得更加可建模、可規劃,也為真實機器人系統提供了一種可擴展的解決方案。隨著世界模型與強化學習技術的發展,未來的機器人系統或許能夠像人類團隊一樣,通過共享意圖與協同行動完成更加復雜的任務。

特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相關推薦
熱點推薦
終于定了!中國移動正式發通知:自4月30日起,全國統一執行

終于定了!中國移動正式發通知:自4月30日起,全國統一執行

大魚簡科
2026-03-31 19:29:10
在醫院你遭遇過最羞恥的事是什么?網友:一個比一個炸裂啊

在醫院你遭遇過最羞恥的事是什么?網友:一個比一個炸裂啊

解讀熱點事件
2026-02-04 00:05:07
澳門世界杯!4大名將0:3慘敗,張本美和剃光頭,蒯曼再戰孫穎莎

澳門世界杯!4大名將0:3慘敗,張本美和剃光頭,蒯曼再戰孫穎莎

秋姐居
2026-04-02 17:08:03
羅永浩力挺楊笠遭"精準打擊",直播間被下單后發貨再退款

羅永浩力挺楊笠遭"精準打擊",直播間被下單后發貨再退款

戧詞奪理
2026-04-01 11:14:44
2026年 “純電已死,混動為王” 純電車企只剩兩家了

2026年 “純電已死,混動為王” 純電車企只剩兩家了

小怪吃美食
2026-04-01 13:05:42
軍銜最高的12位開國女軍官,都是什么軍銜?

軍銜最高的12位開國女軍官,都是什么軍銜?

幽州校尉
2026-03-28 07:31:51
我國在威海打撈英國潛艇并拆解封存,39年后卡梅倫公開指責中方

我國在威海打撈英國潛艇并拆解封存,39年后卡梅倫公開指責中方

磊子講史
2026-03-18 18:02:08
當年的網紅一姐馮提莫怎么變這樣了??

當年的網紅一姐馮提莫怎么變這樣了??

東方不敗然多多
2026-04-02 18:26:25
照片中的這位女神,當年火遍大江南北,美麗動人 迷倒了萬千男人!

照片中的這位女神,當年火遍大江南北,美麗動人 迷倒了萬千男人!

科學發掘
2026-04-02 12:03:34
頭部大廠員工問:“張雪峰事件后,公司會強制員工早下班嗎?” 高贊回復:“老板估計會早下班”

頭部大廠員工問:“張雪峰事件后,公司會強制員工早下班嗎?” 高贊回復:“老板估計會早下班”

新浪財經
2026-04-02 09:10:50
國家煙草專賣局發布關于公開征求《國家煙草專賣局關于修改部分電子煙監管政策文件的通知(征求意見稿)》意見的通知

國家煙草專賣局發布關于公開征求《國家煙草專賣局關于修改部分電子煙監管政策文件的通知(征求意見稿)》意見的通知

每日經濟新聞
2026-04-02 08:50:07
張雪回應陳光標送1300萬勞斯萊斯:找車商8折收了,把錢捐給嫣然天使基金,我們還用面包車接客戶!陳光標:支持

張雪回應陳光標送1300萬勞斯萊斯:找車商8折收了,把錢捐給嫣然天使基金,我們還用面包車接客戶!陳光標:支持

每日經濟新聞
2026-04-02 13:17:32
出大事了,伊朗發起斬首行動,大批美軍官被抬走?英法德俄失聲

出大事了,伊朗發起斬首行動,大批美軍官被抬走?英法德俄失聲

霽寒飄雪
2026-04-02 07:19:42
比亞迪可變磁通電機實測:高速續航29,電耗直降15-20

比亞迪可變磁通電機實測:高速續航29,電耗直降15-20

三農老歷
2026-04-02 15:01:55
告天下子女:再孝順,也不要為年過70歲的老父老母,做這三件事

告天下子女:再孝順,也不要為年過70歲的老父老母,做這三件事

楓紅染山徑
2026-04-02 14:36:32
澳門世界杯!2大世界冠軍被淘汰,國乒大潰敗,孫穎莎迎大挑戰

澳門世界杯!2大世界冠軍被淘汰,國乒大潰敗,孫穎莎迎大挑戰

寶哥精彩賽事
2026-04-02 14:27:18
佟晨潔宣布離婚!離婚后仍幫前夫理財,21歲花40萬在上海買房

佟晨潔宣布離婚!離婚后仍幫前夫理財,21歲花40萬在上海買房

椰黃娛樂
2026-04-02 16:23:14
核桃立大功!國際頂刊證實:可降低全身炎癥,4周壽命延長45%

核桃立大功!國際頂刊證實:可降低全身炎癥,4周壽命延長45%

鄒小蘑菇
2026-03-31 12:02:26
遼寧VS浙江懸念重重!趙繼偉持續低迷成隱患,洛佩斯如何破局?

遼寧VS浙江懸念重重!趙繼偉持續低迷成隱患,洛佩斯如何破局?

老葉評球
2026-04-02 18:12:32
轟94+31+15!四巨頭爆錘黃蜂,哈登有麻煩了,騎士首輪遇到硬骨頭

轟94+31+15!四巨頭爆錘黃蜂,哈登有麻煩了,騎士首輪遇到硬骨頭

巴叔GO聊體育
2026-04-02 15:18:07
2026-04-02 20:00:49
機器之心Pro incentive-icons
機器之心Pro
專業的人工智能媒體
12667文章數 142605關注度
往期回顧 全部

科技要聞

三年虧20億,最新估值58億,Xreal沖刺港股

頭條要聞

凱越機車否認"內涵"張雪機車:張雪離開前持股近36%

頭條要聞

凱越機車否認"內涵"張雪機車:張雪離開前持股近36%

體育要聞

邵佳一的改革,從讓每個人踢舒服開始

娛樂要聞

宋寧峰帶女兒出軌,張婉婷找董璇哭訴

財經要聞

高油價、AI泡沫...誰將壓垮美國經濟

汽車要聞

軸距2米7/后排能蹺腿 試駕后驅小車QQ3 EV

態度原創

房產
親子
教育
時尚
軍事航空

房產要聞

巨無霸來了!??诔歉?,突然又爆大動作!

親子要聞

生了倆男孩的父母,應該怎樣平衡倆娃的關系?二胎父母都該看一看

教育要聞

3分鐘學會一個雅思7分句/段(第336期)

女人有沒有品位看看穿搭就知道,這些造型值得借鑒,溫柔高級

軍事要聞

伊朗自殺無人機突進 逼退林肯號航母

無障礙瀏覽 進入關懷版