機(jī)器之心發(fā)布
過去兩年,從 Sora 到 Veo,再到 Cosmos,視頻生成模型在「視覺逼真」這條路上飛速狂奔,生成的畫面已經(jīng)足以以假亂真。但一個(gè)根本性的問題始終懸而未決:這些模型真的「理解」了物理世界嗎?這個(gè)問題目前還沒有一個(gè)答案。
事實(shí)上,當(dāng)這些模型去生成機(jī)器人操作的視頻,「夾爪穿模、物體憑空消失、時(shí)序錯亂」等物理違規(guī)現(xiàn)象比比皆是。從「看起來像」到「真能干活」,一直橫亙著一條技術(shù)實(shí)現(xiàn)的鴻溝。
究竟什么樣的模型才可以真能干活?圍繞這個(gè)問題,一場全球性的技術(shù)競賽正在打響 ——CVPR 2026 WorldArena Challenge
![]()
- 賽事官網(wǎng):http://cvpr2026challenge.world-arena.ai/
- WorldArena 排行榜:https://world-arena.ai/
- WorldArena GitHub:https://github.com/tsinghua-fib-lab/WorldArena
- ABot-PhysWorld GitHub:https://github.com/amap-cvlab/ABot-PhysWorld
- ABot-PhysWorld 論文:https://github.com/amap-cvlab/ABot-PhysWorld/blob/main/tech_report/ABot-PhysWorld.pdf
- Workshop 官網(wǎng):https://videoworldmodel-workshop.github.io/
- 官方交流群(微信):https://github.com/tsinghua-fib-lab/WorldArena/assets/WeChat.jpg
- 官方交流群(Discord):https://discord.gg/ZMrJJD55
- 官方郵箱:WorldArena1@outlook.com
一、WorldArena Challenge:世界模型的「大考」來了
WorldArena Challenge 是依托 CVPR 2026 Video World Model Workshop 舉辦的國際挑戰(zhàn)賽,由高德地圖視覺技術(shù)中心(AMAP CV Lab)、流形空間(Manifold.ai)和清華大學(xué)牽頭,聯(lián)合普林斯頓大學(xué)、新加坡國立大學(xué)、香港大學(xué)等全球頂尖學(xué)術(shù)機(jī)構(gòu)共同主辦。
與此前的世界模型評測不同,WorldArena 的核心理念可以用四個(gè)字概括:「真能干活」。評測體系不僅關(guān)注視頻「好不好看」,更聚焦于生成的內(nèi)容是否遵循物理規(guī)律、是否能支撐機(jī)器人的實(shí)際操作。比賽基于清華大學(xué)等 8 所頂尖高校聯(lián)合研發(fā)的 WorldArena Benchmark,涵蓋 16 大核心指標(biāo)和 3 大真實(shí)應(yīng)用任務(wù),旨在推動世界模型從「視覺逼真」向「功能可用」轉(zhuǎn)型。此次比賽設(shè)置了以下兩個(gè)賽道,參賽團(tuán)隊(duì)可根據(jù)研究方向選擇單一賽道或雙賽道并行參與。
賽道一評估世界模型在視頻生成層面的綜合感知質(zhì)量 —— 不是簡單地看「畫面漂不漂亮」,而是從視覺質(zhì)量、動作質(zhì)量、內(nèi)容一致性、物理法則遵循度、可控性和 3D 準(zhǔn)確性六大維度,通過 16 項(xiàng)量化指標(biāo)展開全方位評測。最終通過 EWMScore 整合為統(tǒng)一的綜合分?jǐn)?shù)排名。簡單說,不是比誰的視頻最好看,而是比誰的視頻最「合理」。
![]()
賽道二為具身任務(wù)功能性賽道。這是 WorldArena 的核心創(chuàng)新方向,首次將評測延伸至真實(shí)的具身任務(wù)執(zhí)行層面,圍繞世界模型在具身智能中的三大核心使用價(jià)值展開評估:作為數(shù)據(jù)合成引擎,能否生成有效提升策略模型性能的合成數(shù)據(jù);作為策略評估器,能否替代物理仿真器準(zhǔn)確評估策略;作為行動規(guī)劃器,能否直接規(guī)劃出可執(zhí)行的動作序列。賽道二將率先開放數(shù)據(jù)合成引擎與策略評估器的提交通道,對于排名靠前的方案,后續(xù)將引入行動規(guī)劃器進(jìn)行額外加權(quán)打分,以全面驗(yàn)證模型的實(shí)用價(jià)值。
![]()
二、即刻上手,高性能開源世界模型已就位
賽事主辦方之一的高德為提升創(chuàng)新活躍、降低參賽門檻,已將其世界模型ABot-PhysWorld完全開源 —— 這個(gè)模型目前在 WorldArena Leaderboard 上排名領(lǐng)先,參賽者可以直接在此基礎(chǔ)上訓(xùn)練和優(yōu)化。
ABot-PhysWorld 是高德即將發(fā)布的 ABot-World 系列的首個(gè)子工作,聚焦于具身場景下的物理一致性視頻生成。與現(xiàn)有模型追求「視覺合理性」不同,ABot-PhysWorld 的核心目標(biāo)是「物理真實(shí)性」—— 讓 AI 生成的不僅是連續(xù)幀,而是符合物理規(guī)律的可行操作序列。
![]()
在技術(shù)實(shí)現(xiàn)上,該模型取得了多項(xiàng)關(guān)鍵突破:
四維泛化數(shù)據(jù):從 300 萬原始數(shù)據(jù)清洗至 30 萬高質(zhì)量 SFT 數(shù)據(jù),覆蓋本體泛化(不同機(jī)器人形態(tài))、任務(wù)泛化(50+ 任務(wù)類型)、場景泛化(10+ 場景)和物體泛化(1000+ 物體類別),確保模型不偏向特定場景。
DPO 偏好對齊:通過 VLM-as-Judge 構(gòu)造 1 萬條偏好數(shù)據(jù)對,使用 Direct Preference Optimization 讓模型在「物理正確」和「物理錯誤」之間做出正確選擇,顯著減少穿模、變形等物理違規(guī)現(xiàn)象。
Dense Action Map 精細(xì)控制:11 萬條動作控制數(shù)據(jù),將機(jī)器人動作編碼為空間稠密的控制信號,通過 Context Blocks 分支與視頻 latent 融合,實(shí)現(xiàn)精細(xì)化動作注入。
在獨(dú)立的 PAI-Bench 基準(zhǔn)上,ABot-PhysWorld 以0.8491 的綜合得分0.9306 的領(lǐng)域得分刷新 SOTA,顯著超越 GigaWorld、Wanx-2.5、Veo 3.1、Sora 2 等開源和閉源模型。更重要的是,它成功打破了業(yè)界長期存在的「視覺質(zhì)量與物理合規(guī)性」之間的 Trade-off—— 在保持極具競爭力的視覺質(zhì)量的同時(shí),實(shí)現(xiàn)了領(lǐng)域得分的大幅領(lǐng)先。
在 WorldArena Leaderboard 上,ABot-PhysWorld 同樣表現(xiàn)優(yōu)異,名列前茅。這一成績充分證明了高德在具身世界模型方向的技術(shù)實(shí)力。
為保障賽事公平性并加速社區(qū)創(chuàng)新,主辦方明確 ABot-PhysWorld 不參與最終評獎。該模型已開放完整模型權(quán)重、訓(xùn)練代碼及數(shù)據(jù)處理流程,參賽團(tuán)隊(duì)可直接在此高起點(diǎn)基線上進(jìn)行微調(diào)、數(shù)據(jù)策略優(yōu)化或技術(shù)創(chuàng)新。
值得一提的是,今年以來高德在具身智能領(lǐng)域動作頻頻,先后發(fā)布多款具身模型,并在多項(xiàng)權(quán)威基準(zhǔn)測試中取得 SOTA。結(jié)合此次 ABot-PhysWorld 的開源及 ABot-World 系列的預(yù)告,高德在具身世界模型領(lǐng)域的產(chǎn)業(yè)布局正持續(xù)深化。
三、賽程安排與參賽指南
賽事總獎金池超過 14,000 美元,各賽道分設(shè)一、二、三等獎。獲獎團(tuán)隊(duì)將獲得 CVPR Workshop 報(bào)告展示機(jī)會,頂尖隊(duì)伍可跨賽道獲獎。目前提交通道已開放并支持實(shí)時(shí)刷榜,最終提交截止時(shí)間為 2026 年 5 月 25 日,結(jié)果將于 6 月 1 日公布,并于 6 月 4 日在 CVPR 期間舉行頒獎典禮。
參賽流程非常簡潔,預(yù)計(jì)半天即可跑通第一個(gè)提交:
- 準(zhǔn)備數(shù)據(jù):從 Hugging Face 下載 val_dataset /test_dataset。
- 生成視頻:用您的模型輸出 ≥640×480、121 幀 @24fps 視頻(輸入:初始幀 + 文本 / 動作)。
- 打包提交:壓縮成 zip(視頻文件夾 + model_README.md),在官網(wǎng)注冊提交或發(fā)送至官方郵箱。
目前已有眾多頂尖學(xué)術(shù)團(tuán)隊(duì)與產(chǎn)業(yè)機(jī)構(gòu)報(bào)名參賽,賽事詳情與報(bào)名入口請?jiān)L問官網(wǎng)。
![]()
特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺“網(wǎng)易號”用戶上傳并發(fā)布,本平臺僅提供信息存儲服務(wù)。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.