337p人体粉嫩胞高清图片,97人妻精品一区二区三区在线 ,日本少妇自慰免费完整版,99精品国产福久久久久久,久久精品国产亚洲av热一区,国产aaaaaa一级毛片,国产99久久九九精品无码,久久精品国产亚洲AV成人公司
網(wǎng)易首頁 > 網(wǎng)易號 > 正文 申請入駐

世界模型WoW發(fā)布,200萬次真實交互讓AI真正懂物理

0
分享至


始智AI wisemodel.cn社區(qū)是源自中國的中立開放的AI開源社區(qū)。正在,歡迎加入共同成長。

人類對世界的認(rèn)知,源于親手觸摸、嘗試與探索,而非被動觀察。但當(dāng)前主流視頻生成模型如 Sora,僅靠海量視頻數(shù)據(jù)學(xué)習(xí),缺乏真實世界交互體驗,常常出現(xiàn)違背物理常識的 “幻覺”。近日,由北京人形機(jī)器人創(chuàng)新中心與香港科技大學(xué)等機(jī)構(gòu)聯(lián)合推出的 WoW 世界模型,憑借 200 萬條真實機(jī)器人交互數(shù)據(jù),打通 “感知 - 想象 - 反思 - 行動” 閉環(huán),讓 AI 真正具備物理直覺,為 embodied intelligence 發(fā)展奠定關(guān)鍵基礎(chǔ)!已上線始智AI-wisemodel開源社區(qū),歡迎體驗。


模型地址

https://wisemodel.cn/models/WoWworldmodel/WoW-1-Wan-14B-2M/intro

https://wisemodel.cn/models/WoWworldmodel/WoW-1-Wan-1.3B-2M

01.

行業(yè)痛點:

傳統(tǒng)世界模型的三大致命缺陷


現(xiàn)有世界模型雖能生成逼真視頻,卻難以適配真實世界交互需求:

  1. 物理認(rèn)知薄弱:僅通過被動觀察學(xué)習(xí),缺乏因果關(guān)聯(lián)理解,生成內(nèi)容常出現(xiàn)物體穿透、重力異常等物理謬誤;
  2. 想象與行動脫節(jié):能 “想象” 未來場景,卻無法將其轉(zhuǎn)化為可執(zhí)行的機(jī)器人動作,難以落地應(yīng)用;
  3. 泛化能力不足:在未見過的場景、機(jī)器人形態(tài)或任務(wù)中表現(xiàn)糟糕,難以適應(yīng)真實世界的多樣性。

這些問題導(dǎo)致 AI 始終無法真正 “理解” 世界,只能做表面的模式復(fù)刻。

02.

技術(shù)革新:

WoW的四大核心突破

WoW以 “真實交互數(shù)據(jù) + 閉環(huán)優(yōu)化框架” 為核心,實現(xiàn)四大關(guān)鍵創(chuàng)新,讓 AI 從 “看世界” 升級為 “懂世界、控世界”:


1. 200 萬次真實交互:筑牢物理直覺根基

摒棄互聯(lián)網(wǎng)視頻數(shù)據(jù),WoW 采用 203 萬條真實機(jī)器人交互軌跡訓(xùn)練,涵蓋 5275 個任務(wù)、12 種不同機(jī)器人形態(tài),累計時長超 7300 小時。數(shù)據(jù)經(jīng)過嚴(yán)格篩選,剔除無效交互,保留高質(zhì)量、因果關(guān)系明確的操作記錄,包括單臂 / 雙臂 manipulation、剛性 / 柔性物體交互等場景,讓模型在真實物理反饋中學(xué)習(xí)規(guī)律,而非死記硬背視頻模式。

2. SOPHIA 閉環(huán)框架:讓 AI 學(xué)會 “反思優(yōu)化”

創(chuàng)新提出 SOPHIA 自優(yōu)化框架,模擬人類 “嘗試 - 反饋 - 修正” 的認(rèn)知過程:

  • 生成器(Solver):基于擴(kuò)散 Transformer(DiT)生成符合物理規(guī)律的未來視頻,融合 3D 小波變換與 RoPE 位置編碼,保證時空一致性;
  • 評論家(Critic):由視覺語言模型(VLM)組成動態(tài)評估團(tuán)隊,從任務(wù)完成度、物理合理性、運(yùn)動流暢度等維度打分;
  • 優(yōu)化器(Refiner):根據(jù)評估反饋迭代優(yōu)化文本指令,引導(dǎo)生成器修正錯誤,逐步提升物理一致性。

這種 “生成 - 評估 - 優(yōu)化” 的閉環(huán),讓模型不斷反思改進(jìn),避免單一生成的局限性。

3. Flow-Mask 逆動力學(xué)模型:打通 “想象到行動” 最后一公里

設(shè)計 FM-IDM 模塊,能將生成的視頻軌跡轉(zhuǎn)化為 7 自由度機(jī)械臂可執(zhí)行的動作指令。通過分析相鄰幀的光流變化與場景掩碼,精準(zhǔn)推斷機(jī)器人末端執(zhí)行器的平移、旋轉(zhuǎn)及夾爪控制信號,實現(xiàn) “想象場景→動作落地” 的完整閉環(huán)。在真實機(jī)器人測試中,該模塊在簡單任務(wù)上成功率達(dá) 94.5%,中等難度任務(wù)達(dá) 75.2%,大幅超越傳統(tǒng)方法。

4. WoWBench 基準(zhǔn):量化物理與因果推理能力

構(gòu)建首個聚焦物理一致性的評估基準(zhǔn) WoWBench,包含 606 個樣本、20 個子任務(wù),從四大維度全面測試模型:

  • 感知理解(物體識別、空間關(guān)系等)

  • 預(yù)測推理(碰撞動力學(xué)、物體恒存性等)

  • 決策規(guī)劃(長時任務(wù)分解、因果依賴等)

  • 泛化執(zhí)行(未見場景、機(jī)器人形態(tài)等)

采用多維度評估指標(biāo),既包括視頻質(zhì)量、軌跡一致性等量化指標(biāo),也涵蓋人類主觀評分,全面衡量模型的真實世界適配能力。


03.

性能驗證:

多項指標(biāo)刷新紀(jì)錄,真實場景表現(xiàn)亮眼

WoW 在實驗中展現(xiàn)出遠(yuǎn)超傳統(tǒng)模型的綜合能力:

  • 基準(zhǔn)測試霸榜:在 WoWBench 上實現(xiàn) 96.53% 的指令理解準(zhǔn)確率和 80.16% 的物理規(guī)律符合率,人類評估與自動評估均排名第一;
  • 物理一致性卓越:能準(zhǔn)確模擬碰撞、形變、流體等復(fù)雜物理現(xiàn)象,在剛性物體交互、柔性材料操作等場景中無明顯物理謬誤;
  • 泛化能力突出:無需微調(diào)即可適配 12 種不同機(jī)器人形態(tài),在素描、油畫等風(fēng)格化場景,以及 “物體超重”“重力偏移” 等反事實場景中,仍能生成合理結(jié)果;
  • 真實落地可行:成功控制物理機(jī)器人完成取放面包、關(guān)閉抽屜、按鈕按壓等任務(wù),動作流暢且精準(zhǔn)。

04.

適用場景:

賦能多領(lǐng)域智能升級

WoW 的技術(shù)特性使其在多個場景具備極高應(yīng)用價值:

  • 機(jī)器人操控:為工業(yè)機(jī)械臂、服務(wù)機(jī)器人提供高精度動作規(guī)劃,適配多樣化任務(wù)與環(huán)境;
  • 物理模擬:替代傳統(tǒng)物理引擎,高效生成復(fù)雜場景模擬視頻,助力游戲開發(fā)、仿真測試;
  • 多視圖生成:支持從有限視角重建完整 3D 場景,生成幾何一致的新穎視圖;
  • VLM 能力增強(qiáng):作為認(rèn)知沙盒,幫助視覺語言模型調(diào)試規(guī)劃邏輯,將復(fù)雜任務(wù)成功率從 30% 提升至 89%。


無論是工業(yè)自動化、智能家居,還是虛擬仿真、AI 助手升級,WoW 都能憑借其強(qiáng)大的物理理解與行動能力提供核心支撐。

WoW 的推出,打破了傳統(tǒng)世界模型 “只懂想象、不會行動” 的局限,證明了 “真實交互是 AI 習(xí)得物理直覺的關(guān)鍵”。其 200 萬條真實交互數(shù)據(jù)、SOPHIA 閉環(huán)優(yōu)化框架與 FM-IDM 動作轉(zhuǎn)化模塊的有機(jī)結(jié)合,讓 AI 首次實現(xiàn) “感知世界 - 想象未來 - 反思優(yōu)化 - 操控物理” 的完整閉環(huán)。

隨著技術(shù)的進(jìn)一步迭代,未來的 AI 將具備更強(qiáng)的環(huán)境適應(yīng)能力與自主決策能力,在工業(yè)生產(chǎn)、家庭服務(wù)、科研探索等領(lǐng)域發(fā)揮更大價值。

----- END -----


wisemodel相關(guān):

系列模型:

關(guān)于wisemodel更多

1

歡迎持續(xù)關(guān)注和支持

開源社區(qū)建設(shè)需要長期堅持和投入,更需要廣大用戶的積極參與、貢獻(xiàn)和維護(hù),歡迎大家加入wisemodel開源社區(qū)的志愿者計劃和開源共創(chuàng)計劃。期待更多開發(fā)者將開源成果,包括模型、數(shù)據(jù)集和代碼等發(fā)布到 wisemodel.cn 社區(qū),共建中立、開放的AI開源社區(qū)生態(tài)。歡迎掃碼添加wisemodel微信,申請加入wisemodel社群,持續(xù)關(guān)注wisemodel.cn開源社區(qū)動態(tài)。

2

歡迎加盟wisemodel開源社區(qū)

始智AI wisemodel社區(qū)自2023年9月上線以來,逐漸成為影響力日益擴(kuò)大的中立開放的AI開源社區(qū),為了加快公司發(fā)展,我們長期需要技術(shù)、運(yùn)營等人才加盟,技術(shù)側(cè)重在AI infra、后端開發(fā),熟悉K8S、模型訓(xùn)練和推理等技術(shù), 以及熟悉開發(fā)者生態(tài)運(yùn)營的成員,歡迎感興趣的朋友加盟,可以通過添加wisemodel微信,或者將簡歷投遞到郵箱:liudaoquan@wisemodel.cn

3

歡迎投稿優(yōu)質(zhì)內(nèi)容

歡迎投稿分享人工智能領(lǐng)域相關(guān)的優(yōu)秀研究成果,鼓勵高校實驗室、大企業(yè)研究團(tuán)隊、個人等,在wisemodel平臺上分享各類優(yōu)質(zhì)內(nèi)容,可以是AI領(lǐng)域最新論文解讀、最新開源成果介紹,也可以是關(guān)于AI技術(shù)實踐、應(yīng)用和總結(jié)等。投稿可以發(fā)郵件到liudaoquan@wisemodel.cn,也可以掃碼添加wisemodel微信。

4

關(guān)于wisemodel開源社區(qū)

始智AI wisemodel.cn開源社區(qū)由清華校友總會AI大數(shù)據(jù)專委會副秘書長劉道全創(chuàng)立,旨在打造和建設(shè)中立開放的AI開源創(chuàng)新社區(qū),將打造成“HuggingFace”之外最活躍的AI開源社區(qū),匯聚主要AI開源模型、數(shù)據(jù)集和代碼等,歡迎高校科研院所、大型互聯(lián)網(wǎng)公司、創(chuàng)新創(chuàng)業(yè)企業(yè)、廣大個人開發(fā)者,以及政府部門、學(xué)會協(xié)會、聯(lián)盟、基金會等,還有投資機(jī)構(gòu)、科技媒體等,共同參與建設(shè)AI開源創(chuàng)新生態(tài)。

向上滑動查看

特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺“網(wǎng)易號”用戶上傳并發(fā)布,本平臺僅提供信息存儲服務(wù)。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相關(guān)推薦
熱點推薦
歐盟對烏第50批軍援規(guī)模龐大,克林頓坦言俄烏沖突是美國責(zé)任

歐盟對烏第50批軍援規(guī)模龐大,克林頓坦言俄烏沖突是美國責(zé)任

史政先鋒
2026-03-30 19:29:19
震驚!浙大博士孟偉自曝時日無多,直播猛灌酒呲牙,狀態(tài)嚇壞網(wǎng)友

震驚!浙大博士孟偉自曝時日無多,直播猛灌酒呲牙,狀態(tài)嚇壞網(wǎng)友

川渝視覺
2026-03-29 21:27:07
打破歐美日壟斷,張雪機(jī)車兩天奪兩冠,直播間涌入6000多人!公司估值超10億元,創(chuàng)始人草根出身,20年前湖南衛(wèi)視紀(jì)錄片刷屏

打破歐美日壟斷,張雪機(jī)車兩天奪兩冠,直播間涌入6000多人!公司估值超10億元,創(chuàng)始人草根出身,20年前湖南衛(wèi)視紀(jì)錄片刷屏

每日經(jīng)濟(jì)新聞
2026-03-30 18:16:10
中國銀行副行長劉承鋼:把握大量定期存款到期有利時機(jī),有效對沖資產(chǎn)收益下行壓力

中國銀行副行長劉承鋼:把握大量定期存款到期有利時機(jī),有效對沖資產(chǎn)收益下行壓力

北京商報
2026-03-30 18:07:56
一對母女同框征婚火了!母親3萬8、女兒8萬8,網(wǎng)友神評笑翻全網(wǎng)

一對母女同框征婚火了!母親3萬8、女兒8萬8,網(wǎng)友神評笑翻全網(wǎng)

行者聊官
2026-03-30 12:53:10
致1人死亡!博羅石灣一工業(yè)園被掛牌督辦

致1人死亡!博羅石灣一工業(yè)園被掛牌督辦

南方都市報
2026-03-30 09:54:57
從楊主席訪伊朗受怠慢,聊聊如今為何有伊朗人稱我們“秦腔窮”?

從楊主席訪伊朗受怠慢,聊聊如今為何有伊朗人稱我們“秦腔窮”?

阿胡
2026-03-30 12:52:29
接陌生電話不要先出聲

接陌生電話不要先出聲

大象新聞
2026-03-29 07:29:10
李榮浩公開討伐不到48小時,單依純過往被扒,身體隱疾是冰山一角

李榮浩公開討伐不到48小時,單依純過往被扒,身體隱疾是冰山一角

阿纂看事
2026-03-30 17:35:47
米萊高調(diào)宣布:我將阿根廷的貧困率降低了27%,全靠尊重產(chǎn)權(quán)和市場經(jīng)濟(jì)

米萊高調(diào)宣布:我將阿根廷的貧困率降低了27%,全靠尊重產(chǎn)權(quán)和市場經(jīng)濟(jì)

風(fēng)向觀察
2026-03-30 14:33:04
掙了老百姓幾個億,死后卻被人排長隊送別,他做對了什么?

掙了老百姓幾個億,死后卻被人排長隊送別,他做對了什么?

李昕言溫度空間
2026-03-28 15:50:27
剛送別張雪峰,11歲女兒收到第一張江湖令!

剛送別張雪峰,11歲女兒收到第一張江湖令!

職場火鍋
2026-03-30 15:42:03
殯葬新規(guī)3月30日起實施 新規(guī)明確不全面禁止土葬

殯葬新規(guī)3月30日起實施 新規(guī)明確不全面禁止土葬

閃電新聞
2026-03-30 11:46:27
貴州茅臺時隔近兩年半再提價,飛天茅臺自營體系零售價調(diào)整為1539元/瓶

貴州茅臺時隔近兩年半再提價,飛天茅臺自營體系零售價調(diào)整為1539元/瓶

界面新聞
2026-03-30 20:29:15
“不要國王!”遭遇“全球羞辱時刻”,“不滿意率”創(chuàng)新高,特朗普仍在“嘴硬”……

“不要國王!”遭遇“全球羞辱時刻”,“不滿意率”創(chuàng)新高,特朗普仍在“嘴硬”……

新民周刊
2026-03-30 15:36:19
6月1號起,車管所跟你關(guān)系不大了

6月1號起,車管所跟你關(guān)系不大了

音樂時光的娛樂
2026-03-30 15:57:27
伊朗:美軍撤離伊邊境鄰近地區(qū),美多架預(yù)警機(jī)和加油機(jī)被擊落,多處倉庫被摧毀,未來更多高價值目標(biāo)將被列入打擊名單

伊朗:美軍撤離伊邊境鄰近地區(qū),美多架預(yù)警機(jī)和加油機(jī)被擊落,多處倉庫被摧毀,未來更多高價值目標(biāo)將被列入打擊名單

魯中晨報
2026-03-30 07:09:20
盤點:戰(zhàn)爭滿30日,伊朗被斬首高官全名單!下一個會是誰?

盤點:戰(zhàn)爭滿30日,伊朗被斬首高官全名單!下一個會是誰?

大江看潮
2026-03-30 10:03:00
注意!廣東部分地區(qū)將有10級以上雷暴大風(fēng)

注意!廣東部分地區(qū)將有10級以上雷暴大風(fēng)

廣東發(fā)布
2026-03-30 22:19:21
澤連斯基獲諾貝爾和平獎提名,俄羅斯著名博主發(fā)出悲觀論調(diào)

澤連斯基獲諾貝爾和平獎提名,俄羅斯著名博主發(fā)出悲觀論調(diào)

史政先鋒
2026-03-30 14:56:15
2026-03-30 23:16:49
wisemodel開源社區(qū) incentive-icons
wisemodel開源社區(qū)
始智AI wisemodel.cn開源社區(qū),打造中國版“huggingface”
466文章數(shù) 14關(guān)注度
往期回顧 全部

科技要聞

一句謊言引發(fā)的硅谷血案

頭條要聞

女子借公司500萬維權(quán)14年收回1.2萬:連利息零頭都不夠

頭條要聞

女子借公司500萬維權(quán)14年收回1.2萬:連利息零頭都不夠

體育要聞

想進(jìn)世界杯,意大利還要過他這一關(guān)

娛樂要聞

全紅嬋聊到體重哭了,每天只吃一頓飯

財經(jīng)要聞

本輪地緣沖突,A股憑什么走出獨(dú)立行情

汽車要聞

限時12.58萬起 銀河星耀8遠(yuǎn)航家系列上市

態(tài)度原創(chuàng)

游戲
手機(jī)
藝術(shù)
公開課
軍事航空

四月PS新會免游戲爆料!類魂與二次元雙大作領(lǐng)銜

手機(jī)要聞

兩款至尊版機(jī)型即將到來,或為一加和REDMI旗下

藝術(shù)要聞

600 年前的「產(chǎn)亡孤魂」,藏著中國女性最痛的記憶

公開課

李玫瑾:為什么性格比能力更重要?

軍事要聞

第三艘航母出動數(shù)千名士兵抵達(dá) 美軍大舉增兵中東戰(zhàn)場

無障礙瀏覽 進(jìn)入關(guān)懷版