337p人体粉嫩胞高清图片,97人妻精品一区二区三区在线 ,日本少妇自慰免费完整版,99精品国产福久久久久久,久久精品国产亚洲av热一区,国产aaaaaa一级毛片,国产99久久九九精品无码,久久精品国产亚洲AV成人公司
網易首頁 > 網易號 > 正文 申請入駐

斯坦福具身智能大佬看好的世界模型,竟出自英偉達Cosmos?

0
分享至



讓機器人成為能主動想象、理解、行動的智能體。

作者 |許麗思

編輯 |漠影

前陣子,特斯拉釋放重磅消息,Optimus 3即將亮相,它將是一款通用人形機器人,也是特斯拉第一款走向量產的機器人,將在今年年底前啟動生產。同時,Optimus已經在特斯拉工廠執行一些簡單任務。

機器人行業的敘事,正從會跑會跳的技術演示轉向能落地干活的使用能力,距離走進人類生活似乎越來越近了。不過,在demo和規模化落地之間,還需要邁過安全、可靠性與功能成熟度等門檻。

在這道門檻前,數據問題變得更尖銳。以特斯拉Optimus的研發為例,早期團隊曾采用動作捕捉服和遠程操作方案,但在去年開始探索其他訓練方式。

這種困境并非個例,行業普遍面臨真實機器人數據昂貴、稀缺且強依賴硬件形態,進而導致訓練與評估難以規模化復制、場景泛化能力有限。

此前,英偉達打造了“三臺計算機”解決方案:DGX系列提供強勁算力支撐,Omniverse平臺Cosmos世界基礎模型平臺高效生產仿真數據,AGX作為邊端完成部署和驗證,三者協同形成完整閉環,為物理AI開發提供全鏈條支持。

其中,Cosmos的角色,在于成為物理AI破解數據難題的關鍵工具。它能夠輕松生產大量符合物理規律的逼真合成數據,解決真實世界數據稀缺、模型測試風險高等挑戰,讓機器人在虛擬環境中先試錯、再實戰。

同時,開發者還可通過微調 Cosmos WFM構建自定義模型,大幅降低物理AI開發門檻。


01.

輕松生成大量逼真合成數據,

讓機器人更能適配真實場景挑戰

與只需要處理單一模態數據的傳統AI不同,物理AI需要支撐機器人在真實場景中完成復雜任務,比如工廠抓取零部件時的準確受力反饋、戶外場景移動時的復雜地形應對與行動策略調整等,對數據的真實性、多樣性、規模化需求極高。

物理AI模型的開發成本高且需要大量真實數據和測試,而Cosmos世界基礎模型使開發者能夠輕松生成大量符合物理規律的逼真合成數據,以用于訓練和評估其現有的模型。

具體來說,Cosmos世界基礎模型包括了三大部分:Cosmos Predict、Cosmos Transfer和Cosmos Reason。

Cosmos Predict讓機器人擁有一種堪稱提前看結局的能力,能夠預測動態環境的未來狀態。Cosmos Predict 2.5已將多種預測能力整合到單一模型中,實現了在單幀輸入條件下快速生成30秒預測視頻。

它為機器人復雜任務規劃提供了強大支撐,開發者可基于此對模型進行后期訓練,將視頻預測能力轉化為策略建模所需的動作生成能力。

比如,在機器人執行精密裝配任務前,先通過Cosmos Predict模擬不同操作路徑的結果,選擇最優方案,從而讓機器人在實戰中更精準、更安全,大幅減少試錯成本與操作風險。


Cosmos Transfer通過ControlNet架構,能基于輸入數據生成高保真世界場景,改變光照、天氣、物體材質等條件,生成同一場景的無數種可能。最新的Cosmos Transfer 2.5能夠生成更高質量、逼真的數據,且大小僅為Cosmos Transfer 1的三分之一。

對機器人來說,它可以在虛擬環境中體驗千變萬化的現實世界。無需依賴海量真實場景數據采集,就能有效提升機器人對不同場景的泛化能力,降低適配多場景應用的開發成本,加速規模化落地進程。


Cosmos Reason則是一個完全可定制的多模態AI推理模型,專為理解運動、物體交互和時空關系而構建。它讓機器人能夠理解空間、時間和物理特性,還能給Cosmos Predict生成多樣化、逼真的提示,并使用基于文本的控件從視頻中篩選高質量的合成數據。

當機器人擁有了像人類一樣推理的能力,它就不再只是執行預設指令的工具,而是能理解物理世界規律、進行有意識決策的智能體,提升了在復雜未知場景中的自主應對能力,打破規模化落地的場景適配局限。

除了這些基礎模型,Cosmos還包括由NVIDIA Cosmos Curate提供支持的數據處理和管理工作流,使開發者能夠在NVIDIA HopperGPU上僅用40天處理2000萬小時的數據,在NVIDIA BlackwellGPU上只需14天就能處理2000萬小時的數據。

Cosmos還配備一套視頻和圖像tokenizer,可以將視頻轉換為不同視頻壓縮比的標記,用于訓練各種Transformer模型。與現在先進的tokenizer相比,Cosmos tokenizer的總壓縮率高出8倍,處理速度快12倍,讓訓練成本大幅降低。

02.

基于Cosmos開發的WOW:

讓機器人看懂、理解并行動于世界

去年,北京人形機器人創新中心(以下簡稱“北京人形”)發布具身世界模型WoW,備受學術界、產業界關注。

不僅Huggingface官方留言“Excellent work”催更開源,斯坦福具身智能大佬、PI創始人Chelsea Finn還在與清華合作文章中引用了WoW技術報告。

值得一提的是,WoW正是北京人形研發團隊以Cosmos為基座,結合自身在機器人交互數據、算法優化等方面的積累打造而成,可以說是Cosmos在具身智能領域的最佳實踐之一,充分驗證了Cosmos平臺的靈活性與擴展性。

WOW是一個能讓機器人真正看見、理解并行動于世界的世界模型,提出了一個全新的框架,將世界生成、動作預測、視覺理解和自我反思融合為一個統一系統,使得AI不再只是看視頻或生成圖像,而能通過交互學習世界的物理規律,并在真實環境中自主操作。

模型怎么樣才能夠像人類一樣,通過實踐不斷進步,越來越聰明?WoW給出了答案:其提出的SOPHIA框架,把大語言模型與擴散Transformer結合起來,在語言引導下生成物理上合理的未來,讓AI形成"生成預測-批評-修正"的閉環,使得模型在執行任務時能不斷優化。


▲SOPHIA框架讓AI生成結果后自我評估、給出反饋,并通過Refiner Agent改進提示詞或推理鏈

WOW中還有一個基于Diffusion Transformer架構的世界生成引擎,它能夠根據環境狀態與智能體當前觀測,預測未來場景、推演物理演化、還原動態因果鏈。

光有視覺“想象”還不夠,WoW還能實現視頻生成和機器人動作執行的閉環。只要給定連續兩幀預測視頻,FM-IDM逆動力學模型就能夠計算出機器人末端執行器的動作變化量,將想象的視頻預測轉化為可執行動作,讓AI的想象真正落地。


▲FM-IDM讓模型實現從視頻到行動的閉環

在泛化能力上,WoW表現突出:無需微調,即可在UR5、Franka、AgileX等不同機器人平臺上執行任務,甚至能操作從未見過的物體,比如定制文化衫、氣球等柔性物體等,展現出強大的物理規律抽象能力。


總而言之,基于Cosmos,Wow實現了“想象世界-理解物理-生成視頻-執行動作-再學習”的完整閉環,推動AI擁有直覺物理的能力,加快通用機器人的規模化落地與泛化。

03.

結語:擁有對物理世界的想象力,

AI加快成為真正的具身智能體

Cosmos及開發者基于其構建的模型,讓機器人不再只是物理世界的被動觀察者,而是成為能主動想象、理解、行動的智能體,讓人看到了AI真正成為具身智能體的未來。

隨著機器人能像人類一樣通過互動學習物理規律,而不是依賴海量數據“死記硬背”,具身智能的終極目標,讓AI真正理解世界、在現實世界中行動就不再是遙不可及的未來。

特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相關推薦
熱點推薦
浙江東陽,33 歲的男子,在母親長眠的公墓旁,在車里結束了生命

浙江東陽,33 歲的男子,在母親長眠的公墓旁,在車里結束了生命

老貓觀點
2026-04-02 13:02:45
山西一小吃店3人死亡,知情人:店鋪剛接手沒幾天,店主夫婦和小姨子凌晨加工“碗禿”時遇難,原計劃天亮后開展免費試吃活動慶祝新店開張

山西一小吃店3人死亡,知情人:店鋪剛接手沒幾天,店主夫婦和小姨子凌晨加工“碗禿”時遇難,原計劃天亮后開展免費試吃活動慶祝新店開張

揚子晚報
2026-04-03 07:31:50
900頁心血變廢紙!巴喬當年怒炒意大利足協 注定了意大利足球落寞

900頁心血變廢紙!巴喬當年怒炒意大利足協 注定了意大利足球落寞

仰臥撐FTUer
2026-04-03 05:30:14
退休人員也要繳費了!4月起執行,每月扣多少、誰能免,一次說清

退休人員也要繳費了!4月起執行,每月扣多少、誰能免,一次說清

閱微札記
2026-04-02 22:22:41
中國“房爺”涉嫌用非法資金在英國購7億房產,疑似身份曝光!

中國“房爺”涉嫌用非法資金在英國購7億房產,疑似身份曝光!

兵叔評說
2026-04-02 17:55:25
薅羊毛失敗!50萬婚紗費砸手里了,70名女子“嫁給自己”荒唐收場

薅羊毛失敗!50萬婚紗費砸手里了,70名女子“嫁給自己”荒唐收場

火山詩話
2026-04-02 06:26:48
蔣正全、拉齊尼、欒留偉、胡友平、李靜毅等,最后畫面公開

蔣正全、拉齊尼、欒留偉、胡友平、李靜毅等,最后畫面公開

環球網資訊
2026-04-02 15:05:50
美軍傷亡最新數據曝光!美防長:陸軍參謀長立即辭職

美軍傷亡最新數據曝光!美防長:陸軍參謀長立即辭職

大國之翼
2026-04-03 06:38:48
戰事未了美先言勝遭市場“打臉” 伊朗再發地面戰警告:絕不留活口

戰事未了美先言勝遭市場“打臉” 伊朗再發地面戰警告:絕不留活口

環球網資訊
2026-04-03 08:10:11
650公里高速實測:電車油車差距太殘酷,真實感受句句不騙人

650公里高速實測:電車油車差距太殘酷,真實感受句句不騙人

復轉這些年
2026-04-01 09:06:39
伊朗稱擊中敵軍先進戰機

伊朗稱擊中敵軍先進戰機

財聯社
2026-04-03 03:56:29
勒布朗·詹姆斯:如果灰熊隊贏得2003年選秀狀元簽,他會選擇罷賽

勒布朗·詹姆斯:如果灰熊隊贏得2003年選秀狀元簽,他會選擇罷賽

好火子
2026-04-03 03:24:53
美軍對伊地面行動五大方案曝光 專家:最可能雙線并進

美軍對伊地面行動五大方案曝光 專家:最可能雙線并進

瑯琊閣梅莊主
2026-04-02 18:28:34
為啥中國人糖尿病世界第一?

為啥中國人糖尿病世界第一?

瑪麗姬絲
2026-04-02 19:59:11
留給美國時間不多了,伊朗戰爭打完后,世界就只剩一個超級大國了

留給美國時間不多了,伊朗戰爭打完后,世界就只剩一個超級大國了

觸摸史跡
2026-04-02 14:39:03
他賣了40%的“澳洲優思益”,共計10萬單,憑什么央視要對他追責?別呀,他還只是個孩子。

他賣了40%的“澳洲優思益”,共計10萬單,憑什么央視要對他追責?別呀,他還只是個孩子。

問道求真
2026-04-02 08:03:53
上海中山醫院心內科爆棚?回應:服務患者普通號常年不限號,近期換季再迎高峰

上海中山醫院心內科爆棚?回應:服務患者普通號常年不限號,近期換季再迎高峰

上觀新聞
2026-04-02 20:49:03
張雨綺直播帶貨情緒失控,怒懟拖延付款消費者:好說不聽,歹說不聽,都給你試用七天了

張雨綺直播帶貨情緒失控,怒懟拖延付款消費者:好說不聽,歹說不聽,都給你試用七天了

洪觀新聞
2026-04-02 09:58:46
打響抵制美食博主第一槍!成都一火鍋店張貼告示,表示一律不接待

打響抵制美食博主第一槍!成都一火鍋店張貼告示,表示一律不接待

火山詩話
2026-04-03 07:16:51
俄軍高級將領墜機身亡,6名總部軍官同時遇難

俄軍高級將領墜機身亡,6名總部軍官同時遇難

桂系007
2026-04-02 23:42:01
2026-04-03 09:27:00
機器人前瞻
機器人前瞻
專注于機器人報道的媒體
451文章數 10關注度
往期回顧 全部

科技要聞

戰火燒向科技公司!亞馬遜中東云計算中心遭襲

頭條要聞

被中國外交部揭底的日本極右翼分子身份披露

頭條要聞

被中國外交部揭底的日本極右翼分子身份披露

體育要聞

邵佳一的改革,從讓每個人踢舒服開始

娛樂要聞

《浪姐》人氣榜出爐!曾沛慈斷層第一

財經要聞

全球石油危機或將蔓延

汽車要聞

軸距2米7/后排能蹺腿 試駕后驅小車QQ3 EV

態度原創

家居
時尚
親子
數碼
軍事航空

家居要聞

歲月靜好 典雅新章

為什么“這個顏色”成為今年頂流?這樣穿好看又治愈

親子要聞

洗頭的舒適區,讓爸爸想出更多帶娃創意

數碼要聞

華為Mate X8折疊屏:8.15英寸巨幕+麒麟9040,最強折疊屏要來了

軍事要聞

伊朗自殺無人機突進 逼退林肯號航母

無障礙瀏覽 進入關懷版