337p人体粉嫩胞高清图片,97人妻精品一区二区三区在线 ,日本少妇自慰免费完整版,99精品国产福久久久久久,久久精品国产亚洲av热一区,国产aaaaaa一级毛片,国产99久久九九精品无码,久久精品国产亚洲AV成人公司
網(wǎng)易首頁 > 網(wǎng)易號 > 正文 申請入駐

π0.7發(fā)布,機器人迎來GPT-2時刻

0
分享至


智東西
編譯 高遠矚
編輯 漠影

智東西4月17日報道,一個成立僅兩年的機器人初創(chuàng)公司Physical Intelligence,剛剛拿出了讓整個灣區(qū)AI圈為之震動的新成果。其最新發(fā)布的機器人基礎模型π0.7,能夠讓機器人執(zhí)行從未被明確訓練過的任務:從使用空氣炸鍋烹飪紅薯,到在一臺從未見過任何衣物折疊數(shù)據(jù)的工業(yè)機器人上成功疊好T恤。



更令人驚訝的是,這些能力并非刻意設計,而是在訓練過程中“涌現(xiàn)”出來的。

“我的經(jīng)驗一直是,當我深入了解數(shù)據(jù)中的內容時,我基本上可以猜出模型能做什么。我很少感到驚訝。但過去幾個月是我第一次真正感到驚訝。”Physical Intelligence研究科學家Ashwin Balakrishna在論文發(fā)布后坦言。

他隨機買了一個齒輪組,問機器人“你能轉動這個齒輪嗎?”結果機器人真的做到了。這種超越死記硬背、能夠組合技能解決新問題的能力,在機器人領域尚屬首次。

π0.7的出現(xiàn),可能預示著機器人AI正接近類似大語言模型領域的“GPT-2時刻”,其能力開始以超出基礎數(shù)據(jù)預期的方式增長。

一、零基礎上手空氣炸鍋只見過兩個相關片段,卻能學會使用

論文中最具沖擊力的發(fā)現(xiàn),來自于π0.7對空氣炸鍋的使用。

當研究者要求它“用空氣炸鍋烹飪一個紅薯”時,它完成了部分任務,比如打開炸籃、嘗試放入紅薯,但未能完全成功。這已經(jīng)足夠令人驚訝,因為模型從未見過完整的“拿起紅薯-打開炸籃-放入-關閉-啟動”這一鏈條。


更令人振奮的是,當研究者采用“語言指導”的方式,像向新員工解釋事情一樣,逐步給出指令:“打開空氣炸鍋”“拿起紅薯”“把紅薯放進炸籃”“關閉空氣炸鍋”……π0.7能夠精準地跟隨這些實時指令,成功完成整個任務。

Physical Intelligence研究員、斯坦福大學計算機科學博士生Lucy Shi透露,早期的一個空氣炸鍋實驗成功率只有5%,但在花了大約半小時優(yōu)化提示工程(prompt engineering)后,成功率躍升至95%。“有時失敗模式不在機器人或模型上,”她說,“而在于我們不擅長提示工程。”

這一現(xiàn)象讓人不禁聯(lián)想到大語言模型的“涌現(xiàn)”能力:就像GPT-2能寫出關于“安第斯山脈獨角獸”的奇怪故事一樣,π0.7也能將從未一起出現(xiàn)過的技能重新組合。

Physical Intelligence聯(lián)合創(chuàng)始人、UC Berkeley教授Sergey Levine評價道:“它到底從哪里學會空氣炸鍋是什么?這很難追溯。但看到機器人領域出現(xiàn)這種情況,真的很特別。”


▲人類用逐步指令“教”機器人使用空氣炸鍋的過程

二、跨具身遷移:讓笨重的工業(yè)臂學會疊衣服,性能媲美人類專家

如果說空氣炸鍋案例展示了π0.7能組合不同技能,解決從未見過的任務,那么跨具身遷移(cross-embodiment transfer)實驗則展示了它在物理形態(tài)層面的遷移能力。

研究者決定在一個完全不同的機器人上測試π0.7:雙臂UR5e系統(tǒng)。這是兩臺UR5e工業(yè)級機械臂,帶有Robotiq平行夾爪。它們的手臂更長、更重,慣性大,夾爪也不夠精確,遠程操作本身就很困難。關鍵是,研究者從未用這個平臺收集過任何衣物折疊的數(shù)據(jù)。也就是說,對于UR5e來說,折疊T恤是一個“零樣本”(zero-shot)任務。

結果令所有人震驚:π0.7不僅成功地在UR5e上折疊了T恤和毛巾,而且其任務進度達到了85.6%,成功率達到了80%。

為了給這個數(shù)字提供參照,研究團隊進行了一項人類受試者研究:招募了10名平均擁有375小時遠程操作經(jīng)驗的頂級操作員(均處于公司操作員經(jīng)驗排名的前2%),讓他們在UR5e上“零樣本”嘗試折疊T恤。這些操作員雖然熟悉源機器人,但從未在UR5e上做過這個任務。結果顯示,人類操作員的平均任務進度為90.9%,成功率為80.6%。π0.7的表現(xiàn)幾乎與這些專家持平。

并且,π0.7在UR5e上采用的折疊策略與源機器人完全不同。在源機器人上,人類操作員通常以傾斜的末端執(zhí)行器接近布料,先壓住織物再提起;而在UR5e上,π0.7自發(fā)地采用垂直抓取,這是更適合長臂、高慣性機器人的策略。

模型沒有盲目模仿訓練數(shù)據(jù)中的動作,而是根據(jù)目標具身的物理特性調整了自己的行為。這正是跨具身遷移的本質:不是復制運動軌跡,而是理解任務目標并找到適合當前身體的新解法。


▲跨具身遷移結果:左側對比π0.5、π0.6、π0.7在多個跨具身任務上的成功率,右側展示UR5e折疊衣物的任務進度和人類對比


▲展示策略自適應變化(傾斜抓取 vs 垂直抓取)

三、開箱即用:從削蔬菜皮到組裝盒子,全面對標專用模型

除了空氣炸鍋和跨具身折疊,π0.7在常規(guī)的靈巧操作任務上也交出了一份亮眼的成績單。

Physical Intelligence將π0.7與之前通過強化學習微調的專用模型π0.6*進行了系統(tǒng)比較。任務包括:制作濃縮咖啡(多步驟:磨粉、壓粉、扣入手柄、萃取)、組裝盒子(將平板紙盒折疊成立體盒子)、折疊T恤和短褲、削蔬菜皮(西葫蘆、黃瓜、胡蘿卜)、更換垃圾袋、切西葫蘆、做花生醬三明治等。

結果顯示,π0.7在所有任務上都達到了與專用模型相當甚至更高的性能。

例如,在衣物折疊任務中,π0.7的吞吐量(每小時成功次數(shù))甚至超過了RL專家模型。在需要記憶的任務中,π0.7也不需要任何微調,開箱即用就達到了與專用記憶模型(π0.6-MEM)相似的水平,比如“找到藏在抽屜里的物體”或“交換三個杯子的位置”。

在指令遵循方面,π0.7同樣大幅超越了前代模型π0.5和π0.6。

研究者在4個未見廚房和2個未見臥室中設計了14個指令遵循場景,每個場景需要機器人執(zhí)行3-6步開放式指令,π0.7的整體指令遵循成功率顯著高于前代。

更令人印象深刻的是,π0.7能夠處理“分布外”的復雜指代指令,例如“拿起我會用來喝湯的物體”或“拿起最大盤子上的水果”。當結合子目標圖像(GC模式)時,性能進一步提升。

此外,π0.7還能打破數(shù)據(jù)集的偏見:在“反向清理”任務中,數(shù)據(jù)中通常是“垃圾扔垃圾桶、盤子放餐盤回收箱”,但π0.7能夠遵循指令將垃圾放入餐盤回收箱、盤子放入垃圾桶。在“反向冰箱到微波爐”任務中,數(shù)據(jù)只有“冰箱→微波爐”,π0.7卻能從微波爐取出食物放回冰箱,這極大依賴子目標圖像提供的視覺引導。


▲指令遵循成功率

四、π0.7的技術核心:5B參數(shù)、異構數(shù)據(jù)與跨任務泛化

π0.7模型架構概覽:

π0.7是一個參數(shù)量約50億(5B)的視覺-語言-動作模型(VLA),其核心組件包括:

1、視覺-語言骨干網(wǎng)絡:基于Gemma3 4B模型(含4億參數(shù)的視覺編碼器),負責處理多視角圖像、語言指令和機器人本體感知信息。

2、動作專家模塊:一個8.6億參數(shù)的Transformer,采用流匹配(Flow Matching)目標生成連續(xù)動作,輸出長度為50步的動作塊(action chunk)。

3、記憶機制:沿用MEM(多尺度具身記憶,Multi-scale Embodied Memory)架構,對歷史觀測進行時空壓縮,使模型能處理變長的歷史幀。

4、多模態(tài)上下文:訓練時模型接受四種額外提示——子任務語言指令、子目標圖像(subgoal image)、片段元數(shù)據(jù)(episode metadata)和控制模式(關節(jié)空間或末端執(zhí)行器控制)。訓練時每種提示會隨機丟棄一部分,使模型在推理時能靈活組合使用。


▲π0.7模型架構圖

π0.7訓練數(shù)據(jù)特點:

π0.7使用了大規(guī)模異構數(shù)據(jù),包括多種機器人平臺的演示數(shù)據(jù)、自主策略評估產生的成功與失敗數(shù)據(jù)、人類遠程操作干預數(shù)據(jù)、第一人稱人類視頻,以及互聯(lián)網(wǎng)上的非機器人數(shù)據(jù)(如圖像問答、視頻字幕等)。

訓練時,模型還接受四種額外提示作為數(shù)據(jù)上下文:子任務語言指令、子目標圖像(subgoal image)、片段元數(shù)據(jù)(episode metadata)和控制模式(關節(jié)空間或末端執(zhí)行器控制)。每種提示在訓練中會隨機丟棄一部分,使模型在推理時能靈活組合使用。

模型通過元數(shù)據(jù)標注區(qū)分不同質量的數(shù)據(jù),從而能從次優(yōu)數(shù)據(jù)中學習而不損害性能。這些元數(shù)據(jù)包括:整體速度(以500步為一檔,如1750-2250步標為“2000步”)、整體質量(1-5分)、錯誤標簽(是否犯錯)和控制模式。

訓練中團隊還采用了“知識絕緣”技術(KI),讓語言骨干網(wǎng)絡的梯度與動作模塊隔離,避免動作預測干擾預訓練的視覺語言特征,從而更穩(wěn)定地學習多模態(tài)上下文。

通過這種設計,π0.7學會了根據(jù)提示中的“質量=5”“錯誤=false”“速度=8000”等條件,輸出高質量、快速、無錯誤的動作。而訓練數(shù)據(jù)中的次優(yōu)片段則提供了豐富的“負面樣本”和狀態(tài)多樣性,增強了模型的魯棒性(Robustness)。



▲開箱即用性能對比: 展示π0.7與π0.6*專家模型在濃縮咖啡、盒子搭建、衣物折疊等任務上的成功率和吞吐量對比


▲元數(shù)據(jù)消融實驗結果

五、能力突破拐點已至,三大局限仍待突破

盡管π0.7取得了令人矚目的成果,但研究團隊并沒有回避其局限性。

首先,π0.7目前還無法僅憑一個高層次的指令自主執(zhí)行復雜的多步驟任務。

“你不能告訴它,‘嘿,去給我烤些面包片’,”Sergey Levine坦言。“但如果你逐步引導它——‘對于烤面包機,打開這個部分,按下那個按鈕,這樣做’——那么它實際上往往能做得很好。”也就是說,對于長時程、多階段的新任務,仍然需要人類通過語言進行“指導”或訓練一個高層策略來分解子任務。

其次,機器人領域缺乏標準化的基準測試,這使得外部驗證變得困難。

Physical Intelligence主要依靠與自家前代模型的對比,以及內部設計的一系列評分規(guī)則(如削蔬菜皮的完成百分比、折疊衣物的質量評分)。不同實驗室之間的任務和環(huán)境差異很大,難以直接比較。

第三,也是根本性的問題:語言模型有整個互聯(lián)網(wǎng)可以學習,而機器人沒有。

盡管π0.7也使用了網(wǎng)絡預訓練、人類視頻等數(shù)據(jù),但物理世界的交互數(shù)據(jù)仍然稀缺且昂貴。研究者承認,對于某些任務,零樣本泛化的成功率(60-80%)仍然低于分布內任務(超過90%)。未來需要更高效的數(shù)據(jù)利用方法,例如利用π0.7本身的可引導性進行自主強化學習。

此外,由于訓練數(shù)據(jù)集規(guī)模巨大且內容龐雜,研究者往往難以確切知道某個能力究竟來自哪個具體片段。例如,空氣炸鍋的知識可能來自那兩個片段,也可能來自網(wǎng)絡上無數(shù)張廚房圖片的預訓練。這種“黑箱”特性與大型語言模型如出一轍,但也意味著真正的組合泛化(compositional generalization)正在發(fā)生:模型不是在檢索記憶,而是在重新混合。

Levine回憶起當年GPT-2生成“安第斯山脈獨角獸”故事時的震撼:“它到底從哪里學到秘魯?shù)莫毥谦F?那是非常奇怪的組合。現(xiàn)在在機器人領域看到這種情況,真的很特別。”

批評者可能會指出,機器人演示的任務看起來不如“后空翻”那樣酷炫。但Levine反駁說,泛化本身看起來總是不如精心編排的特技表演那么戲劇化——但它要有用得多。


▲數(shù)據(jù)擴展性曲線:左圖顯示有元數(shù)據(jù)時,即使在數(shù)據(jù)質量下降的情況下,π0.7的性能仍能隨數(shù)據(jù)量增加而持續(xù)提升;右圖顯示高任務多樣性數(shù)據(jù)對泛化性能的關鍵貢獻

結語:組合泛化實現(xiàn)突破,通用機器人“大腦”將至

π0.7的發(fā)布,標志著機器人基礎模型從“死記硬背”走向“組合泛化”的初步突破。它能夠在零樣本下完成空氣炸鍋烹飪、跨具身折疊衣物等從未見過的任務,性能媲美人類專家和RL微調專用模型。這背后是多樣化上下文提示、元數(shù)據(jù)條件化(conditioning on metadata)和超大規(guī)模異構數(shù)據(jù)訓練的共同作用。

如今,物理智能的“GPT時刻”似乎也在悄然臨近。Physical Intelligence已融資超10億美元,最新估值達56億美元,并正洽談新一輪可能將其推至110億美元的融資。

當然,也有人對此持保留態(tài)度,認為π0.7的跨具身能力目前僅限于夾爪操作,尚未涉及更復雜的全身控制,但這類質疑并未掩蓋多數(shù)人對該方向的樂觀預期。

盡管其仍有諸多限制:無法自主完成長鏈條任務、缺乏標準化評測、數(shù)據(jù)依賴性依然存在……但他們的研究成果已經(jīng)向世界證明:一個可引導、可教會、可遷移的通用機器人“大腦”,不再是科幻。

特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網(wǎng)易號”用戶上傳并發(fā)布,本平臺僅提供信息存儲服務。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相關推薦
熱點推薦
這五個號碼千萬不要接,一旦接聽,銀行卡里的錢都可能秒沒

這五個號碼千萬不要接,一旦接聽,銀行卡里的錢都可能秒沒

笑熬漿糊111
2026-04-20 00:05:15
突發(fā)!340億開源巨頭徹底撤離中國,419名頂級工程師被瘋搶,18年深耕終落幕…

突發(fā)!340億開源巨頭徹底撤離中國,419名頂級工程師被瘋搶,18年深耕終落幕…

新浪財經(jīng)
2026-04-20 04:31:06
太難了!貴州女子哭訴生意不好,想把女兒生活費2000降到1600遭拒

太難了!貴州女子哭訴生意不好,想把女兒生活費2000降到1600遭拒

火山詩話
2026-04-20 13:51:19
金像獎成功收官:四大尷尬,三大暖心,兩個意外發(fā)現(xiàn),謝霆鋒贏麻

金像獎成功收官:四大尷尬,三大暖心,兩個意外發(fā)現(xiàn),謝霆鋒贏麻

八斗小先生
2026-04-20 16:37:47
坑慘宏遠,沒籃偏要投,7中1+假摔投死球隊,球迷:真心菜的不行

坑慘宏遠,沒籃偏要投,7中1+假摔投死球隊,球迷:真心菜的不行

南海浪花
2026-04-20 23:14:36
被蘋果、華為干倒的諾基亞,又殺回來了!

被蘋果、華為干倒的諾基亞,又殺回來了!

大佬灼見
2026-04-19 10:28:53
港媒曝張曼玉“五官徹底分離”,61歲生圖惹爭議,倆部位面目全非

港媒曝張曼玉“五官徹底分離”,61歲生圖惹爭議,倆部位面目全非

冷紫葉
2026-04-20 17:12:17
澆小麥的地下水變成血紅色,誰來守護我們的生存底線?

澆小麥的地下水變成血紅色,誰來守護我們的生存底線?

記錄劉杰
2026-04-19 21:39:47
網(wǎng)友喊話請何潤東代言霸王茶姬,有人都把圖P好了,客服:建議已詳細登記;何潤東翻紅后,賬號漲粉近200萬

網(wǎng)友喊話請何潤東代言霸王茶姬,有人都把圖P好了,客服:建議已詳細登記;何潤東翻紅后,賬號漲粉近200萬

魯中晨報
2026-04-20 14:48:15
鄭麗文回應“大陸武統(tǒng)”,作出滿分回答,還給民進黨指了一條明路

鄭麗文回應“大陸武統(tǒng)”,作出滿分回答,還給民進黨指了一條明路

頭條爆料007
2026-04-19 20:27:52
絕不談判!永久關閉豁免窗口!中國打響光刻機反擊戰(zhàn)

絕不談判!永久關閉豁免窗口!中國打響光刻機反擊戰(zhàn)

阿七說史
2026-04-20 15:10:26
最新:曝俄軍敗退扎波羅熱!丟失幾年來占領的全部土地

最新:曝俄軍敗退扎波羅熱!丟失幾年來占領的全部土地

項鵬飛
2026-04-20 20:13:15
油價明晚24時將調整,預計迎2026年首降,車主加滿一箱50升92號汽油將少花20.5元

油價明晚24時將調整,預計迎2026年首降,車主加滿一箱50升92號汽油將少花20.5元

海峽網(wǎng)
2026-04-20 22:40:46
醪糟再次被關注!醫(yī)生發(fā)現(xiàn):高血脂患者喝醪糟,不用多久4大變化

醪糟再次被關注!醫(yī)生發(fā)現(xiàn):高血脂患者喝醪糟,不用多久4大變化

芹姐說生活
2026-04-19 15:52:53
原雷神山院長落馬,其“權色交易”的背后,坑害了多少女醫(yī)護家庭

原雷神山院長落馬,其“權色交易”的背后,坑害了多少女醫(yī)護家庭

長安一孤客
2026-04-20 18:58:28
河南一男子因病偏癱,覺得虧欠妻子主動離婚,女兒擺酒席慶祝:他們開心就好,離婚不離家,母親繼續(xù)照顧父親,房車等全部財產都在母親名下

河南一男子因病偏癱,覺得虧欠妻子主動離婚,女兒擺酒席慶祝:他們開心就好,離婚不離家,母親繼續(xù)照顧父親,房車等全部財產都在母親名下

洪觀新聞
2026-04-20 16:20:08
爭議!趙繼偉慘敗夜發(fā)“呵呵” 自責“想找地縫鉆進去”引熱議

爭議!趙繼偉慘敗夜發(fā)“呵呵” 自責“想找地縫鉆進去”引熱議

醉臥浮生
2026-04-20 22:28:30
罰15億!拼多多一員工故意關門,對抗調查,導致執(zhí)法人員手指骨折

罰15億!拼多多一員工故意關門,對抗調查,導致執(zhí)法人員手指骨折

魔都姐姐雜談
2026-04-19 08:03:27
出手扣下兩批軍火,又一個歐洲國家,加入制裁以色列的行列中

出手扣下兩批軍火,又一個歐洲國家,加入制裁以色列的行列中

空天力量
2026-04-20 17:09:18
日本將地震震級調整至7.5級

日本將地震震級調整至7.5級

界面新聞
2026-04-20 16:30:33
2026-04-21 01:35:00
智東西 incentive-icons
智東西
智東西,AI產業(yè)新媒體,專注報道人工智能的前沿技術發(fā)展,和技術應用帶來的千行百業(yè)產業(yè)變革。
11639文章數(shù) 117035關注度
往期回顧 全部

科技要聞

HUAWEI Pura X Max發(fā)布 售價10999元起

頭條要聞

19歲女孩挪用自家1700萬當"榜一大姐" 親爹帶女兒自首

頭條要聞

19歲女孩挪用自家1700萬當"榜一大姐" 親爹帶女兒自首

體育要聞

阿森納已拼盡全力,但你早干嘛去了...

娛樂要聞

《八千里路云和月》田家泰暗殺

財經(jīng)要聞

利潤暴跌7成,字節(jié)到底在做什么

汽車要聞

把天門山搬進廠?開仰望U8沖上45度坡的那刻 我腿軟了

態(tài)度原創(chuàng)

藝術
健康
本地
親子
軍事航空

藝術要聞

沙特官宣:全球最大單體建筑,延期十年!網(wǎng)友:又是畫餅?

干細胞抗衰4大誤區(qū),90%的人都中招

本地新聞

12噸巧克力有難,全網(wǎng)化身超級偵探添亂

親子要聞

【孤獨癥科普】啥是孤獨癥,哪些孩子易發(fā)生,如何應對?

軍事要聞

特朗普:美艦向伊朗貨船開火炸出個洞

無障礙瀏覽 進入關懷版