網(wǎng)易首頁 > 網(wǎng)易號 > 正文申請入駐

擊敗PI！星動紀元登頂具身奧林匹克，狂攬三項全球冠軍

2026-04-10 18:07:22　來源: 量子位

北京舉報

分享至

田晏林發(fā)自凹非寺量子位 | 公眾號 QbitAI

人工智能和機器人領域，有一個反直覺現(xiàn)象：

往往人類覺得復雜、困難的任務，機器人做起來很容易；而人類不以為意的一些感知與運動技能，讓機器復現(xiàn)異常困難。

就像AlphaGo可以輕松打敗人類圍棋冠軍，但如果將其置于機器人體內(nèi)，可能連一只貓都抓不穩(wěn)；

大模型能破解國際數(shù)學奧林匹克競賽難題，卻無法驅(qū)動機械手精準地捏起一支筆并寫下答案。

這種人類對任務預期與機器實際處理難度的理解錯位，就是莫拉維克悖論。

因為對世界人形機器人大賽“有點失望”，前Google資深機器人專家Benjie Holson用自己的名字創(chuàng)辦了Benjie’s Olympics，向機器人專家們發(fā)出挑戰(zhàn)。

在這個具身靈巧操作奧林匹克的“賽場”，機器人可以挑戰(zhàn)15項任務，包括抹花生醬、洗油膩的平底鍋、插鑰匙開鎖、把襪子翻過來等人類最日常的動作。

這也是莫拉維克悖論中，機器很難處理的各種典型場景。

有參賽團隊耗費6個月打磨Demo，在任務挑戰(zhàn)中遭遇“滑鐵盧”，3天內(nèi)失敗率高達90%，盡顯賽事的嚴苛與殘酷。

這15項任務來自5個Event：開門、洗衣、基本工具使用、指尖、濕滑路面。

每個Event下都有3個任務，按照難度的不同，分為金銀銅牌。只有每項任務獲得第一，才能摘得對應的獎牌。

在一輪輪的貼身肉搏中，來自中國的具身智能公司星動紀元，一舉斬獲三項任務全球第一，包括兩項金牌難度任務第一，一項銀牌難度任務第一。

在剝橘子、開鎖、翻襪子任務中，其表現(xiàn)全面超越美國明星具身智能公司Physical Intelligence（簡稱“PI”），刷新世界紀錄。

要知道，在其他比賽里出現(xiàn)的PI，大多是別人拉著它的開源模型去跑的，并不是PI主動參加。

但Benjie’s Olympics是PI目前唯一一個主動參加的比賽。用的還是閉源模型，代表了PI的最高水平。

星動紀元作為該賽事目前唯一上榜的中國具身企業(yè)，也是唯一一個在該比賽中打敗了PI閉源模型的玩家。

終極真實壓力測試

和正規(guī)機器人大賽相比，Benjie’s Olympics沒有繁瑣的報名流程、華麗的賽事包裝，只因最純粹的實操能力對決，吸引全球不少頂尖具身智能公司的關注。

Scientific American評價其是物理智能終極真實壓力測試：

“it’s where demos die and useful robots are born.”
（Demo死在這里，實用機器人從這里誕生。）

Benjie’s Olympics的核心特質(zhì)是強制泛化而非復現(xiàn)。

它不考察機器人對固定場景的機械復刻，只檢驗其在真實復雜環(huán)境中的自適應、自決策能力。

換句話說，只有真正具備泛化與觸覺智能的系統(tǒng)，才能在比賽中存活。

在Benjie’s Olympics上，首個拿到多枚金牌的PI團隊曾給出評價：

“Every task targets the hardest unsolved problems in embodiment: deformables, contact-rich manipulation, long-horizon autonomy. No other contest comes close.”
（每個任務都瞄準具身智能最難未解問題：柔性物體、高接觸操作、長時序自主。沒有其他比賽能比肩。）

別看只有15個比賽項目，參賽規(guī)則十分嚴苛，要求全自主，開始后無遙控、無人工介入、無遠程修正；

無仿真，必須在真實家庭場景下操作，保證有真實光照、紋理、摩擦、噪聲；

環(huán)境隨機、物體也隨便擺放，不可貼標記，也不可預掃描地圖。完全就是閉卷裸考。

唯一讓Benjie Holson拿不準的，是該不該允許“手臂固定在桌子上”的機器人參賽。

他把決定權(quán)交給網(wǎng)友，投票結(jié)果顯而易見，只允許可移動的機器人參賽。（難度又又又加大了）

在金銀銅牌的設置上，Benjie’s Olympics有一套自己的規(guī)范。

比如洗衣這個Event：“將T恤衫里外翻轉(zhuǎn)折疊”是銅牌；“把襪子翻過來”是銀牌；掛一件男士襯衫能拿到金牌。

對機器人指尖的考驗：“卷起配對的襪子”是銅牌；“使用狗糞袋撿起便便”是銀牌；“剝橙子”是金牌。

每個任務，Benjie Holson都真人示范一遍。

比賽還規(guī)定，只要參賽選手的成績比上一個冠軍的成績至少提高25%，即可獲得獎牌。

看過這15個任務的機器人專家都說，多數(shù)隊伍連銅牌都過不了。

就像剝橙子這個無需任何外部工具即可完成的動作，機器人會非常棘手。

而且，橘子果皮易破、果肉易碎，這個任務難點是要求機器人精準區(qū)分果皮與果肉的細微視覺特征，實時跟蹤剝制過程中的果皮形變，要求視覺感知有極高的魯棒性。

再看開鎖，也是金牌難度任務。

鑰匙孔為毫米級微小目標，要求機器人精準識別鑰匙孔的位置、角度，同時完成鑰匙的姿態(tài)理解，實現(xiàn)毫米級對準，還需克服光照變化、金屬反光、視角偏差等多重干擾，無疑是對機器人精細操作與空間感知的雙重挑戰(zhàn)。

這兩項金牌難度任務，星動紀元均打破紀錄，摘得第一。

剝橙子，之前PI團隊借助削皮刀工具，在2分46秒完成；這次星動紀元純手剝，1分47秒完成，速度提升35%。

他們也成了賽事首個實現(xiàn)完全無工具純手剝操作的團隊。

開鎖，PI團隊66秒完成；星動紀元只用了49秒，速度提升25%。

在銀牌難度任務“翻襪子”中，星動紀元也戰(zhàn)勝了PI。

作為檢驗模型家用泛化能力的核心標桿，翻襪子是柔性物體操作、樣本泛化、效率敏感的典型場景。

襪子翻轉(zhuǎn)過程中會發(fā)生復雜、無規(guī)律的形變，要求機器人實時跟蹤形變，精準區(qū)分襪子的內(nèi)外側(cè)、開口位置，對視覺感知、柔性物體跟蹤能力要求極高。

PI用了176個樣本，1分33秒完成；星動紀元只用了120個樣本，不僅樣本量減少32%，翻襪子速度也比PI提升了30%。

Benjie’s Olympics 公布星動紀元銀牌任務（翻襪子）第一

這三項任務，星動紀元均是全球第一，并創(chuàng)下新世界紀錄。

全靠自研VLA具身模型控場

星動紀元能在如此嚴苛賽事中取得成績，靠的不是運氣，自研的VLA具身大模型功不可沒。

該模型具備三個關鍵優(yōu)勢，沒有一個是虛的，個個都能派上大用場。

第一個優(yōu)勢，是基礎模型知識遷移能力，也就是讓機器人學東西不費勁。

傳統(tǒng)具身智能模型依賴海量訓練數(shù)據(jù)，泛化能力受限。

這就好比教一個小孩認蘋果，你得給他看一萬張?zhí)O果的照片他才能記住。換一種光線、換一種顏色的蘋果，他可能又不認得了。

而星動紀元依托強大的知識遷移能力，大幅優(yōu)化數(shù)據(jù)利用率。

他們先教會小孩“什么是水果”這個概念，再讓他去認蘋果、橘子、香蕉，這樣就快多了。

單說翻襪子這個任務，星動紀元只用了120組訓練樣本，就比另一支團隊用176組樣本做得還要好。

這意味著機器人能很快適應新場景，研發(fā)成本和耗費時間都大大降低。

第二個優(yōu)勢，是讓機器人看得更清楚，尤其是那些小東西。

一個會移動的機器人，它的“眼睛”（攝像頭）是跟著身體一起動的。靠近目標的時候，角度在變、距離在變，傳統(tǒng)的方法很容易“看花眼”。

星動紀元的模型引入了自適應視覺注意力機制。

名字很長，但原理很簡單：自動盯著鑰匙、鎖孔、果皮這類細小又關鍵的東西看，自動把它們看得更清楚、特征更突出，就算環(huán)境很亂、機器人底盤輕微晃動，也能精準識別。

第三個優(yōu)勢，是讓機器人反應變快，手還很穩(wěn)。

傳統(tǒng)模型的工作方式是“做完一步，再看下一步”，模型單次生成超1秒的運動軌跡，響應慢、誤差易累積。

比如，翻襪子過程中襪子突然變形了，等機器人想完下一步怎么做，襪子已經(jīng)滑到別處去了。

星動紀元采用異步高頻推理與短時域規(guī)劃策略，可在當前軌跡未完成時，同步預測下一段運動軌跡，生成后立即切換執(zhí)行。

如圖所示，機器人的一個關節(jié)沿著Chunk 1的路徑運動，直到Chunk 2出現(xiàn)的垂直線，然后你開始沿著該路徑運動，直到Chunk 3出現(xiàn)，依此類推。

這樣一來，每條路徑的最后一段其實用不上，因為新的路徑總會提前出現(xiàn)，機器人直接切換過去就行。

簡單來說，機器人在做當前動作的同時，大腦已經(jīng)在預判下一步、下下一步該怎么走了。

一旦新的路徑算出來，機器人立刻切換過去，中間不等待。每條規(guī)劃的路其實最后一段都用不上，因為新的路總會提前出現(xiàn)。規(guī)劃得越頻繁，機器人就越靈敏。

所以在翻襪子這種襪子不斷變形的任務里，星動紀元的機器人能快速調(diào)整動作，重新找到襪口，一氣呵成。

這三項改進加在一起，效果就更明顯了。

星動紀元的機器人不僅眼看得清，手指靈活，還可以理解工具怎么用，雙手協(xié)同干活，甚至能完成多步驟、需要長時間規(guī)劃的任務。

正是這套全自研的VLA具身模型，讓星動紀元在“只允許移動機器人參賽”這條硬規(guī)則下，不僅沒有吃虧，反而把移動帶來的動態(tài)不確定性，變成了自己的護城河。

冠軍團隊，不止于賽事

這不是星動紀元第一次屠榜了。

2025年10月，星動紀元創(chuàng)始人陳建宇與斯坦福大學Chelsea Finn（PI聯(lián)合創(chuàng)始人）團隊研發(fā)了Ctrl-World可控生成世界模型。

該模型在全球具身智能頂級世界模型權(quán)威評測WorldArena榜單中，超越谷歌、英偉達，斬獲具身任務全球第一。

2026年2月，雙方再次聯(lián)合提出VLAW框架，首次實現(xiàn)VLA策略與動作條件世界模型的協(xié)同迭代優(yōu)化。星動紀元也成了唯一和PI兩次合作的中國具身公司。

陳建宇對端到端VLA范式有多堅持呢？

2020年從加州大學伯克利博士畢業(yè)后，陳建宇回到母校清華大學，擔任交叉信息研究院助理教授，28歲成為清華博導，2023年創(chuàng)辦星動紀元。

2024年9月，星動紀元成為全球首個提出分頻VLA的團隊，PI、Figure、Google、NVIDIA都得排在它后面。

同年12月，該公司發(fā)布融合世界模型的VLA算法框架Video Prediction Policy（現(xiàn)已開源）。

2025年，星動紀元自研的ERA-42端到端VLA具身大模型，實現(xiàn)了對全尺寸雙足人形機器人全身及五指靈巧手的精準控制，成為全球僅有的四家能做到這一點的公司之一。

技術(shù)的終極價值，在于實用。

賽場之外，星動紀元的VLA具身大模型已在多個領域落地。

物流方面，其與順豐合作；在制造業(yè)方面，與吉利、北汽合作；在商業(yè)服務、家庭服務領域，已與海爾、聯(lián)想、世紀金源等企業(yè)達成合作。

在今年中關村論壇亮相的智能分揀機器人，就是星動紀元真干活機器人的代表。

日常工作中，它不僅能完成藥品、日化品、包裹的分揀及掃碼，還能完成“零部件抓取-高精度裝配-質(zhì)量檢測”等制造業(yè)場景的任務。

在商業(yè)服務領域，星動紀元的機器人負責門店客座清潔、物品遞送、導游導覽等工作。其中，部分場景效率當前達到70%～80%。

星動紀元做的事倒是很符合Benjie’s Olympics賽事的初衷：讓有用的機器人在這里誕生，讓只活在Demo里的技術(shù)永遠死去。

當越來越多的玩家從炫技轉(zhuǎn)向?qū)嵱茫瑫l(fā)現(xiàn)在機器人這場長跑里，真正的對手從來不是別人，而是那個人類習以為常、機器卻步履蹣跚的物理世界。

特別聲明：以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺“網(wǎng)易號”用戶上傳并發(fā)布，本平臺僅提供信息存儲服務。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.