田晏林 發(fā)自 凹非寺量子位 | 公眾號 QbitAI
人工智能和機器人領域,有一個反直覺現(xiàn)象:
往往人類覺得復雜、困難的任務,機器人做起來很容易;而人類不以為意的一些感知與運動技能,讓機器復現(xiàn)異常困難。
就像AlphaGo可以輕松打敗人類圍棋冠軍,但如果將其置于機器人體內(nèi),可能連一只貓都抓不穩(wěn);
大模型能破解國際數(shù)學奧林匹克競賽難題,卻無法驅(qū)動機械手精準地捏起一支筆并寫下答案。
這種人類對任務預期與機器實際處理難度的理解錯位,就是莫拉維克悖論。
因為對世界人形機器人大賽“有點失望”,前Google資深機器人專家Benjie Holson用自己的名字創(chuàng)辦了Benjie’s Olympics,向機器人專家們發(fā)出挑戰(zhàn)。
![]()
在這個具身靈巧操作奧林匹克的“賽場”,機器人可以挑戰(zhàn)15項任務,包括抹花生醬、洗油膩的平底鍋、插鑰匙開鎖、把襪子翻過來等人類最日常的動作。
這也是莫拉維克悖論中,機器很難處理的各種典型場景。
有參賽團隊耗費6個月打磨Demo,在任務挑戰(zhàn)中遭遇“滑鐵盧”,3天內(nèi)失敗率高達90%,盡顯賽事的嚴苛與殘酷。
這15項任務來自5個Event:開門、洗衣、基本工具使用、指尖、濕滑路面。
每個Event下都有3個任務,按照難度的不同,分為金銀銅牌。只有每項任務獲得第一,才能摘得對應的獎牌。
在一輪輪的貼身肉搏中,來自中國的具身智能公司星動紀元,一舉斬獲三項任務全球第一,包括兩項金牌難度任務第一,一項銀牌難度任務第一。
![]()
在剝橘子、開鎖、翻襪子任務中,其表現(xiàn)全面超越美國明星具身智能公司Physical Intelligence(簡稱“PI”),刷新世界紀錄。
要知道,在其他比賽里出現(xiàn)的PI,大多是別人拉著它的開源模型去跑的,并不是PI主動參加。
但Benjie’s Olympics是PI目前唯一一個主動參加的比賽。用的還是閉源模型,代表了PI的最高水平。
星動紀元作為該賽事目前唯一上榜的中國具身企業(yè),也是唯一一個在該比賽中打敗了PI閉源模型的玩家。
終極真實壓力測試
和正規(guī)機器人大賽相比,Benjie’s Olympics沒有繁瑣的報名流程、華麗的賽事包裝,只因最純粹的實操能力對決,吸引全球不少頂尖具身智能公司的關注。
Scientific American評價其是物理智能終極真實壓力測試:
“it’s where demos die and useful robots are born.”
(Demo死在這里,實用機器人從這里誕生。)
Benjie’s Olympics的核心特質(zhì)是強制泛化而非復現(xiàn)。
它不考察機器人對固定場景的機械復刻,只檢驗其在真實復雜環(huán)境中的自適應、自決策能力。
換句話說,只有真正具備泛化與觸覺智能的系統(tǒng),才能在比賽中存活。
在Benjie’s Olympics上,首個拿到多枚金牌的PI團隊曾給出評價:
“Every task targets the hardest unsolved problems in embodiment: deformables, contact-rich manipulation, long-horizon autonomy. No other contest comes close.”
(每個任務都瞄準具身智能最難未解問題:柔性物體、高接觸操作、長時序自主。沒有其他比賽能比肩。)
別看只有15個比賽項目,參賽規(guī)則十分嚴苛,要求全自主,開始后無遙控、無人工介入、無遠程修正;
無仿真,必須在真實家庭場景下操作,保證有真實光照、紋理、摩擦、噪聲;
環(huán)境隨機、物體也隨便擺放,不可貼標記,也不可預掃描地圖。完全就是閉卷裸考。
唯一讓Benjie Holson拿不準的,是該不該允許“手臂固定在桌子上”的機器人參賽。
他把決定權(quán)交給網(wǎng)友,投票結(jié)果顯而易見,只允許可移動的機器人參賽。(難度又又又加大了)
![]()
在金銀銅牌的設置上,Benjie’s Olympics有一套自己的規(guī)范。
比如洗衣這個Event:“將T恤衫里外翻轉(zhuǎn)折疊”是銅牌;“把襪子翻過來”是銀牌;掛一件男士襯衫能拿到金牌。
對機器人指尖的考驗:“卷起配對的襪子”是銅牌;“使用狗糞袋撿起便便”是銀牌;“剝橙子”是金牌。
每個任務,Benjie Holson都真人示范一遍。
比賽還規(guī)定,只要參賽選手的成績比上一個冠軍的成績至少提高25%,即可獲得獎牌。
看過這15個任務的機器人專家都說,多數(shù)隊伍連銅牌都過不了。
![]()
就像剝橙子這個無需任何外部工具即可完成的動作,機器人會非常棘手。
而且,橘子果皮易破、果肉易碎,這個任務難點是要求機器人精準區(qū)分果皮與果肉的細微視覺特征,實時跟蹤剝制過程中的果皮形變,要求視覺感知有極高的魯棒性。
![]()
再看開鎖,也是金牌難度任務。
鑰匙孔為毫米級微小目標,要求機器人精準識別鑰匙孔的位置、角度,同時完成鑰匙的姿態(tài)理解,實現(xiàn)毫米級對準,還需克服光照變化、金屬反光、視角偏差等多重干擾,無疑是對機器人精細操作與空間感知的雙重挑戰(zhàn)。
這兩項金牌難度任務,星動紀元均打破紀錄,摘得第一。
![]()
剝橙子,之前PI團隊借助削皮刀工具,在2分46秒完成;這次星動紀元純手剝,1分47秒完成,速度提升35%。
他們也成了賽事首個實現(xiàn)完全無工具純手剝操作的團隊。
開鎖,PI團隊66秒完成;星動紀元只用了49秒,速度提升25%。
在銀牌難度任務“翻襪子”中,星動紀元也戰(zhàn)勝了PI。
作為檢驗模型家用泛化能力的核心標桿,翻襪子是柔性物體操作、樣本泛化、效率敏感的典型場景。
襪子翻轉(zhuǎn)過程中會發(fā)生復雜、無規(guī)律的形變,要求機器人實時跟蹤形變,精準區(qū)分襪子的內(nèi)外側(cè)、開口位置,對視覺感知、柔性物體跟蹤能力要求極高。
PI用了176個樣本,1分33秒完成;星動紀元只用了120個樣本,不僅樣本量減少32%,翻襪子速度也比PI提升了30%。
![]()
Benjie’s Olympics 公布星動紀元銀牌任務(翻襪子)第一
這三項任務,星動紀元均是全球第一,并創(chuàng)下新世界紀錄。
全靠自研VLA具身模型控場
星動紀元能在如此嚴苛賽事中取得成績,靠的不是運氣,自研的VLA具身大模型功不可沒。
該模型具備三個關鍵優(yōu)勢,沒有一個是虛的,個個都能派上大用場。
第一個優(yōu)勢,是基礎模型知識遷移能力,也就是讓機器人學東西不費勁。
傳統(tǒng)具身智能模型依賴海量訓練數(shù)據(jù),泛化能力受限。
這就好比教一個小孩認蘋果,你得給他看一萬張?zhí)O果的照片他才能記住。換一種光線、換一種顏色的蘋果,他可能又不認得了。
而星動紀元依托強大的知識遷移能力,大幅優(yōu)化數(shù)據(jù)利用率。
他們先教會小孩“什么是水果”這個概念,再讓他去認蘋果、橘子、香蕉,這樣就快多了。
單說翻襪子這個任務,星動紀元只用了120組訓練樣本,就比另一支團隊用176組樣本做得還要好。
這意味著機器人能很快適應新場景,研發(fā)成本和耗費時間都大大降低。
![]()
第二個優(yōu)勢,是讓機器人看得更清楚,尤其是那些小東西。
一個會移動的機器人,它的“眼睛”(攝像頭)是跟著身體一起動的。靠近目標的時候,角度在變、距離在變,傳統(tǒng)的方法很容易“看花眼”。
星動紀元的模型引入了自適應視覺注意力機制。
名字很長,但原理很簡單:自動盯著鑰匙、鎖孔、果皮這類細小又關鍵的東西看,自動把它們看得更清楚、特征更突出,就算環(huán)境很亂、機器人底盤輕微晃動,也能精準識別。
![]()
第三個優(yōu)勢,是讓機器人反應變快,手還很穩(wěn)。
傳統(tǒng)模型的工作方式是“做完一步,再看下一步”,模型單次生成超1秒的運動軌跡,響應慢、誤差易累積。
比如,翻襪子過程中襪子突然變形了,等機器人想完下一步怎么做,襪子已經(jīng)滑到別處去了。
星動紀元采用異步高頻推理與短時域規(guī)劃策略,可在當前軌跡未完成時,同步預測下一段運動軌跡,生成后立即切換執(zhí)行。
![]()
如圖所示,機器人的一個關節(jié)沿著Chunk 1的路徑運動,直到Chunk 2出現(xiàn)的垂直線,然后你開始沿著該路徑運動,直到Chunk 3出現(xiàn),依此類推。
這樣一來,每條路徑的最后一段其實用不上,因為新的路徑總會提前出現(xiàn),機器人直接切換過去就行。
簡單來說,機器人在做當前動作的同時,大腦已經(jīng)在預判下一步、下下一步該怎么走了。
一旦新的路徑算出來,機器人立刻切換過去,中間不等待。每條規(guī)劃的路其實最后一段都用不上,因為新的路總會提前出現(xiàn)。規(guī)劃得越頻繁,機器人就越靈敏。
所以在翻襪子這種襪子不斷變形的任務里,星動紀元的機器人能快速調(diào)整動作,重新找到襪口,一氣呵成。
這三項改進加在一起,效果就更明顯了。
星動紀元的機器人不僅眼看得清,手指靈活,還可以理解工具怎么用,雙手協(xié)同干活,甚至能完成多步驟、需要長時間規(guī)劃的任務。
正是這套全自研的VLA具身模型,讓星動紀元在“只允許移動機器人參賽”這條硬規(guī)則下,不僅沒有吃虧,反而把移動帶來的動態(tài)不確定性,變成了自己的護城河。
冠軍團隊,不止于賽事
這不是星動紀元第一次屠榜了。
2025年10月,星動紀元創(chuàng)始人陳建宇與斯坦福大學Chelsea Finn(PI聯(lián)合創(chuàng)始人)團隊研發(fā)了Ctrl-World可控生成世界模型。
該模型在全球具身智能頂級世界模型權(quán)威評測WorldArena榜單中,超越谷歌、英偉達,斬獲具身任務全球第一。
2026年2月,雙方再次聯(lián)合提出VLAW框架,首次實現(xiàn)VLA策略與動作條件世界模型的協(xié)同迭代優(yōu)化。星動紀元也成了唯一和PI兩次合作的中國具身公司。
陳建宇對端到端VLA范式有多堅持呢?
![]()
2020年從加州大學伯克利博士畢業(yè)后,陳建宇回到母校清華大學,擔任交叉信息研究院助理教授,28歲成為清華博導,2023年創(chuàng)辦星動紀元。
2024年9月,星動紀元成為全球首個提出分頻VLA的團隊,PI、Figure、Google、NVIDIA都得排在它后面。
同年12月,該公司發(fā)布融合世界模型的VLA算法框架Video Prediction Policy(現(xiàn)已開源)。
2025年,星動紀元自研的ERA-42端到端VLA具身大模型,實現(xiàn)了對全尺寸雙足人形機器人全身及五指靈巧手的精準控制,成為全球僅有的四家能做到這一點的公司之一。
技術(shù)的終極價值,在于實用。
賽場之外,星動紀元的VLA具身大模型已在多個領域落地。
物流方面,其與順豐合作;在制造業(yè)方面,與吉利、北汽合作;在商業(yè)服務、家庭服務領域,已與海爾、聯(lián)想、世紀金源等企業(yè)達成合作。
![]()
在今年中關村論壇亮相的智能分揀機器人,就是星動紀元真干活機器人的代表。
日常工作中,它不僅能完成藥品、日化品、包裹的分揀及掃碼,還能完成“零部件抓取-高精度裝配-質(zhì)量檢測”等制造業(yè)場景的任務。
在商業(yè)服務領域,星動紀元的機器人負責門店客座清潔、物品遞送、導游導覽等工作。其中,部分場景效率當前達到70%~80%。
星動紀元做的事倒是很符合Benjie’s Olympics賽事的初衷:讓有用的機器人在這里誕生,讓只活在Demo里的技術(shù)永遠死去。
當越來越多的玩家從炫技轉(zhuǎn)向?qū)嵱茫瑫l(fā)現(xiàn)在機器人這場長跑里,真正的對手從來不是別人,而是那個人類習以為常、機器卻步履蹣跚的物理世界。
特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺“網(wǎng)易號”用戶上傳并發(fā)布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.