![]()
用開源生態(tài)評(píng)價(jià)開源模型,以開源模型驅(qū)動(dòng)行業(yè)生態(tài)繁榮,基于繁榮生態(tài)構(gòu)建更進(jìn)一步的產(chǎn)業(yè)發(fā)展飛輪。
作者|皮爺
出品|產(chǎn)業(yè)家
過去一周,具身智能賽道,來了一則新消息。
在第三方測評(píng)平臺(tái)RoboChallenge的榜單上,自變量開源端到端具身智能基礎(chǔ)模型WALL-OSS以54.69分的成績超越pi0,總分排名第二;此外,在疊洗碗巾、掛口杯、按按鈕、澆盆栽、移物入盒及開瓶器進(jìn)抽屜等多個(gè)單動(dòng)作任務(wù)中排名第一。
![]()
這個(gè)榜單驗(yàn)證了國產(chǎn)模型在復(fù)雜物理交互場景下的國際競爭力,也給具身智能產(chǎn)業(yè)人士帶來另外一個(gè)層面的期待:即在產(chǎn)業(yè)級(jí)開源模型的推動(dòng)下,具身智能產(chǎn)業(yè)能否迎來新的“百花齊放”?
在過去的幾年時(shí)間里,具身智能的創(chuàng)新進(jìn)步更多呈點(diǎn)狀分布,并沒有出現(xiàn)和通用場景相似的從“基礎(chǔ)模型—AIGC產(chǎn)品/Agent智能體”百花齊放的涌現(xiàn)時(shí)刻。
這次登榜的自變量開源WALL-OSS模型,讓大家看到一個(gè)新答案。
一、排名第二:
具身智能再迎開源國產(chǎn)新底座
具身智能模型測評(píng)和大語言模型測評(píng)不同。
前者測評(píng)更多為“閉卷答題”,以靜態(tài)數(shù)據(jù)輸出與文本、圖像指標(biāo)為主;而具身模型的測評(píng)更加側(cè)重“感知-決策-執(zhí)行”的物理閉環(huán),在測評(píng)時(shí)需要提前公開任務(wù),核心驗(yàn)證對象為視頻動(dòng)作序列和任務(wù)成功率,類似于“開卷考試+實(shí)操考核”。
因此,相較于閉源模型“黑盒黑箱式”的打榜方式,用公開代碼的開源具身智能模型參與測評(píng),才是最貨真價(jià)實(shí),也是最能反應(yīng)真實(shí)模型水平的評(píng)測方式。
這等同于把學(xué)霸的實(shí)時(shí)解題思路進(jìn)行全面公開,通過把模型代碼、訓(xùn)練數(shù)據(jù)乃至架構(gòu)設(shè)計(jì)公開,讓測評(píng)過程可全程復(fù)現(xiàn)。對比用閉源模型參與測評(píng),也規(guī)避了通過微調(diào)其他模型來"刷榜"的行為,以更客觀、真實(shí)地反映模型能力,同時(shí),“太陽底下”的答題也更支持所有人進(jìn)行任何角度地復(fù)現(xiàn)。
再來看這次自變量開源端到端具身智能基礎(chǔ)模型WALL-OSS的實(shí)測成績——根據(jù)模型測試結(jié)果,榜單總分前三依次是pi0.5、WALL-OSS、pi0。其中,WALL-OSS是唯一一個(gè)國內(nèi)開源具身基礎(chǔ)模型,且在疊洗碗巾、掛口杯、按按鈕、澆盆栽、移物入盒及開瓶器進(jìn)抽屜等多個(gè)考察模型綜合能力的單動(dòng)作任務(wù)中,WALL-OSS排名第一。
![]()
實(shí)際上,這些成績也在“意料之中”。
比如對于老生常談的“災(zāi)難性遺忘”和“模型解耦”問題,從單項(xiàng)任務(wù)的表現(xiàn)來看,WALL-OSS之前就已經(jīng)通過模型架構(gòu)創(chuàng)新,解決了VLM向VLA遷移的損耗問題;再比如在一系列涉及長序列執(zhí)行的任務(wù)中,其“先離散、后連續(xù)、再聯(lián)合”的三階段訓(xùn)練范式,讓模型可以具備更強(qiáng)的認(rèn)知和精準(zhǔn)物理動(dòng)作生成能力。
此外,其思維鏈能力,通過對不同陌生任務(wù)、陌生場景、多模態(tài)因素的任務(wù)適配,外界能更直觀地感受到WALL-OSS底層“統(tǒng)一跨層級(jí)思維鏈”獨(dú)特設(shè)計(jì)對于產(chǎn)品落地的強(qiáng)加持。
二、為什么具身智能基礎(chǔ)模型要走開源路線?
那么,為什么自變量要選擇開源路線,或者從行業(yè)的角度來看,具身智能基礎(chǔ)模型的開源有什么特殊意義?
實(shí)際上,早在去年9月,自變量就已經(jīng)對外進(jìn)行了基礎(chǔ)模型WALL-OSS的開源,在硅谷101播客中,自變量機(jī)器人聯(lián)合創(chuàng)始人&CTO王昊也曾一度闡明了自變量為何堅(jiān)持開源的初衷。
“我一直都覺得開源是非常重要的事情,開源意味著我們可以站在巨人的肩膀上繼續(xù)前進(jìn)。一般的高校、或者一些小型的企業(yè),他們可能沒有能力去做基礎(chǔ)模型,但是如果能夠使用這些基礎(chǔ)開源模型,他們就可以去做應(yīng)用,把它用到各個(gè)方向,豐富整個(gè)生態(tài),這也是一個(gè)非常重要的事情。”
值得一提的是,自變量基于WALL-OSS的開源是更為徹底的開源。
這次的開源模塊中,其對業(yè)界開放了詳細(xì)的模塊設(shè)計(jì)文檔、參數(shù)說明、環(huán)境搭建腳本,核心代碼注釋覆蓋率超80%;在環(huán)境模塊,WALL-OSS明確標(biāo)注所有依賴庫的精確版本,提供Docker鏡像一鍵部署;在工程化模塊,感知、決策、動(dòng)作模塊全部對外開放,內(nèi)置錯(cuò)誤處理和日志系統(tǒng),支持調(diào)試時(shí)可快速定位問題。
此外,WALL-OSS也更開放了通用適配接口,支持全部主流機(jī)器人本體(夾爪、靈巧手),只需修改少量參數(shù)即可適配不同場景。
從開發(fā)者視角來看,這種足夠徹底的開源能夠極大降低開發(fā)者和從業(yè)者的工程成本和研發(fā)周期,而從行業(yè)視角來看,這種優(yōu)質(zhì)開源模型的徹底開源也更可以全面降低整個(gè)具身智能行業(yè)的創(chuàng)新成本,避免不同廠商和開發(fā)者“重復(fù)造輪子”的現(xiàn)象發(fā)生,推動(dòng)整個(gè)行業(yè)生態(tài)更加繁榮。
而這種繁榮一方面可以更一步推動(dòng)具身智能 “群體智慧”的涌現(xiàn),讓具身智能基座模型貼近物理世界的速度更快;同時(shí)另一方面,也更可以加速“體”和“腦”基于生產(chǎn)力層面的結(jié)合,適配更多線下真實(shí)場景,推動(dòng)具身智能行業(yè)“旺盛需求—有效供給”的產(chǎn)業(yè)迭代發(fā)展。
用開源生態(tài)評(píng)價(jià)開源模型,以開源模型驅(qū)動(dòng)行業(yè)生態(tài)繁榮,基于繁榮生態(tài)構(gòu)建更進(jìn)一步的產(chǎn)業(yè)發(fā)展飛輪。唯有如此,具身智能才能從碎片化走向群體智慧,從實(shí)驗(yàn)室走向真實(shí)物理的千行百業(yè)。
特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺(tái)“網(wǎng)易號(hào)”用戶上傳并發(fā)布,本平臺(tái)僅提供信息存儲(chǔ)服務(wù)。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.