網(wǎng)易首頁 > 網(wǎng)易號(hào) > 正文申請入駐

自變量開源模型評(píng)測超pi0背后：具身智能的“涌現(xiàn)”時(shí)刻要來了嗎

2026-01-12 17:17:44　來源: 產(chǎn)業(yè)家

北京舉報(bào)

分享至

用開源生態(tài)評(píng)價(jià)開源模型，以開源模型驅(qū)動(dòng)行業(yè)生態(tài)繁榮，基于繁榮生態(tài)構(gòu)建更進(jìn)一步的產(chǎn)業(yè)發(fā)展飛輪。

作者|皮爺

出品|產(chǎn)業(yè)家

過去一周，具身智能賽道，來了一則新消息。

在第三方測評(píng)平臺(tái)RoboChallenge的榜單上，自變量開源端到端具身智能基礎(chǔ)模型WALL-OSS以54.69分的成績超越pi0，總分排名第二；此外，在疊洗碗巾、掛口杯、按按鈕、澆盆栽、移物入盒及開瓶器進(jìn)抽屜等多個(gè)單動(dòng)作任務(wù)中排名第一。

這個(gè)榜單驗(yàn)證了國產(chǎn)模型在復(fù)雜物理交互場景下的國際競爭力，也給具身智能產(chǎn)業(yè)人士帶來另外一個(gè)層面的期待：即在產(chǎn)業(yè)級(jí)開源模型的推動(dòng)下，具身智能產(chǎn)業(yè)能否迎來新的“百花齊放”？

在過去的幾年時(shí)間里，具身智能的創(chuàng)新進(jìn)步更多呈點(diǎn)狀分布，并沒有出現(xiàn)和通用場景相似的從“基礎(chǔ)模型—AIGC產(chǎn)品/Agent智能體”百花齊放的涌現(xiàn)時(shí)刻。

這次登榜的自變量開源WALL-OSS模型，讓大家看到一個(gè)新答案。

一、排名第二：

具身智能再迎開源國產(chǎn)新底座

具身智能模型測評(píng)和大語言模型測評(píng)不同。

前者測評(píng)更多為“閉卷答題”，以靜態(tài)數(shù)據(jù)輸出與文本、圖像指標(biāo)為主；而具身模型的測評(píng)更加側(cè)重“感知-決策-執(zhí)行”的物理閉環(huán)，在測評(píng)時(shí)需要提前公開任務(wù)，核心驗(yàn)證對象為視頻動(dòng)作序列和任務(wù)成功率，類似于“開卷考試+實(shí)操考核”。

因此，相較于閉源模型“黑盒黑箱式”的打榜方式，用公開代碼的開源具身智能模型參與測評(píng)，才是最貨真價(jià)實(shí)，也是最能反應(yīng)真實(shí)模型水平的評(píng)測方式。

這等同于把學(xué)霸的實(shí)時(shí)解題思路進(jìn)行全面公開，通過把模型代碼、訓(xùn)練數(shù)據(jù)乃至架構(gòu)設(shè)計(jì)公開，讓測評(píng)過程可全程復(fù)現(xiàn)。對比用閉源模型參與測評(píng)，也規(guī)避了通過微調(diào)其他模型來"刷榜"的行為，以更客觀、真實(shí)地反映模型能力，同時(shí)，“太陽底下”的答題也更支持所有人進(jìn)行任何角度地復(fù)現(xiàn)。

再來看這次自變量開源端到端具身智能基礎(chǔ)模型WALL-OSS的實(shí)測成績——根據(jù)模型測試結(jié)果，榜單總分前三依次是pi0.5、WALL-OSS、pi0。其中，WALL-OSS是唯一一個(gè)國內(nèi)開源具身基礎(chǔ)模型，且在疊洗碗巾、掛口杯、按按鈕、澆盆栽、移物入盒及開瓶器進(jìn)抽屜等多個(gè)考察模型綜合能力的單動(dòng)作任務(wù)中，WALL-OSS排名第一。

實(shí)際上，這些成績也在“意料之中”。

比如對于老生常談的“災(zāi)難性遺忘”和“模型解耦”問題，從單項(xiàng)任務(wù)的表現(xiàn)來看，WALL-OSS之前就已經(jīng)通過模型架構(gòu)創(chuàng)新，解決了VLM向VLA遷移的損耗問題；再比如在一系列涉及長序列執(zhí)行的任務(wù)中，其“先離散、后連續(xù)、再聯(lián)合”的三階段訓(xùn)練范式，讓模型可以具備更強(qiáng)的認(rèn)知和精準(zhǔn)物理動(dòng)作生成能力。

此外，其思維鏈能力，通過對不同陌生任務(wù)、陌生場景、多模態(tài)因素的任務(wù)適配，外界能更直觀地感受到WALL-OSS底層“統(tǒng)一跨層級(jí)思維鏈”獨(dú)特設(shè)計(jì)對于產(chǎn)品落地的強(qiáng)加持。

二、為什么具身智能基礎(chǔ)模型要走開源路線？

那么，為什么自變量要選擇開源路線，或者從行業(yè)的角度來看，具身智能基礎(chǔ)模型的開源有什么特殊意義？

實(shí)際上，早在去年9月，自變量就已經(jīng)對外進(jìn)行了基礎(chǔ)模型WALL-OSS的開源，在硅谷101播客中，自變量機(jī)器人聯(lián)合創(chuàng)始人&CTO王昊也曾一度闡明了自變量為何堅(jiān)持開源的初衷。

“我一直都覺得開源是非常重要的事情，開源意味著我們可以站在巨人的肩膀上繼續(xù)前進(jìn)。一般的高校、或者一些小型的企業(yè)，他們可能沒有能力去做基礎(chǔ)模型，但是如果能夠使用這些基礎(chǔ)開源模型，他們就可以去做應(yīng)用，把它用到各個(gè)方向，豐富整個(gè)生態(tài)，這也是一個(gè)非常重要的事情。”

值得一提的是，自變量基于WALL-OSS的開源是更為徹底的開源。

這次的開源模塊中，其對業(yè)界開放了詳細(xì)的模塊設(shè)計(jì)文檔、參數(shù)說明、環(huán)境搭建腳本，核心代碼注釋覆蓋率超80%；在環(huán)境模塊，WALL-OSS明確標(biāo)注所有依賴庫的精確版本，提供Docker鏡像一鍵部署；在工程化模塊，感知、決策、動(dòng)作模塊全部對外開放，內(nèi)置錯(cuò)誤處理和日志系統(tǒng)，支持調(diào)試時(shí)可快速定位問題。

此外，WALL-OSS也更開放了通用適配接口，支持全部主流機(jī)器人本體（夾爪、靈巧手），只需修改少量參數(shù)即可適配不同場景。

從開發(fā)者視角來看，這種足夠徹底的開源能夠極大降低開發(fā)者和從業(yè)者的工程成本和研發(fā)周期，而從行業(yè)視角來看，這種優(yōu)質(zhì)開源模型的徹底開源也更可以全面降低整個(gè)具身智能行業(yè)的創(chuàng)新成本，避免不同廠商和開發(fā)者“重復(fù)造輪子”的現(xiàn)象發(fā)生，推動(dòng)整個(gè)行業(yè)生態(tài)更加繁榮。

而這種繁榮一方面可以更一步推動(dòng)具身智能 “群體智慧”的涌現(xiàn)，讓具身智能基座模型貼近物理世界的速度更快；同時(shí)另一方面，也更可以加速“體”和“腦”基于生產(chǎn)力層面的結(jié)合，適配更多線下真實(shí)場景，推動(dòng)具身智能行業(yè)“旺盛需求—有效供給”的產(chǎn)業(yè)迭代發(fā)展。

用開源生態(tài)評(píng)價(jià)開源模型，以開源模型驅(qū)動(dòng)行業(yè)生態(tài)繁榮，基于繁榮生態(tài)構(gòu)建更進(jìn)一步的產(chǎn)業(yè)發(fā)展飛輪。唯有如此，具身智能才能從碎片化走向群體智慧，從實(shí)驗(yàn)室走向真實(shí)物理的千行百業(yè)。

特別聲明：以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺(tái)“網(wǎng)易號(hào)”用戶上傳并發(fā)布，本平臺(tái)僅提供信息存儲(chǔ)服務(wù)。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.