![]()
近日,全球首個(gè)大規(guī)模多任務(wù)的真機(jī)基準(zhǔn)測(cè)試平臺(tái)RoboChallenge榜單更新,前三名依次為pi0.5、WALL-OSS和pi0。
科普時(shí)間到,pi0.5、pi0是出自美國(guó)公司 Physical Intelliqence的操作大模型,WALL-OSS是出自中國(guó)自變量機(jī)器人的全自研開(kāi)源操作大模型,不僅能完成操作,而且能同時(shí)生成復(fù)雜推理過(guò)程。
這一結(jié)果釋放出強(qiáng)烈的信號(hào)。很長(zhǎng)一段時(shí)間內(nèi),中國(guó)具身智能產(chǎn)業(yè)陷入“大腦缺位”的爭(zhēng)議:我們有較強(qiáng)的本體結(jié)構(gòu)設(shè)計(jì)和運(yùn)控算法,但很難讓機(jī)器人真正“用腦思考”,自主與物理世界交互,進(jìn)而帶來(lái)創(chuàng)造生產(chǎn)力的可能。但現(xiàn)在,中國(guó)具身智能模型已經(jīng)與海外頂級(jí)模型同臺(tái)共舞。
更有意思的是,自變量和pi高度默契地選擇將模型開(kāi)源。看似偶然的戰(zhàn)略趨同,實(shí)則是具身智能產(chǎn)業(yè)發(fā)展到關(guān)鍵階段的必然選擇。
![]()
在RoboChallenge的最新測(cè)試中,自變量WALL-OSS展現(xiàn)了極強(qiáng)的競(jìng)技狀態(tài),總分位居第二,超越了明星模型pi0。在疊洗碗巾、按按鈕、澆盆栽等多個(gè)任務(wù)中,WALL-OSS的得分摘得桂冠,排名第一。
![]()
先來(lái)劃個(gè)重點(diǎn)。
RoboChallenge的測(cè)試或許更像是一場(chǎng)“開(kāi)卷考試”,因?yàn)閿?shù)十個(gè)桌面任務(wù)與場(chǎng)景都是預(yù)知的。這就相當(dāng)于提前布置考題。
而WALL-OSS作為開(kāi)源模型,某種程度上相當(dāng)于明牌上場(chǎng),其每一步操作都真實(shí)可見(jiàn)為模型驅(qū)動(dòng),更多的意義在于給出解題思路,“進(jìn)一步展示模型的真實(shí)性能”。
與用閉源模型參與測(cè)評(píng)的“黑箱”,不知任務(wù)究竟如何完成不同,WALL-OSS作為開(kāi)源模型,其一舉一動(dòng)相當(dāng)于“明牌”炸場(chǎng),換句話說(shuō)其核心能力均可通過(guò)公開(kāi)的代碼和參數(shù)得到完整解釋和復(fù)現(xiàn),其在榜單上的成績(jī)完全是模型真實(shí)能力的直接體現(xiàn),是無(wú)法摻水,難以被“操作”的硬核實(shí)力證明。
從技術(shù)細(xì)節(jié)來(lái)看,WALL-OSS取得優(yōu)異成績(jī)的核心在于對(duì)“端到端”架構(gòu)的深度重構(gòu):
![]()
它依托創(chuàng)新的混合專家(MoE)架構(gòu)及“共享注意力+專家分流”設(shè)計(jì),有效解決了視覺(jué)語(yǔ)言模型向具身模型遷移時(shí)的“災(zāi)難性遺忘”與“模態(tài)解耦”難題;
通過(guò)“先離散、后連續(xù)、再聯(lián)合”的三階段訓(xùn)練范式,消除了“認(rèn)知與動(dòng)作脫節(jié)”的痛點(diǎn),使模型能精準(zhǔn)掌控如澆盆栽時(shí)的動(dòng)作力度;
此外,其內(nèi)化的跨層級(jí)思維鏈推理能力,實(shí)現(xiàn)了高層決策與底層執(zhí)行的無(wú)縫切換,使其在面對(duì)各類突發(fā)狀況時(shí),仍能精準(zhǔn)控制關(guān)節(jié)完成復(fù)雜任務(wù)。
有個(gè)小插曲,WALL-OSS去年9月開(kāi)源,與Physical Intelligence開(kāi)源pi0.5相錯(cuò)一天,這也側(cè)面說(shuō)明了自變量的技術(shù)步調(diào)一直與國(guó)際頭部具身大腦公司同頻。而今天自變量與Physical Intelligence的模型又在榜單前排聚首,更說(shuō)明自變量已經(jīng)站穩(wěn)了全球第一梯隊(duì)。
![]()
開(kāi)源之所以重要,在于生態(tài)建設(shè),其價(jià)值最終體現(xiàn)在生態(tài)的繁榮之上。
自變量認(rèn)為,在具身智能這一軟硬件深度耦合的前沿領(lǐng)域,構(gòu)建一個(gè)高質(zhì)量的開(kāi)源基礎(chǔ)模型底座,是加速整個(gè)行業(yè)生態(tài)繁榮的堅(jiān)實(shí)“地基”,也是實(shí)現(xiàn)機(jī)器人在物理世界大規(guī)模、穩(wěn)定交互的關(guān)鍵。
當(dāng)前,機(jī)器人模型的驗(yàn)證鏈路冗長(zhǎng),行業(yè)里專用小模型、通用大模型質(zhì)量參差不齊,基礎(chǔ)模型、專用模型、微調(diào)模型混雜,且缺乏統(tǒng)一的評(píng)價(jià)標(biāo)準(zhǔn)。開(kāi)源是撥開(kāi)迷霧、推動(dòng)行業(yè)標(biāo)準(zhǔn)化和成熟化的必由之路。
在《硅谷101播客》中,自變量聯(lián)合創(chuàng)始人兼CTO王昊曾說(shuō):“我一直都覺(jué)得開(kāi)源是非常重要的事情,開(kāi)源意味著我們可以站在巨人的肩膀上繼續(xù)前進(jìn)。我們可以基于已有成果做更多的改進(jìn),社區(qū)開(kāi)發(fā)者的反饋也會(huì)幫助到開(kāi)源的公司,開(kāi)源公司可以從中吸取到經(jīng)驗(yàn),然后把這個(gè)技術(shù)路線思考得更加深入。”
![]()
自變量開(kāi)源的WALL-OSS正是秉承這種“提供肩膀”的開(kāi)源理念,所以他們選擇更為徹底的開(kāi)放:不僅開(kāi)放了預(yù)訓(xùn)練模型權(quán)重、完整訓(xùn)練代碼和數(shù)據(jù)集接口,甚至還提供了詳盡的部署文檔。
除了構(gòu)建行業(yè)繁榮生態(tài)之外,“站在巨人肩膀上”還在于避免行業(yè)陷入重復(fù)性研發(fā)的低效困境——無(wú)需每個(gè)企業(yè)、每個(gè)研究者都從零開(kāi)始“一手手自建高樓”,而是可以基于開(kāi)源的基礎(chǔ)模型快速迭代創(chuàng)新,將更多精力投入到差異化技術(shù)研發(fā)與場(chǎng)景化應(yīng)用落地中,大幅提升整個(gè)行業(yè)的創(chuàng)新效率。
黃仁勛也曾直白說(shuō)過(guò),“開(kāi)源如此重要的原因,在于沒(méi)有開(kāi)源初創(chuàng)企業(yè)不能蓬勃發(fā)展,大學(xué)研究人員不能做研究,科學(xué)家不能使用人工智能。基本上,你的經(jīng)濟(jì)沒(méi)有能力從根本上提升自己”。這不僅適用于AI,對(duì)于具身智能和任何技術(shù)來(lái)說(shuō)都是如此。
![]()
事實(shí)上,技術(shù)革命的背后就是一場(chǎng)技術(shù)大規(guī)模應(yīng)用并改變生產(chǎn)方式的過(guò)程。如果沒(méi)有應(yīng)用也就把技術(shù)困厄于象牙塔,無(wú)法激起漣漪。
如自變量所說(shuō)“擁抱開(kāi)源,以透明對(duì)抗虛假,以協(xié)作代替閉門造車”,具身行業(yè)這條厚雪長(zhǎng)坡上,需要的是明燈而非迷霧,眾人拾柴而非孤芳自賞。而開(kāi)源,正是那盞能夠照亮前路、匯聚眾力的燈。
![]()
特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺(tái)“網(wǎng)易號(hào)”用戶上傳并發(fā)布,本平臺(tái)僅提供信息存儲(chǔ)服務(wù)。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.