從實(shí)驗(yàn)室里的翻跟頭、定點(diǎn)動作演示,到真實(shí)場景中穩(wěn)定完成復(fù)雜任務(wù),具身智能的商業(yè)化落地,始終被一道核心門檻牢牢卡住——訓(xùn)練數(shù)據(jù)的規(guī)模化供給與跨主體流通。這一全行業(yè)的共性痛點(diǎn),正在引發(fā)新一輪的技術(shù)路線探索與產(chǎn)業(yè)布局調(diào)整。
4月16日,京東對外公布行業(yè)首個(gè)具身智能數(shù)據(jù)全鏈路基礎(chǔ)設(shè)施,成為繼英偉達(dá)等國際廠商之后,又一家從數(shù)據(jù)底層切入行業(yè)的頭部企業(yè)。在發(fā)布會后的媒體群訪中,京東集團(tuán)副總裁、京東云基礎(chǔ)云業(yè)務(wù)部負(fù)責(zé)人龔義成、京東具身智能研究員李一航詳解了其技術(shù)路線與布局邏輯,而這一系列動作,本質(zhì)上是國內(nèi)具身智能產(chǎn)業(yè)在數(shù)據(jù)瓶頸下的集體探索縮影,折射出行業(yè)早期階段的生態(tài)探索。
全行業(yè)共性堵點(diǎn):遙操作模式觸頂,數(shù)據(jù)供給陷入死循環(huán)
當(dāng)前全球具身智能產(chǎn)業(yè)仍處于商業(yè)化落地的前夜,一個(gè)無法回避的行業(yè)現(xiàn)狀是:絕大多數(shù)機(jī)器人產(chǎn)品仍停留在演示階段,只能在限定環(huán)境中完成預(yù)設(shè)動作,一旦進(jìn)入真實(shí)場景,泛化能力便大幅下滑,無法穩(wěn)定解決實(shí)際問題。
“具身機(jī)器人的大腦智能化程度偏低,核心問題就是具身模型訓(xùn)練缺乏規(guī)模化高質(zhì)量數(shù)據(jù)集。”龔義成在采訪中直言,行業(yè)沿用多年的遙操作數(shù)據(jù)采集模式,已經(jīng)走到了規(guī)模化的天花板,這是全行業(yè)共同面對的瓶頸。
所謂遙操作,即由專人通過手柄等設(shè)備操控機(jī)器人,同步采集抓拿取放等動作數(shù)據(jù),用于模型訓(xùn)練。這一模式存在兩個(gè)天然的、無法突破的短板。其一,數(shù)據(jù)規(guī)模無法起量;其二,數(shù)據(jù)孤島問題無解。
2026年被業(yè)內(nèi)多位從業(yè)者定義為“具身數(shù)據(jù)元年”,本質(zhì)上是行業(yè)對數(shù)據(jù)的需求,已經(jīng)從“補(bǔ)充項(xiàng)”變成了“生存項(xiàng)”。面對遙操作模式的天花板,全球范圍內(nèi)的頭部企業(yè)與科研機(jī)構(gòu),均開始轉(zhuǎn)向人類第一視角(Ego)數(shù)據(jù)的技術(shù)路線探索,即通過采集人類在真實(shí)場景中完成動作的第一視角視頻數(shù)據(jù),訓(xùn)練具身模型,京東也是這一路線的入局者之一。
龔義成表示,人類第一視角真實(shí)場景數(shù)據(jù),是解決具身模型規(guī)模化訓(xùn)練的重要一環(huán),但這條路線的落地,并非簡單的視頻采集,而是需要解決采集設(shè)備、數(shù)據(jù)質(zhì)量、配套基礎(chǔ)設(shè)施三大全行業(yè)空白,這也是所有入局者共同面對的挑戰(zhàn)。
“既要在真實(shí)場景下實(shí)現(xiàn)規(guī)模化數(shù)據(jù)采集,同時(shí)還要兼顧成本與數(shù)據(jù)質(zhì)量。”龔義成介紹,京東為此自研了第一視角采集設(shè)備JoyEgoCam,核心是解決采集環(huán)節(jié)的落地難題。
數(shù)據(jù)質(zhì)量也是全行業(yè)普遍踩坑的環(huán)節(jié),大量企業(yè)盲目堆高數(shù)據(jù)采集時(shí)長,卻忽略了質(zhì)量管控,最終導(dǎo)致數(shù)據(jù)無法轉(zhuǎn)化為模型能力。龔義成舉例,在模型試驗(yàn)中存在這樣的情況,比如用1000小時(shí)高質(zhì)量數(shù)據(jù)訓(xùn)練,模型任務(wù)準(zhǔn)確率很高,但后續(xù)再喂入1000小時(shí)低質(zhì)量數(shù)據(jù)后,模型準(zhǔn)確率反而下降。
龔義成在采訪中直言,低質(zhì)量數(shù)據(jù)對模型不僅沒有價(jià)值,甚至?xí)a(chǎn)生反作用。李一航透露,京東將從三方面保障數(shù)據(jù)質(zhì)量:一是采集設(shè)備參數(shù)貼近人類視覺特性,保證原始數(shù)據(jù)質(zhì)量;二是盡可能地保證多樣性的采集,并開展人工與算法質(zhì)檢與合規(guī)檢查,剔除不合格、不多樣的數(shù)據(jù);三是通過自研數(shù)據(jù)處理管線,將采集數(shù)據(jù)轉(zhuǎn)化為高精度、可直接用于模型訓(xùn)練的標(biāo)注數(shù)據(jù)。
龔義成表示,京東已搭建了從數(shù)據(jù)采集、清洗、自動化標(biāo)注到模型訓(xùn)練的全鏈路基礎(chǔ)設(shè)施,其中包括業(yè)內(nèi)首家支持具身智能千卡級LeRobot開源訓(xùn)練框架的AI開發(fā)平臺,核心就是解決大規(guī)模第一視角數(shù)據(jù)的落地應(yīng)用難題。
值得注意的是,京東并非這條路線的唯一入局者。英偉達(dá)今年推出的EgoScale已經(jīng)驗(yàn)證了第一視角數(shù)據(jù)的有效性,國內(nèi)多家機(jī)器人企業(yè)、科研機(jī)構(gòu)也已啟動相關(guān)布局,行業(yè)路線分化已經(jīng)顯現(xiàn),但所有路線都仍處于早期驗(yàn)證階段,尚未有哪條路線被證明可以完全支撐具身智能的規(guī)模化落地。
數(shù)據(jù)孤島制約發(fā)展,核心優(yōu)勢則在于場景豐富
目前行業(yè)內(nèi)的主流模式,是各家機(jī)器人企業(yè)自建數(shù)據(jù)采集團(tuán)隊(duì)、封閉自有數(shù)據(jù)集,數(shù)據(jù)僅內(nèi)部使用。
這也是京東此次布局的核心落點(diǎn):放棄單一數(shù)據(jù)提供商的定位,轉(zhuǎn)向搭建開放的行業(yè)生態(tài)。“京東不可能把所有場景的數(shù)據(jù)都采集完,這件事必須依賴全行業(yè)的合作伙伴一起完成。”龔義成明確表示,其核心目標(biāo)是聯(lián)合行業(yè)共建具身智能數(shù)據(jù)聯(lián)盟,打破數(shù)據(jù)孤島,通過數(shù)據(jù)的開放流通,降低全行業(yè)的研發(fā)成本。
此前行業(yè)內(nèi)的數(shù)據(jù)集開放,多為科研機(jī)構(gòu)的開源項(xiàng)目,或企業(yè)的有限度開源,尚未形成成熟的商業(yè)化流通體系。但需要正視的是,這一模式能否跑通,仍存在大量未知數(shù):數(shù)據(jù)的知識產(chǎn)權(quán)歸屬、合規(guī)流通規(guī)則、定價(jià)體系、隱私安全保障,均是行業(yè)尚未形成共識的難題。
盡管行業(yè)熱度持續(xù)攀升,資本與產(chǎn)業(yè)投入不斷加大,但多位從業(yè)者在采訪中坦言,全球具身智能產(chǎn)業(yè)仍處于早期發(fā)展階段。
談到規(guī)模化落地,李一航表示,在物流等對效率、時(shí)效要求極高的場景中,具身智能想要真正落地,任務(wù)成功率至少要達(dá)到99%,甚至99.9%;而在家庭、導(dǎo)購、接待等泛家庭場景中,只要能解決90%的問題,即便達(dá)不到極高的成功率,也已經(jīng)具備落地應(yīng)用的價(jià)值。
行業(yè)內(nèi)一直存在不同聲音:有觀點(diǎn)認(rèn)為,當(dāng)前行業(yè)過分關(guān)注數(shù)據(jù)規(guī)模,忽略了模型架構(gòu)、算法創(chuàng)新的核心價(jià)值;也有觀點(diǎn)質(zhì)疑,大語言模型領(lǐng)域的Scaling Law(縮放定律),在具身智能領(lǐng)域是否依然適用。
李一航表示,在具身方向遠(yuǎn)沒有到Scaling Up(規(guī)模化)非常強(qiáng)的地步,數(shù)據(jù)量級和大語言模型、一般多模態(tài)模型相比差很多量級,確實(shí)能夠觀察到隨著數(shù)據(jù)量級的擴(kuò)充,具身模型泛化能力還在指數(shù)級別的提升,多條路線仍有極大探索空間。
而在全球產(chǎn)業(yè)格局上,龔義成判斷,目前行業(yè)整體處于比較早期的階段,中國的核心優(yōu)勢在于場景豐富和創(chuàng)新性落地,作為制造業(yè)強(qiáng)國擁有豐富多樣的應(yīng)用場景,同時(shí)在機(jī)器人本體、硬件、小腦等方面具備較強(qiáng)實(shí)力。
此外,人才爭奪與技術(shù)對就業(yè)的影響也是行業(yè)無法回避的議題。當(dāng)前行業(yè)對人才需求迫切。龔義成透露,目前團(tuán)隊(duì)在具身智能相關(guān)領(lǐng)域招聘人才時(shí),核心要求是必須對AI有深刻理解,是AI的使用者與擁抱者,能夠熟練用好AI工具,這也是行業(yè)普遍的人才需求趨勢。
新京報(bào)貝殼財(cái)經(jīng)記者程子姣
編輯 岳彩周
校對 吳興發(fā)
特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺“網(wǎng)易號”用戶上傳并發(fā)布,本平臺僅提供信息存儲服務(wù)。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.