![]()
![]()
鹿明要為具身行業(yè)建一所“UMI數(shù)據(jù)超市”。
作者 |江宇
編輯 |漠影
過(guò)去一年,具身智能賽道在模型、硬件和應(yīng)用層面不斷取得進(jìn)展,一個(gè)共識(shí)正在業(yè)內(nèi)逐漸形成:真正限制具身智能進(jìn)一步Scale的,是真實(shí)、可復(fù)用的數(shù)據(jù)。
“目前機(jī)器人領(lǐng)域的發(fā)展,核心還是離不開(kāi)訓(xùn)練數(shù)據(jù),”在近期的一次公開(kāi)分享中,宇樹(shù)科技創(chuàng)始人王興興這樣概括他對(duì)具身行業(yè)的判斷。
也正因如此,數(shù)據(jù)問(wèn)題正在成為具身智能進(jìn)一步擴(kuò)展能力邊界時(shí),繞不開(kāi)的核心約束。正是在這樣的背景下,鹿明機(jī)器人選擇了一條不一樣的路。
近日,鹿明機(jī)器人發(fā)布全球首款背包版UMI數(shù)采設(shè)備FastUMI Pro(背包版),并同步啟動(dòng)真實(shí)場(chǎng)景數(shù)據(jù)采集計(jì)劃。
![]()
按照規(guī)劃,鹿明將在多個(gè)城市投放1萬(wàn)臺(tái)背包版FastUMI Pro,進(jìn)入工業(yè)、家庭、酒店、餐館、商場(chǎng)、辦公等六大真實(shí)場(chǎng)景,目標(biāo)直指百萬(wàn)小時(shí)級(jí)數(shù)據(jù)量,構(gòu)建面向具身智能訓(xùn)練的規(guī)模化數(shù)據(jù)基礎(chǔ)設(shè)施。與此同時(shí),鹿明“FastUMI Pro數(shù)據(jù)超市”也將上線。
這一動(dòng)作,也讓鹿明首次以“數(shù)據(jù)基礎(chǔ)設(shè)施建設(shè)者”與“具身智能送水人”的身份,站到了具身智能行業(yè)的聚光燈下。
圍繞該數(shù)采計(jì)劃,機(jī)器人前瞻也與鹿明機(jī)器人聯(lián)席CTO丁琰進(jìn)行了交流。
丁琰將這一選擇概括為一次“工程階段的推進(jìn)”,要將采集推向更真實(shí)、更復(fù)雜的場(chǎng)景,讓數(shù)據(jù)真正覆蓋模型未來(lái)要面對(duì)的真實(shí)世界。
01.
當(dāng)模型開(kāi)始“卡在數(shù)據(jù)上”
具身智能不得不正視真實(shí)世界
在具身智能逐步走向真實(shí)應(yīng)用的過(guò)程中,數(shù)據(jù)的局限往往比模型能力更早暴露出來(lái)。
丁琰把數(shù)據(jù)采集拆成了清晰的階段:第一階段在數(shù)采場(chǎng)的里做采集,光線、環(huán)境、背景、人員管理都可控。
他提到,鹿明機(jī)器人在這一階段持續(xù)完善采集SOP、采集軟件與硬件迭代,以及對(duì)數(shù)據(jù)質(zhì)量的評(píng)估機(jī)制,“基本上在數(shù)采廠里可以實(shí)現(xiàn)自動(dòng)運(yùn)轉(zhuǎn)”。
但當(dāng)任務(wù)難度抬升,模型開(kāi)始被迫面對(duì)更復(fù)雜的物理約束與環(huán)境噪聲時(shí),可控場(chǎng)景的數(shù)據(jù)分布很快會(huì)顯出邊界。
丁琰的一個(gè)判斷是:之所以行業(yè)里會(huì)出現(xiàn)仿真、視頻、強(qiáng)化學(xué)習(xí)等多種數(shù)據(jù)路線,很大程度上是因?yàn)椴簧偃蝿?wù)在早期還相對(duì)簡(jiǎn)單,多種方式“看起來(lái)都能做”。可一旦進(jìn)入更真實(shí)、更凌亂的作業(yè)場(chǎng)景,數(shù)據(jù)的真實(shí)性與一致性就會(huì)變成硬約束。
他舉了工廠質(zhì)檢場(chǎng)景為例:這不是在實(shí)驗(yàn)室里“干凈環(huán)境”的抓取,是在復(fù)雜工況里完成更強(qiáng)約束的操作與判斷,“如果只是做一些簡(jiǎn)單的仿真,或者其他東西就已經(jīng)很難去滿足這種客戶的要求了”。
在他看來(lái),這也是為什么真實(shí)、可靠的真機(jī)數(shù)據(jù)最終不可回避:視頻數(shù)據(jù)可以訓(xùn)練“看懂世界”,仿真可以擴(kuò)展一定的組合空間,但當(dāng)目標(biāo)是“上手干活”,與物理世界交互的那部分能力,最終還是要靠真實(shí)交互數(shù)據(jù)來(lái)支撐。
換句話說(shuō),隨著任務(wù)復(fù)雜度上升,數(shù)據(jù)問(wèn)題是決定模型能否繼續(xù)往前走的底層條件。
02.
為什么是背包形態(tài)?
讓數(shù)據(jù)從數(shù)采場(chǎng)走向真實(shí)場(chǎng)景
當(dāng)“走進(jìn)真實(shí)世界”成為下一階段的共識(shí),新的問(wèn)題隨之出現(xiàn):真實(shí)場(chǎng)景數(shù)據(jù)如何穩(wěn)定采到、如何在采集當(dāng)下就判斷好壞、如何把采集與后續(xù)訓(xùn)練推理打通?
丁琰解釋稱:背包是一種“很天然的形態(tài)”。對(duì)UMI這種多傳感器采集系統(tǒng)而言,如果把數(shù)據(jù)完全離線存下來(lái),數(shù)據(jù)量與吞吐會(huì)很可怕,很難有一個(gè)很好的離線存儲(chǔ)的方式,因此需要把數(shù)據(jù)落到隨身的計(jì)算單元上。
更關(guān)鍵的是,背包里的“小電腦”不只是存儲(chǔ)節(jié)點(diǎn),也是質(zhì)量評(píng)估與任務(wù)管理節(jié)點(diǎn)。
丁琰強(qiáng)調(diào),鹿明團(tuán)隊(duì)非常看重數(shù)據(jù)質(zhì)量,希望采完一條數(shù)據(jù)能即時(shí)做質(zhì)量評(píng)估,告訴采集者好還是不好、為什么不好,否則采了一天的數(shù)據(jù)可能都是廢掉的,而且在較長(zhǎng)時(shí)間里都不知道問(wèn)題出在哪里。
背包形態(tài)使得這種“邊采邊評(píng)估”成為可能,同時(shí)也方便任務(wù)分配、打卡登記與人員管理。再疊加8小時(shí)續(xù)航,背包版FastUMI Pro在形態(tài)上更像一套可移動(dòng)的標(biāo)準(zhǔn)數(shù)采工作站,讓采集真正能夠從可控場(chǎng)地走進(jìn)工廠、酒店、餐館等開(kāi)放環(huán)境。
03.
萬(wàn)臺(tái)級(jí)真實(shí)場(chǎng)景采集
“大規(guī)模”背后是行業(yè)稀缺的工程能力
萬(wàn)臺(tái)設(shè)備、六大場(chǎng)景、百萬(wàn)小時(shí)真機(jī)數(shù)據(jù)量,本身就是一個(gè)足以引發(fā)行業(yè)關(guān)注的數(shù)字。
但更值得討論的,它隱含的門檻:當(dāng)采集從少量樣本進(jìn)入規(guī)模化階段,真正決定上限的往往是數(shù)據(jù)體系能否持續(xù)復(fù)用、持續(xù)擴(kuò)展。
丁琰提到,鹿明之所以選擇在這個(gè)時(shí)間點(diǎn)把采集推向真實(shí)場(chǎng)景,是因?yàn)?strong>鹿明已經(jīng)完成了數(shù)采第一階段——自建“數(shù)采場(chǎng)”采集體系的打磨。光線、環(huán)境、人員管理全部可控,采集SOP、軟件系統(tǒng)、硬件迭代、數(shù)據(jù)質(zhì)量評(píng)估體系等條件全部具備。
同時(shí),業(yè)務(wù)側(cè)也出現(xiàn)了明確的牽引:鹿明機(jī)器人在交付了100萬(wàn)條數(shù)據(jù)后,客戶開(kāi)始提出更進(jìn)階的需求,希望獲得真實(shí)場(chǎng)景的數(shù)據(jù),這推動(dòng)團(tuán)隊(duì)去探索更有價(jià)值、更有難度的采集方式。
放在具身智能行業(yè),丁琰的判斷是:不同團(tuán)隊(duì)在數(shù)據(jù)管線(數(shù)據(jù)生產(chǎn)、數(shù)據(jù)質(zhì)量評(píng)估、數(shù)據(jù)治理以及訓(xùn)練形態(tài))上,差異可能比外界想象得更早出現(xiàn)。
他把這稱為“數(shù)據(jù)決定的東西很多”:一旦選擇了某種數(shù)據(jù)管道,后續(xù)很多算法研究與訓(xùn)練方式都會(huì)隨之變化。
更重要的是,鹿明所選擇的“無(wú)本體”采集方式在速度、擴(kuò)展性和一致性上更容易形成積累優(yōu)勢(shì):采集更快,數(shù)據(jù)積累速度更快;傳感器模態(tài)的擴(kuò)展更順滑,數(shù)據(jù)處理管線也更容易復(fù)用;采(數(shù)據(jù)采集)、訓(xùn)(策略訓(xùn)練)、推(模型推理)在同一交互形態(tài)下保持一致,有利于把現(xiàn)場(chǎng)“不會(huì)的任務(wù)”更快轉(zhuǎn)化為可用策略。
這些點(diǎn)共同構(gòu)成了鹿明這番“大規(guī)模”動(dòng)作的用意:把真實(shí)世界的復(fù)雜性變成一套可運(yùn)行的工程系統(tǒng),并且讓系統(tǒng)能夠長(zhǎng)時(shí)間、跨場(chǎng)景地穩(wěn)定產(chǎn)出。
04.
“采–訓(xùn)–推”閉環(huán)
是數(shù)據(jù)基礎(chǔ)設(shè)施的核心能力
數(shù)據(jù)的價(jià)值,最終取決于它能否被快速轉(zhuǎn)化為模型能力。如果僅從產(chǎn)品層面看,F(xiàn)astUMI Pro是一套數(shù)采軟硬件系統(tǒng),但從鹿明機(jī)器人的戰(zhàn)略路線看,它承擔(dān)的角色顯然不止于此。
丁琰在采訪中反復(fù)強(qiáng)調(diào),鹿明已經(jīng)把“采–訓(xùn)–推”的基建打通,這也是團(tuán)隊(duì)敢把真實(shí)場(chǎng)景采集推向規(guī)模化的底氣之一。
▲FastUMI Pro在工業(yè)及家庭場(chǎng)景的多個(gè)任務(wù)中,完成“數(shù)據(jù)采集-策略訓(xùn)練-模型推理”閉環(huán)。
數(shù)據(jù)不是采完就結(jié)束,而是能被快速消化、快速反饋,進(jìn)而反過(guò)來(lái)指導(dǎo)下一輪采集與任務(wù)擴(kuò)展,也正是在這種閉環(huán)基礎(chǔ)上,鹿明機(jī)器人把“真實(shí)場(chǎng)景規(guī)模化采集”定義為下一階段的重點(diǎn):用更多、更真實(shí)的場(chǎng)景數(shù)據(jù),推高模型能力上限,突破模型能力的天花板。
與此同時(shí),配套上線的“FastUMI Pro數(shù)據(jù)超市”,則把通用數(shù)據(jù)進(jìn)一步產(chǎn)品化,嘗試以更標(biāo)準(zhǔn)的方式讓數(shù)據(jù)進(jìn)入流通體系,用戶可直接通過(guò)其官網(wǎng)商城購(gòu)買覆蓋多場(chǎng)景、多任務(wù)的標(biāo)準(zhǔn)化操作數(shù)據(jù)。
05.
結(jié)語(yǔ):真實(shí)數(shù)據(jù)
是具身智能繞不開(kāi)的底座
從背包版FastUMI Pro的推出,到萬(wàn)臺(tái)級(jí)真實(shí)場(chǎng)景采集計(jì)劃的啟動(dòng),鹿明機(jī)器人所做的,并不只是一次新品發(fā)布或規(guī)模擴(kuò)張。
丁琰在其小紅書(shū)帖子《2026具身數(shù)據(jù)基建戰(zhàn)》中寫(xiě)道:“在模型之外,還有一個(gè)同樣關(guān)鍵、且在后期更難整體調(diào)整的因素:數(shù)據(jù)從哪里來(lái),以及以什么形態(tài)進(jìn)入系統(tǒng)。”
他提到,“從長(zhǎng)期看,真正昂貴的并不是采集一次數(shù)據(jù),而是反復(fù)重建整套數(shù)據(jù)體系。”在這條邏輯下,UMI讓能力擴(kuò)展盡量發(fā)生在同一入口之上,數(shù)據(jù)基建保持相對(duì)穩(wěn)定,系統(tǒng)能力逐步疊加。
從行業(yè)角度看,當(dāng)越來(lái)越多真實(shí)操作數(shù)據(jù)被系統(tǒng)性采集和利用,具身智能才真正具備走出實(shí)驗(yàn)室和數(shù)采場(chǎng)、走向復(fù)雜現(xiàn)實(shí)世界的可能性。
而鹿明此次用萬(wàn)臺(tái)背包版FastUMI Pro,把數(shù)據(jù)采集推向真實(shí)場(chǎng)景,本質(zhì)上是在回答一個(gè)更底層的問(wèn)題——當(dāng)數(shù)據(jù)成為決定模型上限的關(guān)鍵變量,誰(shuí)能夠穩(wěn)定構(gòu)建真實(shí)世界的數(shù)據(jù)基礎(chǔ)設(shè)施,誰(shuí)就將在下一階段的競(jìng)爭(zhēng)中占據(jù)結(jié)構(gòu)性優(yōu)勢(shì)。
特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺(tái)“網(wǎng)易號(hào)”用戶上傳并發(fā)布,本平臺(tái)僅提供信息存儲(chǔ)服務(wù)。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.