![]()
“目前機器人其實可以學(xué)習(xí)人的任何動作。”
前不久,在北京舉辦的2026人形機器人與具身智能標準化年會上,宇樹科技創(chuàng)始人王興興用“任何動作”,概括機器人的能力邊界。而要實現(xiàn)這一效果,需提前采集真人數(shù)據(jù)進行訓(xùn)練。
在機器人的“成長”過程中,采集真人數(shù)據(jù)為何如此關(guān)鍵?海量數(shù)據(jù)又如何賦予機器以“人”的靈性?這些問題的答案,正隨著一座座數(shù)據(jù)采集訓(xùn)練場的落地而逐漸清晰。
訓(xùn)練場上:1250遍“手把手”陪練
春日的青島嶗山區(qū),國家高端智能化家用電器創(chuàng)新中心里,正緊鑼密鼓地推進一項關(guān)鍵項目:機器人的真機數(shù)據(jù)采集與“崗前教育”。
今年1月,青島市人形機器人數(shù)據(jù)采集訓(xùn)練場在此啟用。整層室內(nèi)環(huán)形訓(xùn)練場被錯落切割為廚房、商超、汽車制造等7個實景,每塊置景內(nèi)均有1—2位真人“老師”,耐心地“手把手”教導(dǎo)31個名為夸父的機器“學(xué)生”。
均齡20出頭的年輕數(shù)采師頭戴VR設(shè)備,緊握手柄,耐心而小幅度地比劃著行走、蹲起、抓取等基礎(chǔ)動作。銀黑相間的“夸父”們則略顯生澀地同步扭動關(guān)節(jié),嘗試完美復(fù)刻。
這里鮮有言語聲,偶爾,“咚”的一聲悶響會打斷這份安靜——新手老師動作過急,嘗試練習(xí)平穩(wěn)行走的機器學(xué)生便笨拙栽倒。
這些動作并非隨性編排,而是遵循嚴格的工業(yè)標準。小組長劉文碩告訴記者,訓(xùn)練流程一般是甲方提出需求,位于北京的研發(fā)部門將其拆解為具體動作步驟,最終“發(fā)包”至各地訓(xùn)練場。
訓(xùn)練師們領(lǐng)到的任務(wù)通常是10秒至2分鐘長的演示視頻,他們須在時限內(nèi)高精度還原視頻動作,并重復(fù)單一任務(wù)至少1250遍,以便機器學(xué)生完美復(fù)刻。“動作不到位就是無效數(shù)據(jù),直接作廢。”劉文碩說。
與沉默的機器學(xué)生為伴,每日枯燥地重復(fù)單一動作,“老師”秦小杰仍顯得興致勃勃,“一想到未來大街上的機器人都是自己親手教出來的,還是很有成就感的。”
然而,看似簡單的動作,卻屢屢讓滿身前沿科技的金屬身軀“翻車”,“比如拿個杯子,機器人的手掌有時會整個翻轉(zhuǎn),非常別扭。”
靈巧手,在業(yè)內(nèi)被認為決定著人形機器人的功能上限。秦小杰有時會握住“學(xué)生”這雙分布著數(shù)百個感應(yīng)點的修長鐵手,感受相似形態(tài)下悄然生出的親密。
人類從具備抓握功能到熟練使用工具,走過了逾百萬年的漫長進化;而今,這一進化歷程則被壓縮至以月、年為單位的“商業(yè)催熟”中。
靈巧手并非唯一的關(guān)卡。卡住人形機器人商業(yè)化步伐的,更多的是一顆能獨立決策、應(yīng)對未知的聰慧“大腦”。
因此,海量訓(xùn)練的深層目標,是賦予機器人舉一反三的“泛化能力”。“數(shù)據(jù)能夠幫助機器人學(xué)習(xí)環(huán)境變化規(guī)律和自身行為策略。”山東大學(xué)控制科學(xué)與工程學(xué)院教授王元哲解釋。
“結(jié)構(gòu)化的數(shù)據(jù)集被喂給大模型后,將迭代出更智慧的機器‘大腦’。”青島市人形機器人數(shù)據(jù)采集訓(xùn)練場總經(jīng)理李彥杰進一步介紹,目前,業(yè)界突破主要聚焦兩個方向:負責(zé)決策感知的“大腦”與負責(zé)運動控制的“小腦”。
沿循這兩個方向,業(yè)界分化出不同研發(fā)重心:一派專注硬件動作表現(xiàn),被稱作“本體派”;另一派致力于提升其智商,即“AI派”。
巧婦難為無米之炊,受限于數(shù)據(jù)短缺,AI派遲遲未能迎來自己的革命性進化。正如王興興所言,“誰能把機器人用的大模型做出來,誰就是全世界最厲害的AI和機器人公司。”
公共空間中:讓數(shù)據(jù)走出“孤島”
對高質(zhì)量數(shù)據(jù)的渴求,已成為行業(yè)的共同訴求。盡管自家機器人已在簡單動態(tài)場景中表現(xiàn)出一定的自主心智,松延動力負責(zé)人仍表示:“當(dāng)前產(chǎn)業(yè)的最大瓶頸,在于缺乏高質(zhì)量的真實場景數(shù)據(jù)集。任何實質(zhì)性突破都依賴于此,但行業(yè)尚未形成規(guī)模化積累。”
大型訓(xùn)練場的出現(xiàn),恰恰是為了實現(xiàn)“規(guī)模化的積累”。山東大學(xué)控制學(xué)院機器人工程系副主任張國騰說,“這是把數(shù)據(jù)采集從‘手工作坊’升級為更標準化的‘?dāng)?shù)據(jù)工程’。”
當(dāng)下,不同品牌、構(gòu)型的機器人,僅遵循各自軟硬件體系,數(shù)據(jù)質(zhì)量參差不齊,未形成通用的數(shù)據(jù)語言,各家形同小小“孤島”,直接制約著行業(yè)發(fā)展效率。
公共訓(xùn)練場的價值在于,它為各類機構(gòu)提供了一個可以互動、達成通約的平臺性空間,從而避免重復(fù)建設(shè),并最終走出“各自為戰(zhàn)”的封閉敘事。“我們已經(jīng)開源了部分數(shù)據(jù)集,期待能激發(fā)更多創(chuàng)新。”李彥杰說。
即便訓(xùn)練失敗,在此亦有價值——失敗能暴露傳感噪聲、接觸動力學(xué)、控制飽和、軟硬件延遲等真實問題,往往更有含金量。
進入2025年后,各地對于建設(shè)訓(xùn)練場的熱情逐步迸發(fā)。去年1月,上海浦東新區(qū)率先落子,建成全國首個異構(gòu)人形機器人訓(xùn)練場;北京、合肥、無錫等地步伐緊跟。在山東,除青島外,濟南平陰縣于去年12月亦宣布啟用面積達4000平方米的訓(xùn)練場。
“我們的核心目標之一,是實現(xiàn)產(chǎn)業(yè)場景的落地。”李彥杰表示,青島這座訓(xùn)練場定位清晰,即面向具有本土特色的海洋、康養(yǎng)、新零售等產(chǎn)業(yè)開展實訓(xùn),精準服務(wù)一線需求。
當(dāng)市場尚就“人形”是否必要爭論不休時,部分“夸父”機器人已悄然現(xiàn)身服裝、汽配等場景中,開啟了進廠“打工”生涯。
實驗室里:在仿真中“窮盡可能”
為了讓機器人“耳聰目明”,在山東大學(xué)創(chuàng)新大廈內(nèi),另一條技術(shù)路徑正在探索中:構(gòu)建于仿真世界的推演訓(xùn)練。
這里同樣孕育著激動人心的成果。7層的機器人中心實驗室孵化出了“優(yōu)寶特”這一山東名片;5層的視覺感知與智能系統(tǒng)實驗室則與宇樹科技成立了人形機器人聯(lián)合實驗室,攻關(guān)雙足機器人關(guān)鍵技術(shù)。
“企業(yè)提供機器人作為硬件平臺,我們就在其中刷程序,調(diào)優(yōu)軟件性能。”張國騰認為,高校受限于資金,難以購買昂貴的算力和硬件,企業(yè)恰好可以提供這些重資產(chǎn),以換取智力支持。
更重要的是,在行業(yè)通用標準尚未確立的當(dāng)下,哪家機器人能夠作為高兼容的“底座”支撐更多軟件開發(fā),誰就可能在未來的標準之爭中占得先機。
與訓(xùn)練場不同,實驗室里少有完整的機器人,取而代之的是拆得七零八落的零部件。來自機器人工程、電子信息、物理等專業(yè)的碩博學(xué)生埋首仿真軟件,一遍遍修改參數(shù)、切換視角、調(diào)試細節(jié),以使模擬空間無限逼近物理現(xiàn)實。
“現(xiàn)有的人形機器人,空間理解能力比較差,這是很大一塊短板。”張國騰舉例,面對一張低矮的桌子,小貓小狗都知道低頭穿過,機器人卻會將其視為整塊障礙物而選擇繞行。
仿真訓(xùn)練的本質(zhì),是一種“窮盡可能性”的探索。機器人工程專業(yè)大三學(xué)生趙凱濤解釋:“我們會在仿真環(huán)境里創(chuàng)建任何可能出現(xiàn)的地形,讓機器人一遍遍試錯,摔倒就懲罰,成功就獎勵。”
憑借這套虛擬的獎懲機制,仿真世界中成百上千個機器人正日復(fù)一日“變聰明”,這常讓整個實驗室興奮不已。
那么,實景與仿真訓(xùn)練,孰優(yōu)孰劣?
張國騰認為,兩者并無高下之分。仿真訓(xùn)練更靈活、方便、低成本,但虛擬環(huán)境與現(xiàn)實世界始終存在鴻溝。實景數(shù)據(jù)則是縮窄這道鴻溝的最佳標尺。
一個更務(wù)實的策略是:仿真用于快速篩選方向,少量高質(zhì)量的真機數(shù)據(jù),則用于最終的校準與驗證。
“最希望具身智能大模型從‘讀萬卷書’過渡到‘行萬里路’。”對未來,張國騰不免暢想,在充沛數(shù)據(jù)的支持下,擁有聰明“腦袋”的機器人,終將走出實驗室,與人類一同前行萬里。
來源:大眾新聞
特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺“網(wǎng)易號”用戶上傳并發(fā)布,本平臺僅提供信息存儲服務(wù)。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.