2026年是人形機器人量產元年,也或許是具身智能數據規模化元年。
美國銀行全球研究的報告預測,到2060年,全球人形機器人數量將達到30億臺,按人均計算將超過目前約15億輛汽車。美國銀行估計,其中約62%的人形機器人(大約20億臺)將進入家庭。
但一個問題也被美國銀行所提出,那就是人形機器人等具身智能技術進步仍受限于高質量操作數據的匱乏,以及難以復現人類級別的靈巧度與即興應變能力。
![]()
原因在于人形機器人產業正面臨“本體與小腦趨于成熟、大腦成為規模化應用瓶頸”的核心矛盾。過去幾年,運動控制技術的突破讓機器人學會了行走、跳躍、抓取,甚至后空翻,本體能力不斷刷新人們的認知。然而,當這些機器人被投放到真實的生產生活場景中時,一個尷尬的現實逐漸浮現:它們能精準地完成預設動作,卻難以應對環境的一點變化;它們能識別物體,卻不懂如何根據任務靈活調整。
這意味著全球頂級機器人本體以及運動控制小腦雖然已經趨于成熟,但在人形機器人落地的關口,大腦卻掉了隊,并且開始制約產業規模化。
01.
為什么依然需要真機數據?
大腦主要負責機器人理解任務、規劃決策、精準執行。那么大腦進化靠什么?數據。
機器人大講堂了解到,2025年上半年,全球開源具身數據集累計時長不足1000小時,證明了這一問題的急迫性。
面對數據困局,行業初步形成了三條數據采集路線,分別是真機數據、UMI遙操作數據、合成數據。在數據采集和預訓練階段,合成數據和UMI數據具備天然規模化優勢,因為其可以快速生成海量樣本,覆蓋基礎動作和通用場景,是模型建立初步認知能力的主要原料。但到了強化學習階段,Sim2Real Gap鴻溝卻橫亙在前,機器人在虛擬環境里訓練得再好,一到真實物理世界,抓錯力道、判斷失誤、動作卡頓的問題就接踵而至。
真機數據一定程度上是這個問題的最優解。因為它不僅能提供不可替代的真實物理交互,物理細節更多,而且可以大幅降低模型訓練后處理成本,讓強化學習的收益直接兌現在真實場景中。此外,多機采集的時空一致性更強,尤其在多臺機器人協同采集場景下,數據具備高度時空一致性,能夠有效降低模型訓練的冗余負擔,提升訓練效率。
如果說大腦進化需要數據燃料,那么如今大多數業內人士已經發現,真機數據就是這種燃料中最高能量密度的那一類。其在模型落地的關鍵階段,具有不可替代的核心地位。而訓練場,正是規模化、系統化生產這種核心燃料的基礎設施。它有望從根源上破解行業高質量數據供給不足的痛點,降低全行業的研發門檻與重復投入,加速具身模型迭代與產業落地。
我國已經認識到這個問題,并且正快速著手解決。機器人大講堂獲悉,2026年3月16日,在“開放原子園區行”開源數據集專場上,由工信部指導的唯一國家級開源基金會開放原子開源基金會牽頭,聯合中國信通院、上海人工智能實驗室、百度、樂聚機器人、螞蟻靈波、宇樹、庫帕思等十余家產學研核心機構,宣布啟動國內首個具身智能開源數據集社區,并成立人工智能開源社區開源數據集工作組,加速數據流通。
02.
國家為什么要親自下場?
理解了真機數據的戰略價值,才能理解國家為什么要親自下場。因為一個行業的數據基礎設施,如果長期處于無序發展狀態,就會形成系統性風險,整個產業的研發效率將被整體壓低。但這恰恰又是需要頂層協調才能解決的系統性困局。
開放原子開源基金會的入局,解決的正是這個問題。作為工信部指導的唯一國家級開源基金會,機器人大講堂從會上獲悉,它的核心作用不是替代市場賣數據,而是提供市場機制,建立統一的數據治理框架、權威的質量評估標準、可信的數據流通機制,也就是國家層面開始出手,建設公共基礎設施。
此外,“開放原子具身智能開源數據集社區”正式啟動。該社區由開放原子開源基金會發起建立,樂聚機器人牽頭建設,聯合螞蟻靈波、庫帕思、上海交通大學、哈爾濱工業大學、同濟大學、宇樹、具識智能、具腦磐石、無問智行等核心單位共建,是國家級平臺發起的第一個具身智能開源數據集社區,致力于成為全球具身智能領域有影響力、有吸引力的真實數據資源樞紐與協作創新平臺。
![]()
開源數據集社區專注于三件事:制定數據集的開源治理框架、建立行業質量評估標準、推動數據資源在產學研之間的規范流通與互信共享。這三件事,對應的正是行業長期懸而未決的標準不統一、質量參差不齊、開放共享極難落地三大痛點。換句話說,這個社區要做的是給整個具身智能數據行業定標準。因為有了統一的度量衡,數據才能真正流通;數據能流通,研發門檻才能整體下降;門檻下降,具身智能規模化的時間表才能真正提速。
從這個角度看,國家級平臺的介入,將會是具身智能數據基礎設施建設從企業行為上升至產業戰略的標志性事件。
03.
樂聚、螞蟻靈波、宇樹為何入局?
理解了宏觀背景,再來看這次參與共建的三家最具代表性的企業——樂聚機器人、螞蟻靈波、宇樹。它們來自不同的賽道,有著截然不同的優勢,但選擇在同一個平臺匯聚,背后都有清晰的戰略邏輯。
樂聚是這次社區的牽頭建設單位,這個位置,是用真實的數據積累換來的。在全國14個人形機器人訓練場中,樂聚獨立建設了9個,覆蓋北京、上海、濟南、青島、蘇州、合肥、鄭州、廣州、蕪湖等核心城市,形成了目前國內規模最大的真機數據采集網絡。其中,北京訓練場更是全國規模最大的單體訓練場。基于這一網絡,樂聚年產真機數據能達2500萬條,累計交付20000小時真機數據,已初步跑通采集—開源—交易的完整數據商業鏈路。
![]()
LET數據集系列的成績,則是市場對這種積累最直接的認可。該數據集全平臺總下載量突破100萬次,登頂全網開源具身數據下載榜榜首,成為國內最大具身真機數據提供商。更關鍵的是,樂聚已經把數據價值兌現到了真實工業場景中。基于數據驅動,樂聚率先實現了國內首次可規模化部署的工業技能交付,形成三大落地解決方案,包括為海晨物流打造的塑料箱拆垛方案、為一汽紅旗打造的紙箱拆垛方案、為新時達打造的SMT料盤出庫方案。數據,在樂聚這里已經成為生產線上的實際產出。
機器人大講堂注意到,在此次會議上,樂聚還同步全球首發了OpenLET觸覺靈巧操作+全身運動數據集,填補了行業空白。這一數據集是全球首個融合觸覺靈巧操作與全身高動態運動的稀缺數據集,其能力特性明顯,包括觸覺維度包含6×12×10指尖壓力矩陣、六維腕部力傳感器(精度±0.5%)、RGB-D視覺數據及多場景語義標注,實現視覺-力觸-動作全鏈路對齊。運動維度則涵蓋41個關節精細控制信號,將任務場景從基礎行走延伸至深度下蹲、彎腰等高難度全身聯動任務,動作節奏與平衡維持高度擬人。
![]()
對樂聚而言,牽頭建設國家級開源數據社區,或許是一次戰略升維,即從數據供給方,升級為整個行業數據生態的主導構建者。因為主導標準定義的企業,未來將天然擁有產業話語權。
![]()
而對宇樹、螞蟻靈波這類參與方而言,參與開源數據社區同樣是一場雙向投資,一方面,社區的真機數據可以為機器人本體上的模型訓練提供直接支撐,提升產品的智能化上限;另一方面企業可以深度參與國家級開源生態,拿到高質量、多場景、有標準的真機數據,用自己的核心能力反哺社區生態,形成正循環。
04.
社區三大目標:一個完整的產業飛輪
國家牽頭、重點企業參與,決定了這一戰略布局的輻射廣度。如果仔細看社區的三大目標,會發現其同樣有著不錯的發展縱深。會上,開放原子具身智能開源數據集社區發布了三大建設目標,旨在構建一個能持續進化的產業飛輪。
一是建開放數據平臺,提供數據處理—模型訓練—仿真測試—真機部署一站式工具鏈;二是建數據交易生態,聯動北數所、庫帕思等數據交易平臺,讓數據資產真正流通;三是加速技術與產業深度融合,包括舉辦頂級賽事、孵化創新團隊。
三個目標,構成了一個清晰的正向飛輪。通過高質量數據降低研發門檻,吸引更多開發者入場;而后,更多開發者會帶來更豐富的應用場景,反哺數據的多樣性與質量;數據質量提升驅動模型能力突破,則帶動更多產業落地案例;落地案例驗證數據價值,更將進一步擴大社區規模與吸引力。
這本質上已經不是一個關于數據的典型事件,因為飛輪一旦轉動,將產生持續的自我強化效應,這會使其成為一個關于誰來定義人形機器人產業基礎設施的故事。國家平臺出面,產業龍頭入局,開源標準先行,這套組合拳打出來,具身智能數據從企業私有走向開源共享的臨界點,可能比大多數人預期的,來得更快。
05.
真正的意義會在哪里?
2026年,具身智能的競爭,將不是單一維度的競爭。算法能力、本體硬件、場景資源、數據積累這四個要素,未來正在共同決定一家企業乃至一個產業的天花板在哪里。
過去幾年,行業的注意力大多集中在前兩者,誰的算法更強、誰的本體更穩。但越來越多的從業者意識到,在小腦趨于成熟的當下,真正拉開差距的競爭,正在遷移到數據層面。
數據,將是具身智能的下一個主戰場。而且這場戰役的關鍵,不在于誰能積累最多的私有數據,而在于誰能構建起最高效、最可信、最具生命力的數據生態。私有數據積累,是存量競爭;開源生態建設,是增量競爭。因為存量競爭拼的是資源,增量競爭拼的是號召力。
從這個角度看,國家級平臺牽頭建立開源數據社區,聯合產學研全鏈條力量共建行業數據基礎設施,其戰略價值遠不止于解決當前的數據供給問題,更在于為中國具身智能產業,在全球競爭中構建一道以數據生態為護城河的系統性優勢。
樂聚、螞蟻靈波、宇樹的到來,代表的是中國人形機器人行業頭部力量的戰略共識:數據基礎設施建設,不是一家企業能獨自完成的事,但不能等待,必須現在開始。這不是一個關于數據的故事,這是一個關于誰來定義人形機器人產業下一階段競爭規則的故事。
2026年,大腦之戰正式打響。而真機數據作為這場戰爭的燃料,如今也已經開始規模化量產。那么,最先建好加油站的人,必將決定這場賽跑的節奏。
OpenLET觸覺靈巧操作+全身運動數據集鏈接:
![]()
特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.