具身智能的勝負手,可能并不在機器人本身。
這種認知差,正在被最敏銳的資本迅速兌現為籌碼。
近日,靈初智能宣布完成總額約20億元的天使輪及Pre-A輪融資。
這筆20億元的資金,將加速靈初智能在物流場景的規模化落地與數據采集體系建設。
值得注意的是,這是靈初智能首次系統披露公司的融資進展。
過去很長一段時間,這家公司幾乎沒有在資本層面發聲,而是把大部分精力放在技術路線與數據體系的打磨上。
![]()
而之所以能吸引國家級資本與地方國資的大規模重倉,也與團隊極其互補的底色分不開:
創始人兼CEO王啟斌在手機、智能音箱及機器人領域擁有20年產品操盤經驗,曾擔任黑莓、Sonos及云跡科技高管;
聯合創始人陳源培是00后,在北大人工智能研究院讀研時師從強化學習(RL)代表人物楊耀東,在斯坦福曾與李飛飛有過深入交流,曾拒絕了華為“天才少年”的高薪offer。
在具身智能公司紛紛卷Demo、卷參數的當下,靈初智能的突圍邏輯清晰且冷峻:放棄昂貴且低效的機器人遙操,All in人類原生數據。
長期以來,具身智能被三座數據大山死死壓住:
仿真環境數采存在無法逾越的Sim-to-Real差距,尤其在處理布料等柔性物體時捉襟見肘;
機器人遙操數采則像是一場昂貴的人力外包,碎片化的試點導致成本居高不下,且無法窮盡物理世界的復雜分布;
而硬件本體與數據的深度耦合則成為了“房間里的大象”。數據與硬件強綁定,采集于哪種本體,便服務于哪家體系。這種封閉結構使數據難以跨平臺流通,整個生態將逐漸演變為彼此割裂的孤島。
風頭正盛的UMI設備數采,在靈初智能看來更像是一個“美麗的陷阱”,同樣存在結構性問題。
在靈初智能看來,這并非一場工具之爭,而是一場數據范式之爭。
UMI本質上是讓人拿著機器人的器官去模擬機器,是一種“Robot-Centric”的邏輯。短期內可以降低門檻,長期卻可能鎖死上限。
如果數據從一開始就圍繞機器人本體采集,那么模型的能力邊界也會被提前鎖定;而如果數據源頭來自人類本身,那么模型學習的將是“任務本質”而非“機器結構”。兩種路徑,決定的是具身智能未來的天花板。
![]()
“UMI采集的是機器人夾爪的數據。它無法泛化,今天用UMI采的數據,根本無法直接用到五指靈巧手上。”陳源培指出,這種方案強行將人類擁有20多個自由度的五指靈巧手,降維成了一個只能“開合”的簡易夾爪。
為了破解這一冷啟動難題,靈初智能全棧自研并發布了全球首個具身原生人類數據采集方案——Psi-SynEngine。
![]()
其核心邏輯只有四個字:以人為本。
便攜式外骨骼觸覺手套可精準捕捉人手21個關節自由度及全手觸覺信息,并不影響工人正常作業;系統同步記錄頭戴與手部視角的視覺、觸覺、動作及語言數據,為預訓練階段的多模態對齊提供真值支撐。
更關鍵的是成本結構。
據王啟斌透露,通過手套采集數據的綜合成本,僅為真機遙操方案的10%。
真正的護城河,則來自跨本體遷移能力。
“機器人會迭代,夾爪會更換,但人手是不變的。”陳源培表示。
![]()
通過基于世界模型與強化學習的遷移算法,靈初能夠將人類動作高質量映射到不同構型的靈巧手上,彌合Embodiment Gap。
當數據源頭脫離硬件本體,模型的能力上限也會隨之被重新打開。
數據基建解決的是“礦從哪來”,即“有沒有數據”的問題,而真正拉開公司之間差距的,是“礦煉成什么”,也就是把這些數據轉化為模型能力的效率。
靈初發布數采體系,外人看可能覺得就是個“賣鏟子”的生意。但在創始團隊的邏輯里,這只是飛輪的起點。
![]()
陳源培直言:
數據是用來訓練具身大腦的燃料,而非終點。真正具備長期價值的,是由數據喂養出來的、可遷移的通用操作能力。
靈初智能不賣礦石,也不賣鏟子,賣的是“會干活的腦”。
在靈初的邏輯里,單純靠人力做數采沒什么門檻,本質上賺的是勞動力的錢。而模型對數據的消化、泛化與遷移水平,才直接劃定了這些數據價值的天花板。
因此,靈初走出了一條在行業中相對少見的路徑:
這種“模型驅動數據”的閉環,讓靈初在持續推進模型落地的過程中,能不斷修正數據結構、標注體系與采集方式。
這就把原本死板堆積的“原材料”給帶活了,讓它們變成了一種緊貼模型目標、不斷進化的結構化資產。
![]()
相比行業里還在兜售“大物流”“全場景泛化”這類宏大敘事,靈初表現得有些反直覺的克制。
王啟斌透露,2025年下半年靈初內部曾有過一次關鍵掉頭:停止資源投入純展示型Demo,全面轉向真實數據采集與細分場景交付。
為什么?
這種轉變背后的邏輯其實很務實,因為模型進化需要養料,而最硬核的養料,只有在真實交付中碰撞出的“高密度問題”里才能淘出來。
靈初切入的口子極細,甚至有些“挑剔”,比如專門盯著“衣服供包”或“入箱檢”這種高復雜度、強柔性的活兒。
以衣服供包為例,目前靈初已實現對上千件衣物的泛化抓取,節拍提升至800 UPH(即Unit Per Hour,指每小時產出數量),形成從場景部署、數據采集到模型優化的閉環。
![]()
這套方法在團隊內部被沉淀為一種“能力飛輪”:每一個新場景的落地都在喂養模型,而變強了的模型,又成了他們敲開下一個復雜場景的敲門磚。
飛輪由此啟動。
在具身智能這個“軟硬耦合”的賽道上,全棧幾乎是必選題。
算法離不開硬件,硬件又反過來塑造數據分布,兩者缺了誰都跑不通系統閉環。
但靈初的“全棧”被賦予了某種分寸感,他們通過戰略篩選,將精力高度克制地集中在核心鏈路,走的是一條精準布局、有的放矢的路子。
在王啟斌看來,市場上能買到且夠用的,靈初絕不碰;但凡是卡住核心能力的環節,必須緊緊攥在自己手里。
之所以費力氣自研數據手套和靈巧手,是因為市面上現有的方案在規模化數采和底層電流環控制算法上,根本達不到高精度操作的要求。
![]()
假如將這些環節外包出去,無異于把數據質量和模型演進節奏的“命門”交給了別人。
而對于像輪式底盤這樣已經高度成熟的賽道,他們則選擇通過定制合作來解決,因為那已經不構成技術瓶頸,強行投入只會分散自身精力。
如此取舍背后,其實是在重新厘清靈初這家公司的能力邊界:自研是為了守住核心能力,整合是為了調用通用資源。
這也讓靈初的定位變得愈發清晰——他們本質上是一家通用靈巧操作能力的“大腦驅動公司”,核心算法與數據鏈路自控,硬件形態保持開放,能夠根據不同場景靈活適配。
![]()
對于具身智能公司來說,眼下跟時間賽跑很重要。
因為真實場景的數據反饋是有復利效應的,那些進場早、碰到的復雜任務多的人,才能搶先一步觸達那些決定勝負的長尾數據。
這種由規模和密度堆疊出來的領先優勢,是后來者很難用資本直接抹平的。
所以靈初的方法論重心在于模型能力的沉淀。隨著數據飛輪的啟動,數據成本在降,模型能力在升,這種此消彼長會帶他們步入一個更高階的戰場——
去解決那些更復雜、更廣闊的應用場景。
值得注意的是,靈初智能此次披露的融資信息也釋放出一個信號:具身智能正在進入資本與產業共振階段。
據行業人士估算,在過去一年中,靈初估值已提升約6–7倍,正在向具身智能領域的獨角獸邁進。
![]()
從國家級產業基金、地方國資平臺,再到通信與光通信產業鏈龍頭,這種資本結構背后,其實是產業界對“具身數據基礎設施”的提前押注。
在這個賽道里,大家爭奪的籌碼早已超出了資金本身,時間才是最稀缺的通貨。
隨著數據飛輪轉速加快,比拼的本質也從聚焦于誰賬面上錢多,轉變成了誰跑在了時間的最前面。
而這種領先優勢極具排他性,一旦時間差形成,差距就會以一種極快的速度被放大,留給后來者的空間只會越來越窄。
特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.