![]()
具身智能創業如火如荼,技術路線是否收斂、以及數據來源的選擇,都是大家一直關心的問題。最近清華北大的團隊密集發布了很多研究成果,我們或許可以從中分析出一些趨勢。
![]()
23 年初成立的銀河通用背后是前如布科技聯創尹方鳴和姚騰洲、科學家是北大助理教授王鶴。銀河通用是低成本仿真路線的擁護者,經過 2 年努力于近期重磅發布了 GraspVLA,思路與 RoboCasa、RoboGen 等類似,在海量合成的仿真環境中合成機器人數據。但 GraspVLA 只關注抓取任務,將預訓練的 AnyGrasp 模型部署到仿真中采集大量數據來訓練一個 VLA。在仿真中可以加入很多隨機化、以提升 VLA 的泛化性。
![]()
![]()
![]()
2024 年 9 月成立的靈初智能,CEO 是前京東機器人總裁王啟斌、以及機器人算法負責人柴曉杰、李飛飛學生陳源培,背后科學家包括北大助理教授楊耀東和梁一韜。
![]()
與銀河通用類似,靈初智能也是在仿真環境中大規模預訓練模型,但在模仿學習中加入了強化學習技術、以及真機數據對齊微調訓練,使得即使只用少量仿真和真機數據也能做到很泛化的復雜任務,實現不同技能順滑串聯操作。2024 年 12 月底發布的 Psi R0 模型完成了雙手協作長程的泛化打包任務,已展現出了該模型能實現真正商業化的強大潛力。
靈初智能此前的其他成果,比如 lego 組裝也是長程的靈巧手任務,可以突破過去強力抓取的能力邊界、完成更靈活的抓取和靈巧動作。根據之前的公開信息,靈初智能將于 3 月份發布自研本體以及更泛化的具身大模型。
![]()
在數據選擇方面,23 年 9 月成立的清華系星海圖持完全不同的觀點,他們認為數據價值上,真機數據 > 互聯網數據 > 仿真數據。星海圖 CEO 是 Momenta 前執行董事高繼揚,科學家包括清華助理教授趙行和許華哲。他們計劃今年發布 100 萬條真機數據、明年發布 1000 萬條真機數據。
星海圖計劃采用真機數據為主來預訓練具身大模型、而不是靈初和銀河那種大規模仿真數據預訓練。但以大規模真機數據為主存在 diverse 不足的問題,無法涌現泛化。
![]()
在仿真數據方面,星海圖強調 Real2Sim2Real 后訓練。仿真數據只作為后訓練的一個強化劑,將真實數據在仿真中加入隨機化來擴充 1000 倍,以實現更高的成功率和更好的落地效果。
![]()
三家清北團隊在算法和數據選擇上略有不同。靈初智能在算法上強調強化學習、銀河在數據上強調仿真、星海圖強調真實數據。不過各家都采用了仿真和真實數據結合的方法,只是在預訓練和后訓練上強調不同的數據比例。
期待這幾家準獨角獸公司在未來帶來更多的驚喜。清華北大是具身智能創新的先鋒,近期還有很多有意思的成果。
比如清華星動紀元 ERA-42、北大與國地共建具身智能中心 RoboMind、北大與智元 OmniManip、清華千尋智能 CoPa 和 Data Scaling Law 等工作都很值得分析。
特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.