Jay 發自 凹非寺
量子位 | 公眾號 QbitAI
Generalist AI的GEN-1熱度,仍在發酵。
自節前那場引爆全網的Demo之后,昨日,創始人Pete Florence與團隊,正式釋出了GEN-1的技術博客。
與其說這是一篇技術分享,不如說這是一篇「教同行做事」的檄文。
一點甲不疊,上來就毫不留情地否定了當前炙手可熱的世界模型與VLA之爭。
直言所有關于技術路線的爭論都是浪費時間。
![]()
現在關于「世界模型」的討論,其實是由各種想法在驅動,確實很令人興奮。
但問題是,你的目標是什么?
在他們看來,具身智能的關注點,應該回歸到「目標」本身。
這正是Generalist選擇「離經叛道」的根本原因。
完全不依賴任何已有路線。不走微調VLM加動作頭的捷徑,也不宣稱自己是世界模型。
直接基于真機數據從零開訓。
GEN-1大約99%的參數,都是從零開始訓練的。
Generalist強調,這才是促成GEN-1實現飛躍的核心機密,也是他們真正想與行業分享的洞見。
這是他們從第一性原理出發,得出的最終答案:
想要實現物理AGI,最好的方式,或許就是「從零訓練」這條看似不好走的路。
如果用原力靈機的話說,這叫「具身原生」。
![]()
△原力靈機CEO唐文斌在2026技術開放日現場
是的,這條路線其實并非GEN-1首創。
就在兩個月前,這家來自中國的具身智能新星,就已經用同樣的邏輯,舉辦了一場「具身原生」主題的技術開放日,交出了一份驚艷的答卷。
原力靈機,具身原生大模型DM0,RoboChallenge真機評測全球第一。
![]()
所以,具身原生,到底有什么魔力?
GEN-1引爆具身GPT-3時刻
GEN-1的發布,無疑是2026年春節后,具身智能行業的第一次「大地震」。
創始人Pete Florence將其稱為「GPT-3時刻」。
在多個任務中,該模型的成功率超過99%,完成任務的速度比此前最先進的模型快了大概3倍,甚至涌現出Failure Recovery(故障恢復)的能力。
用實際demo表現,驗證了機器人領域的Scaling Law。
![]()
而此次Generalist在技術博客中的「暴論」,又在行業中掀起了一波余震。
只要數據和算力夠,從零訓,永遠是贏家。
![]()
這句話放在2024年說,大概率會被當成瘋話。
彼時VLA風潮席卷全球,拿一個預訓練好的視覺語言模型,接上動作頭微調一下,是兼顧效率和效果的公認最優解。
到了2026年初,世界模型又成了新的流量密碼。
Generalist偏偏不站隊。
他們從來沒把自己的模型叫VLA,但也不宣揚自己是世界模型。
事實上,他們至今也沒說自己是個什么技術路線,也不想去刻意貼標簽。
但有一點卻是無比清楚:無論靠什么方式,即便是「離經叛道」,他們也要徹底實現物理AGI。
GEN-1的博客引用了John Schulman的觀點,犀利地劃分了「想法驅動」與「目標驅動」兩種研究范式。
前者,是雇傭兵。追漲殺跌,哪個方法火就選哪個,只為眼前的戰功。
后者,是傳教士。選定一個終極目標,然后埋頭苦行,堅定不移地前行,掃清擋在路上的一切障礙。
Generalist選了后者。
基于這個第一性原理,Generalist做出了那個看似瘋狂的決定——
不基于任何現有的基礎模型,直接拿原始數據,冷啟動。
在這方面,Generalist表現出了近乎偏執的「完美主義」。
在他們看來,微調別人的模型,意味著從第一行代碼開始,天花板就被別人鎖死了。
知識邊界、認知能力、甚至底層的缺陷,都已注定,無法更改。
Generalist想要賭的,是明天。
而站在未來的時間節點回望,你會驚覺:
無論是VLM、VLA,還是世界模型,本質上都只是標簽,數據匱乏時期的「拐杖」。
關鍵問題在于,當「身體」恢復健康、肌肉足夠強壯后,我們還需要拐杖嗎?
供給端的版圖永遠在日新月異。
這正是這場比賽最驚心動魄的地方。
就像F1賽車,規則制定者會刻意限制車胎耐久標準,正是在這些Trade-off(權衡)的極限施壓下,才催生出無數截然不同的奪冠策略。
在LLM領域,雖然互聯網數據不再是瓶頸,但算力成為了新的緊箍咒。
這才造就了OpenAI、Anthropic、DeepMind各自基于不同哲學思考,走出了截然不同的進化路線,因為資源只夠他們選一條去All in。
因此,基于第一性原理做出的長期主義戰略判斷,才會更顯得尤為珍貴。
最難的不是應對變化,而是在風云詭譎的環境中,找到那個屹立不變的錨點。
你不僅要計算當前的限制,更要預判這些限制將如何不可避免地發生崩塌。限制變化得越快,這種預判就越重要。
而在Generalist看來,機器人數據不夠,僅僅是暫時的限制。
進入2026年,事實證明,這項限制條件,確實被改寫了。
Generalist已經積累了超過50萬小時的物理交互數據。
當原生數據足夠豐富時,所有輔助手段終將被掃進歷史的垃圾堆。
在他們看來,只有具身原生,從零開訓這個「從無到有」的概念,是為那個即將到來的新世界而生的。
不過,GEN-1可能并非第一個具身原生模型。
在中國,同樣有家All in這個概念的明星具身公司,并且早在今年2月份便高調發布過。
DM0,首個具身原生模型
一起再來看看原力靈機的這份成績單吧。
DM0,RoboChallenge真機評測,雙項全球第一。
- 單任務成功率:62%
- 多任務成功率:37.3%
排在它身后的,是Pi0.5、Pi0等一眾明星模型。
而取得這一成績的,僅僅是一個2.4B參數的模型。并且已全面開源。
![]()
2.4B是什么概念?
在大模型的軍備競賽中,這個參數量幾乎可以被忽略不計。
但結果卻令人嘩然。
對于這個結果,原力靈機合伙人周而進在與「智能相對論」的對話中,淡定地表示:
在機器人領域,無腦堆參數量這件事非常荒誕。
周而進一針見血地指出,參數并非第一性原理。
事實上,一旦找到了真正「原生」的路線,現有具身數據量根本無法支撐起一個大參數模型。
那么,DM0所說的「原生」,到底「原生」在哪?
可以分為三個層面——
首先,是數據原生,這是拉開差距的關鍵。
當前行業的普遍做法是:下載一個預訓練好的VLM,然后外掛一些機器人操作數據進行微調。
快是快,但問題同樣致命:模型壓根沒見過關節電機長什么樣。
它只是看過一些互聯網數據,背誦了關于機械動作的文字描述。僅此而已。
這種「死記硬背」導致了大量無意義的訓練,最終帶來參數膨脹。
這或許是一種參數層面的「幻覺」。
如果模型只是針對單一機型記憶「拿起瓶子」時,每個關節該轉多少度,那么一旦換一臺硬件,它將束手無策。
因此,DM0走了完全不同的路。
它的訓練數據融合了三類來源:
- 多模態互聯網數據:奠定語義理解和常識推理的基座能力。
- 駕駛數據:賦予模型對物理世界的時空推理與動態感知。
- 具身傳感數據:涵蓋視覺、觸覺、力覺等多維度信息,讓模型真正「觸摸」到這個世界。
模型的輸入端,不再僅僅是圖像和文字,更包含了機器人實操的具身軌跡數據。
兩類數據共同優化,迫使模型同時學會「看懂世界」和「動手操作」。
![]()
這是一種極其聰明的做法,在讓數據結構更立體的同時,也巧妙地實現了數據規模的Scaling。
在具體采集策略上,原力靈機的「原生」第一性原理同樣體現得淋漓盡致——
正是因為完全目標導向,所以手段可以相當靈活。
比如對仿真數據的態度。
仿真數據量大管飽,但在精細操作場景中價值有限。例如「裝水」任務,液體一晃,整個瓶子的質心就在變化,仿真環境難以準確建模。
因此,原力靈機在室內導航、剛性物體抓取等方面利用仿真數據,但在精細操作層面,則堅決側重真機。
追求Scaling,但不迷信數據量,而是讓每一份數據都發揮最大價值。
這恰好與Generalist在GEN-1博客中的判斷形成呼應:供給端是會變化的,你要為即將到來的世界而構建。
其次是訓練原生。
DM0將「理解世界」、「操作世界」、「預測世界」三種能力統一訓練。
它不是先訓練一個VLM,再接一個動作頭(Action Head),而是從第一天起,就讓這三種能力在同一個模型體內共同生長、相互塑造。
模型的設計緊貼真實世界需求,評價標準是真機效果,獎勵函數來自真實場景的實踐反饋。
第三是架構原生。
DM0采用天然支持多模態的架構設計,將力覺、觸覺等維度的信息直接融入模型核心,而非外掛式地拼接傳感器模塊。
同時,它具備原生記憶能力,為長序列任務的執行提供堅實支撐。
三個「原生」疊加在一起,指向一個反直覺結果:模型雖小,卻異常泛化。
對具身智能來說,泛化性是真正的試金石。
原力靈機將其拆解為四個維度:
- 對象泛化:同樣是抓取,換個形狀、材質、大小,照樣能穩穩拿起。
- 場景泛化:在A車間能干活,搬到B車間也絕不掉鏈子。
- 任務泛化:不只局限于被教過的幾個動作,更能自主排列組合,將簡單動作串聯成復雜的長程任務。
- 機型泛化:即便換一臺胳膊更長、關節更多的機器人,也能直接驅動其上手干活。
四個維度,缺一不可。
而DM0,從第一天就在為這四個維度做準備。
原力靈機沒有像行業里很多團隊那樣,先針對一種機型訓一個專用模型,跑通demo再說。
DM0在預訓練階段就同時混合了操作、導航、全身控制三類任務,覆蓋了8種構型迥異的機器人硬件。
![]()
相當「粗暴」。
這相當于對模型說:你不是喜歡死記硬背嗎?
好,我把所有任務和所有本體混雜在一起扔給你——來,背!
事實證明,這一策略成功鎖死了模型想通過死記硬背走捷徑的念頭。
「混亂」中,原力靈機倒逼模型不再執著于電機參數,轉而去理解每次操作背后通用的邏輯和物理規律。
智能,就這樣從原生的物理交互中,自然而然地生長了出來。
2.4B參數,RoboChallenge雙項全球榜首。
2026年,是具身原生元年
GEN-1的博客里有句話,目標比方法更強大。
過去兩年,行業最高頻的問題是:機器人什么時候能進廠干活?
但或許,比這個問題更值得關注的是:
機器人什么時候能找到進廠干活的正確方法?
Generalist用GEN-1給出了答案。
從零訓練原生模型,摒棄一切拐杖的「借力」,可能才是通往終局的唯一路線。
無獨有偶,原力靈機的DM0,同樣不約而同地在今年踏上了這條少有人走的路。
![]()
2026年或許不是具身智能的元年。但GEN-1和DM0的出現,正在為2026年烙上一個新標簽:
具身原生元年。
特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.