網易首頁 > 網易號 > 正文申請入駐

在GTC談基座模型，元戎啟行把自己放進了物理AI牌桌

2026-03-19 07:10:09　來源: 鈦媒體APP

北京舉報

分享至

圖片系AI 生成

英偉達GTC大會再次把“物理AI”推到了臺前。

3月17日，英偉達GTC 2026在美國舉行，和往年相比，這屆GTC對外釋放的信號更直接：英偉達已經不滿足于把AI停留在數字世界，而是把“Physical AI”推到了舞臺中央。

官方議程把 physical AI 與 agentic AI、AI factories 并列為大會主線；黃仁勛在相關發布中也把重點放在機器人、仿真、世界模型和開放數據工廠上，試圖把“會算”的AI，進一步推進到“會感知、會判斷、會行動”的AI。

在這個背景下，元戎啟行CTO曹通易在GTC上介紹了Foundation Model（基座模型）為核心重構的輔助駕駛技術體系。這家公司試圖把輔助駕駛從一個單點產品，重新定義為物理世界AI的一種落地形態。換句話說，車不再只是終點，而是起點。

1、汽車只是物理AI的一部分

英偉達這次發布的新內容里，既有面向機器人和工業場景的 Isaac 仿真框架、GR00T 模型，也有面向 physical AI 訓練的數據工廠藍圖；官方甚至明確提到，這套體系將用于機器人、視覺AI代理和自動駕駛開發。

這背后其實是一個比較明顯的產業判斷：過去幾年，AI主要解決的是“理解文本、生成內容、輔助決策”的問題；接下來要解決的，是如何讓系統進入現實空間，在復雜環境里感知、推理、行動，并且承擔結果。

對汽車行業來說，這件事并不抽象。輔助駕駛本質上就是最早、最成熟、也是最嚴苛的 physical AI 試驗場之一。因為車每天都在真實道路中運行，場景開放、變量密集、容錯極低，遠比很多封閉環境里的機器人更難。

所以，元戎啟行選擇在GTC這個時間點，把自己的技術體系和“物理世界AI基座”綁定，并不是在追熱點，而是在順著英偉達定義的新敘事往前走。問題不在于它會不會講故事，而在于這個故事有沒有產業基礎。

2、不是輔助駕駛功能，而是“統一大腦”

按照曹通易在GTC上的表述，元戎啟行正在用 Foundation Model 重構下一代輔助駕駛技術體系，并將其定義為面向物理世界的AI基座模型。公開信息顯示，這套系統以 400 億參數規模的 VLA（視覺—語言—動作）基座模型為核心，試圖把場景理解、駕駛決策和安全評估統一到同一套模型架構里，而不是像過去那樣，把感知、規劃、控制拆成多個相互耦合但并不真正統一的模塊。

這件事為什么重要？因為過去一代輔助駕駛系統最大的問題，不是功能做不出來，而是系統天然是“拼接式”的。看見是一個模塊，理解是一個模塊，決策又是一個模塊，最后靠規則、工程經驗和大量人工調參，把它們盡量焊在一起。

這種架構在高速和標準化道路上還能工作，一旦進入城市、施工、混行、博弈密集的復雜場景，就容易出現兩個老問題：第一，系統知道“看到了什么”，但不一定真正理解發生了什么；第二，系統能完成動作，但不一定讓用戶敢持續使用。

元戎啟行現在想做的，是把“駕駛員”、“分析師”、“裁判員”三種能力塞進同一個基礎模型里。說白了，就是讓系統不只是執行，而是先形成對物理場景的統一理解，再輸出動作。這種路徑和行業過去的“規則+模塊堆疊”相比，核心變化不在架構邏輯：它希望系統先長出一個統一認知，再去調用不同能力，而不是讓不同能力各干各的。

這也是為什么曹通易會把輔助駕駛稱為基座模型的第一個“身體”。這句話聽上去很像技術圈常見的大詞，但放到產業邏輯里并不難理解：今天先讓模型在車上學會感知道路、處理風險、完成動作，明天同樣的認知底座，就有可能遷移到 Robotaxi，甚至更廣義的具身智能系統。

3、為什么是汽車先跑出來？

如果只把這套邏輯當成概念包裝，其實會低估它。元戎啟行這次最現實的一點，是它給終局找到了一條當前可走的路徑：先從量產車開始，把真實世界的數據、反饋和訓練閉環做出來。

公開報道顯示，搭載元戎啟行方案的量產車累計交付已超過25萬輛；公司方面同時強調，這些車輛在復雜道路中的場景理解能力，可以遷移到 Robotaxi 研發中。其面向量產輔助駕駛的數據閉環周期已壓縮到12小時。無論這些數字最終效果如何，至少說明一件事：它不是先去做人形機器人，再倒推通用模型，而是先在車這個高頻、高風險、高反饋密度的場景里，把模型打磨出來。

這條路徑的現實性，恰恰在于汽車行業的特殊性。車是少數已經具備規模化硬件載體、持續在線運行環境、海量真實場景數據，以及明確安全邊界要求的行業。

換句話說，汽車很可能是離物理AI最近的訓練場。英偉達對 physical AI 的最新布局里，也一再把自動駕駛和機器人并列：從 Cosmos 世界模型，到開放數據工廠藍圖，再到面向自動駕駛長尾場景的開放模型家族，底層思路都指向同一個方向——用更統一的世界建模和仿真能力，處理真實世界里最昂貴的長尾問題。

所以，汽車行業積累的數據、算力和工程體系，不只能服務于賣車，也可能反過來成為物理AI時代最先成型的一塊底座，因為車是最貴也最有效的數據源。

4、是中國智駕公司開始搶解釋權

當然，這條路線還遠沒到可以下結論的時候。Foundation Model 能不能真正解決輔助駕駛里的安全一致性、責任邊界和長尾穩定性，最終還要看量產表現，而不是技術演講。尤其在智能駕駛領域，所有宏大敘事最后都要落到一個最樸素的問題上：用戶敢不敢開，車企敢不敢上，監管敢不敢放。

但從行業競爭的角度看，元戎啟行在GTC釋放這個信號，仍然值得重視。因為過去兩年，汽車AI的主導敘事，基本掌握在特斯拉、英偉達這樣的平臺型巨頭手里。中國智駕公司更多是在做應用落地、性能追趕和成本優化，很少有人試圖從“底層范式”層面重新定義自己。

元戎啟行這次的動作，本質上是在爭奪一個新的解釋權：它不滿足于被理解成一家輔助駕駛供應商，而是試圖把自己放進物理AI的更大坐標系里。

這件事能不能成功，現在還言之過早。但有一點已經越來越清楚：輔助駕駛行業正在進入一個新階段。過去比的是有沒有功能、有沒有地圖、能不能開；接下來比的，是誰能先做出一個足夠統一、足夠可遷移、足夠能在真實世界里持續學習的“大腦”，只有這個才能拉開差距。（作者｜李玉鵬，編輯｜李程程）

特別聲明：以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布，本平臺僅提供信息存儲服務。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.