![]()
圖片系AI 生成
英偉達GTC大會再次把“物理AI”推到了臺前。
3月17日,英偉達GTC 2026在美國舉行,和往年相比,這屆GTC對外釋放的信號更直接:英偉達已經不滿足于把AI停留在數字世界,而是把“Physical AI”推到了舞臺中央。
官方議程把 physical AI 與 agentic AI、AI factories 并列為大會主線;黃仁勛在相關發布中也把重點放在機器人、仿真、世界模型和開放數據工廠上,試圖把“會算”的AI,進一步推進到“會感知、會判斷、會行動”的AI。
在這個背景下,元戎啟行CTO曹通易在GTC上介紹了Foundation Model(基座模型)為核心重構的輔助駕駛技術體系。 這家公司試圖把輔助駕駛從一個單點產品,重新定義為物理世界AI的一種落地形態。換句話說,車不再只是終點,而是起點。
1、汽車只是物理AI的一部分
英偉達這次發布的新內容里,既有面向機器人和工業場景的 Isaac 仿真框架、GR00T 模型,也有面向 physical AI 訓練的數據工廠藍圖;官方甚至明確提到,這套體系將用于機器人、視覺AI代理和自動駕駛開發。
這背后其實是一個比較明顯的產業判斷:過去幾年,AI主要解決的是“理解文本、生成內容、輔助決策”的問題;接下來要解決的,是如何讓系統進入現實空間,在復雜環境里感知、推理、行動,并且承擔結果。
對汽車行業來說,這件事并不抽象。輔助駕駛本質上就是最早、最成熟、也是最嚴苛的 physical AI 試驗場之一。因為車每天都在真實道路中運行,場景開放、變量密集、容錯極低,遠比很多封閉環境里的機器人更難。
所以,元戎啟行選擇在GTC這個時間點,把自己的技術體系和“物理世界AI基座”綁定,并不是在追熱點,而是在順著英偉達定義的新敘事往前走。問題不在于它會不會講故事,而在于這個故事有沒有產業基礎。
2、不是輔助駕駛功能,而是“統一大腦”
按照曹通易在GTC上的表述,元戎啟行正在用 Foundation Model 重構下一代輔助駕駛技術體系,并將其定義為面向物理世界的AI基座模型。公開信息顯示,這套系統以 400 億參數規模的 VLA(視覺—語言—動作)基座模型為核心,試圖把場景理解、駕駛決策和安全評估統一到同一套模型架構里,而不是像過去那樣,把感知、規劃、控制拆成多個相互耦合但并不真正統一的模塊。
這件事為什么重要?因為過去一代輔助駕駛系統最大的問題,不是功能做不出來,而是系統天然是“拼接式”的。看見是一個模塊,理解是一個模塊,決策又是一個模塊,最后靠規則、工程經驗和大量人工調參,把它們盡量焊在一起。
這種架構在高速和標準化道路上還能工作,一旦進入城市、施工、混行、博弈密集的復雜場景,就容易出現兩個老問題:第一,系統知道“看到了什么”,但不一定真正理解發生了什么;第二,系統能完成動作,但不一定讓用戶敢持續使用。
元戎啟行現在想做的,是把“駕駛員”、“分析師”、“裁判員”三種能力塞進同一個基礎模型里。說白了,就是讓系統不只是執行,而是先形成對物理場景的統一理解,再輸出動作。這種路徑和行業過去的“規則+模塊堆疊”相比,核心變化不在架構邏輯:它希望系統先長出一個統一認知,再去調用不同能力,而不是讓不同能力各干各的。
這也是為什么曹通易會把輔助駕駛稱為基座模型的第一個“身體”。這句話聽上去很像技術圈常見的大詞,但放到產業邏輯里并不難理解:今天先讓模型在車上學會感知道路、處理風險、完成動作,明天同樣的認知底座,就有可能遷移到 Robotaxi,甚至更廣義的具身智能系統。
3、為什么是汽車先跑出來?
如果只把這套邏輯當成概念包裝,其實會低估它。元戎啟行這次最現實的一點,是它給終局找到了一條當前可走的路徑:先從量產車開始,把真實世界的數據、反饋和訓練閉環做出來。
公開報道顯示,搭載元戎啟行方案的量產車累計交付已超過25萬輛;公司方面同時強調,這些車輛在復雜道路中的場景理解能力,可以遷移到 Robotaxi 研發中。其面向量產輔助駕駛的數據閉環周期已壓縮到12小時。無論這些數字最終效果如何,至少說明一件事:它不是先去做人形機器人,再倒推通用模型,而是先在車這個高頻、高風險、高反饋密度的場景里,把模型打磨出來。
這條路徑的現實性,恰恰在于汽車行業的特殊性。車是少數已經具備規模化硬件載體、持續在線運行環境、海量真實場景數據,以及明確安全邊界要求的行業。
換句話說,汽車很可能是離物理AI最近的訓練場。英偉達對 physical AI 的最新布局里,也一再把自動駕駛和機器人并列:從 Cosmos 世界模型,到開放數據工廠藍圖,再到面向自動駕駛長尾場景的開放模型家族,底層思路都指向同一個方向——用更統一的世界建模和仿真能力,處理真實世界里最昂貴的長尾問題。
所以,汽車行業積累的數據、算力和工程體系,不只能服務于賣車,也可能反過來成為物理AI時代最先成型的一塊底座,因為車是最貴也最有效的數據源。
4、是中國智駕公司開始搶解釋權
當然,這條路線還遠沒到可以下結論的時候。Foundation Model 能不能真正解決輔助駕駛里的安全一致性、責任邊界和長尾穩定性,最終還要看量產表現,而不是技術演講。尤其在智能駕駛領域,所有宏大敘事最后都要落到一個最樸素的問題上:用戶敢不敢開,車企敢不敢上,監管敢不敢放。
但從行業競爭的角度看,元戎啟行在GTC釋放這個信號,仍然值得重視。因為過去兩年,汽車AI的主導敘事,基本掌握在特斯拉、英偉達這樣的平臺型巨頭手里。中國智駕公司更多是在做應用落地、性能追趕和成本優化,很少有人試圖從“底層范式”層面重新定義自己。
元戎啟行這次的動作,本質上是在爭奪一個新的解釋權:它不滿足于被理解成一家輔助駕駛供應商,而是試圖把自己放進物理AI的更大坐標系里。
這件事能不能成功,現在還言之過早。但有一點已經越來越清楚:輔助駕駛行業正在進入一個新階段。過去比的是有沒有功能、有沒有地圖、能不能開;接下來比的,是誰能先做出一個足夠統一、足夠可遷移、足夠能在真實世界里持續學習的“大腦”,只有這個才能拉開差距。(作者|李玉鵬,編輯|李程程)
特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.