![]()
![]()
物理AI的“ChatGPT時刻”已至,中國企業深度參與全產業鏈布局。
作者|王蕊
編輯|西子
2026 年春天,英偉達GTC大會完成一次根本性敘事轉向——從「數字世界」全面跨向「物理世界」。
站在臺上的黃仁勛不再只談更強算力、更大模型,他把英偉達重新定義為一家“AI基礎設施與AI工廠公司”,重心從“模型能力”轉向“AI 如何真正進入現實世界”。
本屆大會釋放了3個最強信號:
“物理AI”的ChatGPT時刻已至,自動駕駛是規模化起點,通用具身智能是長期終點。
數據中心變身“Token 工廠”,核心指標從TFLOPS轉向“每瓦特生成的Token數”。
中國力量從“參會者”變為“深度共建者”,覆蓋了從硬件、軟件到應用場景的全產業鏈。
在這一變化之下,黃仁勛進一步勾勒出“AI五層蛋糕”的全棧架構:加速計算 → 芯片與基礎設施 → 開放模型 → 智能體 AI → 物理 AI,并表示AI必須學會理解重力、摩擦與材料特性,才能真正融入并改造現實世界。
對應這一框架,英偉達的發布也不再是單一芯片,而是一整套AI基礎設施:新一代數據中心平臺與加速計算架構,面向推理優化的軟件體系(如 TensorRT),以及圍繞自動駕駛與機器人的開發與仿真平臺(DRIVE、Isaac、Omniverse),打通訓練 — 推理、云端 — 端側完整閉環。
這一切的底層邏輯,是黃仁勛提出的“Token工廠”經濟學。
他認為,未來的數據中心將不再是存儲中心,而是生產智能Token的工廠,企業的核心競爭力將取決于“每瓦特生成的Token數”。
基于此,他將2025至2027年AI基礎設施的潛在市場規模預測,從5000億美元大幅上調至1萬億美元。未來的AI服務也將像電力一樣分層,從免費到超級服務,價格覆蓋每百萬Token幾美元到上百美元的廣闊區間。
而在本屆大會上,尤為引人注目的是,中國力量在此次生態革命中扮演了前所未有的深度共建者角色。這不再僅是幾家明星企業的亮相,而是一次從硬件、軟件到應用場景的全產業鏈集體登場。
![]()
聯想集團與英偉達聯合發布新一代混合AI解決方案;
智元機器人作為Project GR00T N系列全球首批生態伙伴,展示其精密操作能力;
在核心供應鏈上,速騰聚創的數字化激光雷達、禾賽科技的車規級感知方案,以及領益智造(立敏達)的液冷核心部件,開始進入自動駕駛與算力基礎設施體系。
在應用側,比亞迪、吉利、小馬智行、文遠知行等集體入駐Robotaxi Ready平臺;
而在具身智能方向,宇樹科技、銀河通用機器人等公司,則圍繞仿真與模型探索工業化路徑。
這些路徑看起來各不相同,但指向的是同一個問題:AI的終極價值,取決于能否安全、高效、低成本地融入并改造物理世界。這場“肉身”革命的實現,需要全球芯片、算法、硬件、系統、終端的空前協同。
![]()
然而,從宏偉的生態藍圖到可靠的商業產品,中間還存在著真實的鴻溝:數據從哪里來?系統如何在復雜環境中持續運轉?以及成本如何被壓縮到可以規模化部署的區間?
也正是在這些約束之下,不同公司的技術路徑開始分化。有人在解決數據問題,有人在重構系統架構,也有人在試圖把成本降到可接受范圍。
以下,是部分一線公司在GTC 2026現場及相關活動中的觀點和判斷。
AI的本質是生產“智能 Token”
英偉達創始人 黃仁勛
“英偉達不再只是一家GPU公司。我們已經成為一家‘AI基礎設施與AI工廠公司’。”
“數據中心正在從‘計算中心’轉變為‘Token工廠’。我們的核心指標不再是單純的算力,而是‘每瓦特生成的Token數’(tokens/watt)。”
“我們正在構建的是AI的‘五層蛋糕’:加速計算、AI基礎設施、開放模型、智能體AI,以及最頂層的物理AI。”
“物理AI的‘ChatGPT時刻’已經到來。AI必須學會理解物理世界——重力、摩擦、材料特性。”
“我們將2025年至2027年AI基礎設施的潛在市場規模預測,從5000億美元上調至1萬億美元。”
“AI服務將像電力一樣分層。未來會有免費、中級、高級和超級服務,價格從每百萬Token幾美元到上百美元不等。”
![]()
月之暗面(Kimi)創始人 楊植麟
“長文本(Long Context)不是一個噱頭,它是物理 AI 的數字底座。如果你要讓一個機器人去管理一座工廠,它需要處理的不是幾千個 Token,而是長達數周、包含數百萬個動作序列和環境反饋的‘超長上下文’。沒有極長文本的處理能力,具身智能就永遠無法完成長程任務。”
“未來的 AI 不再是一個全能的巨獸,而是一個個智能體集群(Agent Swarms)。大模型作為‘指揮官’,負責拆解目標,并動態調用成百上千個專業的子代理。這種多智能體協作產生的涌現效應,將遠超單一模型的能力極限。”
![]()
具身智能,死磕“物理常識”
宇樹科技創始人、CEO兼CTO 王興興
“具身智能真正的 ChatGPT 時刻,我個人的判斷是 ‘80/80 準則’:即當機器人能在 80% 的陌生場景中,僅通過簡單的語音或文字指令,就能順利完成大約 80% 的任務時,這個行業就徹底爆發了。”
“很多人覺得運動不重要,但我始終認為運動能力是干活的先決條件。到 2026 年中,人形機器人的奔跑速度將超越人類極限,快過博爾特。這不是為了秀肌肉,而是硬件驅動電機和控制算法閉環成熟的信號。”
“未來生產力的飛躍,一定是 ‘機器人生產機器人’。我們已經開始在工廠里讓機器人組裝它們自己的關節,這種自我復制的閉環會把成本壓到超乎想象。”
“具身智能目前最大的瓶頸并不是模型架構,而是缺乏高質量的、真實的物理交互數據。我們不能像 GPT 訓練文本模型那樣,直接從互聯網上‘抓取’機器人的動作邏輯。每一比特有效的動作數據,現在都需要通過昂貴的遙操作或復雜的仿真合成去獲取。”
“Sim-to-Real 的鴻溝依然是一塊極其難啃的硬骨頭。在虛擬環境里表現完美的算法,到了現實世界中,可能僅僅因為地面摩擦力的 1% 波動,或者光影的一個細微閃爍,就導致整個動作序列的徹底崩潰。這種‘物理精度’的丟失,是量產落地的最大障礙。”
"機器人、AI、具身智能,都不是一兩家公司,甚至也不是一個國家就能獨自完成的事。無論最后是誰率先做成,對整個行業都是好事。"
至簡動力CEO 賈鵬
"當前具身智能行業面臨一個現實鴻溝:具身智能通用能力的不足與用戶高要求之間存在巨大差距。真實世界的復雜程度遠遠超出想象,目前模型泛化能力較差,在大多數場景均難以落地,尤其在靈巧操作任務上幾乎無泛化能力可言。"
"在工廠等應用場景中,只有達到100%的成功率才能形成真正的生產力,產生用戶價值。通用能力的不足與用戶的高要求之間存在著巨大鴻溝,這也是具身智能發展至今仍未大規模落地的真正原因。"
銀河通用機器人創始人兼CTO 王鶴
"我們不追求機器人會做100件事,而是讓它把10件事做到工業級標準。"
"仿真是我們的核心能力。我們與Isaac Sim的合作展示了一條掌握復雜機器人技能(如全身控制與靈巧操作)的確定性路徑。"
![]()
思摩爾國際創始人、董事長兼CEO 陳志平
"過去,操作復雜的工業設備需要經驗豐富的專家,就像專業攝影師才能拍出好照片。今天,AI正在為工業帶來一場‘智能手機革命’,讓毫無專業技能的普通人,也能輕松駕馭強大的生產力工具。我們的核心理念,就是‘讓工業設備,更智能、更簡單’。"
"未來的工業形態將是‘軟件定義制造’的時代,AI基礎設施服務商與工業裝備廠商將深度協同、生態共生。這一格局將催生出工業界的‘龍蝦+Manus’標桿體系:以通用大模型作為認知大腦,通過一個標準化、智能化的中間層,去統一連接、調度和操控物理世界里海量的工業設備,最終打通數字世界與物理世界的隔閡。"
理想汽車基座模型負責人 詹錕
"當我們把視覺、語言和行動統一到一個模型中時,它已不再只是自動駕駛模型,而是在逐漸演化為面向物理世界的通用智能體。基于同一套VLA模型,不僅可以控制車輛,也能夠擴展到機器人。因此,自動駕駛只是物理AI的起點,未來這類基礎模型將驅動新的具身智能范式。"
吉利汽車集團CTO 李傳海
"汽車行業正處在從‘功能疊加’邁向‘體驗融合’的關鍵節點,而核心抓手就是‘AI車’。AI不再是某個功能的‘錦上添花’,而是貫穿研發到制造、從云端到車端的‘血液’。"
"未來的AI Agent不應僅是響應指令的秘書,而應成為能基于實時場景、歷史習慣進行主動服務的伙伴。例如,Eva能夠學習用戶習慣,在檢測到駕駛員長途駕駛后出現疲憊跡象時,主動建議切換至更保守的輔助駕駛模式,并調節車內環境。這標志著車載智能從‘功能模塊’時代,正式邁入‘整車智能中樞’時代。"
元戎啟行CTO 曹通易
“數據閉環的挑戰在于‘長尾數據的清洗效率’。我們現在的系統能從每天 PB 級的數據中自動識別并提取最具訓練價值的 0.01% 極端場景。”
“未來的競爭是算力效率的博弈。如果你需要堆三塊芯片才能跑贏別人的單塊芯片,那么你的商業化成本結構就已經輸了。”
"2025年,我國搭載城市NOA功能的乘用車累計銷量超300萬輛,滲透率超15%。城區NOA功能進一步普及的同時,這一技術從‘可用’向‘好用’‘敢用’跨越的挑戰也正浮出水面。"
![]()
英偉達全球副總裁 吳新宙
“邁向 L4 之路,技術已經不再是唯一的變量。我們現在的重點是如何打造一個‘可規模化、高安全冗余’的自動駕駛工廠。當模型具備了泛化能力,量產的成本曲線將迎來劇烈的向下拐點。”
卓馭科技AI CTO 陳曉智
“我們正在跨越從‘感知世界’到**‘理解世界邏輯’的鴻溝。多模態端到端世界模型的核心價值在于,它賦予了汽車一種‘物理直覺’**,讓智駕系統能像人類駕駛員一樣,在未見過的復雜場景中進行邏輯推理。”
“智駕的下一場革命是‘語義級避障’。系統不僅要知道那是一個物體,還要知道‘那是一個飛走的塑料袋’和‘那是一個橫穿的行人’在物理反饋上的本質區別。”
火山引擎智能座艙負責人 陳婧文
“大模型進入座艙不是為了增加幾個語音指令,而是要實現‘從被動響應到主動理解’的跨越。真正的智能不是你喊它,而是它通過座艙傳感器感知到你的疲勞或焦慮,并在你開口前給出反饋。”
“未來的核心架構一定是‘云端聯動本地’(Cloud-to-Edge)。云端負責極其復雜的意圖拆解和知識檢索,而本地 NPU 負責對隱私敏感、高實時性的交互指令。‘全本地化推理’是保護車主隱私的最后一道防線。”
![]()
阿里巴巴智能座艙負責人 胡曉露
“我們認為,下一代座艙交互引擎必須是‘原生全模態(Native Omni)’。這意味著 AI 不再是把語音轉成文字再理解,而是直接處理原始的音頻流、視覺流。‘零延遲的感官對齊’是消除人機溝通‘電子味’的關鍵。”
“智駕大模型和座艙大模型不應該有兩個‘大腦’。Qwen3-Omni 嘗試做的是語義空間的大一統——當車看到障礙物時,它對物理世界的理解應該能直接同步給座艙助理,實現真正的‘所見即所言’。”
中科創達AI CTO 段崇智
“目前的端到端模型依然面臨‘理解力’瓶頸。我們提出的‘多模態端到端世界模型’,本質上是給 AI 裝上一個物理常識庫。它讓系統具備了‘想象未來’的能力,而不僅僅是根據歷史數據做概率預測。”
“‘感知與規控的強耦合’是不可逆的趨勢。 只有當感知模型本身就帶有‘世界常識’,規控才能做出超越規則的預判決策。”
黑芝麻智能CTO 顧強
“端到端架構的演進正在倒逼芯片設計發生質變。傳統的加速邏輯已經不夠用了,我們需要的是針對‘大模型推理延遲’進行深度優化的新一代總線架構。”
“智能融合的下半場是‘跨域的高效流動’。如何讓智駕數據和座艙數據在同一個芯片平臺上低損耗地共享內存?這不僅是軟件問題,更是底層半導體結構的‘效率博弈’。”
最真誠的智能汽車報道
![]()
特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.