![]()
![]()
“英偉達承認GPU并非推理最優解,AI算力敘事邏輯改寫。”
作者丨劉伊倫 楊依婷
編輯丨包永剛
GTC 2026,主角不再是GPU。黃仁勛用一整場發布會證明:英偉達的戰場已經轉移。
過去十年,英偉達用CUDA生態和Tensor Core,將GPU推至AI計算的中心位置,GPU既是訓練引擎,也是推理主力,包攬一切。
而在這場被視為AI基礎設施風向標的發布會上,敘事重心開始從“更強的GPU”,轉向“如何組織算力”。
從Vera Rubin平臺,到LPX推理機架,再到尚未完全展開的Feynman架構,一條清晰的主線逐漸浮現:AI正在從以訓練為中心的階段,過渡到以推理為核心的階段,而對應的基礎設施,也發生了從通用走向分工的變化。
數據中心也被重新定義為“AI工廠”,衡量標準也從單卡性能,轉向Token產出效率。
但這套新敘事也留下一串未解的追問:LPU的入場是否宣告推理不是GPU的主場?專用架構與通用算力如何分層共處?Token能否真正成為AI時代的硬通貨?而英偉達從"算力壟斷"轉向"生態閉環"的轉身,究竟是前瞻布局,還是存量優勢的被動防守?更多產業洞察,歡迎添加微信YONGGANLL6662交流探討。
為了厘清這場變局的技術邏輯與市場動因,我們和多位產業專家及投資人深度交流之后,獲得了在英偉達新敘事之下產業里的分歧與共識。
同時,我們也特邀3位行業頂級專家,于3月19日11:30開講,對GTC 2026進行深度解析,全方位拆解算力產業的核心趨勢、投資機遇與破局方向,歡迎鎖定視頻號“雷峰網”、“AI 科技評論”直播間,共探產業新局。
01
LPU入局,GPU不是推理時代的「主角」了嗎?
在GTC 2026上,黃仁勛再次重申了他對AI基礎設施演進的判斷:“AI正從‘模型訓練時代’加速邁入‘模型推理時代’,整個AI技術棧的組織方式,都開始被重新定義。”
在AI進入推理的時代,英偉達更新了“全家桶”,包括Vera Rubin平臺、LPX推理機架以及代號為Feynman架構在內的一整套新敘事,從單一GPU主導,轉向多處理器協同的“AI工廠”。
如果說過去十年,GPU是AI時代當之無愧的“主角”,那么在這套新藍圖中,GPU不再試圖包攬一切,而是與CPU、LPU及專用推理單元共同構成分層分工的計算體系。英偉達正在主動拆解“通用算力”的神話,并試圖用更復雜但更高效的架構,去承接一個以推理為中心、以Agent為核心的新周期。關于這一周期的更多深度解讀與行業動態,歡迎添加微信EATINGNTAE交流探討。
雷峰網采訪的業內專家對此分析道:
LPU的推出,在一定程度上,是英偉達承認GPU并非推理最優解。并且,理論上專用推理場景可完全脫離GPU,但英偉達仍將LPU與GPU捆綁組合,既是生態延續,也避免對原有路線的“打臉”。在市場層面,頭部大廠推理需求仍會堅定走向自研與ASIC路線,追求能效與成本自主可控。英偉達GPU+LPU方案,重點客戶可能是中小互聯網客戶。
——芯片產業專家張翔
在Transformer推理中,Prefill、Decode、Orchestration三個階段開始由不同硬件承擔,LPX的出現,本質上是對Decode階段的一次專門優化。GPU依然是訓練和復雜推理的最優解,但在低延遲推理這個細分賽道上,專用架構開始顯示出優勢。GPU不會被LPX取代,而是各司其職。
——芯片產業人士姚金鑫(J叔)
現在市場上LPU的呼聲很高,但其短期內難以成為英偉達版圖中的主力。黃仁勛在演講的過程中一直強調的是LPU的性能,確不清楚其售價,所以LPU的經濟性存疑,其單芯片集成500MB片上SRAM,而SRAM的價格通常是HBM的6-8倍,這一定會抬高LPU的成本,并且受限于工具鏈融合的滯后性,其更多扮演推理場景的補充角色。
——資深產業研究員劉雨嫣
LPX的入場不一定宣告GPU推理時代的終結,而是推理任務分層化的信號,GPU仍坐鎮復雜推理與視頻生成等算力密集型陣地,LPX則專攻低延遲、輕算力的細分場景。未來數據中心的圖景是多元處理器各安其位,GPU“全能選手”退位,推理霸權讓位于專業化分工。
CPX未被提及很讓人意外,此前業內大部分觀點認為此次發布會是CPX負責Prefill、LPU負責Decode的組合,從原理上看,Prefill不依賴顯存、Decode更吃顯存,CPX和LPU本應是最優解,因此本次完全不提CPX,讓人有些意外(超預期不是意外的意思)。
——分析師李維
Vera與Rosa的亮相,配合超節點架構中CPU配比的顯著提升,標志著英偉達正將Agentic AI的爆發視為架構重構的核心變量,其CPU敘事的核心,是AI工廠內部的算力編排權,而非與其他廠商競爭,短期內對x86格局難有實質沖擊。
此外,從系統架構的角度來看,Vera CPU的推出對x86影響同樣有限,Vera是面向AI推理與訓練設計的專用計算單元,而x86作為通用計算架構,仍要承載操作系統、數據庫及海量傳統軟件的運行。Arm的精簡指令集恰好契合AI場景的需求,不需要兼容過往幾十年的軟件棧,可以砍掉冗余邏輯,專注于高性能計算本身。
——芯片產業專家孫旭
從國內算力市場格局來看,英偉達此番推理性價比優勢,對本土市場沖擊有限,國產替代的核心敘事邏輯依舊穩固,并不會因此發生動搖。
——分析師張楠
02
Token成本全球最低,英偉達就能吞下「1萬億美元」?
“推理拐點已經到來。”GTC 2026上,黃仁勛這句話宣告,Token已成為新的硬通貨。
黃仁勛認為,數據中心不再是倉庫,而是生產Token的“AI工廠”,每瓦吞吐量決定生死。而英偉達的Token成本全球最低,即便對手架構免費,面對英偉達也沒有性價比。他算了一筆賬:建一個1GW工廠,空轉15年攤銷就達400億美元,所以必須運行最強的系統才能攤薄成本。
基于這套邏輯,他拋出了一個讓人沸騰的數字:“到2027年AI芯片營收將至少達到1萬億美元。”相比去年預測翻倍,因為“過去兩年計算需求增長了一百萬倍。”
而1萬億美元這一數字,還只覆蓋Blackwell和Vera Rubin兩條產品線,若疊加CPU、Groq、存儲及網絡設備,這一規模或將達到1.25萬億美元。
當“全球最低Token成本”成為護城河,這套經濟學真能支撐1萬億美元營收嗎?
雷峰網采訪的業內專家對此分析道:
當黃仁勛把“Tokens/W”作為衡量AI工廠產出的核心度量衡時,其實背后還有一層更重要的產業深意,算力競爭的度量體系,正在從芯片走向系統,從峰值參數走向端到端能效。從某種程度上,GTC 2026公開驗證了這種系統視角,因為當NVIDIA自己都開始把敘事中心放到AI Factory上時,行業就已經在從AI計算芯片中心主義走向計算系統中心主義。
基于這個邏輯,我認為英偉達目前的估值并不高,甚至偏低。它賣的是整個系統,在系統級優化上,沒有誰能比它做得更好。唯一可能構成競爭的對手還是谷歌TPU,其他廠商基本追不上,這個格局到現在也沒變。
——芯片產業人士姚金鑫(J叔)
阿里成立ATH、英偉達GTC也將Token視為接下來的業務核心,兩大巨頭的同時發力證明,行業的核心爭奪,正是Token的生產、計量與分配主導權。Token全鏈路效率直接決定AI產業的經濟性,誰能掌握最低的Token生產成本與最高效的流轉體系,誰就掌握未來十年的產業定價權。如同電力時代的電網、互聯網時代的帶寬,AI時代正圍繞Token的創造、輸送與應用,正在形成一個規模潛力遠超想象的全新產業生態。
——九章云極技術專家陳昊
英偉達的護城河正在從“算力壟斷”轉向“生態閉環”。過去一年,其戰略重心明顯上移——通過綁定上游獨立供應商與下游AI數據中心,構建垂直整合的產業鏈控制力,既對沖大廠自研芯片的替代風險,又以系統級交付抬高競爭門檻。但長期盈利能力仍面臨結構性壓力,英偉達終將回歸高端制造業的常態利潤區間,只是時間早晚問題。
——分析師李維
AI已從聊天機器人升級為驅動社會生產力的核心引擎,Token是驅動AI運轉的基礎要素,如同電力之于工業時代,阿里、英偉達等巨頭意在成為AI時代的能源工廠。未來AI競爭的關鍵在于Token生產能力,具備規模化Token生產能力的企業,才能在AI競爭中占據優勢。大模型訓練僅占用少量算力,推理環節才是算力消耗的主力,需持續生成Token,Token的成本高低直接決定AI的普及與社會滲透程度。類比移動互聯網邊際成本為零的規模效應,只有Token成本降至如水、電般低廉、可被普通用戶輕松負擔,AI時代才會真正全面到來。
——分析師張楠
03
NVLink 6、CPO登場,透著英偉達的「焦慮」
英偉達在Vera Rubin平臺上部署了第六代NVLink互連架構,實現GPU之間的高速擴展連接。
與此同時,英偉達還推出了全球首個CPO光電共封裝的Spectrum-X以太網交換機,通過與臺積電合作的CoWoS先進封裝技術,將光引擎直接集成于交換芯片封裝體內,實現電信號與光信號的片上直轉,目前已進入量產階段。
黃仁勛在主題演講中表示,隨著AI模型體量指數級增長、智能體推理需求全面爆發,未來數據中心將進化為一臺單機架級超級計算機越來越像一臺超級計算機。關于這些前沿技術如何重塑AI基礎設施,歡迎添加微信EATINGNTAE深入交流。
雷峰網采訪的業內專家對此分析道:
英偉達正以Vera CPU、Rubin GPU、NVLink 6、ConnectX-9、BlueField-4、Spectrum-6與Groq 3 LPU的“全家桶”組合重構系統解決方案,敘事重心從單顆芯片轉向系統級交付。此外,英偉達還在嘗試構建聯盟,成員包括臺積電、美光、三星、海力士乃至英特爾等企業,試圖以聯盟策略鎖定先進封裝與存儲資源,這也恰恰暴露了英偉達的焦慮:如此龐雜的產品矩陣,仍未能追平谷歌簡潔架構的效能。
谷歌以7nm的ASIC,以及OCS與以太網的極簡組合,實現Token成本與吞吐效率的雙重領先,組網規模輕松突破NVL72的天花板。當對手用“減法”定義下一代基礎設施,英偉達的“加法”生態反而成為規模擴張的包袱。
——資深產業研究員劉雨嫣
當前兩大變數值得關注:一是隨著產業變革,關鍵廠商開始沿著價值鏈整合;二是受地緣政治影響,從中國大陸向外轉移模塊產能。近期,英偉達向Lumentum投資20億,既是為了分擔供應鏈地緣風險,也向上游高價值器件進行了整合。而原模塊供應商,也加快腳步在國外布局產能,應對份額壓力。
從CPO目前落地的進程來看,其推廣較為保守主要來自多個方面:一是維護便利性極其成本較高,不及可插拔光模塊,也會推高用戶的運維成本;二是核心芯片良率偏低,導致系統整體成本居高不下;三是來自于應用場景,傳統上光和銅的邊界很清晰,短距離情況下,銅比光更具有優勢。不過技術的迭代將逐步提升良率和可靠性,進一步優化維護便利與運維成本。同時,Scaling Law對需求的極致放大,尤其是帶寬的消耗,使得銅與光的界限在發生改變。雖然光完全替代銅還需要時日,但是方向是明確的。
對大型云廠商而言,只要能通過商業手段攤薄成本、算清總賬,CPO就具備規模化基礎。總體而言,CPO技術方向已明確,剩下的只是路徑問題。
——芯片產業人士姚金鑫(J叔)
CPO的delay暴露了英偉達的技術困局,銅互聯帶寬見頂、光互聯推進受阻,雙線均遭遇性能瓶頸。此外,英偉達的存量生態,不僅是優勢,同時也是包袱,其為守住既有優勢,系統堆疊愈發過重,框架性創新讓位于漸進式改良,這種“路徑依賴式”的防守策略,很難成為在資本市場上的利好。
——芯片產業專家張翔
04
OpenClaw 定義「智能體計算機」,SaaS 時代終局已至?
GTC 2026上,英偉達將OpenClaw定位為定義“智能體計算機”的下一代操作系統,并將其重要性類比為Linux之于服務器、Kubernetes之于云原生。為此,英偉達聯合OpenClaw創始人推出企業級增強棧NemoClaw,為智能體落地提供安全、可規模化的企業級能力。
黃仁勛在演講中拋出判斷:未來絕大多數SaaS都將演變為AaaS(智能體即服務)。“你的OpenClaw戰略是什么?” 或將成為科技公司的核心命題。
雷峰網采訪的業內專家對此分析道:
傳統SaaS公司都將消失的言論并非危言聳聽,AI智能體對當前SaaS業態帶來巨大沖擊,按席位訂閱的商業模式逐步失效,人力替代使得帳號需求銳減,算力成本也日益不可控。過去SaaS企業只能向模型公司調取算力與服務,不僅環境搭建繁瑣、成本不可控,也難以支撐智能體長期穩定運行,其必須走向AI化,打造和運營自主智能體。
Token分層定價并非對傳統SaaS訂閱模式的替代,而是AI時代商業模式的自然演進。客戶對這一模式的接受度,也將經歷從初期疑慮到逐步認同的過程,因為Token的分層定價將實現成本與價值的精準匹配,簡單查詢可使用低價 Token,深度推理選擇高價Token,天然適配智能體時代的算力消耗邏輯。
——九章云極技術專家陳昊
OpenClaw本質上是一個以CPU為主的控制與編排系統,外接GPU推理后端,這意味著它并非單純的AI推理負載,而是典型的CPU密集型任務——控制路由、工具執行、狀態持久化等都有CPU承擔。因此,Agent越流行,AaaS生態越壯大,CPU的總需求就越高,且這種需求不僅體現在核數上,更體現在芯片顆數上。
與此同時,系統級能力也會成為AaaS時代的核心競爭力。未來決定Agent應用落地的,不再僅僅是模型表現,還包括能否將智能體安全、穩定地接入生產環境,以及與之配套的云平臺、工具鏈、連接器和安全體系,這也將推動數據中心的基礎設施衡量標準,從單純比拼“模型能力的強弱”轉向“同等投資下可支撐的持續在線Agent數量”,即從單一的GPU算力轉向GPU+CPU雙芯驅動。
所以,具備CPU、GPU全棧組合能力的廠商,將在AaaS轉型浪潮中占據先發優勢。
——芯片產業人士姚金鑫(J叔)
AI芯片還有哪些潛在的技術趨勢?算力格局將發生什么變化?歡迎添加微信YONGGANLL6662交流探討。
05
今日11點丨全網最強「英偉達GTC」洞察、創投機遇梳理
想吃透GTC 2026核心技術精髓?
3月19日11:30,雷峰網重磅打造GTC專題圓桌對話,特邀半導體與AI算力領域三位頂級專家,深度拆解大會技術突破,直擊國產算力破局關鍵!
直播時間:2026年3月19日 11:30(北京時間)
觀看平臺:視頻號“雷峰網”、“AI科技評論”直播間
掃碼預約,和頂尖專家一起解鎖GTC算力變革密碼,搶占產業先機!
![]()
掃碼預約,觀看直播↑↑↑
(趙之齊對本文亦有貢獻)
注:張翔、李維、孫旭、張楠、陳昊皆為化名。
![]()
特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.