![]()
GTC 2026 演講中,黃仁勛傳遞的核心信息很明確。
即 AI 正進入“推理與智能體時代”,數據中心正在從計算中心演變為生產 Token 的“AI 工廠”。
圍繞這一趨勢,英偉達發布了從 GPU 架構、數據處理軟件庫、AI 超級計算平臺到智能體軟件棧的一整套基礎設施。
黃仁勛說,黃仁勛說,AI 正在進入一個數萬億美元規模的基礎設施時代,而英偉達就是這個時代的“基建總包商”。
當天發布的一系列技術——Feynman 架構、Vera Rubin 超級 AI 平臺、數據處理核心庫 cuDF / cuVS、AI 工廠基礎設施 DSX、智能體平臺 NemoClaw 等,真實的構成了一套完整的 AI 基建技術棧。
一、CUDA20年:英偉達真正的護城河
演講一開始,黃仁勛并沒有談新產品,而是回顧了 CUDA 誕生 20 年的歷史。
![]()
他的核心觀點是,英偉達最難復制的優勢,不是 GPU,而是 CUDA 的安裝基數。
過去 20 年,CUDA 建立了一個龐大的軟件生態:關鍵數據、全球數億塊GPU 運行 CUDA、數千種工具、編譯器、框架與庫,及開源生態的數十萬項目。
而 CUDA增長邏輯是一個典型的飛輪效應。
安裝基數 → 開發者 → 新算法 → 新市場 → 更多公司 → 更大安裝基數……
這套飛輪已經跑了 20 年。
其直接結果是,計算成本持續下降。
黃仁勛舉了一個很典型的例子,
六年前發布的 Ampere GPU,在云上的價格甚至還在上漲。
原因很簡單,軟件持續優化,讓舊 GPU 的價值不斷提高。
因此 CUDA 帶來的并不僅是性能提升,而是長期下降的算力成本曲線。
這也是為什么英偉達愿意持續支持每一塊舊GPU。
因為安裝基數越大,飛輪越快。
二、AI 時代最重要的一張圖:數據處理
黃仁勛表示,本場演講最重要的一張圖,其實與 GPU 無關,而是數據處理架構。
![]()
他指出,AI 正在徹底改變全球數據處理體系。
數據可以分為兩類:
一是結構化數據,企業傳統 IT 的核心。
典型技術如 SQL、Spark、Pandas 等。
典型平臺如Snowflake、Databriks、Amazon Web Services、Microsoft、Google 等。
這些系統本質上都在處理 DataFrame(數據框)。
它們是企業運營的 “事實來源(Ground Truth)”。
二是非結構化數據,全球約 90% 的數據都是非結構化數據。包括視頻、語音、圖像、文檔、PDF等。
過去的問題是,計算機無法理解它們,而 AI 改變了這一點。
多模態模型可以解析語義、閱讀文檔、理解視頻、解析語音,從而把非結構化數據變成可計算的數據。
為此,英偉達為此推出兩項核心技術。
即cuDF,GPU加速的 DataFrame計算庫, 用于結構化數據和cuVS,向量搜索與語義計算庫, 用于 非結構化數據
這兩者將成為未來 AI 數據基礎設施的核心軟件層。
他舉了一個重要案例,IBM 已經在其數據平臺 watsonx.data 中集成 cuDF。
這意味著,AI 正在重新定義整個數據處理產業。
三、AI 原生公司的爆發
過去一年,AI 創業進入歷史性階段。
數據顯示,2025年,AI創業融資1500億美元,且融資規模從千萬級→數十億美元級。
背后就是海量算力的需求。
黃仁勛把這一輪技術浪潮與三次計算革命類比:
計算平臺
誕生公司
PC
微軟
互聯網
移動云
Amazon / Meta
現在,AI 也將誕生新一代巨頭。
他認為, AI 爆發的三大原因是,ChatGPT 開啟生成式 AI,推理模型出現,及AI agent 爆發。
ChatGPT 讓計算模式從檢索轉為生成,推理模型讓AI開始具備思考、規劃和解析的能力,Token 使用量爆炸式增長。
Agent時代開啟,以Claude Code為代表。
從此 AI 可以閱讀代碼、編譯、測試、自動迭代,甚至一個任務可以自動運行數百次實驗。
關于推理時代催生的算力需求,黃仁勛給出一個驚人的數字:
過去兩年,計算需求增長10000倍,使用量增長 100 倍。
而他個人感受是,真實需求增長接近 100 萬倍。
![]()
四、Token 成本成為核心指標
在 AI 時代,數據中心的角色正在改變。
過去是存儲 + 計算,而未來是 Token 工廠。
衡量效率的指標也變成,tokens / watt(每瓦生成 token 數)
研究機構 SemiAnalysis 的評估顯示,從Hopper H200 → Grace Blackwell NVLink 72,英偉達系統每瓦性能提升約 35 倍。
![]()
分析師 Dylan Patel 認為,實際接近 50 倍。
軟件優化同樣關鍵。
僅通過更新軟件棧,生成速度可以從700 token/s 提升到5000 token/s,性能提升約7倍。
黃仁勛給出一個非常現實的計算,建設一個 1GW 數據中心,15 年攤銷成本約400億美元。
因此,企業必須保證運行效率最高的計算系統,否則 Token 成本就會失控。
他的結論非常直接:
NVIDIA 的 Token 成本目前“不可觸碰”。
五、Vera Rubin:AI 超級計算機
本次演講的另一個高潮是 Vera Rubin AI 平臺。
![]()
這是一個完整的 AI 超級計算系統。
2 萬顆 NVIDIA 芯片、40 機架、1152 個 Rubin GPU、60 exaflops 算力、10PB/s 帶寬。
目前合作伙伴包括 OpenAI、Anthtopic、Meta、Mistral AI 等。
黃仁勛說:
以前我發布產品時,手里舉的是一塊 GPU。
現在我發布的是一整臺超級計算機。
Vera Rubin 代表的是,完整的垂直整合 AI 系統
包括:GPU、CPU、網絡、存儲、軟件棧等。
其中新的 Vera CPU 也首次亮相。
它是,全球首個采用 LPDDR5 的數據中心 CPU
目標是,極致能效比。
六、下一代 GPU:Feynman
英偉達還首次詳細介紹了下一代架構,Feynman GPU。
![]()
其關鍵升級集中在 內存與封裝。
如,定制HBM
可能采用定制HBM4E,或提前布局 HBM5
并允許把 GPU邏輯直接嵌入存儲芯片。
新CPU架構:Rosa
Feynman平臺將配套 Rosa CPU。
這個名字致敬了兩位科學家,Rosalyn Sussman Yalow 和 Rosalind Franklin。
Rosa CPU 的角色是Agentic AI 調度中樞。
具體負責協調GPU、內存、網絡和 Token 流。
七、AI 工廠操作系統:DSX
隨著 AI 基礎設施規模擴大,其建設方式也在發生變化。
現在的數據中心在建造前就會,先在數字世界里建一遍。
使用的工具包括Simcenter STAR-CCM+、Cadence Design Systems和 ETAP。
英偉達推出的新平臺NVIDIA DSX,目標是成為AI 工廠的操作系統。
![]()
它可以模擬數據中心、優化電力、化散熱、動態調度算力,甚至根據電網壓力自動調整功耗。
八、Agent 時代的軟件:NemoClaw
對開發者影響最大的,是智能體軟件棧。
黃仁勛重點提到了開源項目,OpenClaw。
他認為 OpenClaw 的意義類似Linux、Kubernetes、HTML,可以被看作Agent 時代的操作系統。
功能包括任務拆解、子 Agent 協作、工具調用、文件系統訪問、多模態交互等。
![]()
英偉達在此基礎上推出了 NVIDIA NemoClaw, 新增能力包括 企業安全策略、 網絡防護、 隱私路由、 治理系統集成等, 目標是,讓企業安全部署 AI Agent。
![]()
九、AI 生態:300萬開源模型
黃仁勛最后談到 AI 生態。
目前全球開放模型規模,已接近300 萬個。
英偉達也發布了一系列基礎模型,如Nemotron(語言模型)、Cosmos(世界模型)、GR00T(機器人模型)、BioNeMo(生物 AI)。
目標是,推動主權 AI(Sovereign AI)。
同時英偉達還宣布成立 Nemotron Coalition。
![]()
合作伙伴包括Cursor、LangChain、Perplexity AI、Mistral AI。
結語:AI 的三大浪潮
![]()
在演講最后,黃仁勛總結稱, AI 正同時經歷 三場革命。
一是, AI 推理與 AI 工廠;
二是, Agentic AI(智能體);
三是, Physical AI(機器人)。
當計算、模型和基礎設施三者同時成熟時,AI 產業將進入一個全新的時代。
而英偉達顯然希望成為這個時代的基礎設施核心。
特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.