網易首頁 > 網易號 > 正文申請入駐

GTC 2026上，黃仁勛講了個1萬億美元的故事

2026-03-17 17:38:52　來源: 動點科技

上海舉報

分享至

開啟新征程

文｜動點科技

作者｜李鵬輝

再過一年，AI能夠帶來怎樣的震撼？在黃仁勛看來，它可以精確到一個數字之上。

今年度的英偉達春晚GTC 2026上，黃仁勛為外界展示了這家芯片巨頭對于AI下半場的思考與規劃。他在演講中提到，到2027年，英偉達已經看到了至少1萬億美元的需求（基于25、26、27年三年的需求預判總和）。而他也進一步指出，“我也相信，未來的實際計算需求會遠高于這個數字。”

但就在一年前的GTC上，這個判斷還是“到2026年，看到了Blackwell與Vera Rubin的5000億美元（25年+26年的需求總和）的高信心需求和采購訂單”。僅一年時間，黃仁勛對市場需求的預判有了顯著增長。這場近3小時演講的核心，則正是他的底氣所在。

萬億需求，從何而來

黃仁勛對1萬億美元AI計算需求的判斷，建立在他對這一輪AI變化的理解，以及英偉達過去20年積累的底層能力之上。

在演講中，他將過去兩年AI的發展拆解為三個關鍵節點：ChatGPT開啟了生成式AI時代，讓AI從感知理解走向了內容生成；o3系列推理模型的爆發，讓AI實現了反思、規劃與問題拆解，讓生成式AI有了事實grounding；而像Claude Code這樣的產品，則讓AI進一步從“回答問題”走向“執行任務、完成實際工作”。

在他看來，這三個節點直接改變了AI計算的核心需求。

黃仁勛在演講中提到，推理階段的計算需求大約增長了1萬倍，而AI的使用量又增長了100倍，因此他相信，過去兩年全球AI計算需求整體增長了100萬倍。在他看來，AI的發展早已越過了以訓練為核心的階段，重心已經大步走向了推理應用。

相應的，企業對AI基礎設施的核心訴求也在隨之改變。在黃仁勛的說法里，數據中心已經越來越像一座“token工廠”。在固定電力約束下，企業真正要盯住的，是單位功耗下能產出多少token，以及每個token的成本還能壓到多低。

這也是黃仁勛為什么會把需求看到1萬億美元的關鍵原因之一：當AI全面進入推理驅動的落地階段，從大模型廠商、云服務商，到各個行業的實體企業，都需要大規模的AI算力基礎設施，來支撐token生產的核心需求。而在黃仁勛的判斷里，這個需求的爆發才剛剛開始。

另一個底層支撐，是走過20年周期的CUDA生態。演講開篇，黃仁勛用了大量篇幅致敬CUDA發布20周年，在他的邏輯里，CUDA是英偉達能承接萬億級需求的核心護城河。20年間，CUDA架構已經在全球積累了數億級的GPU安裝基數，形成了“安裝基數吸引開發者——開發者創造算法突破——催生新市場——進一步擴大安裝基數”的正向飛輪。

體現到現實層面，黃仁勛指出，6年前發布的Ampere架構，如今在云端的租賃價格仍在上漲。這背后的核心原因正是CUDA生態的持續軟件優化，讓老架構的算力價值不斷增值，大幅延長了基礎設施的使用壽命。對客戶而言，這意味著投入的算力資產能持續產生價值，而這也是企業愿意大規模采購英偉達基礎設施的核心前提。

對于未來，英偉達這樣定義

圍繞推理時代不斷增長的token需求，英偉達這次在GTC上拿出的重點，已經不只是單一芯片。

正如演講所展示的那樣，這一輪布局的核心，是Vera Rubin平臺。按英偉達官方的說法，這是一套由七顆芯片、五大機架級系統組成的AI超級計算機，面向Agentic AI的全生命周期而設計，涵蓋計算、存儲、網絡與安全等多個層面。英偉達給出的關鍵指標，是其最高可實現10倍的推理吞吐/每瓦提升，并把每token成本壓到原來的十分之一。

Vera Rubin平臺。圖源：英偉達

但這套平臺的核心價值，遠不止算力本身。

圍繞Agentic AI在推理階段對CPU環境、存儲訪問、網絡擴展和系統調度的要求，英偉達同時推出了Vera CPU Rack、基于BlueField-4的存儲與數據處理層，以及以Spectrum-X和Quantum-X800為代表的互聯方案。它想解決的問題很明確：隨著模型變大、上下文變長、KV緩存和企業數據調用越來越頻繁，AI工廠需要被重新設計，存儲、網絡和CPU都不能再只是GPU的附屬配角。

此外，針對推理行業長期存在的“高吞吐與低延遲難以兼顧”的問題，英偉達也希望通過Vera Rubin和Groq 3 LPX Rack相結合的方式解決。

黃仁勛把推理拆成兩個環節：prefill預填充與注意力計算，需要高并行、高算力的通用計算能力；而token解碼生成，則更依賴低延遲與高并發能力。英偉達給出的思路，是把這兩類負載交給不同特性的計算單元分別處理，再通過低延遲互聯把它們接起來。作為結果，官方表示，Vera Rubin與Groq 3 LPX的組合可帶來35倍的吞吐/每兆瓦提升。

圖源：英偉達

最后，面向更廣闊的企業級市場，英偉達也拿出了更完整的軟件和模型層組合。圍繞企業結構化與非結構化數據處理，英偉達繼續推進QDF和QVS；圍繞OpenClaw，推出了NemoClaw，把安全、隱私和企業級可用性補進這套智能體框架；同時，Vera Rubin平臺也和更大范圍的Nemotron、自動駕駛、機器人與生物醫療模型體系一起，構成了英偉達這次想交出的“從推理到底層應用”的完整答案。

芯片、平臺、生態

在黃仁勛的邏輯里，1萬億美元的AI計算需求，不是靠英偉達一家就能承接的，而最終的市場規模，也遠不止1萬億美元。

他在演講中強調，英偉達的核心戰略，在于“垂直整合，水平開放”。

所謂垂直整合，是英偉達打通了從芯片、系統架構、算法庫、基礎模型到場景落地的全鏈條；而水平開放，是英偉達將所有打磨好的技術能力，全部開放給全行業的合作伙伴，讓不同領域的企業都能基于英偉達的平臺，低成本落地AI業務，而非打造封閉的自有生態。也正是這套戰略，讓英偉達的生態覆蓋了AI產業的全鏈條。

放到更具體的行業里看，這套邏輯也已經開始顯現。演講提到，本次GTC參會人數最多的行業是金融服務。這意味著，金融機構已經成為這一輪AI落地中最活躍的參與者之一，算法交易等場景也正在從傳統機器學習繼續走向大模型。

此外，醫療行業同樣被黃仁勛放到了重點位置。按他的說法，AI Biology、藥物研發、診斷支持等方向都已經開始進入這一輪變化。而在自動駕駛領域，也已經有比亞迪、現代、日產、吉利四大車企新加入英偉達的robotaxi就緒平臺，疊加此前的奔馳、豐田、通用等合作伙伴，每年覆蓋的新車規模達到1800萬輛。在機器人領域，英偉達則推出了從仿真、訓練到落地的全棧工具鏈——據悉，本次GTC現場有110款機器人搭載了英偉達的相關技術。

開發者、初創公司與英偉達生態的下一站

當然，不可忽視的是，整個英偉達生態的核心生命力，也來自開發者與AI初創公司。

黃仁勛在演講中提到，過去一年全球AI創業領域的風險投資達到1500億美元。對英偉達來說，這些初創公司也是這輪生態擴張里最活躍的一部分力量。

英偉達通過開源模型、開放算法庫、提供算力支持，降低了初創公司的AI開發門檻，而這些初創公司的成長與場景創新，又會持續放大全球AI計算的整體需求，成為英偉達未來增長的長期動力。為此，英偉達還啟動了Nemotron聯盟，聯合多家頂尖AI初創企業，共同研發下一代基礎大模型，持續完善開發者生態。

圖源：英偉達

至此，不難發現正是這些遍布全行業的合作伙伴、開發者與初創公司，共同構成了英偉達萬億級需求的基本盤。明年的GTC上，我們或許會看到這位皮衣教主為我們帶來更為驚嘆的數字，但無論是5000億美元還是1萬億美元甚至更高，對英偉達來說，每一年，都會是新階段的開始。而它的腳步，從未止步于此。

- - - - - - - - END - - - - - - - -

*想要獲取行業資訊、和志同道合的科技愛好者們分享心得，那就趕快掃碼添加“動點君”加入群聊吧！群里更有不定期福利發放！

精彩好文值得推薦！

一鍵轉發，戳個在看！

特別聲明：以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布，本平臺僅提供信息存儲服務。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.