![]()
![]()
開啟新征程
文|動點科技
作者|李鵬輝
再過一年,AI能夠帶來怎樣的震撼?在黃仁勛看來,它可以精確到一個數字之上。
今年度的英偉達春晚GTC 2026上,黃仁勛為外界展示了這家芯片巨頭對于AI下半場的思考與規劃。他在演講中提到,到2027年,英偉達已經看到了至少1萬億美元的需求(基于25、26、27年三年的需求預判總和)。而他也進一步指出,“我也相信,未來的實際計算需求會遠高于這個數字。”
![]()
但就在一年前的GTC上,這個判斷還是“到2026年,看到了Blackwell與Vera Rubin的5000億美元(25年+26年的需求總和)的高信心需求和采購訂單”。僅一年時間,黃仁勛對市場需求的預判有了顯著增長。這場近3小時演講的核心,則正是他的底氣所在。
萬億需求,從何而來
黃仁勛對1萬億美元AI計算需求的判斷,建立在他對這一輪AI變化的理解,以及英偉達過去20年積累的底層能力之上。
在演講中,他將過去兩年AI的發展拆解為三個關鍵節點:ChatGPT開啟了生成式AI時代,讓AI從感知理解走向了內容生成;o3系列推理模型的爆發,讓AI實現了反思、規劃與問題拆解,讓生成式AI有了事實grounding;而像Claude Code這樣的產品,則讓AI進一步從“回答問題”走向“執行任務、完成實際工作”。
在他看來,這三個節點直接改變了AI計算的核心需求。
黃仁勛在演講中提到,推理階段的計算需求大約增長了1萬倍,而AI的使用量又增長了100倍,因此他相信,過去兩年全球AI計算需求整體增長了100萬倍。在他看來,AI的發展早已越過了以訓練為核心的階段,重心已經大步走向了推理應用。
相應的,企業對AI基礎設施的核心訴求也在隨之改變。在黃仁勛的說法里,數據中心已經越來越像一座“token工廠”。在固定電力約束下,企業真正要盯住的,是單位功耗下能產出多少token,以及每個token的成本還能壓到多低。
這也是黃仁勛為什么會把需求看到1萬億美元的關鍵原因之一:當AI全面進入推理驅動的落地階段,從大模型廠商、云服務商,到各個行業的實體企業,都需要大規模的AI算力基礎設施,來支撐token生產的核心需求。而在黃仁勛的判斷里,這個需求的爆發才剛剛開始。
另一個底層支撐,是走過20年周期的CUDA生態。演講開篇,黃仁勛用了大量篇幅致敬CUDA發布20周年,在他的邏輯里,CUDA是英偉達能承接萬億級需求的核心護城河。20年間,CUDA架構已經在全球積累了數億級的GPU安裝基數,形成了“安裝基數吸引開發者——開發者創造算法突破——催生新市場——進一步擴大安裝基數”的正向飛輪。
![]()
體現到現實層面,黃仁勛指出,6年前發布的Ampere架構,如今在云端的租賃價格仍在上漲。這背后的核心原因正是CUDA生態的持續軟件優化,讓老架構的算力價值不斷增值,大幅延長了基礎設施的使用壽命。對客戶而言,這意味著投入的算力資產能持續產生價值,而這也是企業愿意大規模采購英偉達基礎設施的核心前提。
對于未來,英偉達這樣定義
圍繞推理時代不斷增長的token需求,英偉達這次在GTC上拿出的重點,已經不只是單一芯片。
正如演講所展示的那樣,這一輪布局的核心,是Vera Rubin平臺。按英偉達官方的說法,這是一套由七顆芯片、五大機架級系統組成的AI超級計算機,面向Agentic AI的全生命周期而設計,涵蓋計算、存儲、網絡與安全等多個層面。英偉達給出的關鍵指標,是其最高可實現10倍的推理吞吐/每瓦提升,并把每token成本壓到原來的十分之一。
![]()
Vera Rubin平臺。圖源:英偉達
但這套平臺的核心價值,遠不止算力本身。
圍繞Agentic AI在推理階段對CPU環境、存儲訪問、網絡擴展和系統調度的要求,英偉達同時推出了Vera CPU Rack、基于BlueField-4的存儲與數據處理層,以及以Spectrum-X和Quantum-X800為代表的互聯方案。它想解決的問題很明確:隨著模型變大、上下文變長、KV緩存和企業數據調用越來越頻繁,AI工廠需要被重新設計,存儲、網絡和CPU都不能再只是GPU的附屬配角。
此外,針對推理行業長期存在的“高吞吐與低延遲難以兼顧”的問題,英偉達也希望通過Vera Rubin和Groq 3 LPX Rack相結合的方式解決。
黃仁勛把推理拆成兩個環節:prefill預填充與注意力計算,需要高并行、高算力的通用計算能力;而token解碼生成,則更依賴低延遲與高并發能力。英偉達給出的思路,是把這兩類負載交給不同特性的計算單元分別處理,再通過低延遲互聯把它們接起來。作為結果,官方表示,Vera Rubin與Groq 3 LPX的組合可帶來35倍的吞吐/每兆瓦提升。
![]()
圖源:英偉達
最后,面向更廣闊的企業級市場,英偉達也拿出了更完整的軟件和模型層組合。圍繞企業結構化與非結構化數據處理,英偉達繼續推進QDF和QVS;圍繞OpenClaw,推出了NemoClaw,把安全、隱私和企業級可用性補進這套智能體框架;同時,Vera Rubin平臺也和更大范圍的Nemotron、自動駕駛、機器人與生物醫療模型體系一起,構成了英偉達這次想交出的“從推理到底層應用”的完整答案。
芯片、平臺、生態
在黃仁勛的邏輯里,1萬億美元的AI計算需求,不是靠英偉達一家就能承接的,而最終的市場規模,也遠不止1萬億美元。
他在演講中強調,英偉達的核心戰略,在于“垂直整合,水平開放”。
所謂垂直整合,是英偉達打通了從芯片、系統架構、算法庫、基礎模型到場景落地的全鏈條;而水平開放,是英偉達將所有打磨好的技術能力,全部開放給全行業的合作伙伴,讓不同領域的企業都能基于英偉達的平臺,低成本落地AI業務,而非打造封閉的自有生態。也正是這套戰略,讓英偉達的生態覆蓋了AI產業的全鏈條。
放到更具體的行業里看,這套邏輯也已經開始顯現。演講提到,本次GTC參會人數最多的行業是金融服務。這意味著,金融機構已經成為這一輪AI落地中最活躍的參與者之一,算法交易等場景也正在從傳統機器學習繼續走向大模型。
此外,醫療行業同樣被黃仁勛放到了重點位置。按他的說法,AI Biology、藥物研發、診斷支持等方向都已經開始進入這一輪變化。而在自動駕駛領域,也已經有比亞迪、現代、日產、吉利四大車企新加入英偉達的robotaxi就緒平臺,疊加此前的奔馳、豐田、通用等合作伙伴,每年覆蓋的新車規模達到1800萬輛。在機器人領域,英偉達則推出了從仿真、訓練到落地的全棧工具鏈——據悉,本次GTC現場有110款機器人搭載了英偉達的相關技術。
開發者、初創公司與英偉達生態的下一站
當然,不可忽視的是,整個英偉達生態的核心生命力,也來自開發者與AI初創公司。
黃仁勛在演講中提到,過去一年全球AI創業領域的風險投資達到1500億美元。對英偉達來說,這些初創公司也是這輪生態擴張里最活躍的一部分力量。
英偉達通過開源模型、開放算法庫、提供算力支持,降低了初創公司的AI開發門檻,而這些初創公司的成長與場景創新,又會持續放大全球AI計算的整體需求,成為英偉達未來增長的長期動力。為此,英偉達還啟動了Nemotron聯盟,聯合多家頂尖AI初創企業,共同研發下一代基礎大模型,持續完善開發者生態。
![]()
圖源:英偉達
至此,不難發現正是這些遍布全行業的合作伙伴、開發者與初創公司,共同構成了英偉達萬億級需求的基本盤。明年的GTC上,我們或許會看到這位皮衣教主為我們帶來更為驚嘆的數字,但無論是5000億美元還是1萬億美元甚至更高,對英偉達來說,每一年,都會是新階段的開始。而它的腳步,從未止步于此。
- - - - - - - - END - - - - - - - -
*想要獲取行業資訊、和志同道合的科技愛好者們分享心得,那就趕快掃碼添加“動點君”加入群聊吧!群里更有不定期福利發放!
精彩好文值得推薦!
一鍵轉發,戳個在看!
![]()
特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.