![]()
文 / 道哥
來源 / 節(jié)點AI觀
美國當?shù)貢r間1月5日,英偉達CEO黃仁勛率在拉斯維加斯楓丹白露酒店的劇場中心舉行新年的第一場演講。依然是那身熟悉的皮衣。
通常情況下,英偉達會在春季于硅谷舉行的開發(fā)者大會上詳細介紹其最新芯片的規(guī)格和性能。但黃仁勛表示,由于人工智能所需的計算復(fù)雜度不斷提高,以及市場對先進處理器用于訓練和運行AI模型的巨大需求,整個半導體行業(yè)不得不加快步伐。
在總結(jié)2025年這一年變化時,黃仁勛特意提到了DeepSeek R1的出現(xiàn)意外起到的催化劑作用,另外,在他身后的PPT上,還展示了中國開源模型Kimi K2和Qwen。
整個演講持續(xù)一個半小時,仔細看來,這場大會信息密度極高。節(jié)點AI總結(jié)了下分別是Agentic AI、物理AI、新芯片三大關(guān)鍵詞。
01 芯片新架構(gòu)Vera Rubin全面投產(chǎn)
![]()
雖然芯片新架構(gòu)出現(xiàn)在演講后半程,但算力作為AI的心臟,小編認為還是有必要提前點出:
這次大會上,英偉達發(fā)布了一套由六個部分組成的Rubin平臺——包括Rubin和Rubin Ultra兩種規(guī)格的GPU與CPU,以及NVLink 6交換芯片和ConnectX-9 SuperNIC。
這款新服務(wù)器專為處理創(chuàng)建此類模擬而設(shè)計,能將其用于模型訓練所需的海量計算負載。命名由來是,20世紀中期美國天文學家Vera Rubin,她曾通過對天體運動的開創(chuàng)性觀測取得重大科學突破。
黃仁勛評價,每一顆芯片都是革命性的,都值得單獨開一場發(fā)布會。
從公開數(shù)據(jù)來看性能驚人:
其中,Rubin GPU的NVFP4(4位浮點數(shù)格式)推理算力為50PFLOPS,是Blackwell的5倍;NVFP4訓練算力是35PFLOPS,是Blackwell的3.5倍;HBM4內(nèi)存帶寬22TB/s,是Blackwell的2.8倍,晶體管數(shù)量3360億個,是Blackwell的1.6倍。與Blackwell平臺相比,Rubin平臺通過軟硬件協(xié)同設(shè)計,將推理token成本降低10倍,將訓練MoE模型(專家模型)所需的GPU數(shù)量減少4倍。
“如果我們不做協(xié)同設(shè)計,即便在每年提升1.6倍晶體管數(shù)量的最好情況下,以及在每個晶體管性能提升一些,例如提升25%的情況下,也難以獲得巨大的性能提升。”黃仁勛表示,這就是為什么要做另外一些事情,例如推出NVFP4,以便在可以損失精度的地方實現(xiàn)更高的吞吐量。這種協(xié)同設(shè)計,使新的芯片平臺可以有比較大的性能提升。
從商業(yè)化步伐來看,英偉達下一代AI超級芯片平臺Vera Rubin已進入全面量產(chǎn),2026年下半年開始向合作伙伴交付,AWS、Google Cloud、Microsoft、Oracle等主要云服務(wù)商已確認部署。
02 劍指Agentic AI
有了充足的燃料——算力,軟件層才有想象空間。
如果說近年來AI領(lǐng)域最熱門的概念有哪些,Agentic AI絕對位列其中。
現(xiàn)在英偉達在試圖為企業(yè)們降低Agent的開發(fā)成本。
英偉達稱,其發(fā)布的Nemotron-CC,是一個多語言預(yù)訓練語料庫,覆蓋140多種語言,總規(guī)模達1.4萬億token,被定位為構(gòu)建和微調(diào)模型的“開放”基礎(chǔ)層。
公司同時強調(diào)了一套名為“Granary”的指令數(shù)據(jù)集,目標是讓模型在企業(yè)級任務(wù)上“開箱即用”
從現(xiàn)場展示來看,利用英偉達的硬件和框架,開發(fā)者在幾分鐘內(nèi)就能構(gòu)建出一個功能完整的個人助理。這在幾年前是不可想象的,而現(xiàn)在,它變得易如反掌。
英偉達加入開源運動的原因不難理解,是希望用“免費樣品”把開發(fā)者吸引進自家生態(tài),這樣反而能鞏固硬件的優(yōu)勢。
事實上,近年來英偉達一直致力于豐富開源生態(tài)。用英偉達生成式AI與軟件副總裁Kari Briski的話所說,此次大會的發(fā)布是一次“擴展”。
“在2025年,英偉達是Hugging Face上最大的貢獻者之一——發(fā)布了650個開放模型和250個開放數(shù)據(jù)集。”Briski表示。
對企業(yè)而言,Agent門檻的降低對未來的影響十分深遠。未來的IT部門,或許會將人類員工從繁瑣的流程中解放出來。工作內(nèi)容將變成“招募、管理和優(yōu)化”各種AI數(shù)字代理。
這正是AI Agent的終極魅力,從被動的數(shù)據(jù)喂養(yǎng),變成了一個能夠主動解決問題的數(shù)字員工,為企業(yè)創(chuàng)造極高的效率和價值。
03 接棒LLM,物理AI是下個主角
![]()
如果Agent是軟件層面的智能面,那么物理AI——這次演講的重頭戲,就是聯(lián)動現(xiàn)實世界與物理世界的全新應(yīng)用場景。從黃仁勛的規(guī)劃來看,自動駕駛、機器人、工業(yè)制造將是首推的三大場景。
黃仁勛強調(diào)表示,英偉達已為物理AI工作了8年。他認為,物理AI的ChatGPT時刻即將到來。
而仿真是英偉達幾乎所有物理AI工作的核心——英偉達通過其Omniverse平臺,構(gòu)建了一個與現(xiàn)實世界幾乎一模一樣的“數(shù)字孿生”環(huán)境。在這個虛擬世界里,AI可以安全、高效地進行訓練。
黃仁勛強調(diào),這一多層次的技術(shù)棧,正推動AI從屏幕內(nèi)的對話者,轉(zhuǎn)變?yōu)槟軌蛟诂F(xiàn)實世界中執(zhí)行任務(wù)的行動者。
最先試驗的落地場景就是對安全系數(shù)要求極高的自動駕駛。
此次英偉達推出開源推理VLA模型Alpamayo,該模型系列包含開源AI模型、仿真工具和數(shù)據(jù)集,可加速基于推理的、安全的自動駕駛車輛開發(fā),這是英偉達AV團隊數(shù)千人的工作成果。
“我想我們都同意,從非自動駕駛汽車到自動駕駛汽車的轉(zhuǎn)折點,可能就發(fā)生在這個時候。”黃仁勛表示,未來十年里,可以相當肯定,世界上很大一部分汽車將是自動駕駛或高度自動駕駛的。
從落地效果來看,英偉達DRIVE AV軟件將在梅賽德斯奔馳車輛上使用,相關(guān)的AV自動駕駛汽車剛投入生產(chǎn)。第一輛AV自動駕駛汽車將在今年第一季度在美國上路,第二季度進入歐洲,第三或第四季度進入亞洲。英偉達還將繼續(xù)更新版本,合作建造L4 Robotaxi的生態(tài)系統(tǒng)還在擴大。
機器人方面,面向智能機器人的推理視覺語言模型(VLM)Isaac GR00T N1.6等,還有多個用于機器人開發(fā)的新開源框架。
除了專門的硬件設(shè)備,黃仁勛還將目光投向了工業(yè)級場景。
黃仁勛宣布了與西門子深化合作,將英偉達的物理AI模型、Omniverse仿真平臺集成至西門子的工業(yè)軟件組合,覆蓋從芯片設(shè)計、工廠模擬到生產(chǎn)運營的全生命周期。
“我們正站在一場新工業(yè)革命的開端,”他表示。物理AI將賦能芯片設(shè)計、生產(chǎn)線自動化乃至整個數(shù)字孿生系統(tǒng),實現(xiàn)“在計算機中設(shè)計、在計算機中制造”。
與其說是產(chǎn)品發(fā)布會,倒不如說是,黃仁勛本人對AI及計算產(chǎn)業(yè)未來十年的預(yù)判與宣言。通過開源關(guān)鍵模型、發(fā)布顛覆性硬件,英偉達試圖強勢定義,下個AI時代的技術(shù)標準與基礎(chǔ)設(shè)施。
其戰(zhàn)略核心也延續(xù)以往英偉達的開源+軟硬一體的作風,以全棧式的開放生態(tài),牢牢占據(jù)從數(shù)據(jù)中心到智能終端的每一個計算節(jié)點,不放過任何一個有可能鞏固護城河的機會。
特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺“網(wǎng)易號”用戶上傳并發(fā)布,本平臺僅提供信息存儲服務(wù)。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.