![]()
GTC 2026 即將開幕,黃仁勛準(zhǔn)備掏出的不再是單純刷新參數(shù)的怪獸級(jí) GPU,而是一張價(jià)值 200 億美元的明牌——一款基于 SRAM(靜態(tài)隨機(jī)存取存儲(chǔ)器)的專用推理芯片。
這標(biāo)志著英偉達(dá)歷史上最大規(guī)模收購(gòu)案(吞并 Groq 核心資產(chǎn))的底層技術(shù)正式落地。但這絕不是一次常規(guī)的產(chǎn)品迭代,黃仁勛正在親手打破自己維持了多年的神話:“一顆通用 GPU 可以包打天下”。
在筆者看來,這輪架構(gòu)調(diào)整的表象是硬件路線的演進(jìn),底層卻是英偉達(dá)面對(duì)科技巨頭“諸侯割據(jù)”與監(jiān)管高壓時(shí),極其老辣的防御性進(jìn)攻。
外界有一種極其粗暴的誤讀,認(rèn)為英偉達(dá)轉(zhuǎn)向 SRAM 是為了“拋棄 HBM”。這在半導(dǎo)體的物理規(guī)律上根本站不住腳。
標(biāo)準(zhǔn)的 SRAM 單元需要 6 個(gè)晶體管(6T)來存儲(chǔ) 1 個(gè)比特,而 HBM 依賴的 DRAM 只需要 1 個(gè)晶體管加 1 個(gè)電容(1T1C)。這種先天的物理結(jié)構(gòu)差異,導(dǎo)致 SRAM 的硅片面積是 DRAM 的 5 到 10 倍。這意味著 SRAM 速度極快,但極其昂貴且根本做不出大容量,它裝不下動(dòng)輒數(shù)千億參數(shù)的大模型。
英偉達(dá)真正的算盤,是搞“算力的階級(jí)分化”。
過去,無論是煉大模型還是日常的 AI 問答,大家都在搶極其昂貴且缺貨的 HBM 和 GPU。但現(xiàn)在,AI 的重心已經(jīng)徹底滑向了“推理(Inference)”。思科等機(jī)構(gòu)的最新預(yù)測(cè)顯示,到 2027 年,高達(dá) 75% 的 AI 工作負(fù)載將全面轉(zhuǎn)向?qū)崟r(shí)推理。
面對(duì)這種不可逆的趨勢(shì),英偉達(dá)給出了路線圖切分:
一邊是即將登場(chǎng)的下一代 Vera Rubin 架構(gòu),繼續(xù)把 GPU 和 HBM 的堆料推向極致,死死鎖住云廠商的“大模型訓(xùn)練”底座;
另一邊,就是這次基于 Groq 技術(shù)推出的 LPU(語(yǔ)言處理單元)。它用片上 SRAM 替代片外存儲(chǔ),徹底干掉數(shù)據(jù)搬運(yùn)的延遲,專門用來收割那些對(duì)實(shí)時(shí)性要求極高、單次請(qǐng)求成本極敏感的場(chǎng)景。
為什么一向推崇通用計(jì)算的英偉達(dá),會(huì)突然調(diào)轉(zhuǎn)車頭搞起專用推理架構(gòu)?
答案是被逼出來的。
就在近期,業(yè)界傳出 Meta 計(jì)劃在 2027 年將部分推理工作負(fù)載切給谷歌 TPU。當(dāng)大模型逐漸走向同質(zhì)化,推理成本的極致壓縮就成了生死線。如果英偉達(dá)繼續(xù)強(qiáng)迫所有客戶用“殺雞用牛刀”的 GPU 去做低延遲推理,大客戶遲早會(huì)跑向谷歌、AMD,甚至是以 Groq 為代表的初創(chuàng)公司。
為了掐滅這個(gè)苗頭,黃仁勛在 2025 年底砸出了 200 億美元。但最絕的不是金額,而是操盤手法。
如果英偉達(dá)直接全盤收購(gòu) Groq,這筆交易必定會(huì)被美國(guó) FTC 和歐盟的反壟斷監(jiān)管機(jī)構(gòu)以“壟斷 AI 算力”為由直接斃掉。因此,英偉達(dá)采取了極其狡猾的“資產(chǎn)收購(gòu)+技術(shù)授權(quán)+核心團(tuán)隊(duì)挖角(Acquihire)”模式。
他們花 200 億美元買斷了 Groq 的核心專利使用權(quán),并把創(chuàng)始人 Jonathan Ross 連同兩百多名核心工程師直接“收編”進(jìn)英偉達(dá)。而 Groq 這家公司的空殼,在名義上依然作為獨(dú)立實(shí)體存在。
這是一種合法但極其殘酷的“掏空”式并購(gòu)。黃仁勛用 200 億美元的“過路費(fèi)”,繞開了反壟斷的紅線,兵不血刃地干掉了最危險(xiǎn)的推理端刺客,順手接收了 Groq 生態(tài)上超過 200 萬(wàn)名開發(fā)者。
這套“GPU主內(nèi)(訓(xùn)練),SRAM主外(推理)”的組合拳一旦打出,整個(gè)算力產(chǎn)業(yè)鏈的利潤(rùn)池將面臨殘酷的重新分配。
首先,HBM 的神話將被祛魅。它依然是訓(xùn)練端不可或缺的皇冠明珠,但那種“只要搞 AI 就必須買 HBM”的非理性繁榮將一去不復(fù)返。
留給其他芯片創(chuàng)業(yè)公司的單點(diǎn)突破空間被焊死。過去幾年,無數(shù)初創(chuàng)公司拿著“比英偉達(dá)推理快 X 倍”的 PPT 找融資。如今,當(dāng)裁判員自己下場(chǎng)推出極致低延遲的專用芯片,并且將其無縫接入英偉達(dá)龐大的 CUDA 軟件生態(tài)棧時(shí),單靠底層架構(gòu)創(chuàng)新就能撕開一道口子的時(shí)代,正式終結(jié)了。
當(dāng)所有人都以為 GTC 2026 將是一場(chǎng)關(guān)于“算力規(guī)模有多大”的肌肉秀時(shí),黃仁勛其實(shí)不關(guān)心 SRAM 和 HBM 誰(shuí)替代誰(shuí),他只關(guān)心如何用最密不透風(fēng)的產(chǎn)品矩陣,把每一分流向 AI 數(shù)據(jù)中心的錢都截留在自己的口袋里。
這早就不是一場(chǎng)比拼芯片跑分的極客游戲,而是商業(yè)帝國(guó)捍衛(wèi)戰(zhàn)。
特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺(tái)“網(wǎng)易號(hào)”用戶上傳并發(fā)布,本平臺(tái)僅提供信息存儲(chǔ)服務(wù)。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.