網(wǎng)易首頁(yè) > 網(wǎng)易號(hào) > 正文申請(qǐng)入駐

英偉達(dá)200億收購(gòu)落地，新推理芯片引領(lǐng)75%AI負(fù)載轉(zhuǎn)向推理

2026-03-20 06:46:36　來源: 骨子里的一身傲氣

四川舉報(bào)

分享至

GTC 2026 即將開幕，黃仁勛準(zhǔn)備掏出的不再是單純刷新參數(shù)的怪獸級(jí) GPU，而是一張價(jià)值 200 億美元的明牌——一款基于 SRAM（靜態(tài)隨機(jī)存取存儲(chǔ)器）的專用推理芯片。

這標(biāo)志著英偉達(dá)歷史上最大規(guī)模收購(gòu)案（吞并 Groq 核心資產(chǎn)）的底層技術(shù)正式落地。但這絕不是一次常規(guī)的產(chǎn)品迭代，黃仁勛正在親手打破自己維持了多年的神話：“一顆通用 GPU 可以包打天下”。

在筆者看來，這輪架構(gòu)調(diào)整的表象是硬件路線的演進(jìn)，底層卻是英偉達(dá)面對(duì)科技巨頭“諸侯割據(jù)”與監(jiān)管高壓時(shí)，極其老辣的防御性進(jìn)攻。

外界有一種極其粗暴的誤讀，認(rèn)為英偉達(dá)轉(zhuǎn)向 SRAM 是為了“拋棄 HBM”。這在半導(dǎo)體的物理規(guī)律上根本站不住腳。

標(biāo)準(zhǔn)的 SRAM 單元需要 6 個(gè)晶體管（6T）來存儲(chǔ) 1 個(gè)比特，而 HBM 依賴的 DRAM 只需要 1 個(gè)晶體管加 1 個(gè)電容（1T1C）。這種先天的物理結(jié)構(gòu)差異，導(dǎo)致 SRAM 的硅片面積是 DRAM 的 5 到 10 倍。這意味著 SRAM 速度極快，但極其昂貴且根本做不出大容量，它裝不下動(dòng)輒數(shù)千億參數(shù)的大模型。

英偉達(dá)真正的算盤，是搞“算力的階級(jí)分化”。

過去，無論是煉大模型還是日常的 AI 問答，大家都在搶極其昂貴且缺貨的 HBM 和 GPU。但現(xiàn)在，AI 的重心已經(jīng)徹底滑向了“推理（Inference）”。思科等機(jī)構(gòu)的最新預(yù)測(cè)顯示，到 2027 年，高達(dá) 75% 的 AI 工作負(fù)載將全面轉(zhuǎn)向?qū)崟r(shí)推理。

面對(duì)這種不可逆的趨勢(shì)，英偉達(dá)給出了路線圖切分：

一邊是即將登場(chǎng)的下一代 Vera Rubin 架構(gòu)，繼續(xù)把 GPU 和 HBM 的堆料推向極致，死死鎖住云廠商的“大模型訓(xùn)練”底座；

另一邊，就是這次基于 Groq 技術(shù)推出的 LPU（語(yǔ)言處理單元）。它用片上 SRAM 替代片外存儲(chǔ)，徹底干掉數(shù)據(jù)搬運(yùn)的延遲，專門用來收割那些對(duì)實(shí)時(shí)性要求極高、單次請(qǐng)求成本極敏感的場(chǎng)景。

為什么一向推崇通用計(jì)算的英偉達(dá)，會(huì)突然調(diào)轉(zhuǎn)車頭搞起專用推理架構(gòu)？

答案是被逼出來的。

就在近期，業(yè)界傳出 Meta 計(jì)劃在 2027 年將部分推理工作負(fù)載切給谷歌 TPU。當(dāng)大模型逐漸走向同質(zhì)化，推理成本的極致壓縮就成了生死線。如果英偉達(dá)繼續(xù)強(qiáng)迫所有客戶用“殺雞用牛刀”的 GPU 去做低延遲推理，大客戶遲早會(huì)跑向谷歌、AMD，甚至是以 Groq 為代表的初創(chuàng)公司。

為了掐滅這個(gè)苗頭，黃仁勛在 2025 年底砸出了 200 億美元。但最絕的不是金額，而是操盤手法。

如果英偉達(dá)直接全盤收購(gòu) Groq，這筆交易必定會(huì)被美國(guó) FTC 和歐盟的反壟斷監(jiān)管機(jī)構(gòu)以“壟斷 AI 算力”為由直接斃掉。因此，英偉達(dá)采取了極其狡猾的“資產(chǎn)收購(gòu)+技術(shù)授權(quán)+核心團(tuán)隊(duì)挖角（Acquihire）”模式。

他們花 200 億美元買斷了 Groq 的核心專利使用權(quán)，并把創(chuàng)始人 Jonathan Ross 連同兩百多名核心工程師直接“收編”進(jìn)英偉達(dá)。而 Groq 這家公司的空殼，在名義上依然作為獨(dú)立實(shí)體存在。

這是一種合法但極其殘酷的“掏空”式并購(gòu)。黃仁勛用 200 億美元的“過路費(fèi)”，繞開了反壟斷的紅線，兵不血刃地干掉了最危險(xiǎn)的推理端刺客，順手接收了 Groq 生態(tài)上超過 200 萬(wàn)名開發(fā)者。

這套“GPU主內(nèi)（訓(xùn)練），SRAM主外（推理）”的組合拳一旦打出，整個(gè)算力產(chǎn)業(yè)鏈的利潤(rùn)池將面臨殘酷的重新分配。

首先，HBM 的神話將被祛魅。它依然是訓(xùn)練端不可或缺的皇冠明珠，但那種“只要搞 AI 就必須買 HBM”的非理性繁榮將一去不復(fù)返。

留給其他芯片創(chuàng)業(yè)公司的單點(diǎn)突破空間被焊死。過去幾年，無數(shù)初創(chuàng)公司拿著“比英偉達(dá)推理快 X 倍”的 PPT 找融資。如今，當(dāng)裁判員自己下場(chǎng)推出極致低延遲的專用芯片，并且將其無縫接入英偉達(dá)龐大的 CUDA 軟件生態(tài)棧時(shí)，單靠底層架構(gòu)創(chuàng)新就能撕開一道口子的時(shí)代，正式終結(jié)了。

當(dāng)所有人都以為 GTC 2026 將是一場(chǎng)關(guān)于“算力規(guī)模有多大”的肌肉秀時(shí)，黃仁勛其實(shí)不關(guān)心 SRAM 和 HBM 誰(shuí)替代誰(shuí)，他只關(guān)心如何用最密不透風(fēng)的產(chǎn)品矩陣，把每一分流向 AI 數(shù)據(jù)中心的錢都截留在自己的口袋里。

這早就不是一場(chǎng)比拼芯片跑分的極客游戲，而是商業(yè)帝國(guó)捍衛(wèi)戰(zhàn)。

聲明：個(gè)人原創(chuàng)，僅供參考

特別聲明：以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺(tái)“網(wǎng)易號(hào)”用戶上傳并發(fā)布，本平臺(tái)僅提供信息存儲(chǔ)服務(wù)。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.