2025年12月,英偉達悄悄花了200億美元買下了一家叫Groq的AI芯片公司。
2026年4月17日,OpenAI宣布將向另一家AI芯片公司Cerebras采購超過200億美元的芯片。同一天,Cerebras正式向納斯達克遞交IPO文件,目標估值350億美元。
兩筆錢,金額幾乎完全相同。一筆是收購,一筆是采購。一筆來自全球最大的AI芯片賣家,一筆來自全球最大的AI買家。
這不是兩件獨立的事,這是同一場戰(zhàn)爭里的兩個對稱動作。戰(zhàn)場的名字叫:AI推理。
絕大多數(shù)人沒注意到這場戰(zhàn)爭。因為它沒有爆炸聲,只有一行行財務(wù)公告,和硅谷工程師圈子里流傳的技術(shù)討論。但它的影響可能比過去兩年任何一次AI發(fā)布會都要深遠——因為它在重新分配一個幾乎確定會成為史上最大科技市場的控制權(quán)。
推理是什么,為什么2026年的關(guān)鍵詞不再是"訓(xùn)練"
在講兩個200億之前,需要先理解一個背景:AI芯片的戰(zhàn)場,正在發(fā)生一次重心遷移。
訓(xùn)練和推理,是AI算力消耗的兩個階段。訓(xùn)練是造模型——把海量數(shù)據(jù)喂給神經(jīng)網(wǎng)絡(luò),讓它學(xué)會某種能力。這個過程通常只發(fā)生一次,或者定期更新。推理是用模型——每次用戶發(fā)出一個問題,ChatGPT給出一個回答,背后就是一次推理請求。
2023年,全球AI算力支出的大頭在訓(xùn)練,推理是配角。
但這個比例正在快速倒置。
根據(jù)德勤和CES 2026的市場研究數(shù)據(jù),2025年推理已經(jīng)占到全部AI算力支出的50%;2026年,這個比例將跳到2/3。聯(lián)想CEO楊元慶在CES上說得更直白:AI支出的結(jié)構(gòu),將從"80%訓(xùn)練+20%推理",完全翻轉(zhuǎn)為"20%訓(xùn)練+80%推理"。
邏輯并不復(fù)雜。訓(xùn)練是一次性成本,推理是持續(xù)性成本。GPT-4訓(xùn)了一次,但每天要回答億級用戶的問題,每一次對話都是一次推理請求。規(guī)模化部署之后,推理的累積消耗遠超訓(xùn)練。
這意味著什么?意味著AI產(chǎn)業(yè)最賺錢的那塊蛋糕,正在從"訓(xùn)練芯片"移向"推理芯片"。而這兩種芯片,需要截然不同的架構(gòu)設(shè)計。
英偉達的問題:為訓(xùn)練設(shè)計的芯片,天生不擅長推理
英偉達的H100、H200,是為訓(xùn)練設(shè)計的怪獸。它們的核心優(yōu)勢是極高的計算吞吐量——訓(xùn)練需要對海量矩陣做大量乘法運算,GPU擅長這種"多核并行計算"。
但推理的瓶頸不是計算,是內(nèi)存帶寬。
當(dāng)用戶發(fā)出問題,芯片需要把整個模型的權(quán)重從內(nèi)存里"搬"到計算單元里,然后才能生成回答。這個"搬"的過程,才是推理延遲的真正來源。英偉達的GPU用的是外接高帶寬內(nèi)存(HBM),搬運這一步不可避免地引入延遲——對于每秒要處理幾千萬次請求的ChatGPT來說,這個延遲在乘以規(guī)模之后,變成了真實的性能瓶頸。
OpenAI內(nèi)部工程師注意到這個問題時,他們在給Codex(代碼生成工具)做優(yōu)化,發(fā)現(xiàn)無論怎么調(diào)參,響應(yīng)速度都受制于英偉達GPU的架構(gòu)上限。
換句話說,英偉達在推理端的劣勢,不是努力程度的問題,是架構(gòu)的問題。
Cerebras的WSE-3芯片走了完全不同的路線。這塊芯片大到需要用晶圓級封裝——面積46,255平方毫米,比人的手掌還大——把90萬個AI核心和44GB超高速SRAM內(nèi)存集成在同一塊硅片上。內(nèi)存直接貼在計算核心旁邊,"搬運"的距離從厘米級縮短到微米級。結(jié)果:推理速度比英偉達H100快15到20倍。
需要補充的是:英偉達并沒有坐以待斃。其最新的Blackwell(B200)架構(gòu)在推理性能上比H100提升了4倍,正在大規(guī)模部署。但Blackwell追的是一個移動的靶——Cerebras同期也在迭代,而整個芯片市場涌現(xiàn)出的競爭對手,已經(jīng)不只是Cerebras一家。
英偉達的200億:歷史最大并購背后的一張承認書
2025年12月24日,英偉達宣布了它歷史上最大的一筆收購。
目標是Groq。
Groq是Cerebras的同類競爭對手,主打的也是為推理優(yōu)化的SRAM架構(gòu)芯片——它叫LPU(語言處理單元),當(dāng)時在公開測評中是全球推理速度最快的芯片服務(wù)。英偉達花了200億美元,把Groq的核心技術(shù)和創(chuàng)始團隊全部買走,包括創(chuàng)始人Jonathan Ross和多位谷歌TPU團隊出身的頂級芯片工程師。
這是英偉達2019年70億美元收購Mellanox之后,規(guī)模最大的一次并購,整整翻了三倍。
在許多分析師看來,這筆錢背后傳遞的信息,遠比金額更重要:英偉達認為自己在推理端有結(jié)構(gòu)性缺口,而且這個缺口大到值得花200億去堵。
如果英偉達真的相信自己的GPU在推理端無敵,它根本不需要收購Groq。這筆錢本質(zhì)上是一張價值200億美元的技術(shù)采購單——承認SRAM嵌入式架構(gòu)在推理場景里有真實的技術(shù)優(yōu)勢,承認英偉達靠現(xiàn)有產(chǎn)品線無法自然覆蓋這個優(yōu)勢,用最貴的價格買下了一個它自己填不上的技術(shù)缺口。
當(dāng)然,英偉達收購后的官方敘事是另一套——"與Groq深度整合,提供更完整的推理解決方案。" 技術(shù)語言的翻譯版本是:我們意識到自己的東西不夠用,所以買了別人的。
OpenAI的200億:買芯片只是表面,入股才是關(guān)鍵
現(xiàn)在回到OpenAI這邊。
2026年1月,OpenAI和Cerebras簽了一份100億美元的三年算力采購協(xié)議——當(dāng)時媒體報道的重點是"OpenAI正在多元化芯片供應(yīng)商",語氣輕描淡寫。
但4月17日最新曝光的細節(jié),讓這件事的性質(zhì)發(fā)生了根本變化:
第一,采購金額從100億變成了200億,翻了一倍。
第二,OpenAI將獲得Cerebras的認股權(quán)證,隨著采購規(guī)模增加,持股比例最高可達Cerebras總股本的10%。
第三,OpenAI還將向Cerebras提供10億美元的數(shù)據(jù)中心建設(shè)資金——換句話說,OpenAI在幫Cerebras蓋廠。
這三個細節(jié)放在一起,畫出來的圖景完全不同:OpenAI不只是在買芯片,OpenAI是在孵化一個供應(yīng)商。
這個邏輯在科技史上有清晰的先例。2006年蘋果開始與三星合作定制A系列芯片,最初也是大宗采購協(xié)議,但隨著蘋果不斷加深參與、最終自研M系列芯片,供應(yīng)鏈的控制權(quán)徹底從英特爾和三星那里轉(zhuǎn)移到蘋果自己手上。OpenAI在做的,有幾分類似——但有一個重要邊界:蘋果從一開始就掌握芯片設(shè)計權(quán),OpenAI目前仍然是采購者,Cerebras上市后也將獨立發(fā)展、服務(wù)更多客戶。這條路的終點未必是OpenAI完全掌控Cerebras,更可能是雙方建立深度互依的生態(tài)共同體。
一方面用200億和入股綁定Cerebras,確保非英偉達的推理算力持續(xù)供應(yīng);另一方面,OpenAI正在與博通合作研發(fā)自有ASIC芯片,預(yù)計2026年底量產(chǎn)。兩條腿同時走,終點是算力自主。
Cerebras今天IPO,你買的是什么
4月17日,Cerebras正式提交納斯達克IPO申請,目標估值350億美元,計劃融資30億美元。
這個估值,距離它2025年9月還是81億美元,漲了四倍多。今年2月剛完成新一輪融資,當(dāng)時估值已升至230億美元,IPO目標的350億在此基礎(chǔ)上又溢價了52%。
熟悉Cerebras歷史的人知道,這是它第二次嘗試上市。第一次,2024年,因為核心客戶G42(阿聯(lián)酋主權(quán)科技投資基金)占當(dāng)年收入的83%~97%,CFIUS以國家安全為由介入審查,IPO被迫撤回。
這次,G42已經(jīng)從股東名單中消失,取而代之的是OpenAI。
換句話說,Cerebras的客戶集中度結(jié)構(gòu)性問題尚未根本解決——大客戶的名字換了,依賴大客戶的格局還在。投資者要做的判斷是:這個大客戶是更好還是更糟?從信用角度看,OpenAI顯然優(yōu)于G42;從戰(zhàn)略角度看,OpenAI同時也是Cerebras的競爭對手孵化者——它的自研ASIC一旦成熟,對Cerebras是真實的替代威脅。
公平起見,Cerebras也在積極拓展其他客戶,招股書預(yù)計將列出更多元化的收入來源,集中度會有所改善。但在OpenAI自研芯片量產(chǎn)之前,這個問題的答案還沒有揭曉。
買Cerebras的股票,你實際上是在同時押注:OpenAI會持續(xù)選擇Cerebras,且 OpenAI的自研ASIC不會提前到來。這兩條,都不是確定的。
當(dāng)然,多頭理由也是真實的:如果推理市場的規(guī)模按預(yù)測軌道增長,Cerebras哪怕只在這個市場里占到一個小份額,絕對數(shù)字也相當(dāng)可觀。問題不在于Cerebras有沒有機會,而在于350億的定價是否已經(jīng)反映了最樂觀的情形。
兩個200億,對稱地出現(xiàn)在2025年底到2026年4月這段時間里。
一個來自全球最大的AI芯片賣家,買下了推理市場競爭對手的技術(shù)。
一個來自全球最大的AI買家,孵化了推理市場上挑戰(zhàn)英偉達的公司。
英偉達的200億是防御——它用最貴的價格堵住了一個自己填不上的技術(shù)缺口。
OpenAI的200億是進攻——它在燒錢建設(shè)一條不依賴英偉達的推理高速公路,同時拿到了這條路上一個收費站的認股權(quán)。
這場戰(zhàn)爭沒有槍聲,但資金的流向從來不說謊。兩筆錢告訴你的,比任何AI發(fā)布會都更清楚:AI推理基礎(chǔ)設(shè)施的控制權(quán),正在被爭奪。而這塊市場,2026年將占到全行業(yè)算力支出的三分之二。
Cerebras的IPO,是這場戰(zhàn)爭吹響的號角。
特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺“網(wǎng)易號”用戶上傳并發(fā)布,本平臺僅提供信息存儲服務(wù)。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.