AI算力競賽的焦點,正在悄然從GPU轉(zhuǎn)向一個長期被忽視的角色——CPU。
隨著AI智能體和強化學(xué)習(xí)(RL)工作負載的爆發(fā)式增長,CPU在數(shù)據(jù)中心的戰(zhàn)略地位正經(jīng)歷結(jié)構(gòu)性重估。知名半導(dǎo)體分析機構(gòu)SemiAnalysis首席分析師Dylan Patel在4月8日的一次深度訪談中直言,AI工作負載的范式正從簡單的文本生成向復(fù)雜的智能體和強化學(xué)習(xí)演進,CPU正面臨"極其嚴(yán)重的產(chǎn)能短缺"。
市場研究機構(gòu)TrendForce的最新報告印證了這一判斷:當(dāng)前AI數(shù)據(jù)中心的CPU與GPU配比約為1:4至1:8,而在智能體AI時代,這一比例預(yù)計將演變至1:1至1:2。
![]()
這一結(jié)構(gòu)性轉(zhuǎn)變已在供需兩端引發(fā)連鎖反應(yīng)。Intel和AMD已于2026年第一季度末對部分CPU產(chǎn)品線提價。與此同時,英偉達和Arm雙雙于2026年3月宣布進軍服務(wù)器CPU市場——一家GPU巨頭與一家IP授權(quán)商在同一個月做出相同選擇,絕非巧合,而是市場信號的集中釋放。
智能體崛起,CPU從配角變瓶頸
在AI發(fā)展的早期階段,CPU的角色相當(dāng)邊緣。Dylan Patel將其描述為:"負載很輕。你發(fā)一個字符串,它回一個字符串,簡單的推理,對CPU需求不大。"彼時,GPU憑借其大規(guī)模并行矩陣運算能力主導(dǎo)了AI算力需求,CPU僅承擔(dān)向GPU壓縮和路由內(nèi)存數(shù)據(jù)的輔助職能。
然而,以O(shè)penAI o1為代表的新一代推理模型,以及隨之興起的AI智能體架構(gòu),從根本上改變了這一格局。與靜態(tài)大語言模型不同,智能體AI需要動態(tài)與環(huán)境交互——規(guī)劃任務(wù)、調(diào)用工具、在子智能體之間傳遞數(shù)據(jù)、評估任務(wù)是否完成。這一"編排層"(Orchestration)的全部協(xié)調(diào)工作,恰恰落在CPU肩上,使其成為典型的CPU密集型負載。
2025年11月發(fā)布的學(xué)術(shù)論文《A CPU-Centric Perspective on Agentic AI》進一步量化了這一壓力:在智能體AI場景中,CPU工具處理(包括Python解釋、網(wǎng)頁爬取、詞法摘要、數(shù)據(jù)庫檢索等)產(chǎn)生的延遲,可占總延遲的高達90.6%;在大批量處理場景下,CPU動態(tài)能耗可達系統(tǒng)總動態(tài)能耗的44%。
Arm的測算則從容量角度揭示了需求缺口的量級:傳統(tǒng)AI數(shù)據(jù)中心每吉瓦(GW)約需3000萬顆CPU核心,而在智能體AI時代,這一需求將激增至1.2億顆——增幅達四倍。
![]()
Intel承壓,AMD乘勢擴張
CPU需求的結(jié)構(gòu)性上升,首先在傳統(tǒng)x86市場引發(fā)了格局重塑。
Intel的Xeon處理器曾長期占據(jù)數(shù)據(jù)中心CPU市場逾95%的份額。這一統(tǒng)治地位自2021年起開始松動——Intel 7制程的良率問題導(dǎo)致Xeon Sapphire Rapids發(fā)布延遲近兩年,為AMD的EPYC Milan打開了市場缺口。
2026年,Intel計劃推出兩款旗艦產(chǎn)品:采用Darkmont架構(gòu)的Xeon 6+(Clearwater Forest),擁有288核/288線程,TDP約450W;以及采用Panther Cove-X架構(gòu)的Xeon 7(Diamond Rapids),最高256核/256線程,TDP高達650W。兩款產(chǎn)品均基于Intel最先進的18A制程,并首次引入Foveros Direct混合鍵合技術(shù)。然而,TrendForce指出,受18A制程良率問題持續(xù)困擾,兩款產(chǎn)品的量產(chǎn)時間均可能推遲至2027年。
相比之下,AMD的節(jié)奏更為穩(wěn)健。其2026年旗艦產(chǎn)品EPYC Venice將采用臺積電N2制程、Zen 6架構(gòu),并搭載CoWoS-L與SoIC先進封裝,通過同步多線程(SMT)技術(shù)實現(xiàn)256核/512線程——線程數(shù)為當(dāng)前市場最高。TrendForce預(yù)計,AMD將在2026年持續(xù)從Intel手中蠶食市場份額。
英偉達、Arm強勢入局,競爭格局重寫
傳統(tǒng)x86雙雄之外,一批非傳統(tǒng)玩家正以前所未有的速度涌入服務(wù)器CPU賽道,從根本上改寫競爭格局。
2026年3月,英偉達宣布將Vera CPU作為獨立產(chǎn)品對外銷售,以滿足客戶對更靈活CPU:GPU配置的需求。Vera采用英偉達自研Olympus架構(gòu),基于臺積電N3制程與CoWoS-R封裝,提供88核/176線程,并配備1.8 TB/s的NVLink-C2C互聯(lián),可與英偉達GPU實現(xiàn)內(nèi)存共享。首批合作伙伴涵蓋Alibaba、ByteDance、Cloudflare、CoreWeave、Oracle等。英偉達還推出了Vera CPU機架,單機架集成256顆CPU,合計22,528核/45,056線程,總內(nèi)存達400 TB。
![]()
同月,Arm宣布推出首款自研CPU產(chǎn)品Arm AGI CPU,終結(jié)了其35年純授權(quán)商的歷史定位。該產(chǎn)品基于臺積電N3制程與Neoverse V3架構(gòu),提供136核/136線程,TDP為300W,支持DDR5-8800內(nèi)存與PCIe Gen6。首批合作伙伴包括Meta、OpenAI、Cerebras、Cloudflare、SK Telecom等。Arm同步推出兩款機架配置:風(fēng)冷版集成60顆AGI CPU(8,160核,約180 TB內(nèi)存),液冷版則支持336顆CPU(45,696核,1 PB內(nèi)存)。
主要云服務(wù)商(CSP)同樣加速布局自研CPU。AWS于2025年12月發(fā)布基于臺積電N3制程的Graviton5(192核/192線程),并與自研Trainium 3 AI ASIC協(xié)同部署以降低AI計算成本;微軟于2025年11月推出Cobalt 200(N3制程,132核/132線程);谷歌則計劃于2026年推出Axion C4A.metal裸金屬版本及下一代Axion N4A,主打最高性價比。
IC后端設(shè)計服務(wù)商迎來增量機遇
非傳統(tǒng)玩家的大規(guī)模入場,正在為IC后端設(shè)計服務(wù)商創(chuàng)造可觀的增量業(yè)務(wù)。
TrendForce指出,AWS目前仍堅持自主完成CPU后端設(shè)計,而谷歌和微軟均已將CPU后端設(shè)計服務(wù)外包給創(chuàng)意電子(Global Unichip Corp.,GUC)。隨著更多CSP和新興CPU廠商加入市場,這一外包需求有望持續(xù)擴大。
TrendForce預(yù)計,2026年至2028年間,Broadcom、Marvell、GUC、Alchip、聯(lián)發(fā)科等ASIC設(shè)計服務(wù)商將陸續(xù)承接來自上述客戶的新增項目。對于尋找AI基礎(chǔ)設(shè)施投資新切口的市場參與者而言,這一環(huán)節(jié)或許正是GPU熱潮之外,尚未被充分定價的結(jié)構(gòu)性機遇。
特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺“網(wǎng)易號”用戶上傳并發(fā)布,本平臺僅提供信息存儲服務(wù)。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.