配比從1:8變1:1，被低估的CPU正成為AI新瓶頸

2026-04-15 11:08:21　來源: 華爾街見聞官方

上海舉報

分享至

AI算力競賽的焦點，正在悄然從GPU轉(zhuǎn)向一個長期被忽視的角色——CPU。

隨著AI智能體和強化學(xué)習(xí)（RL）工作負載的爆發(fā)式增長，CPU在數(shù)據(jù)中心的戰(zhàn)略地位正經(jīng)歷結(jié)構(gòu)性重估。知名半導(dǎo)體分析機構(gòu)SemiAnalysis首席分析師Dylan Patel在4月8日的一次深度訪談中直言，AI工作負載的范式正從簡單的文本生成向復(fù)雜的智能體和強化學(xué)習(xí)演進，CPU正面臨"極其嚴(yán)重的產(chǎn)能短缺"。

市場研究機構(gòu)TrendForce的最新報告印證了這一判斷：當(dāng)前AI數(shù)據(jù)中心的CPU與GPU配比約為1:4至1:8，而在智能體AI時代，這一比例預(yù)計將演變至1:1至1:2。

這一結(jié)構(gòu)性轉(zhuǎn)變已在供需兩端引發(fā)連鎖反應(yīng)。Intel和AMD已于2026年第一季度末對部分CPU產(chǎn)品線提價。與此同時，英偉達和Arm雙雙于2026年3月宣布進軍服務(wù)器CPU市場——一家GPU巨頭與一家IP授權(quán)商在同一個月做出相同選擇，絕非巧合，而是市場信號的集中釋放。

智能體崛起，CPU從配角變瓶頸

在AI發(fā)展的早期階段，CPU的角色相當(dāng)邊緣。Dylan Patel將其描述為："負載很輕。你發(fā)一個字符串，它回一個字符串，簡單的推理，對CPU需求不大。"彼時，GPU憑借其大規(guī)模并行矩陣運算能力主導(dǎo)了AI算力需求，CPU僅承擔(dān)向GPU壓縮和路由內(nèi)存數(shù)據(jù)的輔助職能。

然而，以O(shè)penAI o1為代表的新一代推理模型，以及隨之興起的AI智能體架構(gòu)，從根本上改變了這一格局。與靜態(tài)大語言模型不同，智能體AI需要動態(tài)與環(huán)境交互——規(guī)劃任務(wù)、調(diào)用工具、在子智能體之間傳遞數(shù)據(jù)、評估任務(wù)是否完成。這一"編排層"（Orchestration）的全部協(xié)調(diào)工作，恰恰落在CPU肩上，使其成為典型的CPU密集型負載。

2025年11月發(fā)布的學(xué)術(shù)論文《A CPU-Centric Perspective on Agentic AI》進一步量化了這一壓力：在智能體AI場景中，CPU工具處理（包括Python解釋、網(wǎng)頁爬取、詞法摘要、數(shù)據(jù)庫檢索等）產(chǎn)生的延遲，可占總延遲的高達90.6%；在大批量處理場景下，CPU動態(tài)能耗可達系統(tǒng)總動態(tài)能耗的44%。

Arm的測算則從容量角度揭示了需求缺口的量級：傳統(tǒng)AI數(shù)據(jù)中心每吉瓦（GW）約需3000萬顆CPU核心，而在智能體AI時代，這一需求將激增至1.2億顆——增幅達四倍。

Intel承壓，AMD乘勢擴張

CPU需求的結(jié)構(gòu)性上升，首先在傳統(tǒng)x86市場引發(fā)了格局重塑。

Intel的Xeon處理器曾長期占據(jù)數(shù)據(jù)中心CPU市場逾95%的份額。這一統(tǒng)治地位自2021年起開始松動——Intel 7制程的良率問題導(dǎo)致Xeon Sapphire Rapids發(fā)布延遲近兩年，為AMD的EPYC Milan打開了市場缺口。

2026年，Intel計劃推出兩款旗艦產(chǎn)品：采用Darkmont架構(gòu)的Xeon 6+（Clearwater Forest），擁有288核/288線程，TDP約450W；以及采用Panther Cove-X架構(gòu)的Xeon 7（Diamond Rapids），最高256核/256線程，TDP高達650W。兩款產(chǎn)品均基于Intel最先進的18A制程，并首次引入Foveros Direct混合鍵合技術(shù)。然而，TrendForce指出，受18A制程良率問題持續(xù)困擾，兩款產(chǎn)品的量產(chǎn)時間均可能推遲至2027年。

相比之下，AMD的節(jié)奏更為穩(wěn)健。其2026年旗艦產(chǎn)品EPYC Venice將采用臺積電N2制程、Zen 6架構(gòu)，并搭載CoWoS-L與SoIC先進封裝，通過同步多線程（SMT）技術(shù)實現(xiàn)256核/512線程——線程數(shù)為當(dāng)前市場最高。TrendForce預(yù)計，AMD將在2026年持續(xù)從Intel手中蠶食市場份額。

英偉達、Arm強勢入局，競爭格局重寫

傳統(tǒng)x86雙雄之外，一批非傳統(tǒng)玩家正以前所未有的速度涌入服務(wù)器CPU賽道，從根本上改寫競爭格局。

2026年3月，英偉達宣布將Vera CPU作為獨立產(chǎn)品對外銷售，以滿足客戶對更靈活CPU:GPU配置的需求。Vera采用英偉達自研Olympus架構(gòu)，基于臺積電N3制程與CoWoS-R封裝，提供88核/176線程，并配備1.8 TB/s的NVLink-C2C互聯(lián)，可與英偉達GPU實現(xiàn)內(nèi)存共享。首批合作伙伴涵蓋Alibaba、ByteDance、Cloudflare、CoreWeave、Oracle等。英偉達還推出了Vera CPU機架，單機架集成256顆CPU，合計22,528核/45,056線程，總內(nèi)存達400 TB。

同月，Arm宣布推出首款自研CPU產(chǎn)品Arm AGI CPU，終結(jié)了其35年純授權(quán)商的歷史定位。該產(chǎn)品基于臺積電N3制程與Neoverse V3架構(gòu)，提供136核/136線程，TDP為300W，支持DDR5-8800內(nèi)存與PCIe Gen6。首批合作伙伴包括Meta、OpenAI、Cerebras、Cloudflare、SK Telecom等。Arm同步推出兩款機架配置：風(fēng)冷版集成60顆AGI CPU（8,160核，約180 TB內(nèi)存），液冷版則支持336顆CPU（45,696核，1 PB內(nèi)存）。

主要云服務(wù)商（CSP）同樣加速布局自研CPU。AWS于2025年12月發(fā)布基于臺積電N3制程的Graviton5（192核/192線程），并與自研Trainium 3 AI ASIC協(xié)同部署以降低AI計算成本；微軟于2025年11月推出Cobalt 200（N3制程，132核/132線程）；谷歌則計劃于2026年推出Axion C4A.metal裸金屬版本及下一代Axion N4A，主打最高性價比。

IC后端設(shè)計服務(wù)商迎來增量機遇

非傳統(tǒng)玩家的大規(guī)模入場，正在為IC后端設(shè)計服務(wù)商創(chuàng)造可觀的增量業(yè)務(wù)。

TrendForce指出，AWS目前仍堅持自主完成CPU后端設(shè)計，而谷歌和微軟均已將CPU后端設(shè)計服務(wù)外包給創(chuàng)意電子（Global Unichip Corp.，GUC）。隨著更多CSP和新興CPU廠商加入市場，這一外包需求有望持續(xù)擴大。

TrendForce預(yù)計，2026年至2028年間，Broadcom、Marvell、GUC、Alchip、聯(lián)發(fā)科等ASIC設(shè)計服務(wù)商將陸續(xù)承接來自上述客戶的新增項目。對于尋找AI基礎(chǔ)設(shè)施投資新切口的市場參與者而言，這一環(huán)節(jié)或許正是GPU熱潮之外，尚未被充分定價的結(jié)構(gòu)性機遇。

特別聲明：以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺“網(wǎng)易號”用戶上傳并發(fā)布，本平臺僅提供信息存儲服務(wù)。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.