公眾號記得加星標??,第一時間看推送不會錯過。
英國工作站制造商Acorn Computer創立至今已近半個世紀,而其旗下的Acorn RISC Machines—— 也就是我們如今熟知的Arm、Arm有限公司(Arm Ltd)或Arm控股(Arm Holdings)—— 獨立運營,并最終在 1998 年分拆上市,距今也已有近四十年。
2016 年以來,日本綜合企業集團軟銀一直持有Arm的大部分乃至全部股份,具體持股比例取決于Arm是否有部分股份公開流通。軟銀有意布局生成式人工智能芯片業務,這一點從其 2025 年 3 月以 65 億美元收購獨立的Arm架構服務器 CPU 廠商安培計算(Ampere Computing) 便可看出;同時,軟銀也在為人工智能模型研發企業提供資金支持。即便Arm在 2023 年 9 月再度上市,軟銀仍持有其約 90% 的股份。昨日Arm AGI 通用人工智能處理器發布后,股價大漲 15%,公司總市值(含流通股)達到 1643 億美元。
Arm最終意識到,自己必須自研 CPU—— 不僅限于數據中心所用 CPU,還包括邊緣設備與個人終端所用的各類芯片 —— 這一決定顯然已是大勢所趨。安培計算自成立以來便一直備受行業關注,其核心模式就是為超大規模云廠商與云計算服務商提供第二供應商選項,供應數據中心級Arm架構服務器 CPU。這些廠商原本會自主設計芯片,并委托博通、邁威爾等企業協助完成芯片的制造與封裝,最終形成成品。
Arm云人工智能事業部執行副總裁穆罕默德?阿瓦德自 2018 年 10 月主導 Neoverse 服務器 CPU 知識產權模塊項目、2023 年 8 月推出計算子系統(CSS)以提供更完善的 CPU 設計方案以來,持續推進相關業務。據他表示,客戶早已不滿足于Arm僅提供完整 CPU 設計方案,而是希望其直接供應成品 CPU 芯片。三年前,首家提出這一需求的客戶正是元平臺公司(Meta Platforms),這也直接促成了Arm自研 AGI CPU 的立項;緊隨其后的則是開放人工智能研究中心(OpenAI)。元平臺是為數不多不涉足公有云業務的超大型科技企業,因此在 CPU、GPU、各類加速處理器(XPU)、數據處理器(DPU)與交換專用集成電路(ASIC)的選用上擁有更大自由度;而同樣不運營云服務的人工智能模型企業 OpenAI,也具備類似的靈活空間。(這也是這兩家公司始終在布局各類前沿技術的原因。)
此前,安培計算的 AmpereOne 系列芯片在超大規模云廠商與云計算服務商中已取得一定市場突破,但被軟銀收購后,其市場動作便趨于沉寂。我們僅看到其 192 核 “北極星(Polaris)”AmpereOne M 芯片于 2024 年第四季度開始出貨,并登陸甲骨文云基礎設施實例,除此之外鮮有動靜。我們高度推測,軟銀收購安培計算,正是為了給Arm增添第二支芯片設計團隊,支撐其每年迭代的自研 CPU 路線圖。截至目前,軟銀并未披露Arm與安培計算未來的業務整合方式;Arm高層昨日也僅提及,AGI CPU 項目約三年前應元平臺的要求啟動,并未透露更多細節。
上圖為Arm首席執行官勒內?哈斯手持第一代 AGI CPU 樣品,該芯片目前已進入送樣階段,將于今年下半年大規模量產供貨給元平臺、OpenAI 及其他采購客戶。哈斯通過數據闡釋了 CPU 在智能體人工智能數據中心中依然至關重要的原因。如今,所有超大規模云廠商與大型云計算服務商早已自研Arm架構服務器 CPU,“為何選擇Arm” 已是毋庸置疑的答案。英偉達供應著全球絕大多數 GPU,其 NVL72 機架級系統均基于 “格蕾絲(Grace)”CG100 Arm CPU,Arm也因此成為大型人工智能節點主機端的默認 CPU 架構。超大規模云廠商與云計算服務商均希望將自研Arm CPU 與英偉達 GPU、超威半導體(AMD)GPU 及自研 XPU 搭配使用,部分廠商會采用授權的 NVLink Fusion 接口,另一些則會通過以太網使用 UALink 或 ESUN 協議。
對Arm而言,意義重大的是:自當年從Acorn Computer分拆上市以來,Arm芯片累計出貨量已超3500 億顆;短期內潛在出貨量仍將以百億顆計,因為如今每一顆 GPU 或 XPU 都需要大量 CPU 核心支持,無論是主機系統內,還是負責網絡虛擬化、分布式存儲控制的數據處理器(DPU)中,均是如此。
哈斯表示,一座功率 1 吉瓦的現代化人工智能數據中心,按此前測算約搭載 50 萬至 60 萬顆加速芯片,同時還需配備3000 萬個 CPU 核心—— 若按單顆 CPU 約 100 核計算,大約相當于 30 萬顆 CPU。而在智能體人工智能場景下,搭載數十種模型的智能體對推理模型的調用頻率,將達到人類使用聊天機器人的 15 倍以上,人工智能推理系統需要部署的 CPU 數量將持續攀升。哈斯保守估計,每吉瓦算力需求至少需要1.2 億個 CPU 核心。隨著核心數量增加,CPU 總需求量或將遠超 100 萬顆;而據多方預測,全球新增人工智能數據中心算力將達到 100 至 150 吉瓦,按單顆 CPU 平均 120 核計算,整體 CPU 需求量約為 1 億至 1.5 億顆。
也正因如此,Arm決意抓住這一重大機遇,不再局限于原有業務模式。到 2030 年,智能體人工智能系統所用 CPU 的整體潛在市場規模將達到 1000 億美元。Arm已向華爾街(但未向昨日參加 “Arm無處不在” 大會的媒體與公眾)透露,其目標是到 2031 年,通過 AGI CPU 產品實現150 億美元營收。
與之相比,Arm此前表現亮眼的 Neoverse 知識產權授權與計算子系統(CSS)許可收入,便顯得微不足道。超大規模云廠商與云計算服務商本就不愿自主設計 CPU 與 XPU,他們自研芯片,只是因為認為現有供應商定價過高。而Arm自研芯片與各大廠商的自研Arm架構 CPU 兼容,如今這些科技巨頭可以直接依賴Arm供應成品芯片;未來,很有可能會有多家科技巨頭更多采用Arm AGI CPU,而非繼續自研。
Arm能否成功,很大程度上取決于第一代 AGI CPU 的設計,以及其路線圖中后續產品的規劃。
天生適配低功耗
Arm顯然無法將自家 AGI CPU 與過去十年間超大規模云廠商、云計算服務商自研的Arm架構服務器 CPU 直接對比 —— 畢竟Arm本身也從這些自研設計中獲得了可觀的授權收益。
因此在發布演示中,X86 架構被設定為對比標桿。但現實是,Arm必須與這些自研芯片共存;若想實現業務穩定增長,還需在特定負載下,于性能、擴展能力、能效與成本等核心指標上超越競品。阿瓦德在 AGI CPU 發布會上詳細介紹了前三項指標,而成本則直接決定了總體擁有成本(TCO)與總體擁有成本收益(TCA)。
為快速推進與元平臺的合作項目,Arm以其 “波塞冬(Poseidon)”V3 核心與 “航海家(Voyager)”CSS V3 平臺為基礎展開研發,相關細節我們曾在 2024 年 2 月詳細報道。波塞冬核心搭載雙 SVE2 向量處理單元,在處理人工智能負載所需的部分運算時性能強勁。
我們將這款首發 AGI 芯片暫稱為AGI CPU-1(目前未知其官方代號),以區別于后續迭代產品。該芯片基于 Armv9.2 指令集,最高搭載136 顆核心,采用臺積電 N3(3 納米)工藝制造,晶圓圓徑限制略高于 800 平方毫米,與行業主流規格一致。
136 核的規格與最初航海家 CSS 的設計參數并不完全吻合:
![]()
AGI CPU 采用雙芯粒設計,每顆芯粒承載一半的計算與 I/O 能力,芯粒間通過裸片互聯技術相連。阿瓦德表示,這一設計優于超威、英特爾采用的獨立 I/O 與內存控制器裸片搭配計算核心裸片的方案,能夠減少緩存層級架構中的非統一內存訪問(NUMA)域,實現所有核心與內存間的低延遲通信。任意核心訪問插槽內任意控制器所連接的內存,延遲均低于 100 納秒。
航海家 CSS 的設計規格為:單顆芯粒搭載 64 核、6 個 DDR5 內存控制器與 4 個 PCIe 5.0 控制器,單插槽可擴展至兩顆芯粒,總計 128 顆 V3 核心、12 個內存控制器與 8 個 PCIe 5.0 控制器。
136 核的配置顯得有些特殊。仔細觀察上方芯片裸片照片(我們經過多方查找才獲得高分辨率細節圖)可見,AGI CPU-1 的每顆芯粒上排布著 5 列、每列 12 顆核心,共計 60 核,兩顆芯粒總計 120 核。在這些 V3 核心陣列的上下方,還存在另一類核心 —— 或許是專為通用服務器負載設計、向量運算需求較低的 “赫爾墨斯(Hermes)”Neoverse N3 核心。(詳見 Neoverse 路線圖。)但規格書明確標注,該芯片搭載 136 顆 Neoverse V3 核心。即便如此,120 顆常規 V3 核心加上 20 顆專用 V3 核心,總數應為 140 核,而非 136 核。
每顆芯粒的上下邊緣集成 6 個內存控制器,左右外側邊緣則為 PCIe 控制器。理論上,內存控制器周邊可能額外集成 6 顆及以上 V3 核心,但這種布局并不常見。當然,芯片設計本就不乏非常規方案。
此外,這張裸片照片也有可能與實際產品存在出入。
若要實現規整的 136 核配置,在每列 12 核的布局下難度頗高。若保持單顆芯粒 6 列核心、兩顆芯粒組合,單插槽總核心數為 144 顆;若核心良率為 94.4%,則可用核心數恰好為 136 顆。但這與圖片顯示的布局依然不符。
目前我們尚未獲知每顆核心的一級緩存容量,但已知每顆核心配備2MB 二級緩存,最高主頻3.7GHz。該芯片不支持睿頻與超線程技術 —— 這兩項正是 X86 CPU 的標志性功能,而安培計算的設計理念也同樣不認可這兩項技術。在安培看來,追求 CPU 確定性性能時,睿頻與超線程帶來的麻煩遠大于收益;同時,超線程還會增加安全漏洞的攻擊面。
AGI CPU-1 的每個 DDR5 控制器可搭載一根內存條,內存頻率最高可達 8.8GHz,實現單核心 6GB / 秒的內存帶寬。(12 個 DDR5 控制器搭配 DDR5-8800 內存,總內存帶寬為 844.8GB / 秒;若按 144 核滿配計算,單核心帶寬為 5.9GB / 秒;按 136 核可用核心計算,單核心帶寬為 6.2GB / 秒。)
單插槽提供96 條 PCIe 6.0 通道,這也表明元平臺對 I/O 帶寬的需求遠超Arm最初為航海家 CSS V3 規劃的規格。這些 I/O 通道可通過數據處理器(DPU)連接以太網交換機,雙方均運行元平臺主推的 ESUN 內存一致性協議。必要時,這些 PCIe 6.0 接口也可用于擴展主內存,只是會占用對外 I/O 帶寬。
這款 136 核 AGI CPU-1 最亮眼的特點在于:熱設計功耗僅 300 瓦。這一數據充分體現了Arm為元平臺打造高性能、低功耗芯片的工程取舍,折算下來單核心功耗僅 2.2 瓦。
對比來看,128 核 “Granite Rapids” 至強 6 6980P(高性能 P 核 + 超線程)在 2GHz 主頻下功耗達 500 瓦,單核心 3.9 瓦;144 核 “ Sierra Forest” 至強 6(節能 E 核,無超線程)在 2.2GHz 主頻下功耗 330 瓦,單核心 2.3 瓦。目前我們尚未掌握 3.7GHz 主頻 V3 核心的具體性能數據,但可以確定,其性能遠優于 Sierra Forest E 核,且憑借 2.85 倍的主頻優勢,有望超越 Granite Rapids P 核。
阿瓦德透露了部分 AGI CPU-1 的性能參考數據:
![]()
下方性能數據均以某款未指明型號的 X86 核心為基準(推測為支持超線程的 Granite Rapids P 核,Sierra Forest E 核不支持超線程),性能按單線程或整機柜線程數歸一化計算,深灰色柱形為基準數據,淺灰色柱形為開啟超線程后的影響。
圖表第一部分為單線程性能:AGI CPU 不支持超線程,單線程性能約為對比 X86 核心的 1.3 倍。而 X86 服務器芯片開啟超線程后,單線程性能反而下降,對整機柜穩定線程數的提升也十分有限。AGI CPU 的每瓦性能對比 X86 方案優勢尤為顯著。
注:我們暫未獲知對比所用的具體負載,但結合 AGI CPU 的定位與數據中心應用場景,測試負載應為人工智能相關任務,而非標準性能評估機構(SPEC)基準測試。
哈斯與阿瓦德均未提及芯片定價,而這正是決定 AGI CPU 成敗的關鍵因素。Arm若要在 2031 年實現 150 億美元銷售額,必須制定合理的價值定價 —— 即單位性能成本低于同級 X86 處理器,同時憑借更優的性能 / 成本 / 能效比提升溢價空間。此外,每一代 AGI CPU 后續迭代都需要持續創新,形成差異化優勢。
眾所周知,企業采購看重的是產品路線圖,而非單一型號產品。以下為Arm AGI CPU 系列產品路線圖:
![]()
轉向高數值孔徑(High NA)2 納米工藝與環繞柵極(GAA)晶體管技術后,芯片可實現單次光刻,晶體管尺寸縮小至原來的 1/1.7,數量接近提升三倍。若單插槽搭載兩倍于現有規格、受圓徑限制的高數值孔徑芯粒,Arm理論上可實現約 6 倍的晶體管容量,用于數據存儲與運算處理。但這需要采用四芯粒設計,每顆芯粒的四條邊緣中有兩條用于芯粒間互聯。
上圖暗示 AGI CPU 將實現每年迭代,但并未作出明確承諾。同時圖表清晰顯示,Arm仍會繼續向自主研發的客戶供應 Neoverse 知識產權模塊與未來的計算子系統方案,正如我們預期,現有自研廠商仍將保留自主設計路線。推出 AGI CPU,一方面是讓缺乏芯片設計團隊的大型企業與機構也能使用Arm服務器 CPU,另一方面也為自研廠商提供第二選擇,如同 X86 生態中超威為客戶提供了英特爾之外的優質方案。
最后一個想法:或許Arm可以復刻工作站,完成一次歷史輪回?畢竟這場大會名為 “Arm無處不在”,而非 “Arm數據中心”。哈斯也暗示,邊緣設備與個人電腦產品即將面世,Arm由此將瞄準規模高達1 萬億美元的更廣闊潛在市場。何樂而不為呢?
既然已經入局,便索性全力以赴。
(來源:nextplatform)
*免責聲明:本文由作者原創。文章內容系作者個人觀點,半導體行業觀察轉載僅為了傳達一種不同的觀點,不代表半導體行業觀察對該觀點贊同或支持,如果有任何異議,歡迎聯系半導體行業觀察。
今天是《半導體行業觀察》為您分享的第4357內容,歡迎關注。
加星標??第一時間看推送
求推薦
特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.