![]()
英偉達最新Vera CPU
鳳凰網科技訊 北京時間3月14日,據CNBC報道,多年來,英偉達的圖形處理器(GPU)一直是市面上最熱門的芯片,但AI智能體的突然興起,為其更為低調的主機芯片中央處理器(CPU)帶來了復興。
現在,英偉達準備在周一開幕的年度GTC大會上,公布其針對AI智能體優化的CPU的新細節,屆時很可能在展臺上推出一款純CPU機架。
“CPU正成為擴展AI和智能體工作流的瓶頸。”英偉達AI基礎設施主管迪昂·哈里斯(Dion Harris)本周對CNBC表示。他認為,這是一個“令人興奮的機會”。
英偉達在2021年發布了其首款數據中心CPU Grace,下一代產品Vera現已投入生產。這些CPU通常與英偉達著名的Hopper、Blackwell或Rubin GPU一起部署在完整的機架級系統中。
GPU需求的激增使英偉達成為家喻戶曉的企業,并成為全球市值最高的上市公司,市值達到4.4萬億美元。今年2月,英偉達整體芯片戰略發生了重大轉變。當時,英偉達與Meta達成了一項多年協議,其中包括首次大規模獨立部署Grace CPU,并計劃在2027年部署Vera。
英偉達告訴CNBC,數千個獨立的英偉達CPU也在為得克薩斯高級計算中心和洛斯阿拉莫斯國家實驗室的超級計算機提供動力。
智能體帶動CPU復興
美國銀行預測,CPU市場規模可能會增長一倍以上,從2025年的270億美元增至2030年的600億美元。僅在上個季度,英偉達就創造了超過620億美元的數據中心收入,同比增長75%。
CPU的復興源于計算需求的根本變化:隨著AI大規模普及,應用場景從問答型聊天機器人逐漸轉向以任務為導向的智能體應用。
雖然GPU非常適合訓練和運行AI模型,因為它們擁有成千上萬顆專注于同時執行大量運算的小核心,但CPU擁有數量較少的高性能核心,可以運行連續的通用任務。
AI智能體需要大量通用計算能力,因為它們需要在AI工作流中傳輸和處理大量數據,并在多個智能體之間進行協同和調度。
![]()
黃仁勛
英偉達CEO黃仁勛(Jensen Huang)在上個月的財報電話會議上表示:“這些智能體系統正在衍生出不同的智能體,它們像一個團隊一樣協同工作。tokens生成的數量已經呈現指數級增長,因此我們需要以更高的速度進行推理。”
黃仁勛在電話會議上多次提到AI智能體,并表示:“在硬件需求轉變的情況下,最重要的就是每瓦性能。”
英偉達在一份新聞稿中表示,其獨立CPU在Meta的數據中心顯著提升了每瓦性能。Creative Strategies芯片分析師本·巴亞林(Ben Bajarin)表示:“這是全新的基礎設施:純CPU機架的全新擴容只負責運行AI智能體。你的軟件將位于別處,你的加速器只負責處理tokens,但必須有中間層來負責協調調度。”
CPU供應危機
如今,一度沉寂的CPU市場正面臨咨詢公司The Futurum Group所稱的“靜悄悄的供應危機”。該機構預測,到2028年,CPU市場的增長率可能會超過GPU。
據路透社報道,頭部CPU供應商AMD和英特爾已向中國客戶發出供應短缺警告。報道稱,CPU交付周期長達六個月,價格已上漲超過10%。
“過去六到九個月,需求出現了前所未有的增長。”AMD數據中心主管福雷斯特·諾羅德(Forrest Norrod)在接受CNBC采訪時表示。
諾羅德認為,CPU需求在短期內不會放緩,也不會停止增長,但AMD已經預見到了需求的增長,并正在“加緊努力”以滿足需求。
英特爾發言人告訴CNBC,該公司預計本季度庫存將達到“最低點”,“但我們正在積極應對,并預計從第二季度到2026年年底,供應將逐步改善”。
Creative Strategies芯片分析師巴亞林表示:“晶圓不會自己長出來。我們沒法憑空多收獲10%的硅晶圓。整個行業都面臨供應緊張的局面。所以不幸的是,CPU晶圓供應受到了限制。”
當被問及英偉達是否會遭遇CPU發貨延遲時,英偉達AI基礎設施主管哈里斯告訴CNBC,“目前一切正常”。
他表示,英偉達擁有“穩健的供應鏈”,能夠應對需求壓力,這在很大程度上得益于該公司將許多CPU與GPU一起在機架級系統中銷售。
為GPU優化
哈里斯表示,與英特爾和AMD生產的更為通用型CPU相比,英偉達在設計上采取了根本不同的方法,使其CPU“最適合”數據處理和AI智能體工作流程。
其中一個主要區別在于每個CPU的核心數量。AMD的EPYC系列和英特爾至強高性能服務器CPU通常擁有128個核心,而英偉達Grace CPU擁有72個核心。
![]()
AMD EPYC系列服務器CPU
哈里斯解釋說:“如果你是超大規模云計算企業,你會希望最大化每個CPU的核心數量,這本質上是為了降低成本,即每核心成本。所以這是一種商業模式。”
但是,英偉達設計其CPU的初衷是專門輔助其明星產品GPU運行AI工作負載。“在這種情況下,你的單線程性能比每核心成本更為重要,因為你要確保那個極為昂貴的資源GPU不會空閑等待。”哈里斯說。
英偉達的CPU也基于ARM架構,該架構更常用于智能手機等低功耗設備的芯片,而英特爾和AMD的CPU則基于傳統的x86架構。x86由英特爾在近50年前推出,自誕生以來一直主導PC和服務器處理器設計。
AMD數據中心主管諾羅德表示:“我認為,英偉達已經非常好地優化了他們的芯片,用于為GPU提供算力支持,但它們并沒有針對通用應用進行很好的優化。”
實際上,英偉達在某些產品上確實依賴于更通用的CPU。例如,在HGX Rubin NVL8平臺中,英偉達將自家GPU與英特爾或AMD的主機CPU配對,供客戶用作構建自有AI機架的基礎組件。
英偉達進軍獨立CPU市場之際,其越來越多的客戶正在為自家數據中心研發基于ARM架構的處理器。
亞馬遜是首家推出自研CPU的主要超大規模云服務公司,于2018年發布了Graviton處理器。The Futurum Group稱,谷歌在2024年發布的Axion處理器,如今處理著約30%的內部應用。微軟在去年11月發布了其第二代Cobalt處理器。ARM預計將于今年推出其自研CPU,Meta將成為其早期客戶。
研究公司Mercury Research估計,2025年第四季度,服務器CPU市場份額由英特爾主導,占比60%,AMD占24.3%,英偉達占6.2%,其余份額則由亞馬遜、微軟和谷歌等超大規模云計算企業基于ARM架構的自研CPU占據。(作者/簫雨)
更多一手新聞,歡迎下載鳳凰新聞客戶端訂閱鳳凰網科技。想看深度報道,請微信搜索“鳳凰網科技”。
特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.