337p人体粉嫩胞高清图片,97人妻精品一区二区三区在线 ,日本少妇自慰免费完整版,99精品国产福久久久久久,久久精品国产亚洲av热一区,国产aaaaaa一级毛片,国产99久久九九精品无码,久久精品国产亚洲AV成人公司
網(wǎng)易首頁 > 網(wǎng)易號 > 正文 申請入駐

SemiAnalysis GTC深度解讀:三款新系統(tǒng)背后,英偉達正在重新定義AI基礎(chǔ)設(shè)施的邊界

0
分享至

在GTC 2026大會上,英偉達一口氣推出三款全新系統(tǒng)——Groq LPX推理機架、Vera ETL256 CPU機架與STX存儲參考架構(gòu),將其產(chǎn)品版圖從GPU算力核心向低延遲推理、CPU編排與存儲層全面延伸,標志著英偉達正系統(tǒng)性地重構(gòu)AI基礎(chǔ)設(shè)施的定義邊界。

其中最受市場關(guān)注的是Groq LPX系統(tǒng)。這是英偉達以200億美元完成對Groq知識產(chǎn)權(quán)授權(quán)與核心團隊引進后,不到四個月內(nèi)推出的首款產(chǎn)品化成果。

LPX機架將Groq的LP30芯片與英偉達GPU深度整合,并引入"注意力與前饋網(wǎng)絡(luò)解耦"(Attention FFN Disaggregation,下稱AFD)技術(shù),在高交互推理場景中針對性地壓縮解碼延遲,為大規(guī)模推理系統(tǒng)開辟了此前不存在的優(yōu)化路徑。

與此同時,Vera ETL256將256顆CPU塞入單一液冷機架,以銅纜拓撲實現(xiàn)機架內(nèi)全互聯(lián),直接瞄準隨AI規(guī)模擴張而日益凸顯的CPU供給瓶頸;STX則通過標準化存儲參考架構(gòu),將英偉達的掌控范圍從算力層和網(wǎng)絡(luò)層正式延伸至存儲基礎(chǔ)設(shè)施層。

SemiAnalysis認為,三款系統(tǒng)共同指向同一個戰(zhàn)略信號:英偉達不再僅僅是GPU供應(yīng)商,而是在向全棧AI基礎(chǔ)設(shè)施平臺商演進,其觸角已覆蓋推理優(yōu)化、CPU密度、存儲編排等此前由其他廠商主導(dǎo)的領(lǐng)域,這將深刻影響整個AI硬件供應(yīng)鏈的競爭格局。

LPX與LP30:Groq架構(gòu)正式融入英偉達推理棧

英偉達與Groq之間的交易在結(jié)構(gòu)上被設(shè)計為知識產(chǎn)權(quán)授權(quán)與人才引進,而非傳統(tǒng)并購。英偉達由此幾乎即時獲得了Groq的全部IP和核心團隊,并在不到四個月內(nèi)推出基于Groq第三代LPU架構(gòu)的LP30芯片與LPX機架系統(tǒng)。

LP30采用三星SF4工藝,配備500MB片上SRAM,F(xiàn)P8精度下算力為1.2 PFLOPS,相較于Groq第一代LPU(230MB SRAM,750 TFLOPS INT8)實現(xiàn)了大幅提升,性能增長主要由制程節(jié)點從GF16遷移至SF4驅(qū)動。

LP30以單一整體裸片形式存在,無需先進封裝。值得關(guān)注的是,SF4工藝不擠占英偉達在臺積電N3上的稀缺產(chǎn)能配額,也不消耗同樣緊張的HBM資源,因此LPX系統(tǒng)代表的是真正意義上的增量產(chǎn)能與增量收入,據(jù)SemiAnalysis指出,這是競爭對手無法復(fù)制的差異化優(yōu)勢。

LPU的核心價值與天然局限

LPU架構(gòu)的競爭優(yōu)勢在于高帶寬SRAM與確定性流水線執(zhí)行機制,這使其在單用戶低延遲場景下具備GPU難以企及的首token生成速度。然而,高密度SRAM的代價是容量受限——權(quán)重加載后所剩空間極為有限,隨批量增大KV Cache迅速飽和,整體吞吐量顯著弱于GPU。

據(jù)SemiAnalysis分析,獨立部署的LPU系統(tǒng)在大規(guī)模token服務(wù)上并不經(jīng)濟,但在對延遲極度敏感的場景中可獲取可觀的溢價,這正是LPU在解耦解碼系統(tǒng)中的定位基礎(chǔ)。


AFD技術(shù):GPU與LPU的角色分工

AFD技術(shù)將大模型推理中的注意力計算(Attention)與前饋網(wǎng)絡(luò)計算(FFN)拆分至不同硬件。注意力計算因涉及動態(tài)KV Cache加載,天然適合GPU處理;FFN計算因其無狀態(tài)、可靜態(tài)調(diào)度的特性,與LPU確定性架構(gòu)高度契合。

在這一框架下,GPU專注處理注意力計算,HBM容量得以充分釋放用于KV Cache,提升系統(tǒng)可并發(fā)處理的token總量;LPU則承擔FFN計算,發(fā)揮其低延遲優(yōu)勢。GPU與LPU之間通過All-to-All集合通信完成token的分發(fā)與匯聚,并以乒乓流水線方式隱藏通信延遲。

此外,LPU也可在投機解碼(Speculative Decoding)框架中發(fā)揮作用,將草稿模型或多token預(yù)測(MTP)層部署至LPU,進一步降低單次解碼步驟的延遲開銷,通常可將每次解碼步驟的輸出token數(shù)提升至1.5至2倍。


LPX機架架構(gòu)

LPX機架由32個1U LPU計算托盤與2臺Spectrum-X交換機構(gòu)成。每個計算托盤搭載16塊LP30、2塊Altera FPGA(英偉達稱之為"Fabric Expansion Logic")、1顆Intel Granite Rapids主機CPU及1塊BlueField-4前端模塊。

FPGA在系統(tǒng)中承擔多重關(guān)鍵職能:將LPU的C2C協(xié)議轉(zhuǎn)換為以太網(wǎng)以接入Spectrum-X規(guī)模擴展網(wǎng)絡(luò),提供LPU與主機CPU之間的PCIe橋接,并為系統(tǒng)提供每塊最高256GB的DDR5擴展內(nèi)存用于KV Cache存儲。整個機架的規(guī)模擴展帶寬總計約640TB/s。

LPU模塊以"腹對腹"方式安裝于PCB板兩側(cè),上下各8塊,旨在縮短全互聯(lián)網(wǎng)格所需的X和Y方向走線長度。節(jié)點內(nèi)16塊LPU以全互聯(lián)Mesh拓撲相連,節(jié)點間通過銅纜背板互聯(lián),跨機架連接則通過前面板OSFP接口實現(xiàn)。


Vera ETL256:256顆CPU的密度極限

隨著AI工作負載對數(shù)據(jù)預(yù)處理、調(diào)度編排和強化學習驗證的需求持續(xù)攀升,CPU正成為制約GPU利用率的新瓶頸。強化學習場景尤為突出——CPU需要并行運行仿真環(huán)境、執(zhí)行代碼并對輸出進行驗證。GPU規(guī)模的擴張速度遠超CPU,使得維持GPU滿載所需的CPU集群規(guī)模不斷擴大。

英偉達的應(yīng)對方案是Vera ETL256,將256顆Vera CPU集成于單一機架,依賴液冷實現(xiàn)這一密度目標。

該系統(tǒng)的設(shè)計邏輯與NVL計算機架一脈相承:將算力密度提升至銅纜可覆蓋機架內(nèi)全部連接的臨界點,從而在主干網(wǎng)絡(luò)層面完全消除光收發(fā)器的需求。銅纜帶來的成本節(jié)約,足以抵消液冷引入的額外開銷。

具體而言,Vera ETL機架由32個計算托盤構(gòu)成,上下各16個,以4個1U MGX ETL交換托盤(基于Spectrum-6)為中軸對稱排列。這種對稱布局刻意壓縮各計算托盤與主干交換托盤之間的線纜長度差異,確保全部連接均處于銅纜可達范圍內(nèi)。

每個交換托盤的后向端口負責機架內(nèi)銅纜主干通信,32個前向OSFP接口則提供與POD其余節(jié)點的光纖連接。機架內(nèi)網(wǎng)絡(luò)采用Spectrum-X多平面拓撲,將200 Gb/s通道分布至四臺交換機,在單一網(wǎng)絡(luò)層內(nèi)實現(xiàn)256顆CPU的全互聯(lián)以太網(wǎng)連接,每個計算托盤承載8顆Vera CPU。


STX:英偉達向存儲層的系統(tǒng)性延伸

STX是英偉達在GTC 2026發(fā)布的存儲參考機架架構(gòu),與此前推出的CMX上下文存儲平臺配套,共同構(gòu)成英偉達向存儲基礎(chǔ)設(shè)施層滲透的完整布局。

STX在CMX基礎(chǔ)上進一步建立參考架構(gòu),精確規(guī)定一個集群中需要配置多少磁盤驅(qū)動器、Vera CPU、BF-4 DPU、CX-9網(wǎng)卡和Spectrum-X交換機。

每個STX機箱內(nèi)含2個BF-4單元,合計2顆Vera CPU、4塊CX-9網(wǎng)卡和4個SOCAMM模塊;整個STX機架共16個機箱,對應(yīng)32顆Vera CPU、64塊CX-9網(wǎng)卡和64個SOCAMM。

英偉達在發(fā)布STX的同時罕見地點名一批主要存儲廠商——包括DDN、Dell Technologies、HPE、IBM、NetApp、Supermicro及VAST Data等——表示上述廠商均將支持STX標準,延續(xù)了英偉達以行業(yè)背書強化參考架構(gòu)話語權(quán)的一貫做法。


據(jù)SemiAnalysis分析,BlueField-4、CMX與STX的組合,代表英偉達在完成算力層(GPU)與網(wǎng)絡(luò)層(Spectrum-X及NVLink)的主導(dǎo)地位之后,正在系統(tǒng)性地向存儲層、軟件層和基礎(chǔ)設(shè)施運營層推進。

三款新系統(tǒng)合力拓寬了英偉達的產(chǎn)品護城河,也意味著AI基礎(chǔ)設(shè)施供應(yīng)鏈中更大比例的市場份額將持續(xù)向英偉達集中。

特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺“網(wǎng)易號”用戶上傳并發(fā)布,本平臺僅提供信息存儲服務(wù)。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相關(guān)推薦
熱點推薦
女排名將周曉蘭:曾和郎平齊名,退役后辭官赴美,如今過得咋樣

女排名將周曉蘭:曾和郎平齊名,退役后辭官赴美,如今過得咋樣

小徐講八卦
2026-02-15 16:20:07
壽命與大便次數(shù)有關(guān)?研究發(fā)現(xiàn):壽命長的人,每天排便在這個次數(shù)

壽命與大便次數(shù)有關(guān)?研究發(fā)現(xiàn):壽命長的人,每天排便在這個次數(shù)

DrX說
2025-10-24 14:15:19
快船24分大逆轉(zhuǎn)!倫納德28+8創(chuàng)紀錄,西卡16中4,加蘭30+5立大功

快船24分大逆轉(zhuǎn)!倫納德28+8創(chuàng)紀錄,西卡16中4,加蘭30+5立大功

魚崖大話籃球
2026-03-28 09:52:25
利物浦一夜3大消息:報價巴西國腳,追逐楚阿梅尼,加克波互換?

利物浦一夜3大消息:報價巴西國腳,追逐楚阿梅尼,加克波互換?

夜白侃球
2026-03-28 09:19:30
上海男籃VS山西!盧偉沖擊13連勝,淡厚然上演CBA首秀,央視直播

上海男籃VS山西!盧偉沖擊13連勝,淡厚然上演CBA首秀,央視直播

體壇瞎白話
2026-03-28 08:33:49
4月1日執(zhí)行!電車天價換電池終結(jié),國家新規(guī)來了

4月1日執(zhí)行!電車天價換電池終結(jié),國家新規(guī)來了

復(fù)轉(zhuǎn)這些年
2026-03-26 09:46:11
浙江某設(shè)計院花式降薪,方案二選一!

浙江某設(shè)計院花式降薪,方案二選一!

黯泉
2026-03-27 16:56:15
鄧文迪還是牛!前夫默多克95歲生日宴,她和兩個女兒精心打扮出席

鄧文迪還是牛!前夫默多克95歲生日宴,她和兩個女兒精心打扮出席

照見古今
2026-03-12 19:27:38
這關(guān)系得是多硬啊!5分4犯規(guī)正負值-6,上空籃不進,照樣打30分鐘

這關(guān)系得是多硬啊!5分4犯規(guī)正負值-6,上空籃不進,照樣打30分鐘

金山話體育
2026-03-27 21:59:08
美國政壇失控!共和黨集體反擊:特朗普若退出,美國將爆發(fā)內(nèi)戰(zhàn)

美國政壇失控!共和黨集體反擊:特朗普若退出,美國將爆發(fā)內(nèi)戰(zhàn)

海闊山遙YAO
2026-03-28 08:56:37
央企利潤上繳比例首次公開,最高達35%,2025年上繳利潤同比增長約78.5%

央企利潤上繳比例首次公開,最高達35%,2025年上繳利潤同比增長約78.5%

金融界
2026-03-27 16:17:53
被低估的淘寶小神店,有它的過人之處。。。

被低估的淘寶小神店,有它的過人之處。。。

艾格吃飽了
2026-03-26 16:41:00
趙櫻子自爆相親翻車!6億豪宅香港富商摘了眼鏡帽子后:下不去嘴

趙櫻子自爆相親翻車!6億豪宅香港富商摘了眼鏡帽子后:下不去嘴

觀魚聽雨
2026-03-27 17:30:53
以色列收到1.28萬份戰(zhàn)火損失賠償申請

以色列收到1.28萬份戰(zhàn)火損失賠償申請

財聯(lián)社
2026-03-26 23:22:07
傾向加入美以行動?海灣多國聯(lián)合聲明譴責伊朗,沙特、阿聯(lián)酋已有所動作

傾向加入美以行動?海灣多國聯(lián)合聲明譴責伊朗,沙特、阿聯(lián)酋已有所動作

澎湃新聞
2026-03-27 14:26:27
吳啟華:后悔演反派,來內(nèi)地定居還交社保,直言能做中國人太好了

吳啟華:后悔演反派,來內(nèi)地定居還交社保,直言能做中國人太好了

白面書誏
2026-03-27 17:37:23
男人的生理需求能有多難忍?網(wǎng)友:我對我老公只有動物本能

男人的生理需求能有多難忍?網(wǎng)友:我對我老公只有動物本能

帶你感受人間冷暖
2026-02-07 03:58:56
緬北詐騙傳聞?wù)嫦啻蟀變H兩月,趙薇再傳2噩耗,唯一靠山也被牽連

緬北詐騙傳聞?wù)嫦啻蟀變H兩月,趙薇再傳2噩耗,唯一靠山也被牽連

阿郎娛樂
2026-03-23 22:37:21
張雪峰有兩個親生孩子

張雪峰有兩個親生孩子

大中國
2026-03-27 00:13:23
多國動手!太子集團陳志引渡受審,背后大佬隱姓埋名15年藏太深

多國動手!太子集團陳志引渡受審,背后大佬隱姓埋名15年藏太深

哭藍了海a
2026-03-28 02:06:44
2026-03-28 11:00:49
華爾街見聞官方 incentive-icons
華爾街見聞官方
中國領(lǐng)先的金融商業(yè)信息提供商
143689文章數(shù) 2653040關(guān)注度
往期回顧 全部

科技要聞

遭中國學界"拉黑"后,這家AI頂會低頭道歉

頭條要聞

前大廠員工開"網(wǎng)絡(luò)賭場" 三個月吸金1900萬

頭條要聞

前大廠員工開"網(wǎng)絡(luò)賭場" 三個月吸金1900萬

體育要聞

“我是全家最差勁的運動員”

娛樂要聞

范瑋琪加盟,官宣《浪姐7》遭全網(wǎng)抵制

財經(jīng)要聞

我在小吃培訓機構(gòu)學習“科技與狠活”

汽車要聞

置換補貼價4.28萬起 第五代宏光MINIEV正式上市

態(tài)度原創(chuàng)

教育
時尚
手機
游戲
旅游

教育要聞

娃的錯題本,以后不用家長整理了......

推廣中獎名單-更新至2026年3月11日推廣

手機要聞

全球首臺闊比例大折疊手機!華為Pura X2要改名

PS5瘋狂漲價!或?qū)⑼侠邸禛TA6》硬件銷量

旅游要聞

解鎖五大春日新玩法 2026年重慶大足石刻國際旅游文化節(jié)4月啟幕

無障礙瀏覽 進入關(guān)懷版