近日,中興通訊正式發布了《超節點技術白皮書》,提出以超節點為核心構建標準化“AI工廠”,通過系統級架構創新,突破傳統算力極限與能效瓶頸,為AI基礎設施的可持續發展開辟了新的路徑。
隨著AI模型參數規模突破萬億量級,算力需求正從單芯片堆疊向系統級協同轉型。傳統分布式訓練模式面臨通信開銷劇增和算力利用率下降等嚴峻挑戰。為解決這一問題,中興通訊推出的超節點技術采用高速互聯協議和專用交換芯片,構建高帶寬域(HBD),將數十到數百顆GPU芯片邏輯整合為統一編址、低延遲、高帶寬的協同計算系統。這一創新架構不僅保留了GPU的物理獨立性,還帶來了類單機的編程與調度體驗,顯著提升了算力利用效率,為大規模模型訓練和推理提供了高性能的算力底座。
在硬件層面,中興通訊自研的OEX正交無背板互聯交換架構成為白皮書的一大亮點。該架構通過物理設計的根本性創新,實現了高密集成、高可靠、簡化運維和開放互聯四大核心優勢。OEX架構突破了物理空間極限,徹底消除了機柜內部成千上萬根高速線纜,極大釋放了機柜空間,實現了單位空間算力密度的飛躍。同時,正交無背板互聯顯著降低了通信損耗和誤碼率,確保了大規模集群通信的高速與穩定。
中興通訊提出的“AI工廠模式”倡導從“項目制”向“工廠模式”轉型,將AI能力建設升級為標準化的現代化流水線。通過統一虛擬化資源池與智能編排,軟件層實現對異構算力的深度調度與管理,最大化資源利用率。依托Nebula單體超節點與Nebula Matrix集群超節點,算力可從百卡平滑擴展至萬卡規模,靈活滿足不同階段的大模型訓練需求。
中興通訊憑借40多年在通信領域的系統工程積累,已構建起從自研系列高性能芯片、復雜系統設計到全球工程交付的全棧能力體系。展望未來,中興通訊將堅持開源開放理念,攜手產業伙伴共同推動智能算力基礎設施的標準化與生態化,構建高效、綠色、可持續的AI發展體系,引領AI算力新紀元。
特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.