【環(huán)球網科技報道 記者 張陽】當前,人工智能產業(yè)正在經歷從生成式AI向智能體(Agentic AI)時代的躍遷。當大模型參數(shù)規(guī)模突破萬億級、訓練數(shù)據(jù)量達到10萬億Token量級時,算力需求呈現(xiàn)出十倍乃至百倍的爆發(fā)式增長。然而,傳統(tǒng)依賴服務器堆疊與以太網聯(lián)接的集群架構,正遭遇規(guī)模擴張與效率衰減的結構性矛盾——集群規(guī)模越大,算力利用率反而越低,訓練中斷頻率越高。
Meta在其Llama 3.1技術論文中披露的數(shù)據(jù)極具警示意義:在1.6萬卡H100集群的54天訓練過程中,累計中斷419次,平均每天近8次故障。這一數(shù)據(jù)揭示了傳統(tǒng)架構的致命短板:當計算節(jié)點通過低速網絡簡單聯(lián)接時,通信瓶頸、內存碎片化、調度開銷等問題會隨著規(guī)模擴張呈指數(shù)級惡化。
在此背景下,華為于MWC2026巴塞羅那首次向海外展示的Atlas 950 SuperPoD、TaiShan 950 SuperPoD等多款超節(jié)點產品及解決方案,標志著算力基礎設施建設正從“物理堆疊”走向“邏輯統(tǒng)一”的范式轉換。通過自研靈衢(Unified Bus)互聯(lián)協(xié)議,華為將最多8192張昇騰NPU卡整合為單一計算實體,使萬卡級集群在邏輯上如同一臺計算機協(xié)同工作。這種“集群+超節(jié)點”的系統(tǒng)級架構創(chuàng)新,本質上是對算力組織方式的重構,搭配全維度的開源開放生態(tài)布局,為全球算力產業(yè)發(fā)展提供了又一種選擇。
![]()
靈衢協(xié)議的技術突破:重新定義超節(jié)點的三大核心要素
超節(jié)點并不是將更多的計算單元進行連接,其技術內涵有著嚴格的界定標準。華為提出的“超大帶寬、超低時延、內存統(tǒng)一編址”三大核心要素,為行業(yè)提供了重要的技術參考框架。
在帶寬層面,Atlas 950 SuperPoD采用獨創(chuàng)的UB-Mesh遞歸直連拓撲網絡架構,支持單板內、單板間和機架間的NPU全互聯(lián),靈衢全光互聯(lián)帶寬達到16.3PB/s。這一指標達到業(yè)界水平的62倍,徹底解決了大規(guī)模并行計算中的數(shù)據(jù)搬運瓶頸。
![]()
在時延層面,傳統(tǒng)以太網架構下跨節(jié)點通信時延通常在微秒級,而靈衢協(xié)議將RTT通信時延從7微秒降至3微妙,實現(xiàn)50%優(yōu)化。對于金融風控等要求響應時間在10毫秒以下的場景,這種時延突破具有決定性意義。
在內存架構層面,Atlas 950 SuperPoD實現(xiàn)1152TB共享內存池,通過內存統(tǒng)一編址技術,數(shù)據(jù)可在計算節(jié)點間快速調取,避免了傳統(tǒng)架構中因數(shù)據(jù)搬運造成的算力空轉。FP8算力達8EFLOPS、FP4算力16EFLOPS的性能指標,分別達到業(yè)界水平的6.7倍。
值得注意的是,華為的技術演進遵循明確的版本迭代路徑。2025年3月推出的Atlas 900超節(jié)點基于靈衢1.0,滿配384卡,已在互聯(lián)網、電信、制造等行業(yè)商用部署數(shù)百套,驗證了技術的成熟度。此次展示的Atlas 950 SuperPoD基于優(yōu)化升級的靈衢2.0,最大支持8192卡全互聯(lián),實現(xiàn)了從“可用”到“領先”的跨越。
全場景產品矩陣:智算與通算的雙輪驅動
值得注意的是,華為此次展示的不僅是AI超節(jié)點,還包括全球首款通算超節(jié)點TaiShan 950 SuperPoD。這反映出一個關鍵趨勢:未來算力基礎設施必須兼顧通用計算與智能計算的雙重需求。
在智算領域,Atlas 950 SuperPoD定位為面向超大規(guī)模AI計算任務的全液冷解決方案,采用正交架構與零線纜電互聯(lián)設計,結合液冷接頭浮動盲插技術實現(xiàn)零漏液,光模塊液冷可靠性提升一倍。針對傳統(tǒng)風冷機房環(huán)境,Atlas 850E作為業(yè)界首個企業(yè)級風冷AI超節(jié)點服務器,支持8到1024卡靈活擴展,填補了風冷條件下的超節(jié)點部署空白。
在通算領域,TaiShan 950 SuperPoD作為業(yè)界首款通算超節(jié)點,具備百納秒級超低時延、TB級超大帶寬和48TB內存池化能力,為數(shù)據(jù)庫、虛機熱遷移、大數(shù)據(jù)處理等傳統(tǒng)通算場景開辟了性能提升的全新路徑。配合TaiShan 500、TaiShan 200等系列服務器,形成了高、中、低全梯度的通算產品體系。
開源開放戰(zhàn)略:從技術領先到生態(tài)共贏
技術創(chuàng)新的價值最終需要通過生態(tài)繁榮來實現(xiàn)。華為在此次展示中重申的開源開放戰(zhàn)略,是其算力底座能夠獲得全球認可的關鍵支撐。
在基礎軟件層面,openEuler操作系統(tǒng)社區(qū)已匯聚超2100家企業(yè)與機構,裝機量突破1600萬套,成為全球領先的開源操作系統(tǒng)社區(qū)。2021年華為將openEuler捐贈給開放原子開源基金會后,仍保持持續(xù)貢獻。
在AI軟件棧層面,華為于2025年底實現(xiàn)CANN異構計算架構的全面開源開放,算子庫、加速庫、圖計算、編程語言等27個軟件包、37個代碼倉全部向開發(fā)者開放。目前CANN已支持65+全球主流開源大模型、50+開源項目,代碼貢獻行超過百萬行,并與PyTorch、vLLM、xLLM、SGlang、Triton等主流開源社區(qū)實現(xiàn)深度適配。
這種開源開放策略的意義在于:通過分層解耦的架構設計,各行業(yè)客戶可以基于開源社區(qū)自主開發(fā)高性能算子,實現(xiàn)真正的自主創(chuàng)新。對于運營商、金融、制造等關鍵行業(yè)而言,這意味著不再受制于封閉的技術體系,而是能夠基于開放的算力底座構建自有能力。
全球算力格局的新變量
MWC26上華為超節(jié)點產品的海外首秀,發(fā)生在全球AI算力競爭格局深刻調整的背景下。為世界提供“新選擇”,意味著在當前以某種架構為主導的算力版圖之外,畫出了另一條清晰可行的路徑。這條路徑不是簡單的替代,而是基于對AI時代算力本質需求的理解,提供的一種更高效、更開放、更具韌性的可能性。
從產業(yè)視角審視,超節(jié)點技術的成熟與商用,正在推動三個層面的結構性變化:其一,算力建設從“芯片中心主義”轉向“系統(tǒng)架構優(yōu)化”,互聯(lián)協(xié)議、拓撲結構、散熱設計等系統(tǒng)工程能力的重要性顯著提升;其二,算力供給從“標準化產品”轉向“場景化解決方案”,不同規(guī)模、不同冷卻條件、不同業(yè)務負載的客戶都能獲得適配方案;其三,算力生態(tài)從“封閉壟斷”轉向“開放共贏”,開源社區(qū)成為技術創(chuàng)新與產業(yè)協(xié)作的核心載體。
MWC2026的展示,標志著這一技術選擇正式走向全球市場。超節(jié)點時代已經開啟,堅實的算力底座,正為智能世界的下一程鋪路。
特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發(fā)布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.