網易首頁 > 網易號 > 正文申請入駐

MWC26：華為Atlas 950 SuperPoD超節(jié)點海外首秀，全球算力版圖迎來新變量

2026-03-11 14:42:26　來源: 環(huán)球Tech

陜西舉報

分享至

【環(huán)球網科技報道記者張陽】當前，人工智能產業(yè)正在經歷從生成式AI向智能體（Agentic AI）時代的躍遷。當大模型參數(shù)規(guī)模突破萬億級、訓練數(shù)據(jù)量達到10萬億Token量級時，算力需求呈現(xiàn)出十倍乃至百倍的爆發(fā)式增長。然而，傳統(tǒng)依賴服務器堆疊與以太網聯(lián)接的集群架構，正遭遇規(guī)模擴張與效率衰減的結構性矛盾——集群規(guī)模越大，算力利用率反而越低，訓練中斷頻率越高。

Meta在其Llama 3.1技術論文中披露的數(shù)據(jù)極具警示意義：在1.6萬卡H100集群的54天訓練過程中，累計中斷419次，平均每天近8次故障。這一數(shù)據(jù)揭示了傳統(tǒng)架構的致命短板：當計算節(jié)點通過低速網絡簡單聯(lián)接時，通信瓶頸、內存碎片化、調度開銷等問題會隨著規(guī)模擴張呈指數(shù)級惡化。

在此背景下，華為于MWC2026巴塞羅那首次向海外展示的Atlas 950 SuperPoD、TaiShan 950 SuperPoD等多款超節(jié)點產品及解決方案，標志著算力基礎設施建設正從“物理堆疊”走向“邏輯統(tǒng)一”的范式轉換。通過自研靈衢（Unified Bus）互聯(lián)協(xié)議，華為將最多8192張昇騰NPU卡整合為單一計算實體，使萬卡級集群在邏輯上如同一臺計算機協(xié)同工作。這種“集群+超節(jié)點”的系統(tǒng)級架構創(chuàng)新，本質上是對算力組織方式的重構，搭配全維度的開源開放生態(tài)布局，為全球算力產業(yè)發(fā)展提供了又一種選擇。

靈衢協(xié)議的技術突破：重新定義超節(jié)點的三大核心要素

超節(jié)點并不是將更多的計算單元進行連接，其技術內涵有著嚴格的界定標準。華為提出的“超大帶寬、超低時延、內存統(tǒng)一編址”三大核心要素，為行業(yè)提供了重要的技術參考框架。

在帶寬層面，Atlas 950 SuperPoD采用獨創(chuàng)的UB-Mesh遞歸直連拓撲網絡架構，支持單板內、單板間和機架間的NPU全互聯(lián)，靈衢全光互聯(lián)帶寬達到16.3PB/s。這一指標達到業(yè)界水平的62倍，徹底解決了大規(guī)模并行計算中的數(shù)據(jù)搬運瓶頸。

在時延層面，傳統(tǒng)以太網架構下跨節(jié)點通信時延通常在微秒級，而靈衢協(xié)議將RTT通信時延從7微秒降至3微妙，實現(xiàn)50%優(yōu)化。對于金融風控等要求響應時間在10毫秒以下的場景，這種時延突破具有決定性意義。

在內存架構層面，Atlas 950 SuperPoD實現(xiàn)1152TB共享內存池，通過內存統(tǒng)一編址技術，數(shù)據(jù)可在計算節(jié)點間快速調取，避免了傳統(tǒng)架構中因數(shù)據(jù)搬運造成的算力空轉。FP8算力達8EFLOPS、FP4算力16EFLOPS的性能指標，分別達到業(yè)界水平的6.7倍。

值得注意的是，華為的技術演進遵循明確的版本迭代路徑。2025年3月推出的Atlas 900超節(jié)點基于靈衢1.0，滿配384卡，已在互聯(lián)網、電信、制造等行業(yè)商用部署數(shù)百套，驗證了技術的成熟度。此次展示的Atlas 950 SuperPoD基于優(yōu)化升級的靈衢2.0，最大支持8192卡全互聯(lián)，實現(xiàn)了從“可用”到“領先”的跨越。

全場景產品矩陣：智算與通算的雙輪驅動

值得注意的是，華為此次展示的不僅是AI超節(jié)點，還包括全球首款通算超節(jié)點TaiShan 950 SuperPoD。這反映出一個關鍵趨勢：未來算力基礎設施必須兼顧通用計算與智能計算的雙重需求。

在智算領域，Atlas 950 SuperPoD定位為面向超大規(guī)模AI計算任務的全液冷解決方案，采用正交架構與零線纜電互聯(lián)設計，結合液冷接頭浮動盲插技術實現(xiàn)零漏液，光模塊液冷可靠性提升一倍。針對傳統(tǒng)風冷機房環(huán)境，Atlas 850E作為業(yè)界首個企業(yè)級風冷AI超節(jié)點服務器，支持8到1024卡靈活擴展，填補了風冷條件下的超節(jié)點部署空白。

在通算領域，TaiShan 950 SuperPoD作為業(yè)界首款通算超節(jié)點，具備百納秒級超低時延、TB級超大帶寬和48TB內存池化能力，為數(shù)據(jù)庫、虛機熱遷移、大數(shù)據(jù)處理等傳統(tǒng)通算場景開辟了性能提升的全新路徑。配合TaiShan 500、TaiShan 200等系列服務器，形成了高、中、低全梯度的通算產品體系。

開源開放戰(zhàn)略：從技術領先到生態(tài)共贏

技術創(chuàng)新的價值最終需要通過生態(tài)繁榮來實現(xiàn)。華為在此次展示中重申的開源開放戰(zhàn)略，是其算力底座能夠獲得全球認可的關鍵支撐。

在基礎軟件層面，openEuler操作系統(tǒng)社區(qū)已匯聚超2100家企業(yè)與機構，裝機量突破1600萬套，成為全球領先的開源操作系統(tǒng)社區(qū)。2021年華為將openEuler捐贈給開放原子開源基金會后，仍保持持續(xù)貢獻。

在AI軟件棧層面，華為于2025年底實現(xiàn)CANN異構計算架構的全面開源開放，算子庫、加速庫、圖計算、編程語言等27個軟件包、37個代碼倉全部向開發(fā)者開放。目前CANN已支持65+全球主流開源大模型、50+開源項目，代碼貢獻行超過百萬行，并與PyTorch、vLLM、xLLM、SGlang、Triton等主流開源社區(qū)實現(xiàn)深度適配。

這種開源開放策略的意義在于：通過分層解耦的架構設計，各行業(yè)客戶可以基于開源社區(qū)自主開發(fā)高性能算子，實現(xiàn)真正的自主創(chuàng)新。對于運營商、金融、制造等關鍵行業(yè)而言，這意味著不再受制于封閉的技術體系，而是能夠基于開放的算力底座構建自有能力。

全球算力格局的新變量

MWC26上華為超節(jié)點產品的海外首秀，發(fā)生在全球AI算力競爭格局深刻調整的背景下。為世界提供“新選擇”，意味著在當前以某種架構為主導的算力版圖之外，畫出了另一條清晰可行的路徑。這條路徑不是簡單的替代，而是基于對AI時代算力本質需求的理解，提供的一種更高效、更開放、更具韌性的可能性。

從產業(yè)視角審視，超節(jié)點技術的成熟與商用，正在推動三個層面的結構性變化：其一，算力建設從“芯片中心主義”轉向“系統(tǒng)架構優(yōu)化”，互聯(lián)協(xié)議、拓撲結構、散熱設計等系統(tǒng)工程能力的重要性顯著提升；其二，算力供給從“標準化產品”轉向“場景化解決方案”，不同規(guī)模、不同冷卻條件、不同業(yè)務負載的客戶都能獲得適配方案；其三，算力生態(tài)從“封閉壟斷”轉向“開放共贏”，開源社區(qū)成為技術創(chuàng)新與產業(yè)協(xié)作的核心載體。

MWC2026的展示，標志著這一技術選擇正式走向全球市場。超節(jié)點時代已經開啟，堅實的算力底座，正為智能世界的下一程鋪路。

特別聲明：以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發(fā)布，本平臺僅提供信息存儲服務。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.