網易數碼訊 3月29日消息,在上海人工智能實驗室(上海AI實驗室)主辦的第二屆浦江AI學術年會期間,其DeepLink團隊正式發布了《超節點技術體系白皮書》。該白皮書旨在系統性解決超節點規模化落地中面臨的異構協同難、跨域調度效率低、工程化部署復雜等核心痛點,為產業實踐提供了重要的理論指導。此次發布匯聚了來自8所頂尖高校與16家核心產業伙伴的共識,覆蓋芯片研發、算力部署、軟件適配到行業應用的全產業鏈環節。
![]()
隨著芯片制程工藝逼近物理極限,單純依賴單芯片性能提升已難以滿足AI大模型訓練、推理及智能體應用爆發的指數級算力需求。超節點技術通過超高帶寬、超低延遲的芯片間互聯,將數十乃至上百顆計算芯片整合為邏輯統一的“超級計算單元”,成為突破算力瓶頸的關鍵路徑。其戰略價值對我國人工智能發展至關重要。
![]()
目前,產業界已涌現多種超節點方案,例如中科曙光的scaleX系列、沐曦科技的耀龍3D Mesh、阿里云的磐久AL128服務器以及新華三的H3C UniPoD S80000等。這標志著算力競爭正從單一的芯片性能比拼,轉向由互聯、整機、軟件及系統可靠性(RAS)等多變量協同決定的系統效能交付能力競爭。
當前超節點領域的產品百花齊放,其本質是一場關于未來技術生態主導權的戰略博弈。在技術路線尚未收斂的窗口期,誰能率先構建完善的“芯片+互聯+軟件”系統級生態,誰便有望確立事實標準。這種生態將產生強大的“鎖定效應”,因為客戶一旦采用,其從底層調度到上層應用都會深度綁定。
![]()
然而,生態割裂也帶來挑戰。若各家軟件棧互不兼容,開發者將面臨重復開發的負擔,阻礙AI應用的跨平臺部署與生態共享。產業界已清醒認識到,彌補單芯片增速與系統需求增速之間的“結構性缺口”,必須依靠全產業鏈的開放協同。封閉的技術棧將導致生態脆弱、代際迭代負擔沉重,具體挑戰包括互聯層原生訪存語義的缺失、機柜級工程設計的復雜性,以及缺乏行業公認的評價框架。
為應對上述挑戰,推動形成行業共同語言與分析框架,上海AI實驗室聯合產學界共同撰寫了此份白皮書。白皮書采用“學術主導編輯、產業分域貢獻”機制,由實驗室與高校負責框架設計與審校,沐曦科技、天數智芯、奇異摩爾、盛科通信、階躍星辰等企業則分別貢獻了芯片架構、互聯協議、系統需求等方面的實踐經驗,確保其成為行業公共知識產品,而非單一廠商的技術主張。
例如,奇異摩爾作為AI互聯領域的創新者,將其KiwiG2G IOD通用IO芯粒方案在應對超節點Scale-Up互聯挑戰中的工程實踐經驗融入白皮書。該方案支持2TB級帶寬與靈活拓撲,為高效互聯提供了支撐。
上海AI實驗室為超節點生態規劃了“認知-評價-驗證-標準”的清晰路徑。本次白皮書解決了第一步,即建立系統級分析框架與共同語言。下一步將推動“超節點能力指數”落地,將多維評價框架轉化為可度量、可比較的評測方法。長期目標是逐步沉淀出一組關鍵接口標準與協同規范,并通過開源(白皮書已在GitHub開源)共建的方式,構建一套行業可持續使用的公共基礎設施。
除理論指導外,上海AI實驗室的DeepLink混訓混推平臺正從軟件層面為超節點生態提供關鍵支撐。該平臺通過統一通信協議、高效調度算法與標準化算子接口,扮演了超節點的“操作系統”角色,實現了“一次適配,全生態可用”,大幅縮短了芯片從流片到應用的周期。其跨域異構調度能力使行業在計算資源有限的情況下,能靈活組合不同性能芯片,降低對特定硬件的路徑依賴,有效破解算力碎片化難題,助推全國算力“一盤棋”的布局。
未來,上海AI實驗室將持續深化技術創新,完善DeepLink技術體系,為優化全國算力資源配置、發展新質生產力注入強勁動能。
