/記得星標我/
比大部分人早一步看見未來
![]()
當?shù)貢r間 3 月 2 日,在西班牙巴塞羅那世界移動通信大會上,中國移動拿出了一項足以震動行業(yè)的硬核成果。原創(chuàng) Scale-Across 技術(shù)體系 GSE-DCI 正式發(fā)布,同時亮相的還有全球首臺超百 T 智算互聯(lián)路由器樣機,單臺設(shè)備吞吐量達到 115.2Tbps。
這不是一次常規(guī)的產(chǎn)品迭代,而是我國在跨智算中心互聯(lián)網(wǎng)絡(luò)核心技術(shù)領(lǐng)域,一次實打?qū)嵉闹卮笸黄啤?/p>
![]()
當下 AI 產(chǎn)業(yè)的高速發(fā)展,對算力的需求幾乎是無止境的。近五年來,我國算力總規(guī)模年均增速保持在 30% 左右,大模型參數(shù)規(guī)模已經(jīng)邁入萬億級甚至十萬億級時代,對算力集群的規(guī)模和效率提出了前所未有的要求。
但行業(yè)很快就遇到了一個無法回避的現(xiàn)實瓶頸。單一智算中心的建設(shè),始終受限于電力供應(yīng)和物理空間,很難無限制擴大規(guī)模。想要承載持續(xù)爆發(fā)的算力需求,只靠單集群堆料已經(jīng)走不通了。
行業(yè)里早就形成了明確共識,AI 計算的發(fā)展,離不開三大網(wǎng)絡(luò)支柱的支撐。最早的 Scale-Up,解決的是單臺服務(wù)器內(nèi)卡與卡之間的互聯(lián)問題,讓單臺設(shè)備的算力能充分釋放。之后的 Scale-Out,解決的是同一個數(shù)據(jù)中心內(nèi),服務(wù)器與服務(wù)器之間的機間互聯(lián)問題,讓單集群的算力規(guī)模能持續(xù)擴大。而現(xiàn)在,全球智算領(lǐng)域競爭的核心,已經(jīng)來到了第三個階段,也就是 Scale-Across 跨智算中心互聯(lián)。
簡單來說,Scale-Across 要做的,就是把地理上分散的多個智算中心,通過網(wǎng)絡(luò)技術(shù)連成一個邏輯上的超級算力集群。這直接決定了未來智算體系的規(guī)模上限和調(diào)度效率,也成了全球智算領(lǐng)域巨頭們爭相布局的新賽道。不管是芯片企業(yè)、設(shè)備廠商還是運營商,都在集中資源攻堅相關(guān)的芯片、產(chǎn)品和解決方案,跨區(qū)域智算網(wǎng)絡(luò)的技術(shù)競爭,已經(jīng)進入了白熱化階段。
正是在這樣的行業(yè)背景下,中國移動原創(chuàng)的 GSE-DCI 技術(shù),精準命中了當前智算互聯(lián)領(lǐng)域長期懸而未決的四大核心難題。一直以來,跨智算中心的長距傳輸,都面臨著多波長負載均衡差、長距擁塞控制響應(yīng)慢、安全保障開銷大、算網(wǎng)調(diào)度協(xié)同難的問題。這些問題不解決,跨中心的算力協(xié)同就只能停留在概念上,實際用起來效率極低,根本無法支撐大模型的規(guī)模化訓(xùn)練和推理需求。
這次發(fā)布的超百 T 智算互聯(lián)路由器樣機,就是這套原創(chuàng)技術(shù)的落地載體。設(shè)備本身具備高密、長距、高效、超寬、無損、安全的核心能力,最關(guān)鍵的一點,是它能把跨百公里分布式 AI 訓(xùn)練的算力效率,提升到單節(jié)點集群的 98% 以上。這個數(shù)字的含金量,行業(yè)內(nèi)的人都能看懂。它意味著,百公里之外的智算中心,在算力調(diào)度層面,幾乎和同一個機房里的集群沒有差別。地理空間對算力規(guī)模的限制,被這項技術(shù)徹底打破了。
有了這樣的算效保障,十萬億級參數(shù)規(guī)模的大模型訓(xùn)練與推理,才有了穩(wěn)定的底層網(wǎng)絡(luò)支撐。不管是跨區(qū)域的大模型協(xié)同訓(xùn)練,還是行業(yè)里重點推進的存算分離架構(gòu),以及全國一體化算力網(wǎng)絡(luò)、東數(shù)西算工程的落地推進,都能靠這項技術(shù),完成從試點到規(guī)模化落地的關(guān)鍵跨越。
很多人可能會覺得,這次的發(fā)布是一次突然的突破,但其實背后是中國移動在這個領(lǐng)域長期的深耕和積累。在這次發(fā)布之前,中國移動已經(jīng)在國際標準領(lǐng)域掌握了話語權(quán),在 IEEE802.3 主導(dǎo)完成了 800G 以太網(wǎng) 20km 標準的立項。同時也完成了業(yè)界首個 800G 以太網(wǎng)城市群智算中心分布式訓(xùn)練的現(xiàn)網(wǎng)技術(shù)試驗,在國內(nèi)多個省市落地了智算互聯(lián)新技術(shù)的試點項目。
這些前期的試點,已經(jīng)跑出了實實在在的性能數(shù)據(jù)。通過技術(shù)優(yōu)化,已經(jīng)能把 AI 大模型的訓(xùn)練時長縮短 20% 到 40%,并且能做到網(wǎng)絡(luò)擁塞場景下,和網(wǎng)絡(luò)不擁塞時同等的算力效率。這也說明,這次發(fā)布的技術(shù)和樣機,不是停留在實驗室里的 PPT 產(chǎn)品,而是經(jīng)過了現(xiàn)網(wǎng)環(huán)境的充分驗證,具備快速規(guī)模化推廣的條件。
在全球產(chǎn)業(yè)伙伴的共同見證下,這次 GSE-DCI 技術(shù)和設(shè)備樣機的發(fā)布,也標志著跨智算中心互聯(lián)技術(shù),正式進入了原創(chuàng)技術(shù)攻堅的全新階段。過去很長一段時間,我們在通信網(wǎng)絡(luò)的核心技術(shù)領(lǐng)域,更多是跟隨國際主流標準和技術(shù)路線。而這一次,我們拿出了完全原創(chuàng)的技術(shù)體系,不僅實現(xiàn)了產(chǎn)品性能的全球領(lǐng)先,還在主導(dǎo)相關(guān)的國際標準,推動整個產(chǎn)業(yè)的技術(shù)路線發(fā)展。這意味著,在智算互聯(lián)這個核心賽道,我們已經(jīng)實現(xiàn)了從跟跑到領(lǐng)跑的跨越。
從更宏觀的層面來看,這項技術(shù)的突破,也為我國 AI + 專項行動計劃的落地,筑牢了智算基礎(chǔ)設(shè)施的底座。全國一體化算力網(wǎng)絡(luò)的建設(shè),核心就是要實現(xiàn)算力資源的跨區(qū)域靈活調(diào)度和高效利用。而 GSE-DCI 技術(shù),恰恰解決了跨區(qū)域算力互聯(lián)的核心瓶頸,讓分散在全國各地的算力資源,能真正形成一張高效協(xié)同的算力網(wǎng)絡(luò),讓算力像水電一樣即取即用的愿景,有了更堅實的技術(shù)支撐。
當然,一次技術(shù)發(fā)布,只是行業(yè)長跑中的一個關(guān)鍵節(jié)點。接下來,中國移動還會持續(xù)完善 GSE-DCI 技術(shù)體系,推進更多的試點應(yīng)用,同時攜手產(chǎn)業(yè)鏈上下游的伙伴,推動這項技術(shù)的標準化和規(guī)模化部署。對于整個中國智算產(chǎn)業(yè)來說,這不僅是一家企業(yè)的技術(shù)突破,更是整個產(chǎn)業(yè)在全球競爭中,拿下的一個關(guān)鍵制高點。未來只有持續(xù)扎根原創(chuàng)技術(shù)攻堅,我們才能在智算領(lǐng)域的全球競爭中,持續(xù)守住領(lǐng)先優(yōu)勢,為全球智算基礎(chǔ)設(shè)施的發(fā)展,貢獻更多中國力量。
- END -
如有合作,請聯(lián)系
特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺“網(wǎng)易號”用戶上傳并發(fā)布,本平臺僅提供信息存儲服務(wù)。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.