![]()
![]()
中科曙光 scaleX 萬卡超集群真機(jī)首秀!5EFlops 總算力+單機(jī)柜 640 卡超節(jié)點(diǎn),四大硬核技術(shù)突破國產(chǎn)算力瓶頸,更以開放生態(tài)重構(gòu)智算產(chǎn)業(yè)新格局,這場(chǎng)算力革命等你來探!
編輯:前沿在線 編輯部
2025年12月18日,昆山,2025人工智能創(chuàng)新大會(huì)上,國產(chǎn)萬卡級(jí)AI集群系統(tǒng),在此首次以真機(jī)形式亮相。
這是一個(gè)意義重大的“國之重器”。面向十五五,中國正全面加速算力基礎(chǔ)設(shè)施建設(shè),賦能整個(gè)社會(huì)經(jīng)濟(jì)數(shù)智化轉(zhuǎn)型。然而,國產(chǎn)算力芯片性能差距大、自主軟硬件生態(tài)不成熟等“短板”,正制約了中國智算產(chǎn)業(yè)的發(fā)展。
現(xiàn)在,面對(duì)這些挑戰(zhàn),中科曙光給出了中國創(chuàng)新的響亮回應(yīng)。
12月18日,在昆山舉行的2025人工智能創(chuàng)新大會(huì)(HAIC2025)上,中科曙光發(fā)布并展出了全球領(lǐng)先的大規(guī)模智能計(jì)算系統(tǒng)——scaleX萬卡超集群。
它不僅是一個(gè)領(lǐng)先技術(shù)突破,更象征著中國智算產(chǎn)業(yè)突破瓶頸、構(gòu)建自主生態(tài)之路的新階段。
![]()
四大優(yōu)勢(shì):突破算力瓶頸
當(dāng)前,人工智能規(guī)模化落地的主要瓶頸,在于傳統(tǒng)的單機(jī)和集群架構(gòu)在處理大規(guī)模AI訓(xùn)練和推理任務(wù)時(shí),普遍存在服務(wù)器間帶寬不足、高時(shí)延等問題。
因此,基于高速互聯(lián)技術(shù),將多塊算力芯片(如GPU或NPU)集成進(jìn)一個(gè)邏輯單元,形成“超節(jié)點(diǎn)”規(guī)模化計(jì)算單元,并進(jìn)一步構(gòu)建大規(guī)模算力集群,已成為有效縮短時(shí)延、提升服務(wù)器間帶寬,實(shí)現(xiàn)更高算力效率的行業(yè)大趨勢(shì)。
“scaleX萬卡超集群,正是曙光發(fā)揮大型計(jì)算機(jī)系統(tǒng)研制經(jīng)驗(yàn)優(yōu)勢(shì),面向萬億參數(shù)大模型、科學(xué)智能等復(fù)雜任務(wù)場(chǎng)景打造的大規(guī)模智能算力基礎(chǔ)設(shè)施方案。”中科曙光高級(jí)副總裁 李斌向《中國新聞周刊》表示。
![]()
據(jù)了解,面對(duì)人工智能基礎(chǔ)設(shè)施對(duì)性能、效率、可靠性、可擴(kuò)展性等方面的極致需求,scaleX萬卡超集群以當(dāng)前業(yè)內(nèi)最高的集成度,實(shí)現(xiàn)了超節(jié)點(diǎn)架構(gòu)、高速互聯(lián)網(wǎng)絡(luò)、存儲(chǔ)性能優(yōu)化、系統(tǒng)管理調(diào)度等全方位的創(chuàng)新突破,部分技術(shù)與能力甚至超越英偉達(dá)計(jì)劃于2027年發(fā)布的NVL576。
相比同類產(chǎn)品,scaleX萬卡超集群實(shí)現(xiàn)了四大技術(shù)優(yōu)勢(shì):
第一,全球首創(chuàng)單機(jī)柜級(jí)640卡超節(jié)點(diǎn)。scaleX萬卡超集群由16個(gè)曙光scaleX640超節(jié)點(diǎn)通過scaleFabric高速網(wǎng)絡(luò)互連而成,可實(shí)現(xiàn)10240塊AI加速卡部署,總算力規(guī)模超5EFlops。作為世界首個(gè)單機(jī)柜級(jí)640卡超節(jié)點(diǎn),scaleX640采用超高密度刀片、浸沒相變液冷等技術(shù),將單機(jī)柜算力密度提升20倍,PUE值低至1.04。
第二,自主研發(fā)原生RDMA高速網(wǎng)絡(luò)。曙光scaleFabric網(wǎng)絡(luò),基于國內(nèi)首款400G 類InfiniBand的原生RDMA網(wǎng)卡與交換芯片,可實(shí)現(xiàn)400Gb/s超高帶寬、低于1微秒端側(cè)通信延遲,充分釋放萬卡超集群算力,并可將超集群規(guī)模輕松擴(kuò)展至10 萬卡以上,相比傳統(tǒng)IB網(wǎng)絡(luò)提升2.33倍,同時(shí)網(wǎng)絡(luò)總體成本降低 30%。
第三,存、算、傳緊耦合深度優(yōu)化。通過“超級(jí)隧道”、AI數(shù)據(jù)加速等設(shè)計(jì),實(shí)現(xiàn)從芯片級(jí)、系統(tǒng)級(jí)到應(yīng)用級(jí)的三級(jí)數(shù)據(jù)傳輸協(xié)同優(yōu)化,使存力平臺(tái)高效應(yīng)對(duì)大模型訓(xùn)練時(shí)萬卡并發(fā)讀寫帶寬極致需求挑戰(zhàn),提升高通量AI推理時(shí)的響應(yīng)速度與結(jié)果精準(zhǔn)度,并可將AI加速卡資源利用率提高55%。
第四,超集群數(shù)字孿生與智能調(diào)度。通過物理集群數(shù)字孿生,實(shí)現(xiàn)故障定位、修復(fù)等全流程可視化智能管理;智能化運(yùn)維平臺(tái)可支撐集群長(zhǎng)期可用性達(dá)99.99%;智能調(diào)度引擎可管理萬級(jí)節(jié)點(diǎn)、服務(wù)十萬級(jí)用戶,支持每秒萬級(jí)作業(yè)調(diào)度。
![]()
從“單點(diǎn)突圍”到“生態(tài)共進(jìn)”:中科曙光引領(lǐng)產(chǎn)業(yè)升級(jí)
scaleX萬卡超集群并非橫空出世,而是中科曙光沿著清晰的“開放創(chuàng)新”路徑,不斷向前突破邁進(jìn)的成果。
過去十年來,中科曙光累計(jì)已建設(shè)超過20個(gè)大規(guī)模算力集群,累計(jì)部署超過50萬張異構(gòu)加速卡。自2025年以來,中科曙光更深入軟件、硬件和生態(tài)底層,聯(lián)手合作伙伴,牽頭打造出了一個(gè)更加自主、更具韌性、高質(zhì)量、可持續(xù)成長(zhǎng)的開放多元架構(gòu)。
2025年9月,中科曙光協(xié)同AI芯片、AI整機(jī)、大模型等20多家產(chǎn)業(yè)鏈上下游企業(yè),共同發(fā)布國內(nèi)首個(gè)AI計(jì)算開放架構(gòu),將過去“算、存、網(wǎng)、電、冷、管、軟”各個(gè)環(huán)節(jié)的單點(diǎn)突破,升級(jí)為整個(gè)產(chǎn)業(yè)鏈的集群協(xié)同創(chuàng)新。
![]()
2025年8月,中科曙光發(fā)布了國內(nèi)首個(gè)行業(yè)標(biāo)準(zhǔn)化超智融合算力平臺(tái):Nebula800。該平臺(tái)依托開放架構(gòu),專攻智能制造、生命科學(xué)、石油勘探等領(lǐng)域AI4S復(fù)雜計(jì)算任務(wù)場(chǎng)景,以一套系統(tǒng)打通超算、智算技術(shù)與生態(tài)壁壘,一平臺(tái)支持多精度、混精度計(jì)算,破解非融合系統(tǒng)計(jì)算精度不全、應(yīng)用普適性差、異構(gòu)資源管理調(diào)度困難等問題。
2025年10月,中科曙光發(fā)布國內(nèi)首個(gè)科學(xué)大模型一站式開發(fā)平臺(tái)OneScience,基于AI計(jì)算開放架構(gòu)理念,讓人工智能更高效地服務(wù)于加速科學(xué)發(fā)現(xiàn)進(jìn)程,驅(qū)動(dòng)新型科研范式。基于該平臺(tái),科研用戶開發(fā)和部署大模型的效率百倍提升,最快只需要3小時(shí)就可以開發(fā)一個(gè)科學(xué)大模型。
![]()
2025年11月,中科曙光發(fā)布全球首個(gè)單機(jī)柜級(jí)640卡超節(jié)點(diǎn)scaleX640,相比業(yè)界同類產(chǎn)品,scaleX640單機(jī)柜算力密度提升20倍,可實(shí)現(xiàn)MoE萬億參數(shù)大模型訓(xùn)練推理場(chǎng)景高達(dá)30%~40%的性能提升,并保障10萬卡級(jí)超大規(guī)模集群擴(kuò)展部署,綜合算力性能和各項(xiàng)指標(biāo)均已全面超越此前國內(nèi)最領(lǐng)先的同類型384超節(jié)點(diǎn)。
![]()
而現(xiàn)在,scaleX萬卡超集群的落地,則是中科曙光將開放理念轉(zhuǎn)化為可落地普惠算力的全新里程碑。作為“AI計(jì)算開放架構(gòu)”最新重磅成果,scaleX萬卡超集群可支持多品牌加速卡以及主流計(jì)算生態(tài),并實(shí)現(xiàn)400+主流大模型、世界模型等適配優(yōu)化。在實(shí)際應(yīng)用中,該超集群可覆蓋大模型訓(xùn)練、金融風(fēng)控、地質(zhì)能源勘探及科學(xué)智能等多元場(chǎng)景,助力“人工智能+”戰(zhàn)略在千行百業(yè)落地生根。
這一系列的動(dòng)作背后,是一場(chǎng)具有深遠(yuǎn)戰(zhàn)略意義的產(chǎn)業(yè)變革。中科曙光正協(xié)同產(chǎn)業(yè)界多方伙伴,從以前的“各自為戰(zhàn)”“單點(diǎn)突圍”,轉(zhuǎn)變?yōu)楣蚕砣舾申P(guān)鍵共性技術(shù)能力,依托系統(tǒng)工程思維推進(jìn)智算集群創(chuàng)新的產(chǎn)業(yè)“生態(tài)共進(jìn)”。將內(nèi)部多樣化的技術(shù)路線整合為對(duì)外統(tǒng)一的強(qiáng)大算力服務(wù)。
這不僅是解鎖“人工智能+”戰(zhàn)略的算力密碼,更將為全球數(shù)智化未來,提供一個(gè)多元、開放的中國方案。
前沿動(dòng)態(tài)
前沿大會(huì)
前沿人物
點(diǎn)「在看」,給前前加雞腿
特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺(tái)“網(wǎng)易號(hào)”用戶上傳并發(fā)布,本平臺(tái)僅提供信息存儲(chǔ)服務(wù)。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.