![]()
過(guò)去幾年,國(guó)產(chǎn)GPU的發(fā)展常常被簡(jiǎn)化為一個(gè)問(wèn)題:“性能趕上英偉達(dá)了嗎?”但真正決定算力自主的,從來(lái)不是單顆芯片跑分多高,而是能不能從底層芯片、驅(qū)動(dòng)、軟件到整套集群系統(tǒng)都自己說(shuō)了算。
最近,摩爾線程推出“花港”GPU架構(gòu)和“夸娥”智算集群,正是在回答這個(gè)更關(guān)鍵的問(wèn)題——國(guó)產(chǎn)GPU能否構(gòu)建自己的全棧能力?
“花港”不是又一塊堆參數(shù)的芯片,而是一次面向AI時(shí)代的重新設(shè)計(jì)。
傳統(tǒng)GPU最初為圖形渲染而生,后來(lái)被AI“借用”。而“花港”從一開(kāi)始就把大模型訓(xùn)練和推理的需求納入架構(gòu)考量。比如,它優(yōu)化了計(jì)算單元與內(nèi)存之間的數(shù)據(jù)通路,減少大模型運(yùn)行時(shí)的數(shù)據(jù)搬運(yùn)瓶頸;同時(shí)通過(guò)自研指令集和編譯器,讓上層軟件能更高效地調(diào)用硬件資源。這種軟硬一體的思路,讓芯片不再是“通用加速器”,而是為AI量身打造的引擎。
更重要的是,“花港”強(qiáng)調(diào)通用性與兼容性的平衡。它不僅支持主流AI框架如PyTorch和TensorFlow,還向下兼容圖形渲染任務(wù),這意味著同一塊芯片既能用于訓(xùn)練大模型,也能支撐游戲、設(shè)計(jì)等傳統(tǒng)GPU應(yīng)用場(chǎng)景。這種“一芯多用”的策略,有助于降低生態(tài)建設(shè)初期的門(mén)檻,也為未來(lái)商業(yè)化鋪平道路。
但光有好芯片還不夠,就像再好的發(fā)動(dòng)機(jī),沒(méi)有整車(chē)也跑不起來(lái)。摩爾線程的“夸娥”集群,就是這輛“整車(chē)”。它不只是把幾十甚至上千塊GPU簡(jiǎn)單連在一起,而是整合了高速互聯(lián)、任務(wù)調(diào)度、故障容錯(cuò)和能效管理的一整套系統(tǒng)。據(jù)公開(kāi)信息,“夸娥”已支持千卡規(guī)模部署,并在真實(shí)客戶(hù)環(huán)境中穩(wěn)定運(yùn)行。這意味著國(guó)產(chǎn)GPU首次具備了支撐大規(guī)模AI訓(xùn)練的能力——過(guò)去,這類(lèi)任務(wù)幾乎完全依賴(lài)英偉達(dá)的DGX系統(tǒng)和NVLink互聯(lián)技術(shù)。
“夸娥”的另一個(gè)亮點(diǎn)在于其開(kāi)放性和可擴(kuò)展性。它采用模塊化設(shè)計(jì),可根據(jù)不同行業(yè)需求靈活配置算力規(guī)模,既適用于科研機(jī)構(gòu)的小型實(shí)驗(yàn)集群,也能滿(mǎn)足互聯(lián)網(wǎng)公司動(dòng)輒千卡的大模型訓(xùn)練。同時(shí),其調(diào)度系統(tǒng)支持異構(gòu)計(jì)算資源整合,未來(lái)還能兼容其他國(guó)產(chǎn)芯片,避免形成新的“孤島”。
更重要的是,“花港+夸娥”的組合,代表了一條真正可控的技術(shù)路徑。
從芯片設(shè)計(jì)、驅(qū)動(dòng)開(kāi)發(fā)、編程框架適配,到集群調(diào)度和運(yùn)維工具,摩爾線程正在搭建一條不依賴(lài)外部斷供風(fēng)險(xiǎn)的完整鏈條。這不僅關(guān)乎國(guó)家安全,也直接影響中國(guó)AI產(chǎn)業(yè)的成本和迭代速度。當(dāng)一家公司訓(xùn)練千億參數(shù)模型不再需要排隊(duì)等海外GPU、也不必受制于閉源工具鏈,創(chuàng)新效率自然大幅提升。
當(dāng)然,挑戰(zhàn)依然不小。英偉達(dá)的優(yōu)勢(shì)不僅在于硬件,更在于CUDA生態(tài)十年積累的開(kāi)發(fā)者習(xí)慣、豐富的庫(kù)函數(shù)和廣泛的兼容性。摩爾線程要吸引開(kāi)發(fā)者遷移,必須持續(xù)打磨工具鏈,降低使用門(mén)檻,并聯(lián)合高校、云廠商和行業(yè)用戶(hù)共同豐富應(yīng)用場(chǎng)景。生態(tài)建設(shè)無(wú)法速成,但方向已經(jīng)明確:未來(lái)的競(jìng)爭(zhēng),是系統(tǒng)級(jí)能力的競(jìng)爭(zhēng),不是單一芯片的軍備競(jìng)賽。
值得肯定的是,摩爾線程并未閉門(mén)造車(chē)。它正積極與國(guó)內(nèi)操作系統(tǒng)、云計(jì)算平臺(tái)和AI企業(yè)合作,推動(dòng)軟硬件協(xié)同優(yōu)化。這種“共建生態(tài)”的姿態(tài),比單純追求技術(shù)指標(biāo)更具長(zhǎng)遠(yuǎn)價(jià)值。
在杰哥看來(lái),從“能造芯片”到“能建系統(tǒng)”,摩爾線程邁出的這一步,或許不會(huì)立刻撼動(dòng)全球格局,但它為中國(guó)算力基礎(chǔ)設(shè)施打下了關(guān)鍵的地基。真正的自主可控,不是某一天突然實(shí)現(xiàn)的,而是在一次次從底層到應(yīng)用的閉環(huán)驗(yàn)證中逐漸夯實(shí)的。
“花港”與“夸娥”的意義,正在于此——它們不只是產(chǎn)品,更是一種信號(hào):國(guó)產(chǎn)GPU,開(kāi)始認(rèn)真做“系統(tǒng)”了。而這,才是算力自主真正的起點(diǎn)。
特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺(tái)“網(wǎng)易號(hào)”用戶(hù)上傳并發(fā)布,本平臺(tái)僅提供信息存儲(chǔ)服務(wù)。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.