數(shù)字經(jīng)濟(jì)時(shí)代,算力基礎(chǔ)設(shè)施乃經(jīng)濟(jì)發(fā)展、產(chǎn)業(yè)升級(jí)和企業(yè)轉(zhuǎn)型的根基所在。
在中國(guó),打造“新質(zhì)生產(chǎn)力”、推動(dòng)經(jīng)濟(jì)高質(zhì)量發(fā)展乃全社會(huì)共同目標(biāo),算力產(chǎn)業(yè)加速發(fā)展成為必然。一方面,國(guó)產(chǎn)AI芯片迅速成長(zhǎng),呈現(xiàn)出百花齊放的狀態(tài),并在部分場(chǎng)景中經(jīng)受過(guò)考驗(yàn);另一方面,“百模大戰(zhàn)”的盛況推動(dòng)了中國(guó)大模型技術(shù)、產(chǎn)品突飛猛進(jìn),“人工智能+”勢(shì)在必行,AI算力需求也隨之水漲船高。
因此,如何讓算力、大模型和AI應(yīng)用之間更好地適配,打通“人工智能+”任督二脈,真正推動(dòng)人工智能在垂直行業(yè)落地和算力產(chǎn)業(yè)高質(zhì)量發(fā)展,就成為當(dāng)前算力產(chǎn)業(yè)必須攻克的難題。
值得關(guān)注的是,在近期舉辦的2024 中國(guó)算力大會(huì)上,一系列算力領(lǐng)域成果的頒布,讓產(chǎn)業(yè)界看到巨大希望。
這其中,超聚變AI Space大模型加速引擎就是突出代表。AI Space大模型加速引擎為企業(yè)AI業(yè)務(wù)落地提供端到端的產(chǎn)品和服務(wù),旨在解決當(dāng)前大模型遷移、訓(xùn)練、以及推理應(yīng)用落地過(guò)程中的諸多難點(diǎn),成功入圍本屆算力大會(huì)“創(chuàng)新先鋒案例”,獲得產(chǎn)業(yè)界的高度認(rèn)可。
![]()
從可用走向好用:AI大模型還缺些什么
對(duì)于中國(guó)各大行業(yè)的企業(yè)而言,“大模型”已然成為打造“新質(zhì)生產(chǎn)力”和推動(dòng)“人工智能+”落地的重要抓手。可以預(yù)見(jiàn),來(lái)幾年生成式AI等大模型技術(shù)在政務(wù)、金融、制造、能源等行業(yè)的滲透率會(huì)明顯提升。
顯然,在外部環(huán)境日趨復(fù)雜、市場(chǎng)充滿各種不確定性的趨勢(shì)下,自主大模型+自主算力是我國(guó)算力產(chǎn)業(yè)重要組成部分,也是未來(lái)發(fā)展中一支最為確定的力量。
不過(guò),大模型是一項(xiàng)極為復(fù)雜的工程化項(xiàng)目,涉及到基礎(chǔ)設(shè)施、大模型、應(yīng)用等諸多方面,從“可用”到“好用”更是需要不斷努力和持續(xù)優(yōu)化。當(dāng)前在我國(guó),大模型已正式開(kāi)啟進(jìn)入到垂直行業(yè),在大模型的落地中普遍遇到如下挑戰(zhàn):
![]()
首先,我國(guó)自主大模型和AI芯片等領(lǐng)域均處于快速發(fā)展的階段,在產(chǎn)品力方面取得長(zhǎng)足進(jìn)步,帶來(lái)繁榮的產(chǎn)業(yè)生態(tài)之余,也讓產(chǎn)品兼容性差、缺乏統(tǒng)一標(biāo)準(zhǔn)的現(xiàn)象愈發(fā)突出,給各行各業(yè)的使用帶來(lái)極大挑戰(zhàn),亟待產(chǎn)業(yè)界正視。
其次,垂直行業(yè)有場(chǎng)景、有數(shù)據(jù),降本、提質(zhì)和增效的需求又強(qiáng)烈,對(duì)于大模型青睞有加。但大模型的落地與應(yīng)用極為復(fù)雜,遷移、部署過(guò)程相當(dāng)復(fù)雜,需要專(zhuān)業(yè)的技術(shù)人員進(jìn)行繁瑣的配置和不斷的調(diào)試。
第三,大模型徹底改變了基礎(chǔ)設(shè)施的規(guī)模和復(fù)雜性,在訓(xùn)練和推理過(guò)程中出現(xiàn)故障更是“家常便飯”,需要快速有效的故障感知和定位機(jī)制來(lái)保障 AI 模型的穩(wěn)定運(yùn)行。隨著大模型規(guī)模越來(lái)越大,大模型的高效運(yùn)維和穩(wěn)定運(yùn)行將是一項(xiàng)長(zhǎng)期挑戰(zhàn)。
顯然,讓各種大模型+自主算力更好地適配結(jié)合和發(fā)揮效應(yīng),將是“人工智能+”落地的關(guān)鍵。為此,超聚變正式推出AI Space大模型加速引擎,通過(guò)一站式的大模型遷移、訓(xùn)練和推理應(yīng)用開(kāi)發(fā)解決方案,成功打通“人工智能+”任督二脈,讓人工智能應(yīng)用化繁為簡(jiǎn)。
AI Space:打通“人工智能+”任督二脈
大模型從一項(xiàng)技術(shù)到具體應(yīng)用,通常涉及到環(huán)境部署、模型訓(xùn)練和模型應(yīng)用三個(gè)核心階段,每個(gè)階段都有著不小的技術(shù)鴻溝,并且每個(gè)階段都不是孤立存在,這使得很多行業(yè)用戶面對(duì)大模型往往是“想用卻怕用不好“的心態(tài)。
如今,AI Space的出現(xiàn),有望徹底打破大模型應(yīng)用的尷尬局面。
具體來(lái)看,對(duì)于大模型落地而言,好的“開(kāi)局”等于成功的一半。在當(dāng)前的中國(guó)用戶中,大模型徹底改變了基礎(chǔ)設(shè)施的規(guī)模與復(fù)雜性,千卡、萬(wàn)卡集群在不斷涌現(xiàn),多元算力環(huán)境逐漸成為標(biāo)配。因此,如何在大規(guī)模、復(fù)雜的基礎(chǔ)設(shè)施環(huán)境中,完成包括操作系統(tǒng)、硬件等的適配就成為“開(kāi)局”的關(guān)鍵。
對(duì)此,超聚變以完善的工具+專(zhuān)業(yè)的服務(wù)+豐富的經(jīng)驗(yàn)來(lái)幫助眾多企業(yè)點(diǎn)亮“開(kāi)局”。借助自身深厚的操作系統(tǒng)和硬件調(diào)優(yōu)全棧能力,以及自研的開(kāi)局工具,超聚變AI Space能夠幫助客戶快速完成環(huán)境部署和調(diào)試。
![]()
進(jìn)入到訓(xùn)練階段,隨著多元異構(gòu)算力成為標(biāo)配,以及集群規(guī)模越來(lái)越大,加上豐富的應(yīng)用場(chǎng)景需要不同的算法框架和算子庫(kù)來(lái)支撐,算力的高效匹配正變得愈發(fā)重要。對(duì)此,超聚變AI Space 通過(guò)開(kāi)發(fā)、重構(gòu)算子,幫助客戶解決硬件架構(gòu)差異導(dǎo)致的訓(xùn)練問(wèn)題,真正讓模型訓(xùn)練“跑起來(lái)”。此外,超聚變的模型調(diào)優(yōu)服務(wù),解決精度和性能問(wèn)題,提升模型訓(xùn)練效率。以LSTM模型為例,LSTM模型算子經(jīng)過(guò)調(diào)優(yōu)后,F(xiàn)P16性能提升了 24.28%, FP32性能提升了 28%以上。
在模型應(yīng)用階段,AI集群規(guī)模越大,故障中斷和集群重啟的情況越多,容易導(dǎo)致集群可用性差和大模型應(yīng)用打折扣。例如,Meta最新報(bào)告就指出其Llama 3大模型在萬(wàn)卡集群環(huán)境中,45天時(shí)間出現(xiàn)數(shù)百次故障報(bào)錯(cuò),對(duì)于基礎(chǔ)設(shè)施挑戰(zhàn)可見(jiàn)一斑。因此,大模型的故障感知和快速定位,是確保AI集群和大模型用好的關(guān)鍵所在。
超聚變的解決思路,是通過(guò)AI Space來(lái)實(shí)現(xiàn)大模型故障感知定位套件實(shí)現(xiàn)故障自動(dòng)感知、自動(dòng)分析,加上海量客戶調(diào)優(yōu)和故障解決的經(jīng)驗(yàn),確保AI 模型在訓(xùn)練和推理過(guò)程中的穩(wěn)定運(yùn)行。此外,超聚變還通過(guò)AI 開(kāi)發(fā)及應(yīng)用平臺(tái),對(duì) AI 計(jì)算資源實(shí)施統(tǒng)一分配調(diào)度,實(shí)現(xiàn)了 AI 模型從開(kāi)發(fā)到推理部署的流程化。
可以看出,超聚變AI Space在算力基礎(chǔ)設(shè)施和大模型應(yīng)用之間構(gòu)建起一道“橋梁”,既幫助用戶適配和管理起復(fù)雜的基礎(chǔ)設(shè)施環(huán)境,實(shí)現(xiàn)基礎(chǔ)設(shè)施層面的化繁為簡(jiǎn)和“物盡其用”,又通過(guò)算子庫(kù)等一系列專(zhuān)業(yè)的工具、服務(wù),讓模型層的各類(lèi)大模型及應(yīng)用與算力基礎(chǔ)設(shè)施得到最優(yōu)的適配,從而真正打通“人工智能+”落地的任督二脈,助力各種企業(yè)加速應(yīng)用人工智能。
據(jù)悉,超聚變AI Space 目前成功支持100+大模型相關(guān)項(xiàng)目,解決了 500+大模型的生態(tài)適配問(wèn)題,用戶涵蓋金融、互聯(lián)網(wǎng)、運(yùn)營(yíng)商等多個(gè)行業(yè)。
多管齊下,超聚變準(zhǔn)備好了
大模型等人工智能技術(shù)改變世界的“進(jìn)度條”才剛剛開(kāi)始。
接下來(lái),隨著中國(guó)經(jīng)濟(jì)邁向高質(zhì)量發(fā)展,各行各業(yè)將以人工智能為抓手發(fā)展“新知生產(chǎn)力”,全面推動(dòng)人工智能與應(yīng)用場(chǎng)景的融合,不僅會(huì)帶來(lái)持續(xù)且強(qiáng)勁的算力需求,也將推動(dòng)算力產(chǎn)業(yè)加速變革。
如今,一個(gè)AI算力成主導(dǎo)、通用算力與AI算力相互配合的智算時(shí)代已經(jīng)到來(lái)。作為算力產(chǎn)業(yè)的排頭兵,超聚變正在從產(chǎn)品、生態(tài)等多個(gè)維度發(fā)力,全面助力中國(guó)算力產(chǎn)業(yè)變革。
從產(chǎn)品層面看,超聚變憑借扎實(shí)的研發(fā)體系和實(shí)力,正走向產(chǎn)品創(chuàng)新的厚積薄發(fā),涵蓋液冷服務(wù)器、大模型加速引擎、訓(xùn)推一體機(jī)、操作系統(tǒng)、算力管理軟件等。例如,在本次算力大會(huì)上,超聚變的FusionPoD for AI新一代全液冷整機(jī)柜GPU服務(wù)器獲評(píng)“算力中國(guó)·年度重大成果”。
如果說(shuō),大模型AI技術(shù)是算力產(chǎn)業(yè)進(jìn)化的根本因素,那么生態(tài)的繁榮則是算力產(chǎn)業(yè)持續(xù)進(jìn)化和做大做強(qiáng)的關(guān)鍵。力產(chǎn)業(yè)發(fā)展到今天,生態(tài)的重要性愈發(fā)突出。從本次算力大會(huì)可以看出,超聚變對(duì)于算力生態(tài)的重視。
![]()
例如,超聚變攜手用戶、芯片廠商、設(shè)備商、以及產(chǎn)業(yè)組織和高校共同成立了液冷AI開(kāi)放聯(lián)盟。眾所周知,液冷市場(chǎng)如今異常火爆,液冷技術(shù)鏈長(zhǎng)且復(fù)雜,涉及到液冷數(shù)據(jù)中心系統(tǒng)架構(gòu)層、液冷部件及接口層、液冷機(jī)柜等,需要超聚變這樣的產(chǎn)業(yè)龍頭來(lái)牽引,實(shí)現(xiàn)產(chǎn)業(yè)整合、標(biāo)準(zhǔn)統(tǒng)一和生態(tài)繁榮,讓液冷技術(shù)更好地支撐起人工智能應(yīng)用。
又如,安全問(wèn)題在數(shù)字經(jīng)濟(jì)時(shí)代愈發(fā)突出。為此,超聚變攜手黃河科技、云智信安、河南綠盟等企業(yè),共同成立中原網(wǎng)絡(luò)安全生態(tài)聯(lián)盟,在產(chǎn)品、方案、市場(chǎng)等多個(gè)維度展開(kāi)深度合作,共同打造安全可信的中原數(shù)智化生態(tài),為千行百業(yè)的數(shù)智化轉(zhuǎn)型保駕護(hù)航。
綜合觀察,在數(shù)字經(jīng)濟(jì)的帶動(dòng)下,算力產(chǎn)業(yè)走向高質(zhì)量發(fā)展已是大勢(shì)所趨。超聚變作為算力產(chǎn)業(yè)的中堅(jiān)分子,以產(chǎn)品創(chuàng)新和生態(tài)建設(shè)為主線,充分釋放算力價(jià)值,全力驅(qū)動(dòng)大模型等人工智能技術(shù)在各行各業(yè)中的落地與應(yīng)用,為數(shù)字中國(guó)的建設(shè)注入持續(xù)的源動(dòng)力。
大數(shù)據(jù)在線是聚焦人工智能、大數(shù)據(jù)、云計(jì)算等前沿科技領(lǐng)域深度觀察的深度媒體。目前,大數(shù)據(jù)在線在微信公眾號(hào)、今日頭條號(hào)、新浪財(cái)經(jīng)、36氪、雪球號(hào)、觀察號(hào)等主流自媒體平臺(tái)均有入駐,積累粉絲超過(guò)20W;并榮獲今日頭條十大科技新銳媒體、商業(yè)新知十大人工智能媒體等多項(xiàng)殊榮。商務(wù)聯(lián)系請(qǐng)?zhí)砑游⑿牛篛wen_Inter,添加請(qǐng)備注具體信息。
特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺(tái)“網(wǎng)易號(hào)”用戶上傳并發(fā)布,本平臺(tái)僅提供信息存儲(chǔ)服務(wù)。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.