2026年初,中國AI芯片戰場進入群雄并起、優勝劣汰的關鍵階段。
隨著阿里發布真武810E PPU,并披露其已在阿里云部署16000卡國產萬卡集群,一場圍繞“誰真正掌握AI時代底層話語權”的較量,已走向商業落地的生死線。
就在2025年,昇騰因“盤古大模型套殼Qwen”陷入輿論風暴;龍芯在默默推進其全自研GPGPU;以寒武紀、摩爾線程、沐曦股份、壁仞科技、天數智芯為代表的國產GPU/ASIC陣營,則在資本與政策的雙重驅動下加速商業化。
這不再是簡單的芯片性能比拼,而是一場架構、軟件、盈利模式與產業政策的多維博弈。
![]()
公司
芯片類型
核心特點
阿里
PPU
框架原生兼容,無需改代碼,訓推一體
昇騰
ASIC
推理高效,訓練脆弱,CANN生態封閉
寒武紀
ASIC
聚焦推理,訓練脆弱,已實現盈利
摩爾
沐曦
壁仞
天數
GPGPU
圖形+AI,兼容CUDA,尚處虧損期
龍芯
GPGPU
完全自研GPU,無CUDA依賴,性能入門級
阿里真武效法谷歌模式
阿里真武810E的發布,標志著國產AI芯片的一條新路徑:它沒有選擇在硬件架構上死磕英偉達,而是試圖用軟件去“架空”CUDA的壁壘。
不同于以往國產芯片往往要求開發者去適應硬件、“學方言”改代碼的痛苦過程,真武810E走的是一條“軟件遷就人”的路子。它通過編譯器層面的深度兼容,讓大多數基于主流框架(如PyTorch)開發的模型,幾乎不需要改動就能直接運行。
這種“拿來即用”的兼容性,相比昇騰CANN生態那種需要開發者深度介入、手動適配算子的“硬門檻”,在商業落地上顯然更具親和力。
從硬件本身來看,96GB HBM2e顯存和700GB/s的互聯帶寬,保證了它在處理大模型時的吞吐能力。
更關鍵的是,它的核心設計不再是固定的專用電路,而是靈活的通用計算陣列。
這意味著當新的AI算法出現時,它不需要重新設計芯片,往往只需要升級一下編譯器軟件就能支持。
但真武真正的護城河,其實不在芯片本身,而在其背后的“全棧生態”。
放眼全球,能同時把“算力芯片+云基礎設施+大模型”這三塊核心拼圖湊齊的,除了谷歌(TPU + Google Cloud + Gemini),也就只有阿里(真武 + 阿里云 + 千問)。
這一點至關重要。
當其他廠商還在賣“裸芯片”、讓客戶自己去摸索適配時,阿里賣的其實是“已經驗證過的算力服務”。
Qwen作為目前國產第一梯隊的開源模型,已經在真武芯片上跑通了每一個細節。這種“用自家模型,驗證自家芯片”的模式,才是阿里真正的底氣。
它讓真武810E既保留了GPGPU的通用性,又擁有了類似谷歌TPU那樣的垂直整合效率。
![]()
昇騰寒武紀推理有余訓練不足
阿里真武正在進行“通才”路線,那么昇騰910B和寒武紀則更像是一個極端的“特長生”。
昇騰的核心設計邏輯是“為了特定考題而生”。在處理標準化的、固定的AI任務(如推理)時,它的效率高,能追平英偉達。但這種極致的專用性,也帶來了致命的弱點——它太“硬”了,缺乏變通。
本質上說,昇騰和寒武紀這類ASIC,就是以犧牲通用性能,換取特定場景的專用性能。
AI算法的迭代速度是以月為單位的。
當DeepSeek、GLM、Qwen、Kimi等新模型采用了最新的算法架構(如MoE、稀疏注意力)時,昇騰固化的硬件單元往往無法直接支持。
這就好比試卷上的題型變了,但這名考生只會背標準答案。
結果就是,為了運行新模型,開發者必須手動編寫大量底層代碼(算子)來填坑,或者被迫讓芯片切換到低效的通用模式,導致性能出現斷崖式下跌。
此外,在構建萬卡集群進行大規模訓練時,昇騰也暴露出了短板。相比于英偉達成熟的連接技術,昇騰在大規模并聯時的通信穩定性仍有差距,頻繁的故障和崩潰,讓它在訓練超大模型時顯得力不從心。
這就是所謂的“ASIC剛性陷阱”:它在推理應用上能做到極致的性價比,但在需要靈活應變的訓練和渲染場景中,卻因為“偏科”而難以勝任。
2025年的“盤古套殼”風波,本質上就是因為自家AI芯片難以適應新算法的訓練需求,團隊才不得已使用了英偉達GPU和千問——這與其說是道德問題,不如說是技術路線帶來的無奈。
無獨有偶,寒武紀同樣存在“ASIC剛性陷阱”,寒武紀聚焦高性能推理場景,具備能效比高優勢,適合推理密集型客戶。
不過,寒武紀短板也明顯,那就是通用性弱,無法用于訓練或圖形渲染,長期面臨PPU/GPGPU的生態擠壓。
值得一提的是,寒武紀已經具備自我造血能力,而不是完全依然風投燒錢。2025年營收突破60億元,凈利潤突破16億元,成為國產AI芯片中唯一規模化盈利企業。
![]()
國產GPU缺乏人無我有的殺手級應用
摩爾線程、沐曦、壁仞、天數智芯均為GPGPU架構,兼容CUDA,試圖復刻英偉達路徑。
在技術來源上,不乏技術引進的底色,比如摩爾線程、壁仞的GPU IP就源自Imagination公司的授權。
摩爾線程主打全功能GPU,覆蓋AI、圖形、游戲,2025年營收約15億元,虧損約10億元。三年累計虧損額約59億。
沐曦專注數據中心GPU,2025年營收約16億元,虧損約7億元。三年累計虧損額30.57億。
壁仞科技高舉高打,PPT很漂亮,但商業化緩慢。2025年上半年營收5890.3萬,凈虧損約5.5億。三年累計虧損47.5億。
天數智芯2025年上半年營收3.24億,凈虧損約6億。3年累計虧損28.72億。
這幾家公司的共同特點是共同特點是高研發投入、強兼容性(支持CUDA)、但尚未盈利。它們的規劃藍圖也如出一轍,那就是只要產業生態做起來,未來可對標英偉達A100。
不過,面對真武810E的框架原生路線,這些廠商仍需解決一個根本問題——CUDA兼容≠市場盈利。沒有殺手級應用場景和頭部客戶背書,僅靠硬件參數和兼容CUDA難以突圍。
![]()
龍芯GPU另辟蹊徑專注細分市場
龍芯GPU完全自研,不依賴任何國外IP。其FP32算力約1.5 TFLOPS,INT8 AI算力約32 TOPS,性能相當于GTX 1050,雖落性能大幅落后于真武,但在保密辦公、工控、邊緣終端等場景具備不可替代性。
其軟件棧基于OpenCL,并初步適配PyTorch。真正的價值在于絕對安全可控——這是英偉達、摩爾線程等GPU都無法提供的。
未來若能將GPGPU集成進CPU(如龍芯7000系列SoC),有望在端側小模型場景中占據一席之地。
![]()
從資本狂歡到盈利分水嶺
2025年是中國AI芯片的分化之年。
正所謂幾家歡喜幾家愁,有人彈冠相慶,有人黯然神傷。
阿里憑借千問+阿里云+真武,已構建AI全棧閉環:
真武810E已在青海聯通部署16000卡綠色智算集群;
服務小鵬、國家電網、中科院等400+客戶;
Qwen開源模型衍生超20萬個,下載破10億次,反哺芯片適配。
阿里不賣芯片,只賣算力的模式,規避了生態冷啟動難題,直接綁定高價值客戶。不僅在技術上實現全棧閉環,在商業上也實現了正循環。
寒武紀是當下國產AI芯片中唯一規模化盈利企業,穩坐ASIC陣營AI芯片頭把交椅,用實際行動證明垂直場景+高能效比+政策紅利仍是可行路徑。
摩爾線程、沐曦、壁仞、天數智芯在資本市場備受追捧,且有美國英偉達GPGPU禁令倒逼下的國產替代推波助瀾,但若不能在未來幾年內證明商業化能力,恐將陷入“有技術、無市場”的困境。
昇騰則在“盤古套殼”事件后,輿論神話破滅,風評口碑兩極分化,在業內人士中路人緣差,在真實開發者生態中影響力急劇萎縮,高度依賴政府、國企采購,成為依靠政策紅利的“政商神話”。
龍芯不參與云端軍備競賽,而是押注端側小模型+分布式學習,在本地推理等“數據不出域”場景中,打造端側AI的“安全島”。
維度
主導者
核心戰場
關鍵能力
云端大模型
阿里(PPU)
萬卡集群、互聯網
編譯器+互聯+生態+訓練效率
高性能推理
寒武紀(ASIC)
互聯網、國企
能效比、性價比
通用GPU生態
摩爾/沐曦/壁仞/天數
科研、中小企業、圖形渲染
CUDA兼容
政務市場
昇騰(ASIC)
政府、國企
政策綁定、政商神話
安全端側
龍芯(GPGPU)
保密PC、工控、ATM
端側AI“安全島”
真正的國產替代是能用而非能吹
昇騰盤古的神話破滅,源于用“套殼”和指鹿為馬式營銷掩蓋技術缺陷;
寒武紀在商業上的成功,證明了AISC在專用場景的價值;
摩爾線程、沐曦、壁仞、天數智芯豪賭GPUGPU,是對英偉達的模仿和追趕;
龍芯的堅守,是端側AI安全的最后防線;
阿里真武則讓中國開發者第一次擁有了不依賴CUDA,又能高效跑大模型的國產選擇。
未來,中國AI芯片將從“百花齊放”走向“優勝劣汰”。
能活下來的,不是估值最高的,不是PPT最漂亮的,不是政府輸血最多的,而是真正解決客戶問題、創造商業價值的。
能用而非能吹,這才是檢驗AI芯片國產替代的終極標準。
特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.