網易首頁 > 網易號 > 正文申請入駐

從盤古套殼到阿里真武 AI芯片大浪淘沙

2026-02-26 06:09:57　來源: 鐵流1988

浙江舉報

分享至

2026年初，中國AI芯片戰場進入群雄并起、優勝劣汰的關鍵階段。

隨著阿里發布真武810E PPU，并披露其已在阿里云部署16000卡國產萬卡集群，一場圍繞“誰真正掌握AI時代底層話語權”的較量，已走向商業落地的生死線。

就在2025年，昇騰因“盤古大模型套殼Qwen”陷入輿論風暴；龍芯在默默推進其全自研GPGPU；以寒武紀、摩爾線程、沐曦股份、壁仞科技、天數智芯為代表的國產GPU/ASIC陣營，則在資本與政策的雙重驅動下加速商業化。

這不再是簡單的芯片性能比拼，而是一場架構、軟件、盈利模式與產業政策的多維博弈。

公司

芯片類型

核心特點

阿里

PPU

框架原生兼容，無需改代碼，訓推一體

昇騰

ASIC

推理高效，訓練脆弱，CANN生態封閉

寒武紀

ASIC

聚焦推理，訓練脆弱，已實現盈利

摩爾

沐曦

壁仞

天數

GPGPU

圖形+AI，兼容CUDA，尚處虧損期

龍芯

GPGPU

完全自研GPU，無CUDA依賴，性能入門級

阿里真武效法谷歌模式

阿里真武810E的發布，標志著國產AI芯片的一條新路徑：它沒有選擇在硬件架構上死磕英偉達，而是試圖用軟件去“架空”CUDA的壁壘。

不同于以往國產芯片往往要求開發者去適應硬件、“學方言”改代碼的痛苦過程，真武810E走的是一條“軟件遷就人”的路子。它通過編譯器層面的深度兼容，讓大多數基于主流框架（如PyTorch）開發的模型，幾乎不需要改動就能直接運行。

這種“拿來即用”的兼容性，相比昇騰CANN生態那種需要開發者深度介入、手動適配算子的“硬門檻”，在商業落地上顯然更具親和力。

從硬件本身來看，96GB HBM2e顯存和700GB/s的互聯帶寬，保證了它在處理大模型時的吞吐能力。

更關鍵的是，它的核心設計不再是固定的專用電路，而是靈活的通用計算陣列。

這意味著當新的AI算法出現時，它不需要重新設計芯片，往往只需要升級一下編譯器軟件就能支持。

但真武真正的護城河，其實不在芯片本身，而在其背后的“全棧生態”。

放眼全球，能同時把“算力芯片+云基礎設施+大模型”這三塊核心拼圖湊齊的，除了谷歌（TPU + Google Cloud + Gemini），也就只有阿里（真武 + 阿里云 + 千問）。

這一點至關重要。

當其他廠商還在賣“裸芯片”、讓客戶自己去摸索適配時，阿里賣的其實是“已經驗證過的算力服務”。

Qwen作為目前國產第一梯隊的開源模型，已經在真武芯片上跑通了每一個細節。這種“用自家模型，驗證自家芯片”的模式，才是阿里真正的底氣。

它讓真武810E既保留了GPGPU的通用性，又擁有了類似谷歌TPU那樣的垂直整合效率。

昇騰寒武紀推理有余訓練不足

阿里真武正在進行“通才”路線，那么昇騰910B和寒武紀則更像是一個極端的“特長生”。

昇騰的核心設計邏輯是“為了特定考題而生”。在處理標準化的、固定的AI任務（如推理）時，它的效率高，能追平英偉達。但這種極致的專用性，也帶來了致命的弱點——它太“硬”了，缺乏變通。

本質上說，昇騰和寒武紀這類ASIC，就是以犧牲通用性能，換取特定場景的專用性能。

AI算法的迭代速度是以月為單位的。

當DeepSeek、GLM、Qwen、Kimi等新模型采用了最新的算法架構（如MoE、稀疏注意力）時，昇騰固化的硬件單元往往無法直接支持。

這就好比試卷上的題型變了，但這名考生只會背標準答案。

結果就是，為了運行新模型，開發者必須手動編寫大量底層代碼（算子）來填坑，或者被迫讓芯片切換到低效的通用模式，導致性能出現斷崖式下跌。

此外，在構建萬卡集群進行大規模訓練時，昇騰也暴露出了短板。相比于英偉達成熟的連接技術，昇騰在大規模并聯時的通信穩定性仍有差距，頻繁的故障和崩潰，讓它在訓練超大模型時顯得力不從心。

這就是所謂的“ASIC剛性陷阱”：它在推理應用上能做到極致的性價比，但在需要靈活應變的訓練和渲染場景中，卻因為“偏科”而難以勝任。

2025年的“盤古套殼”風波，本質上就是因為自家AI芯片難以適應新算法的訓練需求，團隊才不得已使用了英偉達GPU和千問——這與其說是道德問題，不如說是技術路線帶來的無奈。

無獨有偶，寒武紀同樣存在“ASIC剛性陷阱”，寒武紀聚焦高性能推理場景，具備能效比高優勢，適合推理密集型客戶。

不過，寒武紀短板也明顯，那就是通用性弱，無法用于訓練或圖形渲染，長期面臨PPU/GPGPU的生態擠壓。

值得一提的是，寒武紀已經具備自我造血能力，而不是完全依然風投燒錢。2025年營收突破60億元，凈利潤突破16億元，成為國產AI芯片中唯一規模化盈利企業。

國產GPU缺乏人無我有的殺手級應用

摩爾線程、沐曦、壁仞、天數智芯均為GPGPU架構，兼容CUDA，試圖復刻英偉達路徑。

在技術來源上，不乏技術引進的底色，比如摩爾線程、壁仞的GPU IP就源自Imagination公司的授權。

摩爾線程主打全功能GPU，覆蓋AI、圖形、游戲，2025年營收約15億元，虧損約10億元。三年累計虧損額約59億。

沐曦專注數據中心GPU，2025年營收約16億元,虧損約7億元。三年累計虧損額30.57億。

壁仞科技高舉高打，PPT很漂亮，但商業化緩慢。2025年上半年營收5890.3萬，凈虧損約5.5億。三年累計虧損47.5億。

天數智芯2025年上半年營收3.24億，凈虧損約6億。3年累計虧損28.72億。

這幾家公司的共同特點是共同特點是高研發投入、強兼容性（支持CUDA）、但尚未盈利。它們的規劃藍圖也如出一轍，那就是只要產業生態做起來，未來可對標英偉達A100。

不過，面對真武810E的框架原生路線，這些廠商仍需解決一個根本問題——CUDA兼容≠市場盈利。沒有殺手級應用場景和頭部客戶背書，僅靠硬件參數和兼容CUDA難以突圍。

龍芯GPU另辟蹊徑專注細分市場

龍芯GPU完全自研，不依賴任何國外IP。其FP32算力約1.5 TFLOPS，INT8 AI算力約32 TOPS，性能相當于GTX 1050，雖落性能大幅落后于真武，但在保密辦公、工控、邊緣終端等場景具備不可替代性。

其軟件棧基于OpenCL，并初步適配PyTorch。真正的價值在于絕對安全可控——這是英偉達、摩爾線程等GPU都無法提供的。

未來若能將GPGPU集成進CPU（如龍芯7000系列SoC），有望在端側小模型場景中占據一席之地。

從資本狂歡到盈利分水嶺

2025年是中國AI芯片的分化之年。

正所謂幾家歡喜幾家愁，有人彈冠相慶，有人黯然神傷。

阿里憑借千問+阿里云+真武，已構建AI全棧閉環：

真武810E已在青海聯通部署16000卡綠色智算集群；

服務小鵬、國家電網、中科院等400+客戶；

Qwen開源模型衍生超20萬個，下載破10億次，反哺芯片適配。

阿里不賣芯片，只賣算力的模式，規避了生態冷啟動難題，直接綁定高價值客戶。不僅在技術上實現全棧閉環，在商業上也實現了正循環。

寒武紀是當下國產AI芯片中唯一規模化盈利企業，穩坐ASIC陣營AI芯片頭把交椅，用實際行動證明垂直場景+高能效比+政策紅利仍是可行路徑。

摩爾線程、沐曦、壁仞、天數智芯在資本市場備受追捧，且有美國英偉達GPGPU禁令倒逼下的國產替代推波助瀾，但若不能在未來幾年內證明商業化能力，恐將陷入“有技術、無市場”的困境。

昇騰則在“盤古套殼”事件后，輿論神話破滅，風評口碑兩極分化，在業內人士中路人緣差，在真實開發者生態中影響力急劇萎縮，高度依賴政府、國企采購，成為依靠政策紅利的“政商神話”。

龍芯不參與云端軍備競賽，而是押注端側小模型+分布式學習，在本地推理等“數據不出域”場景中，打造端側AI的“安全島”。

維度

主導者

核心戰場

關鍵能力

云端大模型

阿里（PPU）

萬卡集群、互聯網

編譯器+互聯+生態+訓練效率

高性能推理

寒武紀（ASIC）

互聯網、國企

能效比、性價比

通用GPU生態

摩爾/沐曦/壁仞/天數

科研、中小企業、圖形渲染

CUDA兼容

政務市場

昇騰（ASIC）

政府、國企

政策綁定、政商神話

安全端側

龍芯（GPGPU）

保密PC、工控、ATM

端側AI“安全島”

真正的國產替代是能用而非能吹

昇騰盤古的神話破滅，源于用“套殼”和指鹿為馬式營銷掩蓋技術缺陷；
寒武紀在商業上的成功，證明了AISC在專用場景的價值；
摩爾線程、沐曦、壁仞、天數智芯豪賭GPUGPU，是對英偉達的模仿和追趕；
龍芯的堅守，是端側AI安全的最后防線；
阿里真武則讓中國開發者第一次擁有了不依賴CUDA，又能高效跑大模型的國產選擇。

未來，中國AI芯片將從“百花齊放”走向“優勝劣汰”。

能活下來的，不是估值最高的，不是PPT最漂亮的，不是政府輸血最多的，而是真正解決客戶問題、創造商業價值的。

能用而非能吹，這才是檢驗AI芯片國產替代的終極標準。

特別聲明：以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布，本平臺僅提供信息存儲服務。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.