在華為中國合作伙伴大會2026上,華為正式發布新一代AI算力平臺,核心包括昇騰950PR處理器以及Atlas 350訓練/推理加速卡。
這一代產品的重點不在簡單提升算力規模,而是在計算效率和系統協同能力上的整體升級。
從參數來看,昇騰950PR首次引入FP4低精度計算能力。以700億參數大模型為例,顯存需求從約140GB壓縮至35GB,直接降低75%的資源占用,同時多模態生成效率提升約60%。
![]()
簡單來講,在同等硬件條件下,可以運行更大模型,或者在相同模型規模下顯著降低成本。
在算力之外,內存體系也同步升級。
Atlas 350搭載華為自研高帶寬內存方案,帶寬較上一代提升約2.5倍。對于大模型訓練和推理來說,數據傳輸效率往往是實際性能的瓶頸,高帶寬內存的提升可以減少等待時間,使算力利用率更接近理論上限。
單卡性能方面,官方數據顯示,Atlas 350的算力約為英偉達H20的2.87倍,同時也是當前少數支持FP4推理的產品之一。
這類低精度能力更適用于推理場景,在保證效果的前提下進一步壓縮資源消耗。
![]()
除了芯片本身,本次發布還強調了AI與存儲的協同關系。
華為將其總結為兩個方向:
一是“存儲支撐AI”,即通過高性能存儲系統提升訓練與推理效率;
二是“AI優化存儲”,利用算法能力提升存儲系統的可靠性與管理效率。
例如,通過模型預測可提前約30天識別硬盤故障風險,同時在安全場景中加快異常行為識別速度。
在應用層面,這一代算力平臺已經開始落地多個行業。
醫療領域中,基于大模型的智慧病理系統可以在基層醫院快速部署,提高診斷效率;在AI服務側,通過KV Cache復用減少重復計算,降低首輪響應延遲;
![]()
在企業數據分析場景中,歷史數據可被結構化為“記憶庫”,提升模型持續學習能力。
從技術路徑來看,AI算力正在從“單純堆性能”轉向“提升單位效率”。低精度計算降低資源消耗,高帶寬內存緩解數據瓶頸,而算力與存儲的協同則進一步提高整體系統利用率。
這種變化直接影響模型訓練和部署成本,也決定了AI應用能否規模化落地。
總的來說,昇騰950PR和Atlas 350的發布,標志著AI基礎設施進入新的優化階段。
算力不再只看峰值性能,而是開始強調成本、效率與系統協同能力的平衡。
隨著這些能力逐步落地,大模型應用的門檻有望進一步降低,行業應用節奏也會隨之加快。
特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.