公眾號記得加星標??,第一時間看推送不會錯過。
華為最新人工智能芯片昇騰 950PR,在算力性能上相較英偉達產品,暫時無法為國內超大規模云廠商提供壓倒性優勢,但該芯片迎來一項重大升級:實現了 CUDA 生態兼容。
中國算力產業長期試圖打破英偉達的市場壟斷,此前研發重心多放在架構迭代與板載功能升級上,但成效有限。相關消息顯示,國內大型云廠商仍高度傾向采購英偉達硬件;核心原因不僅在于算力差距,CUDA 軟件生態壁壘同樣關鍵。華為此前依靠原生 CANN 架構嘗試突破 CUDA 壁壘,始終未能完全落地。因此本次推出昇騰 950PR,目標直指直接替代英偉達,承接 AI 訓練與推理業務。
據三位知情人士透露,目前科技企業計劃大規模落地昇騰 950PR;得益于芯片對英偉達 CUDA 軟件體系兼容性大幅提升、響應速度優化,企業落地意愿顯著增強。
下文詳解昇騰 950PR 的核心優勢,首先聚焦本次發布的關鍵突破:CUDA 兼容能力。華為新一代 CANN Next 軟件棧完成重磅升級,新增 SIMT 編程模型,支持線程塊、線程束、內核啟動等原生功能,與 CUDA 高度對標。CANN Next 并非簡單提供代碼轉譯層,而是打造可近乎無縫替換 CUDA 的開發環境 —— 將 CUDA 作為通用開發標準,同時深度發揮昇騰自研生態的性能優勢。
CANN Next 針對昇騰芯片大規模算力調度做深度優化,線程數量、塊尺寸等參數均適配華為自研芯片,實現軟硬件協同設計與彈性擴容。通俗來說:華為并非要徹底取代 CUDA,而是讓開發者沿用 CUDA 的編程習慣與開發邏輯,最終編譯出專為昇騰芯片優化、可彈性擴容的高性能算力程序。這也是昇騰 950PR 相比前代產品,吸引力大幅提升的核心原因之一。
目前有消息稱,字節跳動、阿里巴巴等頭部云廠商即將批量采購昇騰 950PR;華為今年規劃產能達75 萬顆。硬件參數方面:芯片支持 FP8 及以下低精度算力格式,FP8 峰值算力 1PFLOPS,FP4 算力 2PFLOPS;互聯帶寬 2TB/s;搭載華為首款自研 HBM 內存 HiBL 1.0,容量 128GB,內存帶寬 1.6TB/s。自研高帶寬內存技術,也徹底解決了華為芯片量產爬坡的供應鏈制約。
另有技術路線圖 PPT 曝光,涵蓋昇騰全系列 AI 處理器:昇騰 910C、950PR、950DT、960、970,標注各型號發布時間、互聯帶寬、峰值算力等核心規格。
國內市場一直急需英偉達算力產品的國產化替代方案,尤其頭部云廠商需求迫切。采購英偉達 H200 等芯片面臨嚴苛監管限制,倒逼行業轉向海外算力租賃、自研國產芯片兩條路徑。如今依托 CANN Next 軟件棧 + 昇騰 950PR 芯片,華為正加速鞏固在國內 AI 產業的話語權;目前唯一的短板,僅在于芯片出貨產能,以及客戶大規模落地部署的準備進度。
(來源:wccftech)
*免責聲明:本文由作者原創。文章內容系作者個人觀點,半導體行業觀察轉載僅為了傳達一種不同的觀點,不代表半導體行業觀察對該觀點贊同或支持,如果有任何異議,歡迎聯系半導體行業觀察。
今天是《半導體行業觀察》為您分享的第4359內容,歡迎關注。
加星標??第一時間看推送
求推薦
特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.