IT之家 4 月 2 日消息,科技媒體 Wccftech 昨日(4 月 1 日)發(fā)布博文,報(bào)道稱(chēng)基于英特爾發(fā)布的 MLPerf v6.0 基準(zhǔn)測(cè)試結(jié)果,在 AI 推理性能方面,全新 Arc Pro B70 顯卡較上代 B60 飆升 80%。
本次核心測(cè)試平臺(tái)采用四卡并聯(lián)方案,搭載四張 Arc Pro B70 顯卡(總顯存達(dá) 128GB)與最新至強(qiáng) 6 處理器,能輕松駕馭 1200 億參數(shù)的大型語(yǔ)言模型。與競(jìng)品相比,B70 在多卡協(xié)同運(yùn)行時(shí),最多可提供 1.6 倍的 KV 緩存容量,極大地提升了長(zhǎng)文本處理能力。
IT之家附上相關(guān)測(cè)試結(jié)果如下:
英特爾 MLPerf v6.0 GPT-OSS-120B 推理基準(zhǔn)測(cè)試:
GPU ConfigOffline (Tokens/s)Server (Tokens/s)4 x Arc Pro B70 (128 GB)1536.90951.674 x Arc Pro B60 Dual (192 GB)1601.91884.244 x Arc Pro B60 (96 GB)841.04452.19
英特爾 MLPerf v6.0 llama2-70b-99 推理基準(zhǔn)測(cè)試:
GPU ConfigOffline (Tokens/s)Server (Tokens/s)4 x Arc Pro B70 (128 GB)2459.181698.574 x Arc Pro B60 Dual (192 GB)3270.662199.504 x Arc Pro B60 (96 GB)1697.661106.26
英特爾 MLPerf v6.0 llama3.1 8b 推理基準(zhǔn)測(cè)試:
GPU ConfigOffline (Tokens/s)Server (Tokens/s)4 x Arc Pro B60 Dual (192 GB)52.8349.174 x Arc Pro B70 (128 GB)36.0732.584 x Arc Pro B60 (96 GB)26.1524.574 x Arc Pro B50 (64 GB)13.459.272 x Xeon 6 (128 Cores)9.613.68
![]()
該媒體指出提升 AI 推理效率的關(guān)鍵,不僅看顯卡,處理器同樣是核心樞紐。至強(qiáng) 6 處理器憑借內(nèi)置的 AMX 和 AVX-512 加速引擎,實(shí)現(xiàn)最高 90% 的代際性能飛躍。
除硬件迭代外,英特爾持續(xù)深耕 AI 軟件棧優(yōu)化。測(cè)試數(shù)據(jù)顯示,現(xiàn)有 Arc Pro B60 顯卡用戶(hù)無(wú)需更換硬件,僅通過(guò)軟件升級(jí)即可直接獲得 18% 的性能提升。
特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺(tái)“網(wǎng)易號(hào)”用戶(hù)上傳并發(fā)布,本平臺(tái)僅提供信息存儲(chǔ)服務(wù)。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.