337p人体粉嫩胞高清图片,97人妻精品一区二区三区在线 ,日本少妇自慰免费完整版,99精品国产福久久久久久,久久精品国产亚洲av热一区,国产aaaaaa一级毛片,国产99久久九九精品无码,久久精品国产亚洲AV成人公司
網(wǎng)易首頁 > 網(wǎng)易號(hào) > 正文 申請(qǐng)入駐

難以置信!DeepSeek 新變體速度提升200%,企業(yè)部署成本銳減60%

0
分享至

距離DeepSeek發(fā)布其熱門開源模型 DeepSeek 的最新版本 R1-0528,才剛過去一個(gè)多月,本周,一家 24 年歷史的德國(guó)公司 TNG 技術(shù)咨詢有限公司發(fā)布了一個(gè)此類改編版本:DeepSeek-TNG R1T2 Chimera,這是其 Chimera 大型語言模型系列的最新型號(hào)。

R1T2 在效率和速度上實(shí)現(xiàn)了顯著提升,其智能基準(zhǔn)分?jǐn)?shù)達(dá)到 R1-0528 的 90% 以上,同時(shí)生成答案所需的輸出 token 數(shù)量不到 R1-0528 的 40%。

這意味著它能產(chǎn)生更簡(jiǎn)短的回復(fù),直接轉(zhuǎn)化為更快的推理速度和更低的計(jì)算成本。在 TNG的AI 代碼共享社區(qū)上,該公司稱其 “比常規(guī) R1快約 20%,比 R1-0528快兩倍以上”。

對(duì)此,AI 開發(fā)者社區(qū)的反響極為熱烈。社區(qū)高級(jí)負(fù)責(zé)人寫道:“天啊!DeepSeek R1T2,比 R1-0528 快 200%,比 R1 快 20%。在 GPQA 和 AIME 24 上顯著優(yōu)于 R1,通過專家組裝法結(jié)合 DS V3、R1 和 R1-0528 構(gòu)建,且采用 MIT 許可證,可在社區(qū) 上獲取。”


這一提升得益于 TNG 的專家組裝(AoE)方法,這是一種通過選擇性合并多個(gè)預(yù)訓(xùn)練模型的內(nèi)部參數(shù)來構(gòu)建 LLM 的技術(shù)。作為原始 R1T Chimera 的后繼者,R1T2 引入了新的 “三思維”(Tri-Mind)配置,集成了三個(gè)父模型:DeepSeek-R1-0528、DeepSeek-R1 和 DeepSeek-V3-0324。其結(jié)果是一個(gè)經(jīng)過精心設(shè)計(jì)的模型,既能保持高推理能力,又能顯著降低推理成本。

而且,R1T2 的構(gòu)建無需進(jìn)一步微調(diào)或再訓(xùn)練。它繼承了 R1-0528 的推理優(yōu)勢(shì)、R1 的結(jié)構(gòu)化思維模式,以及 V3-0324 簡(jiǎn)潔的指令導(dǎo)向特性,為企業(yè)和研究應(yīng)用提供了一個(gè)更高效且有能力的模型。

01

專家組裝(AoE)與

專家混合(MoE)的區(qū)別

專家混合(MoE)是一種架構(gòu)設(shè)計(jì),其中不同組件根據(jù)輸入有條件地激活。在 DeepSeek-V3 或 Mixtral 等 MoE LLM 中,任何給定 token 的前向傳播過程中,僅激活模型專家層的一部分。這使得超大型模型能夠?qū)崿F(xiàn)更高的參數(shù)數(shù)量和專業(yè)化,同時(shí)保持推理成本可控,因?yàn)槊總€(gè) token 僅評(píng)估網(wǎng)絡(luò)的一小部分。

專家組裝(AoE)是一種模型合并技術(shù),而非架構(gòu)。它用于通過選擇性插值多個(gè)預(yù)訓(xùn)練 MoE 模型的權(quán)重張量來創(chuàng)建新模型。AoE 中的 “專家” 指的是被合并的模型組件,通常是 MoE 層內(nèi)的路由專家張量,而非運(yùn)行時(shí)動(dòng)態(tài)激活的專家。

TNG 對(duì) AoE 的實(shí)現(xiàn)主要側(cè)重于合并路由專家張量,同時(shí)通常保留來自更快模型的更高效共享層和注意力層。這種方法使生成的 Chimera 模型能夠繼承推理能力,而無需復(fù)制最強(qiáng)父模型的冗長(zhǎng)或延遲。

02

性能與速度:基準(zhǔn)測(cè)試的實(shí)際結(jié)果

E-25 和 GPQA-Diamond 測(cè)試集衡量,R1T2 實(shí)現(xiàn)了其最智能父模型 DeepSeek-R1-0528 90% 至 92% 的推理性能。然而,與 DeepSeek-R1-0528 不同,R1T2 被設(shè)計(jì)為更加簡(jiǎn)潔。它能以少得多的詞匯量提供同樣智能的響應(yīng)。TNG 并非關(guān)注原始處理時(shí)間或每秒 token 數(shù),而是以每個(gè)答案的輸出 token 數(shù)來衡量 “速度”,這是成本和延遲的實(shí)用代理指標(biāo)。

根據(jù) TNG 共享的基準(zhǔn)測(cè)試,R1T2 生成響應(yīng)所需的 token 數(shù)約為 R1-0528 的 40%。這意味著輸出長(zhǎng)度減少 60%,直接縮短推理時(shí)間和計(jì)算負(fù)載,將響應(yīng)速度提升 2 倍,即 200%。與原始 DeepSeek-R1 相比,R1T2 平均也約縮短 20%,為高吞吐量或成本敏感的部署提供了顯著的效率提升。這種效率并未以智能為代價(jià)。


03

部署注意事項(xiàng)與可用性

R1T2 根據(jù)寬松的 MIT 許可證發(fā)布,現(xiàn)已在社區(qū)上提供,這意味著它是開源的,可用于構(gòu)建商業(yè)應(yīng)用。TNG 指出,盡管該模型非常適合一般推理任務(wù),但由于繼承自 DeepSeek-R1 的局限性,目前不建議用于需要函數(shù)調(diào)用或工具使用的用例。這些問題可能在未來的更新中解決。

對(duì)企業(yè)技術(shù)決策者的意義

對(duì)于CTO、AI 平臺(tái)所有者、工程負(fù)責(zé)人和 IT 采購(gòu)團(tuán)隊(duì)而言,R1T2 帶來了切實(shí)的好處和戰(zhàn)略選擇:

更低的推理成本:每個(gè)任務(wù)的輸出 token 更少,R1T2 減少了 GPU 時(shí)間和能源消耗,直接轉(zhuǎn)化為基礎(chǔ)設(shè)施節(jié)省 —— 這在高吞吐量或?qū)崟r(shí)環(huán)境中尤為重要。

無開銷的高推理質(zhì)量:它保留了 R1-0528 等頂級(jí)模型的大部分推理能力,但沒有其冗長(zhǎng)性。這非常適合數(shù)學(xué)、編程、邏輯等結(jié)構(gòu)化任務(wù),這些任務(wù)更偏好簡(jiǎn)潔的答案。

開放且可修改:MIT 許可證允許完全的部署控制和自定義,支持在受監(jiān)管或空氣隔離環(huán)境中進(jìn)行私有托管、模型對(duì)齊或進(jìn)一步訓(xùn)練。

新興的模塊化:AoE 方法預(yù)示著未來模型將以模塊化方式構(gòu)建,使企業(yè)能夠通過重組現(xiàn)有模型的優(yōu)勢(shì)來組裝專用變體,而無需從頭開始再訓(xùn)練。

注意事項(xiàng):依賴函數(shù)調(diào)用、工具使用或高級(jí)代理編排的企業(yè)應(yīng)注意當(dāng)前的局限性,盡管未來的 Chimera 更新可能會(huì)解決這些差距。

關(guān)于首席信息官

公眾號(hào)“首席信息官 ”由資深媒體人創(chuàng)辦,致力于用專業(yè)的文字,精準(zhǔn)的洞察,特色的服務(wù),深入的踐行服務(wù)企業(yè)數(shù)智化領(lǐng)域,為產(chǎn)業(yè)的發(fā)展點(diǎn)燃“微光”!

特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺(tái)“網(wǎng)易號(hào)”用戶上傳并發(fā)布,本平臺(tái)僅提供信息存儲(chǔ)服務(wù)。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相關(guān)推薦
熱點(diǎn)推薦
小火星鬧出大險(xiǎn)情,鎮(zhèn)江一女子隨意傾倒垃圾致 4 車燒毀

小火星鬧出大險(xiǎn)情,鎮(zhèn)江一女子隨意傾倒垃圾致 4 車燒毀

揚(yáng)子晚報(bào)
2026-04-08 22:16:11
英國(guó)遭到拒絕后發(fā)出警告,中國(guó)若不合作,中企海外資產(chǎn)將被沒收!

英國(guó)遭到拒絕后發(fā)出警告,中國(guó)若不合作,中企海外資產(chǎn)將被沒收!

真正能保護(hù)你的
2026-04-08 04:20:50
騙走50億被央視曝光!用小鮮肉的血抗衰,“撈金女王”這次真栽了

騙走50億被央視曝光!用小鮮肉的血抗衰,“撈金女王”這次真栽了

涵豆說娛
2026-04-08 18:36:49
果然陽謀在任何面前都是無敵的!網(wǎng)友:把水?dāng)嚮炝耍彩且环N智慧

果然陽謀在任何面前都是無敵的!網(wǎng)友:把水?dāng)嚮炝耍彩且环N智慧

夜深愛雜談
2026-04-07 17:50:08
滿倉迎大漲,但牛市大周期的結(jié)束已經(jīng)不遠(yuǎn)

滿倉迎大漲,但牛市大周期的結(jié)束已經(jīng)不遠(yuǎn)

重遠(yuǎn)投資觀
2026-04-08 15:37:14
伊朗海軍警告霍爾木茲海峽附近船只:須獲許可才能通過

伊朗海軍警告霍爾木茲海峽附近船只:須獲許可才能通過

界面新聞
2026-04-08 19:31:38
利物浦?jǐn)[大巴整活,0-2被巴黎按在地上摩擦

利物浦?jǐn)[大巴整活,0-2被巴黎按在地上摩擦

賽場(chǎng)名場(chǎng)面
2026-04-09 07:25:08
66歲大媽喜歡睡前泡腳,不久腦梗去世,專家怒斥:太無知了

66歲大媽喜歡睡前泡腳,不久腦梗去世,專家怒斥:太無知了

比利
2026-03-21 13:00:22
我退休金一萬,妹妹求我接濟(jì)她,我剛想答應(yīng),看到她女兒發(fā)朋友圈

我退休金一萬,妹妹求我接濟(jì)她,我剛想答應(yīng),看到她女兒發(fā)朋友圈

秋風(fēng)專欄
2025-11-28 09:32:54
廈門最旺商場(chǎng)建在“炸平的墳山”上,科學(xué)解釋不了,玄學(xué)說法不少

廈門最旺商場(chǎng)建在“炸平的墳山”上,科學(xué)解釋不了,玄學(xué)說法不少

愛下廚的阿釃
2026-04-09 04:27:21
麥肯羅直言:17歲男孩就能橫掃薩巴倫卡,性別差距真這么大?

麥肯羅直言:17歲男孩就能橫掃薩巴倫卡,性別差距真這么大?

網(wǎng)球之家
2026-04-08 12:43:01
官宣!濃眉特雷楊本賽季提前報(bào)銷,奇才這波擺爛太秀了

官宣!濃眉特雷楊本賽季提前報(bào)銷,奇才這波擺爛太秀了

仰臥撐FTUer
2026-04-08 10:10:14
泰山隊(duì)外租球員大爆發(fā),領(lǐng)跑射手榜,球迷倒戈,希望他不要回來了

泰山隊(duì)外租球員大爆發(fā),領(lǐng)跑射手榜,球迷倒戈,希望他不要回來了

體壇風(fēng)之子
2026-04-09 04:30:07
蘋果新款iPhone Air 2和iPhone 18上市日期與造型曝光

蘋果新款iPhone Air 2和iPhone 18上市日期與造型曝光

果粉易查
2026-04-07 17:40:03
憤怒!馬繼華竟用秦檜比喻樊振東,引導(dǎo)飯圈:一等軍功章成廢鐵

憤怒!馬繼華竟用秦檜比喻樊振東,引導(dǎo)飯圈:一等軍功章成廢鐵

阿嚼影視評(píng)論
2026-03-22 12:40:08
一場(chǎng)戰(zhàn)爭(zhēng)徹底把中國(guó)打醒!美軍作戰(zhàn)最毒的是什么?中國(guó)用30年看清

一場(chǎng)戰(zhàn)爭(zhēng)徹底把中國(guó)打醒!美軍作戰(zhàn)最毒的是什么?中國(guó)用30年看清

小蘭聊歷史
2026-04-08 01:20:00
中國(guó)“退步”最快的城市:曾與上海、南京齊名,如今淪為三線城市

中國(guó)“退步”最快的城市:曾與上海、南京齊名,如今淪為三線城市

潮鹿逐夢(mèng)
2026-04-02 18:05:04
當(dāng)你有了存款會(huì)瞞著身邊人嗎?網(wǎng)友:存錢就連親爹媽都別告訴

當(dāng)你有了存款會(huì)瞞著身邊人嗎?網(wǎng)友:存錢就連親爹媽都別告訴

帶你感受人間冷暖
2026-02-23 00:30:12
美國(guó)傷亡人數(shù)出爐

美國(guó)傷亡人數(shù)出爐

楊興文
2026-04-04 22:04:35
聯(lián)盟第二后衛(wèi)?只進(jìn)過1次二陣就拿2.85億合同!他不愿再做皮蓬了

聯(lián)盟第二后衛(wèi)?只進(jìn)過1次二陣就拿2.85億合同!他不愿再做皮蓬了

阿浪的籃球故事
2026-04-08 16:05:05
2026-04-09 08:07:00
首席信息官 incentive-icons
首席信息官
以數(shù)字化和商業(yè)創(chuàng)新為視角
508文章數(shù) 130關(guān)注度
往期回顧 全部

科技要聞

吳泳銘成立阿里技術(shù)委員會(huì) 為何這四人入選

頭條要聞

特朗普稱"徹底勝利" 美媒:目標(biāo)一個(gè)沒實(shí)現(xiàn)還陷入困境

頭條要聞

特朗普稱"徹底勝利" 美媒:目標(biāo)一個(gè)沒實(shí)現(xiàn)還陷入困境

體育要聞

40歲,但實(shí)力倒退12年

娛樂要聞

侯佩岑全家悉尼度假,一家四口幸福滿溢

財(cái)經(jīng)要聞

誰騙了董宇輝?

汽車要聞

20萬級(jí)滿配華為全家桶 華境S是懂家庭的大六座

態(tài)度原創(chuàng)

健康
家居
本地
數(shù)碼
公開課

干細(xì)胞抗衰4大誤區(qū),90%的人都中招

家居要聞

自在恣意 侘寂風(fēng)別墅

本地新聞

跟著歌聲游安徽,聽古村回響

數(shù)碼要聞

SK海力士開始供應(yīng)321層QLC NAND cSSD:最高可選2TB

公開課

李玫瑾:為什么性格比能力更重要?

無障礙瀏覽 進(jìn)入關(guān)懷版