337p人体粉嫩胞高清图片,97人妻精品一区二区三区在线 ,日本少妇自慰免费完整版,99精品国产福久久久久久,久久精品国产亚洲av热一区,国产aaaaaa一级毛片,国产99久久九九精品无码,久久精品国产亚洲AV成人公司

網易首頁

網易新聞
網易公開課
網易紅彩
網易嚴選
郵箱大師
網易云課堂

注冊免費郵箱

注冊VIP郵箱（特權郵箱，付費）
免費下載網易官方手機郵箱應用

移動端
網易公開課
網易嚴選
支付
郵箱

網易首頁 > 網易號 > 正文申請入駐

北大團隊改造DeepSeek注意力，速度快四倍還不丟精度

2026-04-06 23:23:39　來源: 量子位

北京舉報

0

分享至

聽雨發自凹非寺量子位 | 公眾號 QbitAI

就在大家都急頭白臉地等待DeepSeek-V4的時候，冷不丁一篇新論文引起了網友們的注意——

提出新稀疏注意力機制HISA（分層索引稀疏注意力），突破64K上下文的索引瓶頸，相比DeepSeek正在用的DSA（DeepSeek Sparse Attention）提速2-4倍。

不僅做到了大幅提速，而且幾乎不丟精度、即插即用不用重新訓練

論文直接在DeepSeek-V3.2和GLM-5上替換索引器，無需微調。

并且在找關鍵信息、長文本理解等任務上，精度都和原方法幾乎持平。

兩步消除上下文索引瓶頸

這篇論文想解決的問題很明確：給大模型的稀疏注意力機制換個更高效的 “檢索器”。

現有主流的DSA等token級稀疏注意力，核心就是通過只計算關鍵token的注意力，降低了核心計算成本。

但這個設計有個致命隱藏問題：要挑出相關字符，得靠一個 “索引器”——它需要把每個待查字符，和前面所有字符挨個打分，再選分數最高的。

文本長度L越長，這個打分的工作量是L的平方級增長。比如長度翻倍，工作量就會翻4倍。

到超長文本時，這個索引器的平方級成本，反而成了拖慢速度的元兇，甚至反而比真正的注意力計算還耗時。

基于此，研究團隊開始思考一個問題：能否在不改變最終稀疏注意力結果的前提下，降低索引器的搜索成本？

于是，他們提出了HISA（分層索引稀疏注意力），核心思路也很簡單：

既然挨個打分太費時間，那就先按塊篩掉大部分無關內容，再在剩下的小塊里精細選。

在功能邏輯上實現對原有模塊的等價替換，無需修改后續注意力計算邏輯，相當于 “換了個更高效的篩子，篩出來的東西幾乎沒變”。

具體就兩步，全程復用原模型的打分規則，零學習成本：

塊級粗過濾

把長文本切成固定大小的 “字符塊”（比如128個字符一塊），給每個塊算一個 “整體特征向量”（相當于給每塊貼個總標簽）
用原索引器的打分方式，只給這些塊標簽打分
挑出分數最高的m個塊（比如64個），直接扔掉剩下的所有塊——塊的數量遠少于字符數。

這一步能省掉絕大部分工作量。

塊內精挑字符

只在第一步選出來的m個塊里，用原索引器的規則給單個字符打分，再挑出最終需要的k個相關字符。

還加了個小優化：文本的第一個塊和最后一個塊必選，保證開頭的背景信息、結尾的最新上下文不被誤篩，也能處理文本拼接的邊界問題。

HISA的關鍵優勢在于：復雜度驟降，還能 “無縫替換”

HISA把原索引器每一層 O (L2) 的算力成本，降到了O(L2/B + L×m×B)（B 是塊大小、m 是選的塊數）

文本越長、塊選得越精準，提速效果越明顯。

更重要的是它的工程友好性

輸出和原索引器完全一致，下游的注意力計算模塊不用改；

不用重新訓練模型、不用調整KV緩存結構，直接替換原索引器就行；

短文本時會自動 “退化” 成原方法，只有超長文本時才觸發分層篩選，全程自適應。

實測提速超猛，精度幾乎沒丟

論文在DeepSeek-V3.2、GLM-5兩大主流大模型上做了全面測試，結果很亮眼：

速度上，在64K長度的文本下，HISA 比原DSA索引器最高提速3.75倍，常規設置也能提速2倍多。

上下文長度越長，HISA的提速效果越顯著，完全契合超長上下文（128K/1M）的實際應用需求。

精度上，HISA也幾乎完全保留原DSA的精度，且顯著優于純塊稀疏方法。

論文進行了“大海撈針”測試，該測試衡量在超長無關文本中，精準檢索指定位置關鍵信息的能力。

結果HISA和DSA幾乎一樣準，在所有長度和插入深度下，檢索精度均接近DSA的近乎滿分。

長文本理解（LongBench 基準）上，HISA的分數也和DSA基本持平。

甚至在部分場景，比如合成檢索、少樣本學習等對token篩選精度要求高的任務中，HISA做到了小幅反超。

而在超參數測試中，不同塊大小、選塊數量下，HISA表現都很穩定，分數均與DSA高度接近，無顯著性能差異

這也說明HISA對超參數的選擇不敏感，魯棒性強，工程落地時無需精細調參。

不過目前HISA還有小瑕疵，作者也提出了后續改進思路：

第一，現在塊是固定大小的，若一個塊里混了無關和相關內容，塊的 “整體標簽” 會不準。

未來可以搞自適應塊、重疊塊，或換更好的塊特征計算方式。

第二，目前只是推理時直接用，未來可以把塊篩選和模型一起訓練，讓篩選更精準。

第三，現在只測了索引器的速度，未來整合到完整的大模型服務框架里，測端到端的吞吐量和延遲。

團隊背景

這篇論文出自北京大學的張牧涵團隊。

張牧涵，北京大學人工智能研究院的Tanure-track助理教授和博士生導師。

回國前曾在Facebook AI（現為 Meta AI）擔任研究員，從事大規模圖學習系統和問題的研究。

其Google Scholar總引用量超過13000次，其中兩篇一作文章引用量分別達到3100+和2400+次，連續多年入選Elsevier全球前2%頂尖科學家（生涯影響力榜單）

Yufei Xu（徐宇飛）和Fanxu Meng（孟繁續）為論文的共同一作。

[1]https://arxiv.org/abs/2603.28458

特別聲明：以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布，本平臺僅提供信息存儲服務。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相關推薦

熱點推薦

印度油輪在霍爾木茲遭炮擊船員喊話伊朗海軍錄音公布

紅星新聞 2026-04-19 17:03:18
10349 跟貼 10349
中俄關系比傳統“聯盟”更深厚、更可靠

看看新聞Knews 2026-04-19 08:36:10
37332 跟貼 37332

五一假期火車票開售以來，鐵路12306拒絕出票105.6萬張

環球網資訊 2026-04-19 15:23:04
2912 跟貼 2912

揭秘年銷10億的爆款宋柚汁：“宋柚”是商標，柚含量不到3%，主配料為糖水，品牌號稱全國銷量第一

藍鯨新聞 2026-04-15 09:44:24
4054 跟貼 4054
網購的2800多元垃圾桶退貨時被申通弄壞商家拒收后天貓極速退款變欠款網購退貨在途風險該誰擔

信網 2026-04-19 14:15:08
91 跟貼 91

山東乳山銀灘“195平米復式房”1萬元起拍，已有多人競價，拍賣公司：產證面積97.94平米，另有贈送面積，非法拍可隨時過戶

極目新聞 2026-04-19 14:06:31
2 跟貼 2

快檢查自家陽臺！有人家里已大量出現，官方提醒：千萬別摸

環球網資訊 2026-04-18 16:23:18
608 跟貼 608
飛行員披露：最棘手時一天22小時坐在機艙準備起飛

環球網資訊 2026-04-19 09:53:02
451 跟貼 451

“真銅實料”互嗆升級，海信高管稱格力部分機型用鋁線電機

紅星資本局 2026-04-17 18:26:04
1635 跟貼 1635
榮耀機器人包攬半馬前三工程師回應

新京報 2026-04-19 12:25:11
4007 跟貼 4007
男子采蘑菇發現五步蛇離自己5米，盤縮落葉中和環境“融為一體”

星視頻 2026-04-19 15:46:19
311 跟貼 311
男子爬上泰山“五岳獨尊”石刻拍照，景區：將核查其身份進行處理

揚子晚報 2026-04-17 12:09:40
1589 跟貼 1589
追到第8名了！申花這個賽季還能爭冠？

新民晚報 2026-04-19 09:21:21
123 跟貼 123
滾出中國！云南潑水節炸出一群“男流氓”，潑女性“臟水”太齷齪

近史博覽 2026-04-20 02:11:11
0 跟貼 0
哥倫比亞總統：美國若一意孤行將激起拉美國家“反抗”

財聯社 2026-04-19 09:28:11
121 跟貼 121
虛報77億、9.6億投資憑空造，河南：堅決整改追責問責

新京報 2026-04-19 17:01:05
299 跟貼 299
“不差錢”的DeepSeek要融資了？投資人：或為期權定價留人才

第一財經資訊 2026-04-19 13:10:09
484 跟貼 484
廣州暹崗大山遭人私挖水晶破壞林業部門回應→

新快報新聞 2026-04-20 00:12:42
14 跟貼 14
俄羅斯海軍艦艇編隊結束訪問離開湛江

環球網資訊 2026-04-19 10:17:26
323 跟貼 323
確認了！系外逃間諜

蚌埠日報 2026-04-20 01:45:13
1 跟貼 1
1200元賣“院士證”，哪里還有學術機構的自重自愛？

華西都市報 2026-04-20 02:23:19
0 跟貼 0
別等來日方長，先把今天過好

大象新聞 2026-04-20 00:47:05
12 跟貼 12
比賽提前結束，WSBK荷蘭站第二輪正賽張雪機車斬獲第七名

澎湃新聞 2026-04-19 20:28:26
0 跟貼 0

83年李鵬當上副總理，79歲的鄧穎超親自上門叮囑：切不可脫離群眾

83年李鵬當上副總理，79歲的鄧穎超親自上門叮囑：切不可脫離群眾

我不是沃神

2026-04-12 14:35:03

艾頓：在詹姆斯這樣的球員身邊打球，你真的沒有理由不努力

艾頓：在詹姆斯這樣的球員身邊打球，你真的沒有理由不努力

懂球帝

2026-04-19 13:34:07

山東贏8分！廣廈13分大勝！北京5分險勝，排名大變，官宣重罰山西

山東贏8分！廣廈13分大勝！北京5分險勝，排名大變，官宣重罰山西

老吳說體育

2026-04-19 21:51:59

虎狼饑渴？為何一些女性會“欲望”特別強烈？可能存在這幾點原因

虎狼饑渴？為何一些女性會“欲望”特別強烈？可能存在這幾點原因

醫者榮耀

2026-03-13 12:10:12

終于來了！iPhone 18 Pro，可變光圈已量產

終于來了！iPhone 18 Pro，可變光圈已量產

小蜜情感說

2026-04-20 01:52:36

騷擾電話為何總打給你？元兇就在微信，關掉這開關立馬清凈

騷擾電話為何總打給你？元兇就在微信，關掉這開關立馬清凈

復轉這些年

2026-04-16 12:31:37

烏度卡：杜蘭特訓練時不慎與隊友膝蓋相撞，導致髕腱區域受傷

烏度卡：杜蘭特訓練時不慎與隊友膝蓋相撞，導致髕腱區域受傷

懂球帝

2026-04-19 08:20:27

炸了！利物浦兩大核心主動求離，安菲爾德迎來巨變

炸了！利物浦兩大核心主動求離，安菲爾德迎來巨變

瀾歸序

2026-04-20 01:42:46

希拉里：我聽說中美俄將劃分勢力范圍，美國管西半球，中國管東亞

希拉里：我聽說中美俄將劃分勢力范圍，美國管西半球，中國管東亞

沙溪解說

2026-04-19 13:31:42

完勝！唐斯25+8+4+3，麥科勒姆26+4，哈特立大功，季后賽走勢改變

完勝！唐斯25+8+4+3，麥科勒姆26+4，哈特立大功，季后賽走勢改變

籃球大視野

2026-04-19 09:05:54

朝鮮想買中國的殲10CE戰斗機，結果被拒絕了

朝鮮想買中國的殲10CE戰斗機，結果被拒絕了

安安說

2026-04-19 14:59:08

6月1日交強險調整！950元固定費取消，好司機保費直接減掉一半

6月1日交強險調整！950元固定費取消，好司機保費直接減掉一半

復轉這些年

2026-04-17 11:59:50

斯諾克世錦賽：卡特5連鞭逆轉，從0-4到5-4反超希金斯

斯諾克世錦賽：卡特5連鞭逆轉，從0-4到5-4反超希金斯

徐觳解說

2026-04-20 01:29:52

現在智駕行業只剩兩種模式：華為模式和Momenta模式

現在智駕行業只剩兩種模式：華為模式和Momenta模式

沙雕小琳琳

2026-04-19 17:28:15

破防！雷軍15小時京滬續航自證清白，懇求全網幫幫小米

破防！雷軍15小時京滬續航自證清白，懇求全網幫幫小米

雷科技

2026-04-18 12:38:28

比梅努更重要！曼聯新星碾壓切爾西，紅魔新核已崛起

比梅努更重要！曼聯新星碾壓切爾西，紅魔新核已崛起

奶蓋熊本熊

2026-04-20 00:20:08

1985年，國安叛徒藏身南美，中國6名兵王萬里鋤奸，FBI顏面盡失

1985年，國安叛徒藏身南美，中國6名兵王萬里鋤奸，FBI顏面盡失

干史人

2026-04-14 21:10:03

孫中山長子孫科 1949 年拒隨蔣介石赴臺，這位爭議人物結局如何

孫中山長子孫科 1949 年拒隨蔣介石赴臺，這位爭議人物結局如何

磊子講史

2025-12-23 17:43:11

胡錫進給沃爾沃汽車做廣告，評論區全翻車了……

胡錫進給沃爾沃汽車做廣告，評論區全翻車了……

麥杰遜

2026-04-17 11:51:26

笑麻！女子吐槽花1年裝修的新中式都說像法庭，我卻笑死在評論區

笑麻！女子吐槽花1年裝修的新中式都說像法庭，我卻笑死在評論區

另子維愛讀史

2026-04-17 17:36:52

追蹤人工智能動態

12497文章數 176455關注度

往期回顧全部

科技要聞

50分26秒破人類紀錄！300臺機器人狂飆半馬

頭條要聞

半年下沉22厘米女子家中坐擁價值上億別墅卻沒法住人

頭條要聞

半年下沉22厘米女子家中坐擁價值上億別墅卻沒法住人

體育要聞

湖人1比0火箭：老詹比烏度卡像教練

娛樂要聞

何潤東漲粉百萬！內娛隔空掀桌第一人

財經要聞

華誼兄弟，8年虧光85億

汽車要聞

29分鐘大定破萬極氪8X為什么這么多人買？

態度原創

+arrTaiduYuanC[i].tag+' | '+arrTaiduYuanC[i].title+'
\

家居

時尚

本地

游戲

教育

家居要聞

法式線條時光靜淌

智能舒適簡約風尚
簡而不減暖居之道
現代融合自然靈動

裝修“精神角落”，就是這么上癮

本地新聞

12噸巧克力有難，全網化身超級偵探添亂

如何將ZH-1火力最大化？《戰艦世界》15.3版本造船廠加點攻略

教育要聞

655家單位、1.29萬個崗位，湖南用心幫大學生找工作

© 1997-2026 網易公司版權所有 About NetEase | 公司簡介 | 聯系方法 | 招聘信息 | 客戶服務 | 隱私政策 | 不良信息舉報 Complaint Center | 廉正舉報 | 侵權投訴

無障礙瀏覽進入關懷版