337p人体粉嫩胞高清图片,97人妻精品一区二区三区在线 ,日本少妇自慰免费完整版,99精品国产福久久久久久,久久精品国产亚洲av热一区,国产aaaaaa一级毛片,国产99久久九九精品无码,久久精品国产亚洲AV成人公司

<nav id="a0aaa"><sup id="a0aaa"></sup></nav>

<sup id="a0aaa"></sup>

<sup id="a0aaa"></sup>

<nav id="a0aaa"></nav>

<nav id="a0aaa"></nav>

網(wǎng)易首頁

網(wǎng)易新聞
網(wǎng)易公開課
網(wǎng)易紅彩
網(wǎng)易嚴(yán)選
郵箱大師
網(wǎng)易云課堂

注冊(cè)免費(fèi)郵箱

注冊(cè)VIP郵箱（特權(quán)郵箱，付費(fèi)）
免費(fèi)下載網(wǎng)易官方手機(jī)郵箱應(yīng)用

移動(dòng)端
網(wǎng)易公開課
網(wǎng)易嚴(yán)選
支付
郵箱

網(wǎng)易首頁 > 網(wǎng)易號(hào) > 正文申請(qǐng)入駐

谷歌新論文把內(nèi)存股價(jià)干崩了！KV cache壓縮6倍

2026-03-26 12:49:57　來源: 量子位

北京舉報(bào)

0

分享至

夢(mèng)晨發(fā)自凹非寺量子位 | 公眾號(hào) QbitAI

學(xué)術(shù)會(huì)議ICLR，居然和美光和西部數(shù)據(jù)大跌扯上關(guān)系了？

兩家存儲(chǔ)芯片巨頭股價(jià)大跌，沒有財(cái)報(bào)暴雷，沒有供應(yīng)鏈斷裂，只是谷歌展示了一篇即將在ICLR 2026正式亮相的論文。

谷歌研究院推出TurboQuant壓縮算法，把AI推理過程中最吃內(nèi)存的KV cache壓縮至少6倍，精度零損失

市場(chǎng)的解讀簡單粗暴，長上下文AI推理以后不需要那么多內(nèi)存了，利空內(nèi)存。

網(wǎng)友紛紛表示，這不就是美劇《硅谷》里的Pied Paper？

Pied Piper是2014年開播的HBO經(jīng)典美劇《硅谷》里的虛構(gòu)創(chuàng)業(yè)公司，核心技術(shù)就是一種“近乎無損的極限壓縮算法”。

2026年，類似的算法在現(xiàn)實(shí)世界居然成真了。

KVCache量化到3 bit

要理解TurboQuant為什么重要，先得理解它解決的是什么問題。

AI大模型推理時(shí)處理過的信息會(huì)臨時(shí)存在KV Cache，方便后續(xù)快速調(diào)用，不用每次從頭算起。

問題是隨著上下文窗口越來越長，內(nèi)存消耗急劇膨脹。KV cache正在成為AI推理的核心瓶頸之一。

傳統(tǒng)的解決思路是向量量化，把高精度數(shù)據(jù)壓成低精度表示。

但尷尬的是，大部分量化方法本身也需要存儲(chǔ)額外的“量化常數(shù)”，每個(gè)數(shù)字要多占1到2個(gè)bit。

TurboQuant用兩個(gè)改動(dòng)把這個(gè)額外開銷干到了零。

PolarQuant（極坐標(biāo)量化）：

不用傳統(tǒng)的X、Y、Z坐標(biāo)描述數(shù)據(jù)，轉(zhuǎn)而用極坐標(biāo)”距離+角度”。

谷歌團(tuán)隊(duì)發(fā)現(xiàn)，轉(zhuǎn)換后角度的分布非常集中且可預(yù)測(cè)，根本不需要額外存儲(chǔ)歸一化常數(shù)。

就像把“往東走3個(gè)路口，往北走4個(gè)路口”壓縮成”朝37度方向走5個(gè)路口”。

信息量不變，描述更緊湊，還省掉了坐標(biāo)系本身的開銷。

QJL（量化JL變換）：

把高維數(shù)據(jù)投影后壓縮成+1或-1的符號(hào)位，完全不需要額外內(nèi)存。TurboQuant用它來消除PolarQuant壓縮后殘留的微小誤差。

兩者組合后PolarQuant先用大部分bit容量捕捉數(shù)據(jù)的主要信息，QJL再用1個(gè)bit做殘差修正。

最終實(shí)現(xiàn)3-bit量化，無需任何訓(xùn)練或微調(diào)，精度零損失。

8倍加速，Benchmark全線拉滿

谷歌團(tuán)隊(duì)在Gemma和Mistral等開源模型上，跑了主流長上下文基準(zhǔn)測(cè)試，覆蓋問答、代碼生成、摘要等多種任務(wù)。

在“大海撈針”任務(wù)上，TurboQuant在所有測(cè)試中拿下完美分?jǐn)?shù)，同時(shí)KV cache內(nèi)存占用縮小了至少6倍。

PolarQuant單獨(dú)使用，精度也幾乎無損。

速度提升同樣顯著。在英偉達(dá)H100 GPU上，4-bit TurboQuant計(jì)算注意力分?jǐn)?shù)的速度，比32-bit未量化版本快了8倍。

不只是省內(nèi)存，還更快了。

在向量搜索領(lǐng)域，TurboQuant同樣超越了現(xiàn)有最優(yōu)量化方法的召回率，而且不需要針對(duì)具體數(shù)據(jù)集做調(diào)優(yōu)，也不依賴低效的大碼本。

AI內(nèi)存的DeepSeek時(shí)刻？

Cloudflare CEO評(píng)價(jià)“這是谷歌的DeepSeek時(shí)刻”。

他認(rèn)為DeepSeek證明了用更少的資源也能訓(xùn)出頂尖模型。

TurboQuant的方向類似，用更少的內(nèi)存，也能跑同樣質(zhì)量的推理。

谷歌表示，TurboQuant除了可以用在Gemini等大模型上，同時(shí)還能大幅提升語義搜索的效率，讓谷歌級(jí)別的萬億級(jí)向量索引查詢更快、成本更低。

不過TurboQuant目前還只是一個(gè)實(shí)驗(yàn)室成果，尚未大規(guī)模部署。

更關(guān)鍵的是，它只解決推理階段的內(nèi)存問題。而AI訓(xùn)練環(huán)節(jié)完全不受影響。

論文地址：
https://research.google/blog/turboquant-redefining-ai-efficiency-with-extreme-compression/

[1]https://x.com/eastdakota/status/2036827179150168182?s=20

特別聲明：以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺(tái)“網(wǎng)易號(hào)”用戶上傳并發(fā)布，本平臺(tái)僅提供信息存儲(chǔ)服務(wù)。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相關(guān)推薦

熱點(diǎn)推薦

谷歌新論文證明LLM可以少吃80%內(nèi)存，閃迪盤中跌去50億美元

DeepTech深科技 2026-03-26 13:26:34
0 跟貼 0
縮減6倍AI內(nèi)存、閃迪美光下挫：拆解谷歌TurboQuant背后的軟硬件博弈

鈦媒體APP 2026-03-26 16:20:07
0 跟貼 0

谷歌掀語音Agent新紀(jì)元！開口就是生產(chǎn)力，Siri的最強(qiáng)外掛來了？

智東西 2026-03-27 23:23:19
0 跟貼 0

未來一年大模型的關(guān)鍵詞是什么？小米MiMo大模型負(fù)責(zé)人羅福莉：“進(jìn)化”

每日經(jīng)濟(jì)新聞 2026-03-27 18:26:29
22 跟貼 22
GitHub修改Copilot隱私政策：4月24日起默認(rèn)使用用戶交互數(shù)據(jù)訓(xùn)練AI

鈦媒體APP 2026-03-27 09:20:08
7 跟貼 7

1000 倍效率神話，Taalas如何用 “模型即芯片” 暴打英偉達(dá)

鈦媒體APP 2026-02-24 15:35:10
0 跟貼 0

業(yè)績猛漲背后，迅策科技正迎來重估時(shí)刻

華爾街見聞官方 2026-03-27 19:37:09
0 跟貼 0
阿里前員工做了個(gè)“破壁”版龍蝦，這能讓大模型記住你嗎｜AI Founder 請(qǐng)回答

鈦媒體APP 2026-03-27 15:54:13
0 跟貼 0

不同靈巧手，終于可以共用「一套大腦」了

機(jī)器之心Pro 2026-03-06 14:40:41
0 跟貼 0
行業(yè)最大規(guī)模具身數(shù)據(jù)集：10Kh RealOmni-Open DataSet

量子位 2026-01-06 10:53:25
0 跟貼 0
行業(yè)最大規(guī)模具身數(shù)據(jù)集！出自簡智機(jī)器人GenRobot.AI

量子位 2026-01-05 17:11:41
0 跟貼 0
趨境科技發(fā)布ATaaS：全球領(lǐng)先的高效能AI Token生產(chǎn)服務(wù)平臺(tái)

量子位 2026-03-28 03:12:28
0 跟貼 0
龍蝦掀起的 AI 執(zhí)行革命，為什么必須由硬件來承接？

虎嗅APP 2026-03-28 04:32:14
0 跟貼 0
一天蒸發(fā)6200億！谷歌算法黑科技擊潰存儲(chǔ)股，華爾街痛批市場(chǎng)“不懂技術(shù)”

每日經(jīng)濟(jì)新聞 2026-03-26 19:00:13
6 跟貼 6
明明是兩個(gè)不同的齒輪，轉(zhuǎn)起來卻能絲滑通過，這算法真絕了！

搞笑大蘑菇 2026-03-27 13:35:59
7 跟貼 7
美官員稱中芯國際已向伊朗軍方提供芯片制造工具外交部回應(yīng)

鳳凰衛(wèi)視 2026-03-27 16:38:27
0 跟貼 0
谷歌地圖5星騙局：臥底記者日賺800英鎊，最后發(fā)現(xiàn)獵物竟是自己

灰度測(cè)試中 2026-03-27 17:31:17
0 跟貼 0
內(nèi)存漲價(jià)致成本上升，索尼PS5系列機(jī)型將在歐洲市場(chǎng)漲價(jià)

環(huán)球網(wǎng)資訊 2026-03-27 11:38:09
1 跟貼 1
全球唯一雙座隱身戰(zhàn)機(jī)！殲-20S跨界作戰(zhàn)有多震撼？專家解析

齊魯壹點(diǎn) 2026-03-27 06:56:45
34415 跟貼 34415
一篇論文砸崩存儲(chǔ)芯片巨頭股價(jià)，谷歌干了什么？

量子位 2026-03-28 02:40:37
0 跟貼 0
WWDC定檔！蘋果與谷歌Gemini重大合作細(xì)節(jié)曝光

智東西 2026-03-27 10:24:23
2 跟貼 2
機(jī)器人進(jìn)汽車廠，給波士頓動(dòng)力，裝上谷歌最強(qiáng)大腦

機(jī)器之心Pro 2026-01-06 19:02:05
4 跟貼 4
DeepSeek推理分裂出多重人格，越社交越聰明

量子位 2026-02-04 03:32:03
0 跟貼 0
美自媒體公司成癮設(shè)計(jì)被判賠300萬美元

artvip 2026-03-27 17:58:17
0 跟貼 0
QVGen讓「超低比特視頻生成量化」真正可用！

機(jī)器之心Pro 2026-02-25 18:07:24
0 跟貼 0
aiX-apply-4B逆襲DeepSeek-V3.2！aiXcoder發(fā)布代碼變更應(yīng)用模型

機(jī)器之心Pro 2026-03-27 15:58:54
0 跟貼 0
小學(xué)幾何訓(xùn)練營，四邊形中的燕尾模型

大力小學(xué)數(shù)學(xué) 2026-03-24 20:05:00
0 跟貼 0
文科生要逆襲了！文科不會(huì)消失，反而會(huì)升級(jí)

周鴻祎 2026-03-27 03:34:38
0 跟貼 0
“龍蝦”出現(xiàn)后，大模型時(shí)代的共識(shí)被推翻了

虎嗅APP 2026-03-28 02:41:40
0 跟貼 0
極限對(duì)決！火箭挑戰(zhàn)塔猜亞，長臺(tái)三板斧演繹單桿147壯舉

只若初見h 2026-03-27 05:48:24
0 跟貼 0
周口一油菜花田打卡地被推土機(jī)鏟平，當(dāng)?shù)兀合挡疬w征收用地，居民不能私自種植

極目新聞 2026-03-27 14:54:50
12660 跟貼 12660
美伊24小時(shí)極限拉扯！中東火藥桶隨時(shí)升級(jí)？

領(lǐng)略非凡 2026-03-26 06:21:02
0 跟貼 0
最新 | 天津供熱采暖收費(fèi)新政發(fā)布

天津廣播 2026-03-27 21:48:34
98 跟貼 98
國乒男雙極限對(duì)拉，對(duì)手意想不到的強(qiáng)，最后還是手拿把掐

田泡芙搞笑 2026-03-27 09:03:15
1 跟貼 1
500萬年前的芯片，20億年前的核反應(yīng)堆，史前文明是否真的存在？

爆笑星空 2026-03-26 03:44:28
0 跟貼 0
前方等位3000桌上海爆火飯館又出新規(guī)：就餐要看SIM卡

上觀新聞 2026-03-27 14:35:54
2035 跟貼 2035
我告訴具體該怎么做，誤差管理瞄準(zhǔn)法

不止聊臺(tái)球的烤地瓜 2026-03-25 14:23:03
14 跟貼 14
對(duì)標(biāo)英偉達(dá)EgoScale數(shù)據(jù)路徑，清華系孵化星憶科技拿到首輪融資

36氪 2026-03-27 16:09:08
0 跟貼 0
鄭州空房天價(jià)水費(fèi)追蹤丨水務(wù)公司：系馬桶漏水，水表計(jì)量有效

大象新聞 2026-03-27 15:17:10
6527 跟貼 6527
足球場(chǎng)上的神操作，門將最后時(shí)刻極限撲救，這牛能吹一輩子！

趣笑小行星 2026-03-25 11:09:23
2 跟貼 2

張玉寧傳射建功！機(jī)警推射破498天國足球荒，5年首次單場(chǎng)傳射

張玉寧傳射建功！機(jī)警推射破498天國足球荒，5年首次單場(chǎng)傳射

奧拜爾

2026-03-27 15:27:15

中國博士后遭美方執(zhí)法人員約談盤問后自殺身亡，中方：敦促美方徹查此案，向受害者家屬和中方做出負(fù)責(zé)任交代

中國博士后遭美方執(zhí)法人員約談盤問后自殺身亡，中方：敦促美方徹查此案，向受害者家屬和中方做出負(fù)責(zé)任交代

每日經(jīng)濟(jì)新聞

2026-03-27 20:24:28

悲催！網(wǎng)傳一男子踩空摔倒死亡，或玩手機(jī)引發(fā)，原本打算6月結(jié)婚

悲催！網(wǎng)傳一男子踩空摔倒死亡，或玩手機(jī)引發(fā)，原本打算6月結(jié)婚

火山詩話

2026-03-27 13:59:41

這是目前為止，我見過腰最細(xì)的女生，沒有之一

這是目前為止，我見過腰最細(xì)的女生，沒有之一

草莓解說體育

2026-03-03 19:15:05

俄羅斯高校或變征兵室！俄大學(xué)生被迫簽署兵役合同

俄羅斯高校或變征兵室！俄大學(xué)生被迫簽署兵役合同

項(xiàng)鵬飛

2026-03-26 20:52:07

我今年55了，想用血淚教訓(xùn)告訴你：不要跟任何人，包括你的父母、子女、枕邊人，分享這4件事

我今年55了，想用血淚教訓(xùn)告訴你：不要跟任何人，包括你的父母、子女、枕邊人，分享這4件事

東林夕亭

2026-03-27 09:07:57

飆升570%！河南一酒企斷代16年后復(fù)出，攪動(dòng)1800億市場(chǎng)

飆升570%！河南一酒企斷代16年后復(fù)出，攪動(dòng)1800億市場(chǎng)

叮當(dāng)當(dāng)科技

2026-03-27 05:47:01

徐靜蕾在洛杉磯的近況，看得人心里五味雜陳。

徐靜蕾在洛杉磯的近況，看得人心里五味雜陳。

南權(quán)先生

2026-03-09 15:52:48

瓦良格號(hào)送到中國后有多震撼？專家刮掉表面的銹跡：鋼材品質(zhì)極佳

瓦良格號(hào)送到中國后有多震撼？專家刮掉表面的銹跡：鋼材品質(zhì)極佳

古書記史

2026-01-06 16:31:56

中央連發(fā)兩文定調(diào)！不出意外的話，一線城市的房價(jià)或迎來大變化

中央連發(fā)兩文定調(diào)！不出意外的話，一線城市的房價(jià)或迎來大變化

離離言幾許

2026-03-27 13:47:28

朝鮮兩名高官發(fā)動(dòng)兵變?yōu)閺埑蓾蓤?bào)仇，因細(xì)節(jié)敗露，金正恩一招鎮(zhèn)壓

朝鮮兩名高官發(fā)動(dòng)兵變?yōu)閺埑蓾蓤?bào)仇，因細(xì)節(jié)敗露，金正恩一招鎮(zhèn)壓

阿胡

2024-04-30 11:48:45

人民日?qǐng)?bào)副總編輯公開表達(dá)不滿：我困惑很久，不吐不快！

人民日?qǐng)?bào)副總編輯公開表達(dá)不滿：我困惑很久，不吐不快！

霹靂炮

2025-12-08 22:03:16

男子自駕游至海南遇美女搭車，同行三天后，他才知道自己逃過死劫

男子自駕游至海南遇美女搭車，同行三天后，他才知道自己逃過死劫

林林故事揭秘

2025-04-10 14:49:38

反轉(zhuǎn)來了，美國前州長直播爆料：特朗普去年遇刺完全是自導(dǎo)自演！

反轉(zhuǎn)來了，美國前州長直播爆料：特朗普去年遇刺完全是自導(dǎo)自演！

觸摸史跡

2026-03-27 10:03:34

重溫1999：西方媒體報(bào)道的炸館“另一面”，17名軍事顧問遇難？

重溫1999：西方媒體報(bào)道的炸館“另一面”，17名軍事顧問遇難？

干史人

2026-02-27 11:00:05

小S長女Elly海邊辣照，這身段誰敢信才20歲？

小S長女Elly海邊辣照，這身段誰敢信才20歲？

娛樂領(lǐng)航家

2026-03-25 23:00:03

現(xiàn)貨黃金價(jià)格深夜再度跳水，一度跌逾3%！金價(jià)為何“上躥下跳”？

現(xiàn)貨黃金價(jià)格深夜再度跳水，一度跌逾3%！金價(jià)為何“上躥下跳”？

澎湃新聞

2026-03-27 09:10:27

從“種地”到“慧種地”：中國智慧春耕跑出“加速度”

從“種地”到“慧種地”：中國智慧春耕跑出“加速度”

新華社

2026-03-27 18:51:13

伊朗下追殺令，在中東搜捕美軍，又有一國下場(chǎng)，德黑蘭等來強(qiáng)援

伊朗下追殺令，在中東搜捕美軍，又有一國下場(chǎng)，德黑蘭等來強(qiáng)援

至死不渝的愛情

2026-03-28 00:05:23

喝過宋太宗的酒后，60歲錢弘俶隨即暴亡，學(xué)者：李煜剛被毒殺不久

喝過宋太宗的酒后，60歲錢弘俶隨即暴亡，學(xué)者：李煜剛被毒殺不久

史筆似塵鉤

2026-03-15 21:56:41

追蹤人工智能動(dòng)態(tài)

12356文章數(shù) 176426關(guān)注度

往期回顧全部

科技要聞

楊植麟張鵬夏立雪羅福莉，聊龍蝦、聊漲價(jià)

頭條要聞

男醫(yī)生給孕妻做彩超丈夫崩潰撞墻:不過了明天就離婚

頭條要聞

男醫(yī)生給孕妻做彩超丈夫崩潰撞墻:不過了明天就離婚

體育要聞

邵佳一：足球就像一場(chǎng)馬拉松

娛樂要聞

范瑋琪加盟，官宣《浪姐7》遭全網(wǎng)抵制

財(cái)經(jīng)要聞

我在小吃培訓(xùn)機(jī)構(gòu)學(xué)習(xí)“科技與狠活”

汽車要聞

與眾08，金標(biāo)大眾不能輸?shù)囊粦?zhàn)

態(tài)度原創(chuàng)

+arrTaiduYuanC[i].tag+' | '+arrTaiduYuanC[i].title+'
\

藝術(shù)

時(shí)尚

數(shù)碼

手機(jī)

教育

藝術(shù)要聞

投資9000萬！奶茶巨頭益禾堂的總部大樓，坐標(biāo)武漢！

推廣中獎(jiǎng)名單-更新至2026年3月11日推廣

數(shù)碼要聞

洛斐QQ音樂聯(lián)名外設(shè)泄露：極地苔原色，瞬間激活432Hz自然聲

手機(jī)要聞

蘋果iOS 26.4導(dǎo)致《生化危機(jī)》游戲崩潰，官方回應(yīng)“正在調(diào)查”

教育要聞

澳洲留學(xué)和vs英國留學(xué)哪個(gè)更值得？

© 1997-2026 網(wǎng)易公司版權(quán)所有 About NetEase | 公司簡介 | 聯(lián)系方法 | 招聘信息 | 客戶服務(wù) | 隱私政策 | 不良信息舉報(bào) Complaint Center | 廉正舉報(bào) | 侵權(quán)投訴

無障礙瀏覽進(jìn)入關(guān)懷版

<tr id="aa84a"><small id="aa84a"></small></tr>

<tfoot id="aa84a"><dd id="aa84a"></dd></tfoot>

<sup id="aa84a"></sup>