3月24日,谷歌研究院發布了一篇論文。
3月25日,全球存儲芯片板塊集體崩盤。
美光股價暴跌4.5%,SK海力士在韓國市場一度重挫6.2%,三星、西部數據、閃迪無一幸免。粗略估算,僅僅一天時間,這些存儲巨頭的市值蒸發了超過6200億人民幣。
3月26日,三星、海力士繼續下跌行情……
![]()
而這一切的導火索,就是谷歌那篇看似平平無奇的論文——TurboQuant。
說實話,第一次看到這個新聞的時候,我也是一臉懵。一個算法而已,至于嗎?
但當我深入了解之后,不由得拍案大呼:這哪是什么算法,這分明是一顆投向存儲芯片行業的核彈。
今天,我們就來聊聊這個讓全球內存巨頭們徹夜難眠的TurboQuant,到底是什么來頭。
一、先搞清楚一個問題:KV緩存是什么?
要講清楚TurboQuant,得先了解一個基本概念——KV緩存。
簡單的說,當你和AI聊天的時候,它之所以能"記住"你們之前的對話,靠的就是KV緩存(Key-Value Cache)。
每次你發送的消息,大模型都會把這條消息的"關鍵信息"(Key)和"具體內容"(Value)保存下來。這樣一來當你繼續提問時,它就能準確定位之前的對話,直接調用緩存就行。
這就像一個筆記本,幫你記住之前聊過的所有內容。
但問題來了——這個"筆記本"越記越多,占用的內存也越來越大。
假如你和AI聊了一萬字的長文,KV緩存可能就占用幾GB的顯存。對于ChatGPT這種每天處理數億次對話的系統來說,存儲成本無疑是個天文數字。
這就是為什么AI推理這么貴的核心原因。不是算力不夠,是內存不夠。
二、TurboQuant到底做了什么?
谷歌的TurboQuant,本質上就是一套"壓縮算法"。
但它厲害的地方在于:它把KV緩存壓縮到了3比特,而且零精度損失。
傳統的KV緩存通常用16比特來存儲。TurboQuant直接把緩存砍到3比特,壓縮率超過80%。
更夸張的是,壓縮后的模型性能絲毫不打折扣。在英偉達H100 GPU上,推理速度最高提升了8倍。
內存占用減少6倍,推理速度提升8倍。這就是TurboQuant交出的成績單。
![]()
用谷歌自己的話說,這是"逼近理論極限"的壓縮技術”。
三、為什么存儲芯片行業慌了?
現在你可以理解,為什么存儲芯片股價會跌跌不休了。
過去兩年,AI產業的爆發帶火了一整條產業鏈。英偉達的GPU賣瘋了,存儲芯片也跟著水漲船高。為了搶占AI算力,各家都斥巨資搶購高帶寬內存,美光、SK海力士、三星的內存產能早早就被它們瓜分干凈,連帶著股價都翻了幾倍(可憐下游被動漲價的手機廠商,錢沒掙到還被罵得狗血淋頭)。
市場的邏輯很簡單:AI越火,需要的算力越多,需要的內存也越多,尤其是高帶寬的HBM內存,市場需求旺盛,價格自然上漲(一箱標準HBM內存,其價值堪比一線城市一套房)。
但TurboQuant的出現,直接打破了這個邏輯。
如果A用更少的資源能夠完成同樣的任務,那存儲芯片的需求還會那么旺盛嗎?
華爾街最怕的,不是競爭,而是"不再需要"。
谷歌用一篇論文告訴市場:你們之前押注的"AI必須配大內存",現在不需要了。
這項顛覆性技術的提出,證明了deepseek技術路線的可行性:用更少的內存,也能跑同樣質量的推理。
![]()
四、但故事還沒結束:技術突破≠行業終結
看到這里,你可能會覺得存儲芯片行業要完蛋了。
但事情沒那么簡單。
首先,TurboQuant目前還只是停留在研究階段,距離大規模商用還有很大一段距離。技術落地需要時間,存儲芯片的短期需求不會立刻消失。
其次,更高效的AI可能會催生更多應用場景。就像5G提速催生了短視頻一樣,AI推理成本的大幅降低,可能會帶來新的爆發式增長點。到時候,存儲芯片的總需求或許會不降反升。
而且這項技術目前只解決了推理階段的內存問題,更加消耗算力的AI算力環節還沒有受到影響。
歷史總是驚人地相似。
20年前,JPEG壓縮技術讓圖片文件縮小了10倍,但存儲需求反而爆炸式增長——因為大家開始瘋狂拍照了。
10年前,視頻壓縮技術讓一部電影從幾GB降到幾百MB,但存儲需求反而繼續飆升——因為大家開始刷短視頻了。
因此,TurboQuant可能不是存儲芯片的終結者,而是AI迅速普及的催化劑。
五、對我們普通人意味著什么?
聊完行業,說說對我們普通人的影響。
第一,AI可能會變得更便宜。
現在用一次GPT-4,背后可能是幾美分的成本,對于高頻使用者來說,成本還是太高了。如果TurboQuant能讓推理成本降低6倍,那AI服務的價格也會跟著大幅下降。說不定以后用AI就是白菜價了。
第二,手機AI可能會更強大。
現在的手機AI大多依賴云端,因為本地內存不夠用。若是應用TurboQuant技術將壓縮后的模型塞進手機,那就意味著未來的Siri、小愛同學可能真的會變聰明。
第三,創業門檻會降低。
做AI應用最大的成本就是算力。如果推理成本大幅降低,更多小公司也能玩轉AI,行業創新會加速。
![]()
TurboQuant的故事,其實是科技行業的縮影。
存儲芯片行業享受了兩年AI紅利,現在谷歌一篇論文就讓他們市值蒸發幾千億。這不是谷歌有多狠,而是技術迭代的必然。
但換個角度想,TurboQuant本身也是因為有了AI推理成本高企不下的需求。沒有Transformer架構,沒有大語言模型,沒有GPU算力,這個節約算力的算法也無從談起。
科技行業就是這樣,一環扣一環,顛覆與被顛覆往復不斷循環。
作為普通人,我們或許無法預測下一個技術突破是什么,但我們可以保持敏感,保持學習。
因為在這個時代,唯一不變的就是變化本身。
特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.