2026年開年,全球AI硬件行業炸了兩顆雷。
![]()
一是英偉達以創紀錄的200億美元天價收購芯片初創企業Groq,押注片上SRAM路線。二是DDR46GB內存價格從3.2美元飆升至62美元,漲幅高達1800%,連古董級的DDR3都在暴漲。
全球科技行業正面臨前所未有的內存短缺危機。透過現象看本質,這些孤立事件指向同一個核心矛盾:AI競爭已從單純的算力堆砌,轉向“數據流戰爭”。底層邏輯正在發生根本性逆轉。
![]()
傳統GPU的AI計算過程中,高達90%的能量和時間都耗費在數據搬運上,而不是計算本身。無論縮短距離、提升帶寬,還是猛砸制程,都改變不了一個事實:搬運過程本身就是能效的終極吞噬者。
于是,一種更激進的根本性方案正在業界孕育而生,存內計算。其核心原理是利用存儲介質本身的物理特性,在存儲單元內直接完成數學運算,實現“存儲即計算”。
![]()
目前兩條技術路線并行。三星主攻的PIM近存計算,在存儲芯片內部集成獨立計算單元,數據無需流出內存顆粒即可完成預處理。
而更具顛覆性的CIM存內計算,則直接利用存儲單元的物理特性完成計算,實現真正的“計算在內存細胞內完成”。當然,這條路從實驗室到量產還需要幾年時間。
在傳統方案中,電信號需要在PCB板上經過數十厘米走線才能到達光模塊。這段距離成了數據搬運中功耗與延遲的主要來源。硅光技術的突破在于,將激光器、調制器、波導探測器全部集成在芯片上,用光子取代電子傳輸。
![]()
優勢明顯:信號損耗從傳統方案的12db降到4db以內,能效大幅提升;憑借波分復用技術,單根光纖可承載多個波長信號,實現超高帶寬。
最關鍵的是,當AI模型邁向萬億級參數,機架間互聯成為集成算力穩定釋放的關鍵,硅光技術的重要性日益凸顯。臺積電、博通等巨頭已紛紛入場。
![]()
GroqLPU走的是另一條路,不再試圖調和通用性與性能的矛盾,而是通過犧牲靈活性來換取確定性與能效的指數級提升。
LPU摒棄傳統外掛HBM,采用數百MB片上SRAM作為主存儲,帶寬高達80TB每秒,是傳統GPU的10倍以上。數據在芯片內像流水線一樣流過計算單元,實現物理意義上的“秒等”到“秒回”跨越。
它徹底摒棄亂序執行、分支預測等復雜邏輯,將調度權交給編譯器,追求極致的確定性。
更極端的是泰山HC1芯片,直接將特定大模型權重固化在芯片金屬掩模層中,采用“模型即芯片”的物理硬連接。一顆芯片只能跑一個特定模型,無法更新切換,但換來的是10倍能效、20倍成本下降,以及17000TOKEN每秒的推理速度,是英偉達B200的48倍。
過去有個共識:算力即等于GPU,CPU只是負責調度的“卡拉菲”。但2026年AI應用從對話轉向agent時代,算力需求正在發生結構性變化。
黃仁勛在發布Rubin平臺時點破要害:AI正在學習如何使用工具,而工具的使用很多是在純CPU環境運行的。當GPU將算法加速推進至極限時,系統最終速度將受限于無法被并行的串行部分。CPU正在從單純的串行處理器,發展成為全局數據流的智能管家。
![]()
這種模式在通用GPU與極端專用路線之間開辟了第三條道路,不通過消滅內存層級來抵抗內存墻,而是通過精細化治理與數據共享,兼顧能效與可編程性。
從存內計算試圖根源上消除數據搬運,到CPU回歸作為智能管家統籌全局;從確定性架構將效率推向極致,到硅光技術用光子打破通訊壁壘,一條主線清晰可見:AI硬件的競爭,已從單純算力堆砌轉向對數據流效率的極致追求。
內存焦慮不會是終點。就像《侏羅紀公園》里的名言:生命總能找到自己的出路。隨著傳統內存逼近擴展極限,誰能讓海量數據以更低能耗、更具確定性的方式在存儲與計算之間完成“生命的進化與迭代”,誰就會是AI時代最終的贏家。
特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.