![]()
出品 | 《態度》欄目
作者 | 袁寧
編輯 | 丁廣勝
芯片行業有一個不成文的共識:看不清方向的時候,看老黃怎么做。
過去十年,黃仁勛幾乎定義了AI硬件的游戲規則——他的GPU從實驗室一路燒進了全球每一個數據中心。你可以質疑他的皮夾克品味,但沒人質疑他的方向感。
所以,當老黃在本周GTC大會上,一邊亮出Vera Rubin平臺,一邊正式推出Groq 3 LPU——這顆以200億美元從初創公司Groq收購技術、快速整合而成的、專門為AI推理而生的芯片——整個行業不得不重新校準坐標系。
更勁爆的消息來自路透社。就在GTC開幕同一周,兩名知情人士透露:
幾個小時后的北京凌晨,一位半導體領域的投資人看完GTC的直播回放,連發三條消息給被投企業CEO:“老黃把故事講完了。”“融資節奏要提前。”
他不是唯一一個睡不著的人。LPU將帶來哪些新變量?
![]()
GTC引爆的連鎖反應
過去兩年,國內做推理方向的芯片團隊在和潛在客戶溝通時,幾乎都經歷過同一種對話模式:架構師們審慎地點頭,說"方向可能是對的",然后跟上一個"但是"——"但我們要看客戶怎么想""但要看老黃怎么做"。
過去兩年,推理芯片公司一直卡在一個隱形門檻上:技術上“基本認可”,商業上“沒人拍板”。
典型對話是: “方向可能對,但要看客戶怎么想。” “或者……看英偉達怎么做。”這不是技術問題,是決策責任問題。
GTC提供了這個背書。而且力度遠超預期,200億美元 + 產品線重構 + 真實部署。
網易智能了解到,GTC之后,已有多家國產GPU廠商和互聯網大廠開始與國內的推理芯片團隊探討架構級驗證的可能性。在芯片行業,這是比簽訂合同更前置、但也更實質的一步——它意味著合作方愿意投入自己的工程資源,在自己的系統架構中實際測試你的方案能否跑通。
據多位投資人和從業者反饋,這波熱度并非只集中在芯片設計公司,還沿著產業鏈向上游蔓延。高速存儲器件、先進封裝方案、甚至專用SRAM和新型存儲IP的供應商,都開始收到更密集的問詢。一位供應鏈人士表示,"好幾家芯片公司突然來問我們MRAM和高密度SRAM IP的合作意向,之前一年可能才一兩家。"
寒序科技是最先感受到這波變化的公司之一。
有中國團隊已經在這個方向深耕了3年
GTC當晚,寒序科技的內部群幾乎刷屏。
工程師們從直播里截圖,一張接一張往群里丟,配的文字越來越激動:"跟我們想的一致。""再看這張,更一致了。""這不就是我們兩年前畫的那張圖嗎?"
CEO朱欣岳還沒醒,群里已經刷了幾十屏。等他拿起手機,投資人的消息也涌了進來,語氣比平時急切,意思卻高度統一:"方向被驗證了,后面的融資節奏可以聊聊了。"
這種“被驗證”的情緒,對寒序來說意義很大。
寒序科技成立于2023年8月,過去近三年一直在做的事情,和老黃這一周昭告天下的方向幾乎完全重合——超高帶寬、確定性流式架構、專為推理設計的芯片。換句話說,寒序可能是國內最早沿著這條路線做國產LPU的團隊之一。
過去一年,朱欣岳見了不少國內GPU公司和互聯網大廠的人。但比起拜訪客戶高管,他花更多時間做的事情是和一線工程師坐在一起,聊趨勢、聊需求。寒序團隊的底色是交叉學科——材料、物理、算法、芯片架構都有人懂,他們習慣從第一性原理出發,從大模型的演進方向、從器件物理的極限、從系統架構的瓶頸多個維度去推演:推理芯片到底應該長什么樣?
結論指向同一個方向:極致高帶寬,舍棄一切冗余功能,只為推理而生。
"之前我們要花很多精力給行業做教育——為什么需要一顆專門的推理芯片,為什么通用GPU不是最優解。"朱欣岳說,"現在完全不需要了。老黃已經替我們講完了。"
但他很清楚,行業關注的焦點已經從"方向對不對"切換到了更尖銳的問題:"你的壁壘夠不夠高?性能到底怎么樣?產品什么時候能上?"
教育市場的苦日子結束了,證明自己的硬仗才剛剛開始。
“中國版 Groq”的差異化路徑
寒序科技常被稱為“中國版 Groq”,但這個說法只對了一半。
兩家公司確實瞄準的是同一個問題:大模型推理,尤其是 Decode 階段,瓶頸不在算力,而在帶寬。誰能更快、更穩定地把數據送到計算單元,誰就更有機會贏下推理時代。
但寒序和 Groq 的差別,不在“都做高帶寬推理”,而在底層介質完全不同。
早在2024年9月和2025年11月,寒序科技就已聯合北京大學物理學院、計算機學院、集成電路學院,以及澳門大學模擬與混合信號集成電路全國重點實驗室,先后承擔、主持兩項北京市科技計劃項目,在北京市科學技術委員會指導下,明確對標 Groq 路線與帶寬指標,前瞻鎖定0.1 TB/mm2/s 級超大帶寬流式推理芯片研發。
這意味著,當 Groq 因 LPU 爆紅時,國內團隊并不是事后追趕,而是已經在同步推進一條差異化路線。
Groq 的解法,是在芯片上堆大量 SRAM,讓數據盡量在片上流動,以極高帶寬專門承擔 Token 的生成和解碼。這條路證明了一件事:推理時代,最快的芯片未必是最能算的,而是最能“喂”的。
但 SRAM 的短板同樣明顯。它采用傳統6T 結構,單元面積大、密度低、成本高。模型越大,需要的芯片數量就越多,系統成本也越高。Groq 證明了方向成立,但 SRAM 路線的經濟性始終是業內公開討論的疑問。
寒序的不同,就在這里。
它沒有沿著 GPU 的片外 HBM 路線走,也沒有復制 Groq 的片上 SRAM 路線,而是選擇用 MRAM 重做推理芯片的存儲底座。MRAM 采用1T1M 結構,在相同工藝節點和芯片面積下,存儲密度可達 SRAM 的5到6倍;讀取速度接近 SRAM,但功耗更低,而且具備非易失性,斷電后數據不丟失,無需持續刷新。
更關鍵的是,MRAM 對極先進制程和復雜封裝的依賴更低。這意味著,寒序有機會在相對成熟、可控的國產工藝上,做到接近先進 SRAM 路線的存儲密度和讀出帶寬,把高帶寬推理芯片從一條高度依賴海外供應鏈的路徑,挪到一條更有國產落地可能性的路徑上來。
在此基礎上,寒序又提出了 MSA(磁性流式處理)架構:將大規模 MRAM Banks 緊鄰矩陣計算單元部署,讓權重和激活盡可能在局部高帶寬范圍內按固定節拍流動,降低對外部存儲的依賴,也減少推理過程中的延遲抖動。
據悉,SpinPU-E 的目標訪存帶寬密度為0.1–0.3 TB/mm2·s,已進入與 Groq 同量級的區間,遠高于傳統 GPU 的水平。
所以,寒序真正的優勢,不是“做中國版 Groq”,而是:在同一條高帶寬推理路線上,用 MRAM 換掉了 SRAM 這層地基。
據悉,寒序首顆測試芯片已經回片跑通,單位面積帶寬做到了100 GB/s/mm2,與Groq LPU(約0.11 TB/mm2/s)處在同一量級,而英偉達H100的這一指標大約在0.002–0.003 TB/mm2/s。
窗口期有多長?
方向被巨頭驗證是好事,但巨頭親自下場也意味著留給創業公司的時間窗口并不長。推理芯片當前也處在一個微妙的時間窗口:方向已經確認,但產品尚未定型;市場開始升溫,但真正的大規模采購還沒有到來。
黃仁勛在GTC上給出了自己的時間表——Groq LPU預計2026年下半年開始規模出貨,Rubin平臺也將全面鋪開。這意味著全球推理硬件市場的"iPhone時刻",大概率在未來12到18個月內到來。
對于中國的推理芯片公司來說,這既是機遇也是倒計時。
最大的壓力在于,巨頭已經下場,一旦全球頭部廠商完成產品定義、客戶教育和系統適配,留給創業公司的時間不會很多。你可以在局部創新,但必須在足夠短的時間內把創新變成產品,把產品變成客戶可部署的方案,同時還要有足夠的資金,撐過從技術驗證到規模落地之間的漫長跋涉。
但中國團隊也并非沒有自己的牌。供應鏈的確定性是其中之一。
在今天的外部環境下,很多客戶真正擔心的不是某一代芯片參數差10%還是20%,而是兩年后、三年后,這條產品線還能不能穩定采購、能不能持續迭代、能不能放心地圍繞它建設自己的系統。一顆不受管制風險影響、能夠長期穩定交付的推理芯片,為客戶提供的是一種確定性——這恰恰是國際巨頭即便技術領先,也未必總能給出的承諾。
但比供應鏈更深層的壁壘,是團隊本身。推理專用芯片不是畫一張架構圖就能做出來的。它依賴的是對底層器件特性的深刻理解、對高帶寬存算一體結構的長期工程積累,以及在可靠性驗證和產品化過程中與客戶反復打磨的實戰經驗。這些東西無法靠融一輪錢、挖幾個人來速成——它們必須用時間換。
朱欣岳對此看得很清楚:"確定性不只來自供應鏈,更來自團隊對這條技術路線的理解深度。我們在磁性存儲器件和高帶寬存算單元上深耕了數年,跟上游供應商反復磨合,從工藝到封裝到可靠性,一個坑一個坑地淌過來。工程師是我們自己培養的,經驗教訓是我們自己拿項目喂出來的,客戶對可靠性和產品化的每一個質疑,我們都接住過、調整過。這些東西沒有捷徑,也很難復制。"
他甚至對英偉達進入中國市場持一種"歡迎"的態度:"如果英偉達的Groq芯片真的進來了,等于他們又替我們做了一輪市場教育。客戶會更快地理解推理芯片是什么、能做什么、應該怎么用。等到我們的產品級芯片就緒,客戶甚至不需要重新學習——直接適配就行。"
在進度上,寒序科技已經走到了關鍵節點。2026年初回片測試的芯片,已經驗證了與Groq LPU一致的帶寬密度——這是超高帶寬流式推理架構中最核心、也可以說是唯一關鍵的指標。2026年內,團隊將陸續完成外部IP驗證和可靠性測試,并在年底完成產品級芯片的流片。如果時間表成立,2027年產品級芯片回片,國產LPU及完整解決方案將正式鋪開。
但芯片行業的殘酷之處在于,從流片到量產,中間還隔著系統驗證、客戶導入等一系列關卡,每一個都可能吃掉數月的時間。但寒序團隊過去數年踩過的坑、與上游供應商建立起的深度協作、在可靠性和產品化上積累的工程經驗,恰恰是穿越這段路程最重要的加速器。
所以,回到那條行業共識:看不清方向的時候,看老黃怎么做。
現在方向清楚了。剩下的問題只有一個:誰能跑得最快?或者更準確地說——誰的團隊更稀缺、更不可替代,誰就能跑得更快、更遠。
