文 | 多空象限
大模型越用越便宜的神話,在一輪又一輪漲價公告中宣告終結。
短短四天之內,阿里云連發三條產品漲價公告:4月13日,DataWorks取消每日API調用次數限制,標準版免費額度調整為10萬次/月,超出部分按量付費;4月15日晚,百煉部分模型單元服務價格上調2%至5%不等;同日,DDoS高防彈性95定價從100元/Mbps/月調整為150元/Mbps/月。而這已是阿里云一個月內的第二次漲價——3月18日,其AI算力、文件存儲等產品最高漲幅已達34%。
![]()
海外的漲價更為隱蔽但同樣深刻,Anthropic調整了旗下Claude Enterprise訂閱模式:從每月每用戶最高200美元的固定費用,轉變為每月20美元基礎費加上按照實際算力消耗計費。對于重度用戶而言,新定價可能導致成本翻倍甚至三倍。
這一輪漲價遠非一次簡單的成本傳導,有人用“硅基通脹”一詞來形容新型工業血液的價值重估,從這個角度來看,漲價的趨勢也很難就此打住。算力正在從“可無限獲取的公共資源”轉變為“需競價獲取的戰略資產”,定價權正在從應用層向基礎設施層遷移。誰掌握算力,誰就掌握AI時代的鑄幣權。
為什么越用越貴?
2026年以來,全球算力需求增長曲線變得越發陡峭,據全球最大的API聚合平臺OpenRouter數據,2026年4月其周度累計Token消耗量較一年前提升約7-8倍。國家統計局今天(4月16日)發布會上的最新數據顯示,截至今年3月,日均詞元(Token)調用量突破140萬億,比上年末增長超40%。
中信證券在研報中指出,Token調用量井噴帶來的是算力需求極大爆發,與此同時供給側受到各類硬約束短期邊際增量有限,目前國內外均出現了嚴重的算力荒。
Agent的興起是算力需求結構最深刻的變革,以OpenClaw為代表的AI Agent,單次任務消耗Token是ChatBot的10到100倍,國內廠商紛紛推出“國產龍蝦”,進一步加速了“養蝦”的普及。
關鍵轉變在于傳統ChatBot產生的算力負載是間歇性的——用戶提問、模型回答、會話結束;而Agent的常態是持續運行,多步驟推理、信息檢索、代碼執行、結果迭代。這種“常駐負載”從根本上改變了算力需求的形態——從請求/響應的離散模式,轉變為全天候持續的算力消耗。
這種轉變也解釋了為什么Agent和多模態應用的爆發對推理端算力需求拉動極大。中信證券認為,AI芯片需求可分為訓練和推理,目前推理端算力需求的增長動力顯著更強。
這樣看來,傳統產業經濟學里的“規模效應”失效了嗎?
傳統SaaS的定價邏輯建立在邊際成本遞減的假設之上——用戶越多,單位成本越低。但AI推理的邊際成本結構截然不同,根源在于算力的邊際成本并非算法決定的,而是由物理供應鏈決定的。高帶寬內存的產能、先進封裝的吞吐量、電力供應的規模——這些物理約束在供給側設置了剛性天花板,導致“需求越大、成本越高”的現象持續存在。
誰的產能,誰的壁壘?
算力“荒”的本質并非芯片不夠,而是整個物理供應鏈的“木桶效應”正在集中顯形。從晶圓到封裝,從內存到光模塊,每一個環節都在構成一道硬約束。
在AI芯片生產鏈條中,CoWoS先進封裝是當前最關鍵的瓶頸。摩根士丹利研報顯示,臺積電2026年CoWoS總產能約93kwpm,較2025年底的70k增長33%。但更關鍵的是,新增產能幾乎被輝達與博通兩大國際客戶包走,僅部分少量產能分配給聯發科。據臺媒報道,臺積電已全面上調2026至2027年CoWoS產能目標,機構推估臺積電先進封裝產能將從今年的130萬片增至2027年的200萬片。即便如此,供給仍遠遠無法滿足井噴式的需求。
高帶寬內存(HBM)是AI算力另一項核心成本,根據SemiAnalysis的存儲模型測算,2026年第一季度,LPDDR5合約價格同比漲幅預計將達約4倍,DDR5合約價格同比漲幅預計將達約5倍。
AI服務器的內存成本占比正在急劇攀升,一臺配備8顆H100 GPU的高端AI服務器,僅HBM內存的采購成本就可能占整機成本的30%以上。當內存價格以數倍的幅度跳漲時,整機成本被成倍推高。
除了芯片和內存,AI基礎設施中的“毛細血管”同樣面臨短缺,800G以上光收發模塊2026年預計增至6300萬組,但EML激光器產能被英偉達等巨頭壟斷,交期已排至2027年之后。Paddle Card等關鍵PCB組件的交期從正常的6周拉長到6個月。
SemiAnalysis報告指出,更高的服務器采購成本壓縮了項目預期回報,迫使部分運營商放緩甚至擱置新部署計劃。換言之,原本應進入市場的新增供給被迫滯后,進一步收緊了租賃市場的供給格局。
當供給側每個環節——晶圓、封裝、內存、光模塊——都形成寡頭壁壘時,算力就從“可復制的商品”變成“需排隊爭奪的稀缺品”。
定價權轉移下的產業鏈博弈
漲價潮最深刻的變革不在于價格本身,而在于它重新定義了AI產業鏈中的權力關系。
過去十年,云計算行業遵循“只降不升”的鐵律——規模效應驅動價格持續下行,廠商以低價獲客、以規模取勝。然而2026年,阿里云、騰訊云、百度云等頭部廠商集體打破這一慣例。
所謂的定價權轉移主要體現在三個層面:
云廠商從“規模擴張優先”轉向“價值定價優先”,將稀缺的GPU資源向高毛利的模型即服務(MaaS)與核心API集中。東吳證券研報分析,當前算力緊缺下,算力租賃廠商的議價權有望提升,其業務正從單純的裸算力出租升級為模型服務或Token分成模式,即從“賣算力”轉向“賣詞元”。
大模型廠商的商業模式也在發生根本性轉變,智譜年內三次提價,整體漲幅超60%。Anthropic從固定訂閱轉向按量計費,標志著大模型公司從“燒錢換增長”向“精細化運營”的轉型。
硬件廠商是這輪漲價的最大受益者,SemiAnalysis數據顯示,部分2至3年前簽署的H100租賃合約,正以原價完成續約,有的合約甚至直接續約4年至2028年。一款2022年發布的芯片,在四五年后仍能以原價鎖定長期租約——這在半導體行業歷史上極為罕見。
誰在承受成本壓力呢?
重度用戶是這場漲價中最直接的“受害者”,Anthropic新定價模式下,重度用戶的成本可能翻倍甚至三倍。
開發者與中小企業正在面臨“算力鴻溝”的擠壓,國內模型廠和云平臺紛紛下調Coding Plan的額度和優惠,智譜等廠商的Coding Plan產品出現了限購現象。
二線云廠商與大模型公司同樣承壓,僅有頭部云廠商能夠獲得較為充足的先進算力資源,中小型廠商在算力爭奪中處于明顯劣勢。
在此背景下,算力正在制造新的社會分層。頭部科技公司鎖定長期協議和先進產能,享有穩定的算力供給和相對有利的價格;中小企業只能按小時租賃、按Token付費,在供需波動中承受更大的成本壓力。
國產替代的加速窗口
算力短缺不僅帶來漲價,也為國產算力產業鏈創造了歷史性機遇。中信證券明確判斷,AI應用爆發對應的國內算力荒將會加速國產卡放量,預計2026年國產算力芯片出貨量至少實現翻倍以上增長,將為算力設計公司、先進制程、先進封裝、先進存儲以及配套產業鏈帶來強勁增長動能。
據IDC數據,2025年中國AI加速卡出貨量約400萬張,其中國產AI加速卡出貨量165萬張,市場份額約41%。華為出貨量約81萬張,市場份額約20%,已與英偉達形成實質性競爭格局。
![]()
在英偉達新的AI加速卡恢復對華銷售之前,中國國產AI加速卡廠商有望持續替代英偉達的市場份額。
從推理端切入國產替代的邏輯同樣清晰,中信證券分析指出,推理環節對算力產品綜合性能要求相較訓練端任務更低,國產算力芯片廠商通過與互聯網廠商深度合作(針對特定需求定制化或優化),能夠提供更適配需求的推理芯片,國產替代節奏相較于訓練端進展更快。
國產算力產業正形成多強并驅的格局,除華為外,寒武紀計劃在2026年交付50萬件AI加速器,其中包含多達30萬件最先進的思元590和690芯片,并計劃將其芯片產量提高兩倍以上。海光信息新一代芯片性能約為H100的45%,2026年計劃量產近30萬顆。
中銀國際證券在研報中稱,“十五五”規劃建議明確提出“適度超前建設新型基礎設施”,算力不再僅僅是技術圈的專業議題,而是上升為國家戰略層面的核心競爭力。
結語
短期內,供需緊張的格局難以根本緩解。大摩預測2026年CoWoS產能僅增長33%,而Token消耗量同比已增長7-8倍——產能增速遠落后于需求增速。關鍵問題集中在AI需求可能出現的問題以及除NVIDIA外的投資標的。當定價權加速向上游集中時,產業鏈的投資邏輯也在同步重構。
中長期來看,這輪漲價潮最深遠的影響,可能在于AI產業成本結構的轉變。
從“訓練昂貴、推理便宜”到“訓練平價、推理昂貴” 。隨著模型架構創新和訓練效率提升,訓練成本在持續下降;但推理環節因Agent常駐負載和多模態交互的普及,正成為算力消耗和成本的核心來源。這意味著未來AI商業模式的盈利模型需要重新設計。
“算力效率”成為核心競爭力,當Token本身成為計價單位,如何降低每次交互的Token消耗、優化推理效率,將成為繼模型能力之后企業競爭的第二條核心賽道。
參考資料
[1]Token量井噴導致算力荒,國產算力在推理端加速突圍,中信證券
[2]電子行業國產算力全面突破:從芯片替代到系統架構創新,中銀國際證券
[3]算力告急!SemiAnalysis深度解讀:從GPU到內存再到光纖,AI供應鏈全線緊繃,華爾街見聞
[4]算力漲價潮席卷全球!阿里、Anthropic連續調價 嚴重算力荒再現,財聯社
特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.