文 | 強調(diào)Next
明天(4月18日),阿里云、百度智能云將正式開始調(diào)價。3周之后,騰訊云也將迎來新一輪漲價。全球范圍內(nèi),OpenAI、Anthropic在過去18個月里把API價格降了超過80%,DeepSeek-R1的出現(xiàn)更讓外界相信推理成本即將歸零。
結果,中國三大云廠商在同一周宣布漲價20%至30%。
![]()
媒體的第一反應是“價格戰(zhàn)結束,大廠開始收割”。這個定調(diào)不算錯,但它停在了最表層的解讀上。它解釋了云廠商為什么要漲,卻沒有回答更關鍵的問題:這次漲價是短暫修正,還是一個持續(xù)性趨勢的起點?答案,藏在一個150年前的經(jīng)濟學悖論里。
01.杰文斯悖論:越便宜,燒得越兇
1865年,英國經(jīng)濟學家威廉·杰文斯觀察到一個反直覺現(xiàn)象:蒸汽機效率提升之后,英國的煤炭消耗總量反而急劇增長:效率提升降低了使用成本,觸發(fā)了需求爆炸。這就是杰文斯悖論(Jevons Paradox),它在2026年的算力市場里精準復現(xiàn)了。
DeepSeek-R1確實讓單Token推理成本大幅下降。但它同時打開了一個需求閘門:大量此前覺得“AI太貴”的企業(yè),開始把AI嵌進業(yè)務流程。一旦嵌入,Token消耗量以非線性速度膨脹。
更關鍵的變化是,AI的應用已經(jīng)從“對話”進入“做事”:Agent和Reasoning Model登場了。一個任務以前燒1000個Token,接上思維鏈之后燒5000個,因為Reasoning Model會自己“思考”,消耗量是普通模式的10到50倍。
![]()
DeepSeek降低了起步門檻,卻捅破了算力天花板。每一單位Token越來越便宜,但每一個業(yè)務任務卻越來越貴。這才是這輪漲價得以成立的真實地基。
02.開源了權重,沒開源推理棧
另一個被大量報道忽略的細節(jié):DeepSeek開源了模型權重,但沒有開源它的推理優(yōu)化棧。這兩者的差別,好比給你了發(fā)動機的設計圖紙,卻沒告訴你怎么調(diào)出F1的性能。
真正決定推理成本的,不只是模型架構,而是藏在水面下的工程能力:投機解碼(Speculative Decoding)的命中率、KV Cache的內(nèi)存調(diào)度策略、Prefill與Decode階段的分離優(yōu)化、萬卡集群的網(wǎng)絡拓撲。這些硬功夫,仍然是少數(shù)頭部云廠商的護城河。
![]()
同樣跑DeepSeek-R1,頭部云廠商的推理效率可以比企業(yè)自建高出3到5倍。這意味著同等算力投入下,云廠商能服務更多并發(fā),單位成本更低。
這個效率差,就是云廠商“溢價”的來源之一。它是實實在在的工程壁壘。所以這次漲價,某種程度上也是在給自己的技術優(yōu)勢定價。
03.諸神之戰(zhàn):四家巨頭的賬本與野心
在這一輪集體調(diào)價的浪潮中,四家核心巨頭的姿態(tài)各異,折射出不同的商業(yè)算盤。
阿里云:吳泳銘式的“利潤質(zhì)量”保衛(wèi)戰(zhàn)。阿里的調(diào)價最堅決,漲幅主要集中在高端GPU實例和存儲(CPFS)上。在阿里全面回歸“效率第一”的背景下,阿里云不再追求所謂的“云市場份額第一”,而是要搶奪“AI算力利潤率第一”。潛臺詞就是,阿里云正在建立一個“VIP算力區(qū)”。如果你無法覆蓋這30%的溢價,你可能就不在阿里的核心目標客戶名單上。
百度智能云:“用戶過濾器”。百度作為最早押注大模型的玩家,正面臨文心大模型推理成本隨調(diào)用量量級躍遷的壓力。所以百度的漲價更像是一場“用戶洗牌”。它在主動洗掉那些只薅羊毛、不產(chǎn)生商業(yè)閉環(huán)的小型個人開發(fā)者,轉(zhuǎn)而全力服務對價格不敏感的B端大客戶。百度需要通過調(diào)價證明:它的AI增長不再靠補貼,而是靠“溢價賣智力”。
騰訊云:生態(tài)鎖死后的“ROI修正”。騰訊云的動作比阿里晚了三周,這是一種典型的“跟隨策略”。騰訊的底氣在于微信生態(tài)和企業(yè)微信的深度綁定。當企業(yè)的工作流已經(jīng)深度嵌入騰訊的社交/協(xié)同生態(tài),遷移成本極高。騰訊云的漲價更像是一種“補漲”,用來修正過去兩年為了搶占生態(tài)而犧牲的ROI,讓AI業(yè)務在財報里變得更“體面”。
火山引擎:戰(zhàn)略性“不平衡跟隨”與搶人計劃。火山引擎(字節(jié)跳動)是這波漲價潮中的變數(shù)。它雖然也調(diào)整了部分價格,但在很多核心API上的漲幅明顯低于阿里和百度。字節(jié)正在利用這個窗口期進行“存量截流”。憑借內(nèi)部抖音、TikTok帶來的恐怖算力消納能力,火山擁有極強的成本攤薄底牌。當對手在“趕客”保利潤時,火山在等那些掉隊者,試圖通過價格差完成最后一次“裝機量”的反超。
04.最大的意外:大企業(yè)開始"出走"
這次漲價引發(fā)了一個沒人預料到的反作用力:它實質(zhì)上堅定了大企業(yè)“自建算力”的決心。
云計算行業(yè)有個隱藏規(guī)律:當月度賬單突破某個閾值,“自建 vs. 租用”的財務模型就會翻轉(zhuǎn)。對于銀行、央國企、大型制造商來說,這個閾值大約在每月300萬到500萬元的云算力支出。
2024年,大多數(shù)大型企業(yè)還在閾值以下,自建劃不來。2025年隨著AI項目鋪開,部分企業(yè)開始觸線。而2026年這輪20%到30%的漲價,直接把一批原本剛好卡線的客戶,推到了“必須認真考慮自建”的區(qū)間。
![]()
這波自建潮的受益者并不是云廠商的競爭對手,而是更邊緣的角色:GPU租賃平臺的3月詢價量同比翻了兩倍;華為昇騰的大客戶交付排期已拉長到6個月;專門幫企業(yè)做"私有化推理集群"的集成商突然成了香餑餑。
云廠商本來打算漲價收割高端客戶,沒想到順手推走了一批有自建能力的大客戶。這個決策風險,在財報季到來時可能會被重新評估。
![]()
05.誰贏了?利益分配的真相
三家云廠商的漲價,在媒體眼里是“大廠收割”。但從整個產(chǎn)業(yè)鏈來看,真正的贏家分布要復雜得多。
![]()
這里有個諷刺的現(xiàn)實:最受傷的是那些最有創(chuàng)新活力的中小AI創(chuàng)業(yè)公司。他們?nèi)绻驗槌杀敬竺娣e倒下,云廠商自己的生態(tài)也會隨之枯萎。
這不是沒有先例。2010年代初期,亞馬遜AWS在某些服務上的激進漲價,加速了部分開發(fā)者轉(zhuǎn)向Google Cloud,間接幫助GCP完成了早期生態(tài)積累。歷史不會簡單重復,但它會押韻。
06.漲價時代,還要持續(xù)多久?
說穿了,這輪漲價的本質(zhì)是中國AI算力市場在需求爆發(fā)與供給約束之間的一次壓力釋放。兩邊擠壓之下,價格只能向上走。這不完全是云廠商的主動選擇,某種意義上也是被迫的定價修復。
![]()
支撐這輪漲價的三個結構性因素,沒有一個會在12個月內(nèi)實質(zhì)性消失:Reasoning模型普及帶來的Token消耗量級躍遷、AI Agent大規(guī)模落地加速、以及Nvidia出口管制帶來的供給約束。
B2B軟件市場有一個反復驗證的規(guī)律:價格棘輪效應(Ratchet Effect)。AWS在2010年代初的幾次漲價,沒有一次在供給改善后完整回吐。Google Cloud存儲定價自2021年以來只走過一次下行臺階,還附帶了存儲上限收緊。云廠商懂這個規(guī)律:這次漲價不只是“趁窗口收割”,更是在鎖定一個新的價格基準線。
![]()
![]()
所以在2027年之前,“算力歸零”不會成真。真正決定價格拐點的,取決于國產(chǎn)算力的調(diào)度效率什么時候能實質(zhì)性追上Nvidia H100。從目前的工程進度來看,這個時間點大概率在2027年至2028年之間。
而在這個窗口里,云廠商有充分的理由“先漲為敬”,因為他們知道,窗口不會永遠開著。
07結語:一場供給側(cè)的結構性博弈
這輪漲價揭示的,不是“AI商業(yè)化成人禮”這種宏大敘事,而是一個更具體的產(chǎn)業(yè)現(xiàn)實:效率革命與需求爆炸同步發(fā)生時,價格不一定下行,反而可能上行。杰文斯悖論在煤炭時代成立,在算力時代同樣成立。
對中小AI應用企業(yè)來說,與其爭論誰在收割,不如認真算一筆賬:自己的業(yè)務場景里,還有多少Token在被無效消耗?
省Token,才是這個時代最硬的護城河。
特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺“網(wǎng)易號”用戶上傳并發(fā)布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.